CN116108059B - 地理测绘分幅矢量数据单体化方法、装置及电子设备 - Google Patents
地理测绘分幅矢量数据单体化方法、装置及电子设备 Download PDFInfo
- Publication number
- CN116108059B CN116108059B CN202310391296.3A CN202310391296A CN116108059B CN 116108059 B CN116108059 B CN 116108059B CN 202310391296 A CN202310391296 A CN 202310391296A CN 116108059 B CN116108059 B CN 116108059B
- Authority
- CN
- China
- Prior art keywords
- geographic
- fragmented
- entity
- entities
- neighborhood
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000013598 vector Substances 0.000 title claims abstract description 165
- 238000013507 mapping Methods 0.000 title claims abstract description 120
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000009432 framing Methods 0.000 title claims abstract description 50
- 239000000872 buffer Substances 0.000 claims description 92
- 238000012216 screening Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 5
- 238000005259 measurement Methods 0.000 claims description 4
- 230000002794 monomerizing effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 241001482237 Pica Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000012536 storage buffer Substances 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Remote Sensing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种地理测绘分幅矢量数据单体化方法、装置及电子设备,属于计算机技术领域,所述方法包括:将各分幅的测绘矢量数据以三元组的形式输入至知识图谱;基于各分幅的边界线三元组,通过空间查询语言搜索碎片化的地理实体,确定多个碎片化地理实体及其对应的边界标记三元组;基于各碎片化地理实体的边界标记三元组和各分幅的编码三元组,通过空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合;基于各碎片化地理实体对应的邻域地理实体集合,获取各碎片化地理实体对应的目标地理实体。通过空间查询语言搜索碎片化地理实体、邻域地理实体以及进行实体合并,能够自动进行地理测绘分幅矢量数据单体化。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种地理测绘分幅矢量数据单体化方法、装置及电子设备。
背景技术
知识图谱是一种结构化的语义知识库,主要用于描述实体之间的关系。知识图谱能够有效地将混乱冗杂的实体和实体间的关系通过知识抽取和融合等手段转换为结构化的知识。
测绘地理信息数据通常包含矢量数据和栅格数据,并以分幅的形式存储。矢量数据是在直角坐标系中,用(x,y)坐标表示地图图形或地理实体的位置和形状的数据。矢量数据一般通过记录坐标的方式来尽可能地将地理实体的空间位置表现得准确无误。在矢量结构数据中,点数据可以直接用坐标值描述,线数据用均匀或不均匀间隔的顺序坐标链来描述,面状数据可用边界线来描述。
常见的测绘矢量数据管理方式是分幅制作(人工勾绘)和分幅存储;由于分幅制作和存储,使得位于图幅边缘的地物的矢量要素图斑被切分成多个地理碎片并落于不同的分幅数据中。然而在构建地理知识图谱时,需要将同一地物(即便可能对应于多个分幅数据中的多个地理碎片)作为一个实体存入知识图谱,以便于面向一个完整的地理实体进行智能检索和计算推理。在构建地理知识图谱的过程中,需要将被切分为多个矢量要素图斑(地物碎片)合并为同一实体(单体化)进行整体管理。如何实现高效地将碎片化的地理对象整合成一个完整对象是目前业界亟待解决的问题。
发明内容
针对现有技术存在的问题,本发明实施例提供一种地理测绘分幅矢量数据单体化方法、装置及电子设备。
第一方面,本发明提供一种地理测绘分幅矢量数据单体化方法,包括:
将各分幅的测绘矢量数据以三元组的形式输入至知识图谱;
基于所述知识图谱中各分幅的边界线三元组,通过所述知识图谱的空间查询语言搜索碎片化的地理实体,确定多个碎片化地理实体及各碎片化地理实体的边界标记三元组;
基于各碎片化地理实体的边界标记三元组和所述知识图谱中各分幅的编码三元组,通过所述知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合,所述编码三元组用于表征分幅之间的相邻关系;
基于各碎片化地理实体和各碎片化地理实体对应的邻域地理实体集合,进行实体合并,获取各碎片化地理实体对应的目标地理实体。
可选地,根据本发明提供的一种地理测绘分幅矢量数据单体化方法,所述基于各碎片化地理实体的边界标记三元组和所述知识图谱中各分幅的编码三元组,通过所述知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合,包括:
基于预设缓冲区配置和所述知识图谱中各碎片化地理实体的几何形态三元组,获取各碎片化地理实体的缓冲区三元组;
基于各碎片化地理实体的边界标记三元组、各碎片化地理实体的缓冲区三元组和各分幅的编码三元组,通过所述知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合。
可选地,根据本发明提供的一种地理测绘分幅矢量数据单体化方法,所述预设缓冲区配置包括预设缓冲距离,所述碎片化地理实体为点要素、线要素或面要素,所述基于预设缓冲区配置和所述知识图谱中各碎片化地理实体的几何形态三元组,获取各碎片化地理实体的缓冲区三元组,包括:
基于所述预设缓冲距离和各碎片化地理实体的几何形态三元组,通过在碎片化地理实体周围绘制缓冲区边界,生成各碎片化地理实体的缓冲区三元组。
可选地,根据本发明提供的一种地理测绘分幅矢量数据单体化方法,所述基于各碎片化地理实体的边界标记三元组、各碎片化地理实体的缓冲区三元组和各分幅的编码三元组,通过所述知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合,包括:
针对各碎片化地理实体,基于预设筛选配置、所述碎片化地理实体的边界标记三元组、所述碎片化地理实体的缓冲区三元组和所述碎片化地理实体所在分幅的编码三元组,通过所述知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取所述碎片化地理实体对应的邻域地理实体集合;
所述预设筛选配置包括:所述邻域地理实体与所述碎片化地理实体的缓冲区存在空间相交,所述邻域地理实体与所述碎片化地理实体具有相同的地物类型,所述邻域地理实体与所述碎片化地理实体具有相同的几何形态,所述邻域地理实体的边界相交位置与所述碎片化地理实体的边界相交位置存在重合。
可选地,根据本发明提供的一种地理测绘分幅矢量数据单体化方法,所述基于各碎片化地理实体和各碎片化地理实体对应的邻域地理实体集合,进行实体合并,获取各碎片化地理实体对应的目标地理实体,包括:
针对各碎片化地理实体,通过比较地理实体的名称,判断所述碎片化地理实体对应的邻域地理实体集合中是否存在待合并的地理实体;
若确定所述碎片化地理实体对应的邻域地理实体集合中存在一个或多个待合并的地理实体,则将所述一个或多个待合并的地理实体与所述碎片化地理实体进行实体合并,确定所述碎片化地理实体对应的目标地理实体。
可选地,根据本发明提供的一种地理测绘分幅矢量数据单体化方法,所述将所述一个或多个待合并的地理实体与所述碎片化地理实体进行实体合并,确定所述碎片化地理实体对应的目标地理实体,包括:
针对各待合并的地理实体,通过所述知识图谱的空间查询语言搜索地理实体在目标边界线上的坐标点,确定所述碎片化地理实体在所述目标边界线上的第一坐标点集合,以及所述待合并的地理实体在所述目标边界线上的第二坐标点集合;
基于所述第一坐标点集合和所述第二坐标点集合,通过距离最近的配对方式,确定所述第一坐标点集合中各坐标点和所述第二坐标点集合中各坐标点之间的配对关系;
基于所述配对关系,合并所述待合并的地理实体与所述碎片化地理实体。
可选地,根据本发明提供的一种地理测绘分幅矢量数据单体化方法,所述知识图谱的模式层包括:测绘矢量本体,所述测绘矢量本体包括时间对象、空间对象和属性对象,所述属性对象包括地理实体名称、地理实体类别、地理实体度量指标、用于记录地理实体所在分幅的序列编号、地理实体缓冲区、边界标记和用于指示是否为经过合并的地理实体的合并标记;
所述将各分幅的测绘矢量数据以三元组的形式输入至知识图谱,包括:
基于所述测绘矢量本体和各分幅的测绘矢量数据,生成各地理实体的三元组集合、各分幅的边界线三元组和各分幅的编码三元组;
输入各地理实体的三元组集合、各分幅的边界线三元组和各分幅的编码三元组至所述知识图谱。
第二方面,本发明还提供一种地理测绘分幅矢量数据单体化装置,包括:
输入模块,用于将各分幅的测绘矢量数据以三元组的形式输入至知识图谱;
确定模块,用于基于所述知识图谱中各分幅的边界线三元组,通过所述知识图谱的空间查询语言搜索碎片化的地理实体,确定多个碎片化地理实体及各碎片化地理实体的边界标记三元组;
第一获取模块,用于基于各碎片化地理实体的边界标记三元组和所述知识图谱中各分幅的编码三元组,通过所述知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合,所述编码三元组用于表征分幅之间的相邻关系;
第二获取模块,用于基于各碎片化地理实体和各碎片化地理实体对应的邻域地理实体集合,进行实体合并,获取各碎片化地理实体对应的目标地理实体。
第三方面,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述地理测绘分幅矢量数据单体化方法。
第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述地理测绘分幅矢量数据单体化方法。
本发明提供的地理测绘分幅矢量数据单体化方法、装置及电子设备,通过将各分幅的测绘矢量数据以三元组的形式输入至知识图谱,可以使用知识图谱的空间查询语言搜索碎片化的地理实体,确定多个碎片化地理实体及各碎片化地理实体的边界标记三元组,进而可以针对每一个碎片化地理实体,通过知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合,进而可以对每一个碎片化地理实体,基于碎片化地理实体和碎片化地理实体对应的邻域地理实体集合,进行实体合并,获取各碎片化地理实体对应的目标地理实体,能够自动化高效地将碎片化的地理对象整合成一个完整对象,实现地理测绘分幅矢量数据单体化。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的地理测绘分幅矢量数据单体化方法的流程示意图之一;
图2是本发明提供的地理测绘分幅矢量数据单体化方法的流程示意图之二;
图3是本发明提供的测绘矢量本体的示意图;
图4是本发明提供的测绘矢量本体的属性对象的示意图;
图5是本发明提供的矢量数据转换为三元组的流程示意图;
图6是本发明提供的地理测绘分幅矢量数据单体化方法的流程示意图之三;
图7是本发明提供的生成缓冲区的示意图之一;
图8是本发明提供的生成缓冲区的示意图之二;
图9是本发明提供的生成缓冲区的示意图之三;
图10是本发明提供的待合并的面矢量地理实体的示意图之一;
图11是本发明提供的待合并的面矢量地理实体的示意图之二;
图12是本发明提供的合并后的面矢量地理实体的示意图;
图13是本发明提供的地理测绘分幅矢量数据单体化装置的结构示意图;
图14是本发明提供的电子设备的结构示意图。
具体实施方式
为了便于更加清晰地理解本发明各实施例,首先对一些相关的背景知识进行如下介绍。
地理测绘数据是由人工分幅勾绘的,一些位于图幅边缘的地理实体(如河流、道路等)会因为分幅被硬性切割并分别放置到不同的图幅中,使得一个完整的地理实体在不同的图幅中碎片化存储。但是在构建知识图谱时,需要将一个完整的地理实体作为一个统一节点来整体管理,所以需要整合被切分的地理实体。而且在实体合并时,由于人工勾绘误差,使得图幅交界处绘制的矢量线段不能分毫不差地对接上,导致合并后的地理实体形状和位置发生较大偏差,需要人工来处理边界误差,使得矢量的空间坐标能够衔接上,费时费力。
为了克服上述缺陷,本发明提供一种地理测绘分幅矢量数据单体化方法、装置及电子设备,通过知识图谱的空间查询语言搜索碎片化的地理实体、邻域地理实体以及进行实体合并,可以实现自动化高效地将碎片化的地理对象整合成一个完整对象。
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明提供的地理测绘分幅矢量数据单体化方法的流程示意图之一,如图1所示,所述地理测绘分幅矢量数据单体化方法的执行主体可以是电子设备,例如服务器等。该方法包括:
步骤101,将各分幅的测绘矢量数据以三元组的形式输入至知识图谱。
具体地,为了实现将碎片化的地理对象整合成一个完整对象,可以基于各分幅的测绘矢量数据,生成各地理实体的三元组集合、各分幅的边界线三元组和各分幅的编码三元组,并可以将地理实体的三元组集合、各分幅的边界线三元组和各分幅的编码三元组导入至知识图谱,进而可以利用知识图谱的空间查询语言搜索碎片化的地理实体和邻域地理实体等。
步骤102,基于所述知识图谱中各分幅的边界线三元组,通过所述知识图谱的空间查询语言搜索碎片化的地理实体,确定多个碎片化地理实体及各碎片化地理实体的边界标记三元组。
具体地,在输入各分幅的测绘矢量数据至知识图谱之后,可以获取各分幅的边界线三元组,边界线三元组可以表示分幅的四条边界线,进而可以基于知识图谱中各分幅的边界线三元组,通过知识图谱的空间查询语言(例如GeoSPARQL空间查询语言)判断各地理实体是否与所在分幅的边界线存在相交,以搜索出多个碎片化地理实体及各碎片化地理实体的边界标记三元组,边界标记三元组可以表示碎片化地理实体与分幅边界线的相交情况。
步骤103,基于各碎片化地理实体的边界标记三元组和所述知识图谱中各分幅的编码三元组,通过所述知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合,所述编码三元组用于表征分幅之间的相邻关系。
具体地,在输入各分幅的测绘矢量数据至知识图谱之后,可以获取各分幅的编码三元组,编码三元组可以表征分幅之间的相邻关系,进而可以针对每一个碎片化地理实体,基于碎片化地理实体的边界标记三元组和碎片化地理实体所在分幅的编码三元组,通过所述知识图谱的空间查询语言(例如GeoSPARQL空间查询语言)在邻域分幅中搜索邻域地理实体,可以获取碎片化地理实体对应的邻域地理实体集合。
步骤104,基于各碎片化地理实体和各碎片化地理实体对应的邻域地理实体集合,进行实体合并,获取各碎片化地理实体对应的目标地理实体。
具体地,在获取各碎片化地理实体对应的邻域地理实体集合之后,针对每一个碎片化地理实体,可以基于碎片化地理实体和碎片化地理实体对应的邻域地理实体集合,进行实体合并,能够获取碎片化地理实体对应的目标地理实体,该目标地理实体为合并后的地理实体,能够实现地理测绘分幅矢量数据单体化。
可以理解的是,本发明将碎片化的地理对象整合成一个完整对象的过程定义为“单体化”过程,其中,“单体”是指每一个需要单独管理的对象,是一个单独的、可以被选中的实体(Entity),该实体可以附加属性,可以被查询统计等等。通过在知识图谱中整合碎片化的地理实体,实现无歧义的单体化表达,进而可以完成知识图谱的数据层融合。
可以理解的是,相关技术中一般是在存储前,将各种碎片化、属性缺失的地理实体在知识图谱外部将其单体化后再将其导入知识图谱,这种操作往往需要使用其它地理信息***(Geographic Information Systems,GIS)开发工具来实现,效率较低。相比而言,本发明提供的地理测绘分幅矢量数据单体化方法将碎片化实体单体化的过程放在知识图谱内实现,进而可以结合知识图谱的空间查询语言(例如GeoSPARQL空间查询语言),在地理实体三元组入库的同时直接完成碎片化实体的合并。
可以理解的是,相关技术中采用深度学习算法来实现数据单体化,但训练神经网络前,需要绘制海量的数据样本,导致样本构建成本较高,而且采用深度学习算法进行数据单体化一般包括语义分割和边缘提取等多个阶段,容易造成误差累积。相比而言,本发明提供的地理测绘分幅矢量数据单体化方法,无需采用深度学习算法,实现成本较低且不存在累积误差,能够自动化高效地将碎片化的地理对象整合成一个完整对象。
可选地,为合并后的目标地理实体所创建的三元组不会覆盖原始地理实体三元组,从而保持数据的原始形态。
本发明提供的地理测绘分幅矢量数据单体化方法,通过将各分幅的测绘矢量数据以三元组的形式输入至知识图谱,可以使用知识图谱的空间查询语言搜索碎片化的地理实体,确定多个碎片化地理实体及各碎片化地理实体的边界标记三元组,进而可以针对每一个碎片化地理实体,通过知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合,进而可以对每一个碎片化地理实体,基于碎片化地理实体和碎片化地理实体对应的邻域地理实体集合,进行实体合并,获取各碎片化地理实体对应的目标地理实体,能够自动化高效地将碎片化的地理对象整合成一个完整对象,实现地理测绘分幅矢量数据单体化。
可选地,根据本发明提供的一种地理测绘分幅矢量数据单体化方法,所述基于各碎片化地理实体的边界标记三元组和所述知识图谱中各分幅的编码三元组,通过所述知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合,包括:
基于预设缓冲区配置和所述知识图谱中各碎片化地理实体的几何形态三元组,获取各碎片化地理实体的缓冲区三元组;
基于各碎片化地理实体的边界标记三元组、各碎片化地理实体的缓冲区三元组和各分幅的编码三元组,通过所述知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合。
具体地,在输入各分幅的测绘矢量数据至知识图谱之后,可以获取各地理实体的几何形态三元组和各分幅的编码三元组,编码三元组可以表征分幅之间的相邻关系,而且便于搜索图幅。在确定多个碎片化地理实体及各碎片化地理实体的边界标记三元组之后,可以针对每一个碎片化地理实体,基于预设缓冲区配置和碎片化地理实体的几何形态三元组,通过绘制缓冲区可以获取碎片化地理实体的缓冲区三元组,进而可以基于碎片化地理实体的边界标记三元组、碎片化地理实体的缓冲区三元组和碎片化地理实体所在分幅的编码三元组,通过知识图谱的空间查询语言(例如GeoSPARQL空间查询语言)在邻域分幅中搜索与碎片化地理实体的缓冲区存在相交的邻域地理实体,能够快捷地获取碎片化地理实体对应的邻域地理实体集合。
可选地,图2是本发明提供的地理测绘分幅矢量数据单体化方法的流程示意图之二,如图2所示,所述地理测绘分幅矢量数据单体化方法包括步骤201至步骤205,其中:
步骤201,将各分幅的测绘矢量数据以三元组的形式输入至知识图谱;
步骤202,基于知识图谱中各分幅的边界线三元组,通过知识图谱的空间查询语言搜索碎片化的地理实体,确定多个碎片化地理实体及各碎片化地理实体的边界标记三元组;
步骤203,基于预设缓冲区配置和知识图谱中各碎片化地理实体的几何形态三元组,获取各碎片化地理实体的缓冲区三元组;
步骤204,基于各碎片化地理实体的边界标记三元组、各碎片化地理实体的缓冲区三元组和各分幅的编码三元组,通过知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合;
步骤205,基于各碎片化地理实体和各碎片化地理实体对应的邻域地理实体集合,进行实体合并,获取各碎片化地理实体对应的目标地理实体。
可选地,根据本发明提供的一种地理测绘分幅矢量数据单体化方法,所述预设缓冲区配置包括预设缓冲距离,所述碎片化地理实体为点要素、线要素或面要素,所述基于预设缓冲区配置和所述知识图谱中各碎片化地理实体的几何形态三元组,获取各碎片化地理实体的缓冲区三元组,包括:
基于所述预设缓冲距离和各碎片化地理实体的几何形态三元组,通过在碎片化地理实体周围绘制缓冲区边界,生成各碎片化地理实体的缓冲区三元组。
具体地,碎片化地理实体可以为点要素、线要素或面要素,可以根据碎片化地理实体所属的要素类型,绘制对应类型的缓冲区,例如在碎片化地理实体为点要素的情况下,可以通过在点要素周围绘制缓冲区边界,生成点要素缓冲区及对应的三元组;例如在碎片化地理实体为线要素的情况下,可以通过在线要素周围绘制缓冲区边界,生成线要素缓冲区及对应的三元组;例如在碎片化地理实体为面要素的情况下,可以通过在面要素周围绘制缓冲区边界,生成面要素缓冲区及对应的三元组。
因此,可以根据碎片化地理实体所属的要素类型,绘制对应类型的缓冲区,使得获取到的缓冲区与碎片化地理实体相适应,合适的缓冲区有助于快捷准确地在邻域分幅中搜索到邻域地理实体。
可选地,根据本发明提供的一种地理测绘分幅矢量数据单体化方法,所述基于各碎片化地理实体的边界标记三元组、各碎片化地理实体的缓冲区三元组和各分幅的编码三元组,通过所述知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合,包括:
针对各碎片化地理实体,基于预设筛选配置、所述碎片化地理实体的边界标记三元组、所述碎片化地理实体的缓冲区三元组和所述碎片化地理实体所在分幅的编码三元组,通过所述知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取所述碎片化地理实体对应的邻域地理实体集合;
所述预设筛选配置包括:所述邻域地理实体与所述碎片化地理实体的缓冲区存在空间相交,所述邻域地理实体与所述碎片化地理实体具有相同的地物类型,所述邻域地理实体与所述碎片化地理实体具有相同的几何形态,所述邻域地理实体的边界相交位置与所述碎片化地理实体的边界相交位置存在重合。
具体地,碎片化地理实体对应的邻域地理实体是可能需要与碎片化地理实体进行合并的地理实体,对于某一地理实体,如果该地理实体与碎片化地理实体的缓冲区存在空间相交,且该地理实体与碎片化地理实体具有相同的地物类型,且该地理实体与碎片化地理实体具有相同的几何形态,且该地理实体的边界相交位置与碎片化地理实体的边界相交位置存在重合,则该地理实体是可能需要与碎片化地理实体进行合并的地理实体,也即邻域地理实体,可以依据此设置对应的预设筛选配置。
具体地,在获取各碎片化地理实体的缓冲区三元组之后,可以针对每一个碎片化地理实体,可以基于预设筛选配置、碎片化地理实体的边界标记三元组、碎片化地理实体的缓冲区三元组和碎片化地理实体所在分幅的编码三元组,通过知识图谱的空间查询语言(例如GeoSPARQL空间查询语言)在邻域分幅中搜索满足上述预设筛选配置所列条件的邻域地理实体,可以获取碎片化地理实体对应的邻域地理实体集合。
因此,可以将邻域地理实体与碎片化地理实体之间的特定关系设置为预设筛选配置,利用预设筛选配置和知识图谱的空间查询语言,能够快捷准确地在邻域分幅中搜索到邻域地理实体。
可选地,根据本发明提供的一种地理测绘分幅矢量数据单体化方法,所述基于各碎片化地理实体和各碎片化地理实体对应的邻域地理实体集合,进行实体合并,获取各碎片化地理实体对应的目标地理实体,包括:
针对各碎片化地理实体,通过比较地理实体的名称,判断所述碎片化地理实体对应的邻域地理实体集合中是否存在待合并的地理实体;
若确定所述碎片化地理实体对应的邻域地理实体集合中存在一个或多个待合并的地理实体,则将所述一个或多个待合并的地理实体与所述碎片化地理实体进行实体合并,确定所述碎片化地理实体对应的目标地理实体。
具体地,在获取各碎片化地理实体对应的邻域地理实体集合之后,针对每一个碎片化地理实体,可以通过比较碎片化地理实体的名称与各邻域地理实体的名称是否相同(名称相同的邻域地理实体可以作为待合并的地理实体),来判断碎片化地理实体对应的邻域地理实体集合中是否存在待合并的地理实体,若存在名称相同的邻域地理实体,则可以确定存在待合并的地理实体,进而可以将各待合并的地理实体与碎片化地理实体进行实体合并,能够获取碎片化地理实体对应的目标地理实体,该目标地理实体为合并后的地理实体。
因此,通过比较碎片化地理实体的名称与各邻域地理实体的名称是否相同,可以从邻域地理实体集合中筛选出待合并的地理实体(进一步排除与碎片化地理实体不是一个整体的邻域地理实体,保障实体合并的准确性),进而各待合并的地理实体与碎片化地理实体进行实体合并,能够实现准确地获取碎片化地理实体对应的目标地理实体。
可选地,根据本发明提供的一种地理测绘分幅矢量数据单体化方法,所述将所述一个或多个待合并的地理实体与所述碎片化地理实体进行实体合并,确定所述碎片化地理实体对应的目标地理实体,包括:
针对各待合并的地理实体,通过所述知识图谱的空间查询语言搜索地理实体在目标边界线上的坐标点,确定所述碎片化地理实体在所述目标边界线上的第一坐标点集合,以及所述待合并的地理实体在所述目标边界线上的第二坐标点集合;
基于所述第一坐标点集合和所述第二坐标点集合,通过距离最近的配对方式,确定所述第一坐标点集合中各坐标点和所述第二坐标点集合中各坐标点之间的配对关系;
基于所述配对关系,合并所述待合并的地理实体与所述碎片化地理实体。
具体地,目标边界线可以是既与碎片化地理实体相交也与待合并的地理实体相交的一条边界线,可以通过知识图谱的空间查询语言(例如GeoSPARQL空间查询语言)搜索地理实体在目标边界线上的坐标点,可以确定碎片化地理实体与目标边界线相交的坐标点集合(也即第一坐标点集合),以及确定待合并的地理实体在目标边界线相交的坐标点集合(也即第二坐标点集合),进而可以通过距离最近的配对方式,确定第一坐标点集合中各坐标点和第二坐标点集合中各坐标点之间的配对关系,进而基于该配对关系,能够高效地合并待合并的地理实体与碎片化地理实体。
可以理解的是,本发明提供的地理测绘分幅矢量数据单体化方法,可以将分幅碎片化地理实体在知识图谱中整合为一个节点,当地理实体以三元组的形式存入知识图谱时,首先判断获取位于图幅边界的地理实体,并基于该中心地理实体的空间范围创建一个缓冲区,遍历所有与该缓冲区相交的,且边界标记(FlagOfEdge)相互对应的地理实体,然后将所有与中心地理实体具有相同矢量类型的地理实体(同为面矢量、线矢量或点矢量)抽取出来,作为候选邻域地理实体集合,最后可以基于空间推理规则判断中心地理实体和候选集合中的哪个实体在被碎片化前是同一个地理实体,然后将二者合并,进而实现碎片化的地理实体在知识图谱中的合并存储。
可以理解的是,由于人工勾绘误差,使得图幅交界处绘制的矢量线段不能分毫不差地对接上,本发明提供的地理测绘分幅矢量数据单体化方法通过确定配对关系,可以基于配对关系,高效地合并待合并的地理实体与碎片化地理实体,减小因为人工分幅绘制矢量而导致的实体合并边界误差,从而使得知识图谱中被单体化的地理实体与实际地物在空间范围上最大程度吻合。
可选地,根据本发明提供的一种地理测绘分幅矢量数据单体化方法,所述知识图谱的模式层包括:测绘矢量本体,所述测绘矢量本体包括时间对象、空间对象和属性对象,所述属性对象包括地理实体名称、地理实体类别、地理实体度量指标、用于记录地理实体所在分幅的序列编号、地理实体缓冲区、边界标记和用于指示是否为经过合并的地理实体的合并标记;
所述将各分幅的测绘矢量数据以三元组的形式输入至知识图谱,包括:
基于所述测绘矢量本体和各分幅的测绘矢量数据,生成各地理实体的三元组集合、各分幅的边界线三元组和各分幅的编码三元组;
输入各地理实体的三元组集合、各分幅的边界线三元组和各分幅的编码三元组至所述知识图谱。
具体地,可以预先构建知识图谱的模式层,进而可以基于模式层中测绘矢量本体和各分幅的测绘矢量数据,通过建立地理对象与模式层概念术语之间的关系,生成描述地理实体的三元组集合,还可以生成各分幅的边界线三元组和各分幅的编码三元组,进而可以将地理实体的三元组集合、各分幅的边界线三元组和各分幅的编码三元组导入至知识图谱,进而能够利用知识图谱的空间查询语言高效地搜索碎片化的地理实体和邻域地理实体等。
可选地,可以为合并后的目标地理实体所创建合并标记三元组,以指示该目标地理实体为经过合并的地理实体,用合并标记三元组区分合并与未合并的地理实体,从而为导入知识图谱的地理实体做了质量标记,以便于高效地筛选合并完的地理实体。
可选地,知识图谱的构建过程可以包括:模式层构建和实例层构建。
(1)模式层构建;
一个地理对象包含的概念可以分为时间概念、空间概念和属性概念。本质上是将地理对象分别在时间、空间、属性三个层面分别进行概念的描述。图3是本发明提供的测绘矢量本体的示意图,如图3所示,可以构建一个包含时间对象(TimeObject)、空间对象(SpatialObject)和属性对象(PropertyObject)的测绘矢量本体(Mapping VectorOntology)。
针对时间对象,可以复用开放地理空间信息联盟(OGC)发布的基于OWL语言的时间本体OWL-Time。该本体用于描述世界上或web页面中资源的时间属性,规定其超类为时间对象(TimeObject)。
针对空间对象,可以复用OGC提出的GeoSPARQL标准,该标准支持在语义web上表示和查询地理空间数据。GeoSPARQL定义了用资源描述框架(RDF)表示的地理空间数据词汇表,并定义了用于处理地理空间数据的SPARQL查询语言的扩展。此外,GeoSPARQL被设计用于容纳基于定性空间推理的***和基于定量空间计算的***。其中,空间对象(SpatialObject)是最顶层的超类,包含特征(Feature)和几何形态(Geometry)两个子类。
针对属性对象,可以从地物的类别、缓冲区的坐标范围和地物度量指标三个方面构建属性对象。图4是本发明提供的测绘矢量本体的属性对象的示意图,如图4所示,该本体的最顶层为属性对象(PropertyObject),其下面主要包括如下7类(其中,后三类是针对被地图图幅边框所切分的地理碎片开展单体化工作所设计):
(a)地理实体名称(Name):“Name”用于记录该地理实体的名字,用于后续碎片化地理实体的筛选与合并;
(b)地理实体类别(TypesOfObject):“TypesOfObject”下的种类由地物种类来决定,例如“Building”(建筑物)、“River”(河流)、“Road”(道路)等“TypesOfObject”类用于在后续的单体化步骤中判断中心地理实体和周边地理实体是否为同一种地物类型,从而排除掉非同类地物、缩小搜索范围;
(c)地理实体度量指标(Metrics):“Metrics”下面是“Length”(长度)和“Area”(面积),分别用来衡量线矢量的长度和面矢量的面积。“Metrics”类用于衡量地理实体的几何形态指标,当地理实体在单体化时,往往会将多个碎片化的地理实体相合并,因此实体面积、长度等指标也发生变化;
(d)用于记录地理实体所在分幅的序列编号(SerialNumber):“SerialNumber”用于记录该幅测绘地理数据的编号,便于后续对指定图幅的索引;
(e)地理实体缓冲区(Buffer):“Buffer”下面是“WKT”属性(存储缓冲区范围的WKT字符串);“Buffer”类用于描述以地理实体为中心的缓冲区坐标范围,并将其以三元组的形式存储到知识图谱中;
(f)边界标记(FlagOfEdge):“FlagOfEdge”用于标记与该碎片化实体相交的边,是图幅边界的哪条边,以便于后续定位合并碎片化地理实体的位置;
(g)用于指示是否为经过合并的地理实体的合并标记(Merge):“Merge”用于记录单体化后的地理实体,如果导入的地理实体是经过单体化操作的新地理实体,那么需要增加Merge标签的三元组。该三元组的属性:subject为地理实体,predicate为“Merge”,object为“True”。
可以理解的是,按照以上的结构设计知识图谱概念层,知识本体概念框架构建的过程是使用protégé等资源描述框架(Resource Description Framework,RDF)语言编辑工具将概念树转换为本体。以protégé工具为例说明实施方式,它是一种广泛使用的工具,可以帮助用户创建和编辑本体。它提供了一个模型构建器来定义实体、实体之间的关系以及目标领域中的实体属性。在本发明中,可以使用protégé创建测绘矢量本体的概念,包括类的层次关系,对象属性和类的数据属性,将构建的本体导出为RDF文件。
(2)实例层构建;
图5是本发明提供的矢量数据转换为三元组的流程示意图,如图5所示,测绘矢量数据通常有很多种格式,可以将所有格式的矢量数据(例如:Shapefile、KML、KMZ等)通过转换程序转换为GeoJSON格式的数据。GeoJSON格式的数据相比矢量数据,其所占空间小,便于存储。在这些GeoJSON文件中,每个地理对象被归类为一个特征(Feature),特征中既包含了地理对象的几何形态(geometry)又包含了地理对象的属性(properties)信息。几何形态描述了这个地理对象的几何类型和空间位置信息,属性描述了地理对象所包含的各类时间信息、地理对象的类别标签以及这一类别的地理对象所特有的其他属性信息。通过建立地理对象与模式层概念术语之间的关系,生成描述地理实体的RDF三元组集合。可以通过编写自动化程序完成GeoJSON格式的地理对象数据到地理实体三元组的转化。
以下为本发明的一个可选的示例,但不作为对本发明的限定。
可选地,图6是本发明提供的地理测绘分幅矢量数据单体化方法的流程示意图之三,如图6所示,在该示例中,地理测绘分幅矢量数据单体化方法包括:步骤601至步骤605。
步骤601,将各分幅的测绘矢量数据以三元组的形式输入至知识图谱。
具体地,针对分幅的测绘矢量数据,可以将一幅数据内的所有矢量按照实例层构建的方式转换为三元组并导入知识图谱,其中需要转换的三元组包括各地理实体的三元组集合、各分幅的边界线三元组和各分幅的编码三元组。
(1)对于各地理实体的三元组集合,可以将GeoJSON格式的地理实体的几何形态信息(geometry)和地理对象属性信息(properties)转换为三元组,并导入进知识图谱。
(2)对于各分幅的边界线三元组,可以将图幅的上、下、左、右四条边以线矢量的形式转换为记录其坐标的三元组(Well-known text,WKT)并导入知识图谱,用于后续搜索图幅中碎片化地理实体。
可以理解的是,WKT是一种文本标记语言,用于表示矢量几何对象、空间参照***及空间参照***之间的转换。在GeoSPARQL本体中,“Geometry”类下面有“as WKT”这个数据属性,用于表示地理实体的空间范围。
例如:当地理实体是点状矢量(POINT)时候,其代表坐标的WKT字符串为POINT{(经度1,纬度1)},例如“POINT{(113.014621,28.059655)}”;当地理实体是线状矢量(LINE)时,其代表坐标的WKT字符串为LINE{(经度1,纬度1),(经度2,纬度2),...,(经度n,纬度n)},这代表了该线矢量从一端到另一端所有顶点的顺次坐标集合;当地理实体是面矢量(POLYGON)时,其代表坐标的WKT字符串为POLYGON{(经度1,纬度1),(经度2,纬度2),...,(经度n,纬度n),(经度1,纬度1)},这代表了从面矢量的一个顶点出发顺次遍历各个顶点,最终又回到初始顶点的所有坐标点集合。包含WKT信息的建筑物坐标信息三元组示例:(Building_AED07F69_RecordingGeom,asWKT,POLYGON{(113.014621,28.059655),…,(113.014621,28.059655)})。
(2)对于各分幅的编码三元组,通过导入图幅编码三元组,可以方便后续进行邻域图幅的判断检索。
例如,对于有标准编码规则的图幅,编码可以有十位编号:X1X2X3X4X5X6X7X8X9X10,可以将其编码以三元组的形式导入知识图谱,例如:(picA,SerialNumber,H51G018025),基于每个图幅的编码三元组,可以用过Sparql语言来查询每个图幅的四邻域图幅是什么。例如:当前图幅的编码为H51G018025,若需要获得其四邻域的图幅,则可以利用Sparql语言查询当前图幅的SerialNumber三元组的图幅编码节点,从而读取到该图幅的编码。该编码的X5X6X7数值加1,为当前图幅的下邻域图幅,X5X6X7数值减1,为当前图幅的上邻域图幅,X8X9X10数值加1,为当前图幅的右邻域图幅,X8X9X10数值减1,为当前图幅的左邻域图幅。进而可以使用Sparql语言查询带有上述四种编码三元组的图幅,从而获得中心图幅的四邻域。
步骤602,利用知识图谱中GeoSPARQL空间查询语言,搜索图幅中碎片化地理实体,获取碎片化地理实体集合S。
具体地,基于碎片化地理实***于图幅边界,并且与图幅边缘相交这一事实,可以使用GeoSPARQL标准中的“Spatial Object”类下的“intersects”属性来分别判断该图幅的四条边界线矢量与图幅内哪些实体在空间上相交。在“PropertyObject”的“FlagOfEdge”属性中,当实体与图幅上边界相交时,记作字符串“top”,与下边界相交记作“down”,与左侧和右侧边界相交分别记作“left”和“right”。并可以基于相交标记,生成记录着相交边的位置的三元组(也即边界标记三元组),从而以三元组的形式记录着某一地理实体究竟与图幅的哪个边相交。
例如:当一个地理实体“River1”与图幅的上边界和左边界都相交时,则通过GeoSPARQL查询并生成(River1,FlagOfEdge,“top,left”),并将该三元组存入知识图谱中。不与图幅边界相交的地理实体,不存在该类型三元组。
经过GeoSPARQL查询后,图幅中与边界相交的地理实体记为s1,s2,…,sn等,所有相交地理实体构成碎片化地理实体集合S。集合S中的地理实体为碎片化,需要被单体化的地理实体。
步骤603,基于预设缓冲距离R和碎片化地理实体集合S,获取各碎片化地理实体的缓冲区三元组并存入知识图谱。
具体地,基于碎片化地理实体集合S,可以分别对其中的地理实体s1,s2,…,sn等创建对应半径为r1,r2,…,rn的缓冲区,这些半径构成半径集合R。
可选地,图7是本发明提供的生成缓冲区的示意图之一,如图7所示,若地理实体s是点要素时,构建的缓冲区为以该点要素为圆心,创建一个半径为r的圆形缓冲区。可以将生成的缓冲区,对应到“PropertyObject”类中的“Buffer”类,并将缓冲区WKT字符串形式的坐标范围转换为三元组存入知识图谱中,从而S中每个地理实体的缓冲区均以三元组的形式记录在知识图谱中。
可选地,图8是本发明提供的生成缓冲区的示意图之二,如图8所示,当地理实体是线要素时,以该线要素的WKT字符串中的每个坐标点为圆心做半径为r的圆,然后按照WKT字符串的坐标顺序为每两个相邻的圆做两条公切线,公切线与圆所围成的区域是线要素的缓冲区。
可选地,图9是本发明提供的生成缓冲区的示意图之三,当地理实体是面要素时,且该面要素的WKT字符串有a个坐标点时,取前a-1个坐标点为圆心,做半径为r的圆,然后按照WKT字符串的坐标顺序为每两个相邻的圆做一条外部公切线,将外部公切线与圆所围成的区域是面要素的缓冲区。
步骤604,依据已有缓冲区,采用GeoSPARQL在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合T。
具体地,对于碎片化地理实体集合S,可以利用SPARQL语言查询图幅的编码三元组来找到邻域图幅,并逐个提取其相邻图幅中的待单体化碎片实体。
例如,以集合S中一个地理实体s1为例,可以将其设置为中心地理实体。利用SPARQL语言查询其“FlagOfEdge”属性的值,根据该属性值判断该地理实体与其所在图幅的哪些边相交。以当前图幅为中心,其上、下、左、右图幅被称为四邻域,其中:
(1)若中心地理实体的“FlagOfEdge”的值为“top”,说明该实体与图幅的上边界相交,然后使用SPARQL语句按照图幅编码规则(SerialNumber三元组),将位于上邻域图幅且“FlagOfEdge”值为“down”的地理实体查询出来,这些地理实体可能要与中心地理实体合并;
(2)若中心地理实体的“FlagOfEdge”值为“down”,说明该实体与图幅的下边界相交,然后使用SPARQL语句按照图幅编码规则,将位于下邻域图幅且“FlagOfEdge”值为“up”的地理实体查询出来,这些地理实体可能要与中心地理实体合并;
(3)若中心地理实体的“FlagOfEdge”值为“left”,说明该实体与图幅的左边界相交,然后使用SPARQL语句按照图幅编码规则,将位于左邻域图幅且“FlagOfEdge”值为“right”的地理实体查询出来,这些地理实体可能要与中心地理实体合并;
(4)若中心地理实体的“FlagOfEdge”值为“right”,说明该实体与图幅的右边界相交,然后使用SPARQL语句按照图幅编码规则,将位于右邻域图幅且“FlagOfEdge”值为“left”的地理实体查询出来,这些地理实体可能要与中心地理实体合并。
基于以上规则,为地理实体s1查询满足如下条件的邻域图幅中的地理实体:(与地理实体s1的缓冲区空间相交)∩(与地理实体s1具有相同的地物类型(TypesOfObject)和几何形态(Geometry))∩(与地理实体s1满足上述FlagOfEdge值的对应关系(也即与地理实体s1的边界相交位置存在重合))。按照该方法对S中的每个地理实体都做查询,经过查询后,将S中的每个地理实体s1,s2,...,sn所对应的邻域图幅实体集合记为T1,T2,…,Tn。
可以将查询获得的结果分别与S中的地理实体构成“碎片化实体—邻域实体集合”对,即:s1—T1,s2—T2,…,sn—Tn。
可以理解的是,碎片化地理实体集合S中碎片化地理实体的FlagOfEdge值与邻域图幅地理实体集合T中FlagOfEdge值对应关系,如表1所示。
表1 FlagOfEdge值对应关系表
步骤605,依据碎片化地理实体集合S中各碎片化地理实体对应的邻域地理实体集合T合并地理实体。
具体地,以集合S中一个地理实体s1为例,说明合并地理实体的过程。
(1)利用SPARQL语句在T1中查询与s1具有相同“Name”属性的地理实体q1,说明s1与q1是同一个地物,需要被合并。再以GeoSPARQL中的intersects属性为依据,利用GeoSPARQL查询s1和q1的WKT字符串中与s1和q1所在图幅相交边线矢量相交的坐标点集合B1{(xb1,yb1),(xb2,yb12),...,(xbn,ybn)},C1{(xc1,yc1),(xc2,yc2),...,(xcn,ycn)}。
(2)将B1与C1中的坐标点,按照距离最近的原则两两配对,以经纬度表达的坐标系为例,其距离计算方法如下公式:
(3)依据配对的点将碎片化的地理实体在空间上合并,其中:
(a)对于两个需要合并的点矢量,可以取它们空间上的中点作为合并后新的点矢量,并为该合并的新点矢量创建几何形态信息(geometry)、地理属性信息(properties)以及标志着该实体为合并后地理实体的“Merge”三元组,例如:(new_point1,Merge,True);
(b)对于两个需要合并的线矢量,可以直接将线矢量的匹配点相连接,合并成一个新的线矢量,并为该合并的新线矢量创建几何形态信息,地理属性信息和“Merge”属性三元组。其几何形态的WKT属性(asWKT)和“Metrics”下的“Length”属性发生变化;
(c)对于两个需要合并的面矢量,可以将面矢量间匹配的点相连接,将两个面矢量合并成一个新的面矢量,并为其创建几何形态信息,地理属性信息和“Merge”属性三元组。其几何形态的WKT属性(asWKT)和“Metrics”下的“Area”属性发生变化,新的WKT字符串中的坐标遍历方向与合并前相同。
可以理解的是,以上合并后的实体创建的三元组并不会覆盖原始地理实体三元组,从而可以保持数据的原始形态。
例如,图10是本发明提供的待合并的面矢量地理实体的示意图之一,图11是本发明提供的待合并的面矢量地理实体的示意图之二,图12是本发明提供的合并后的面矢量地理实体的示意图,如图10-12所示,river1和river2是两个待合并的面矢量地理实体,其中(x1,y1)与(x5,y5)配对,(x2,y2)与(x8,y8)配对。river1原始的三元组包括(river1,asWKT,{(x3,y3),(x1,y1),(x2,y2),(x4,y4),(x3,y3)}),(river1,Area,S1);river2原始的三元组包括(river2,asWKT,{(x5,y5),(x6,y6),(x7,y7),(x8,y8),(x5,y5)}),(river2,Area,S2)。当二者合并后,新生成的三元组为(river_merge,asWKT,{(x3,y3),(x1,y1),(x5,y5),(x6,y6),(x7,y7),(x8,y8),(x2,y2),(x4,y4),(x3,y3)}),(river_merge,Area,S1+S2),(river_merge,Merge,True)。
本发明提供的地理测绘分幅矢量数据单体化方法,通过将各分幅的测绘矢量数据以三元组的形式输入至知识图谱,可以使用知识图谱的空间查询语言搜索碎片化的地理实体,确定多个碎片化地理实体及各碎片化地理实体的边界标记三元组,进而可以针对每一个碎片化地理实体,通过知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合,进而可以对每一个碎片化地理实体,基于碎片化地理实体和碎片化地理实体对应的邻域地理实体集合,进行实体合并,获取各碎片化地理实体对应的目标地理实体,能够自动化高效地将碎片化的地理对象整合成一个完整对象,实现地理测绘分幅矢量数据单体化。
下面对本发明提供的地理测绘分幅矢量数据单体化装置进行描述,下文描述的地理测绘分幅矢量数据单体化装置与上文描述的地理测绘分幅矢量数据单体化方法可相互对应参照。
图13是本发明提供的地理测绘分幅矢量数据单体化装置的结构示意图,如图13所示,所述装置包括输入模块1301,确定模块1302,第一获取模块1303和第二获取模块1304,其中:
输入模块1301,用于将各分幅的测绘矢量数据以三元组的形式输入至知识图谱;
确定模块1302,用于基于所述知识图谱中各分幅的边界线三元组,通过所述知识图谱的空间查询语言搜索碎片化的地理实体,确定多个碎片化地理实体及各碎片化地理实体的边界标记三元组;
第一获取模块1303,用于基于各碎片化地理实体的边界标记三元组和所述知识图谱中各分幅的编码三元组,通过所述知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合,所述编码三元组用于表征分幅之间的相邻关系;
第二获取模块1304,用于基于各碎片化地理实体和各碎片化地理实体对应的邻域地理实体集合,进行实体合并,获取各碎片化地理实体对应的目标地理实体。
本发明提供的地理测绘分幅矢量数据单体化装置,通过将各分幅的测绘矢量数据以三元组的形式输入至知识图谱,可以使用知识图谱的空间查询语言搜索碎片化的地理实体,确定多个碎片化地理实体及各碎片化地理实体的边界标记三元组,进而可以针对每一个碎片化地理实体,通过知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合,进而可以对每一个碎片化地理实体,基于碎片化地理实体和碎片化地理实体对应的邻域地理实体集合,进行实体合并,获取各碎片化地理实体对应的目标地理实体,能够自动化高效地将碎片化的地理对象整合成一个完整对象,实现地理测绘分幅矢量数据单体化。
图14是本发明提供的电子设备的结构示意图,如图14所示,该电子设备可以包括:处理器(processor)1410、通信接口(Communications Interface)1420、存储器(memory)1430和通信总线1440,其中,处理器1410,通信接口1420,存储器1430通过通信总线1440完成相互间的通信。处理器1410可以调用存储器1430中的逻辑指令,以执行地理测绘分幅矢量数据单体化方法,该方法包括:
将各分幅的测绘矢量数据以三元组的形式输入至知识图谱;
基于所述知识图谱中各分幅的边界线三元组,通过所述知识图谱的空间查询语言搜索碎片化的地理实体,确定多个碎片化地理实体及各碎片化地理实体的边界标记三元组;
基于各碎片化地理实体的边界标记三元组和所述知识图谱中各分幅的编码三元组,通过所述知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合,所述编码三元组用于表征分幅之间的相邻关系;
基于各碎片化地理实体和各碎片化地理实体对应的邻域地理实体集合,进行实体合并,获取各碎片化地理实体对应的目标地理实体。
此外,上述的存储器1430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的地理测绘分幅矢量数据单体化方法,该方法包括:
将各分幅的测绘矢量数据以三元组的形式输入至知识图谱;
基于所述知识图谱中各分幅的边界线三元组,通过所述知识图谱的空间查询语言搜索碎片化的地理实体,确定多个碎片化地理实体及各碎片化地理实体的边界标记三元组;
基于各碎片化地理实体的边界标记三元组和所述知识图谱中各分幅的编码三元组,通过所述知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合,所述编码三元组用于表征分幅之间的相邻关系;
基于各碎片化地理实体和各碎片化地理实体对应的邻域地理实体集合,进行实体合并,获取各碎片化地理实体对应的目标地理实体。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种地理测绘分幅矢量数据单体化方法,其特征在于,包括:
将各分幅的测绘矢量数据以三元组的形式输入至知识图谱;
基于所述知识图谱中各分幅的边界线三元组,通过所述知识图谱的空间查询语言搜索碎片化的地理实体,确定多个碎片化地理实体及各碎片化地理实体的边界标记三元组;
基于各碎片化地理实体的边界标记三元组和所述知识图谱中各分幅的编码三元组,通过所述知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合,所述编码三元组用于表征分幅之间的相邻关系;
基于各碎片化地理实体和各碎片化地理实体对应的邻域地理实体集合,进行实体合并,获取各碎片化地理实体对应的目标地理实体。
2.根据权利要求1所述地理测绘分幅矢量数据单体化方法,其特征在于,所述基于各碎片化地理实体的边界标记三元组和所述知识图谱中各分幅的编码三元组,通过所述知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合,包括:
基于预设缓冲区配置和所述知识图谱中各碎片化地理实体的几何形态三元组,获取各碎片化地理实体的缓冲区三元组;
基于各碎片化地理实体的边界标记三元组、各碎片化地理实体的缓冲区三元组和各分幅的编码三元组,通过所述知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合。
3.根据权利要求2所述地理测绘分幅矢量数据单体化方法,其特征在于,所述预设缓冲区配置包括预设缓冲距离,所述碎片化地理实体为点要素、线要素或面要素,所述基于预设缓冲区配置和所述知识图谱中各碎片化地理实体的几何形态三元组,获取各碎片化地理实体的缓冲区三元组,包括:
基于所述预设缓冲距离和各碎片化地理实体的几何形态三元组,通过在碎片化地理实体周围绘制缓冲区边界,生成各碎片化地理实体的缓冲区三元组。
4.根据权利要求2所述地理测绘分幅矢量数据单体化方法,其特征在于,所述基于各碎片化地理实体的边界标记三元组、各碎片化地理实体的缓冲区三元组和各分幅的编码三元组,通过所述知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合,包括:
针对各碎片化地理实体,基于预设筛选配置、所述碎片化地理实体的边界标记三元组、所述碎片化地理实体的缓冲区三元组和所述碎片化地理实体所在分幅的编码三元组,通过所述知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取所述碎片化地理实体对应的邻域地理实体集合;
所述预设筛选配置包括:所述邻域地理实体与所述碎片化地理实体的缓冲区存在空间相交,所述邻域地理实体与所述碎片化地理实体具有相同的地物类型,所述邻域地理实体与所述碎片化地理实体具有相同的几何形态,所述邻域地理实体的边界相交位置与所述碎片化地理实体的边界相交位置存在重合。
5.根据权利要求1所述地理测绘分幅矢量数据单体化方法,其特征在于,所述基于各碎片化地理实体和各碎片化地理实体对应的邻域地理实体集合,进行实体合并,获取各碎片化地理实体对应的目标地理实体,包括:
针对各碎片化地理实体,通过比较地理实体的名称,判断所述碎片化地理实体对应的邻域地理实体集合中是否存在待合并的地理实体;
若确定所述碎片化地理实体对应的邻域地理实体集合中存在一个或多个待合并的地理实体,则将所述一个或多个待合并的地理实体与所述碎片化地理实体进行实体合并,确定所述碎片化地理实体对应的目标地理实体。
6.根据权利要求5所述地理测绘分幅矢量数据单体化方法,其特征在于,所述将所述一个或多个待合并的地理实体与所述碎片化地理实体进行实体合并,确定所述碎片化地理实体对应的目标地理实体,包括:
针对各待合并的地理实体,通过所述知识图谱的空间查询语言搜索地理实体在目标边界线上的坐标点,确定所述碎片化地理实体在所述目标边界线上的第一坐标点集合,以及所述待合并的地理实体在所述目标边界线上的第二坐标点集合;
基于所述第一坐标点集合和所述第二坐标点集合,通过距离最近的配对方式,确定所述第一坐标点集合中各坐标点和所述第二坐标点集合中各坐标点之间的配对关系;
基于所述配对关系,合并所述待合并的地理实体与所述碎片化地理实体。
7.根据权利要求1至6任一项所述地理测绘分幅矢量数据单体化方法,其特征在于,所述知识图谱的模式层包括:测绘矢量本体,所述测绘矢量本体包括时间对象、空间对象和属性对象,所述属性对象包括地理实体名称、地理实体类别、地理实体度量指标、用于记录地理实体所在分幅的序列编号、地理实体缓冲区、边界标记和用于指示是否为经过合并的地理实体的合并标记;
所述将各分幅的测绘矢量数据以三元组的形式输入至知识图谱,包括:
基于所述测绘矢量本体和各分幅的测绘矢量数据,生成各地理实体的三元组集合、各分幅的边界线三元组和各分幅的编码三元组;
输入各地理实体的三元组集合、各分幅的边界线三元组和各分幅的编码三元组至所述知识图谱。
8.一种地理测绘分幅矢量数据单体化装置,其特征在于,包括:
输入模块,用于将各分幅的测绘矢量数据以三元组的形式输入至知识图谱;
确定模块,用于基于所述知识图谱中各分幅的边界线三元组,通过所述知识图谱的空间查询语言搜索碎片化的地理实体,确定多个碎片化地理实体及各碎片化地理实体的边界标记三元组;
第一获取模块,用于基于各碎片化地理实体的边界标记三元组和所述知识图谱中各分幅的编码三元组,通过所述知识图谱的空间查询语言在邻域分幅中搜索邻域地理实体,获取各碎片化地理实体对应的邻域地理实体集合,所述编码三元组用于表征分幅之间的相邻关系;
第二获取模块,用于基于各碎片化地理实体和各碎片化地理实体对应的邻域地理实体集合,进行实体合并,获取各碎片化地理实体对应的目标地理实体。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述地理测绘分幅矢量数据单体化方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述地理测绘分幅矢量数据单体化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310391296.3A CN116108059B (zh) | 2023-04-13 | 2023-04-13 | 地理测绘分幅矢量数据单体化方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310391296.3A CN116108059B (zh) | 2023-04-13 | 2023-04-13 | 地理测绘分幅矢量数据单体化方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116108059A CN116108059A (zh) | 2023-05-12 |
CN116108059B true CN116108059B (zh) | 2023-07-14 |
Family
ID=86256585
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310391296.3A Active CN116108059B (zh) | 2023-04-13 | 2023-04-13 | 地理测绘分幅矢量数据单体化方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116108059B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116701679B (zh) * | 2023-08-03 | 2023-10-10 | 智成时空(西安)创新科技有限公司 | 倾斜摄影数据存储方法及*** |
CN118115632A (zh) * | 2024-04-28 | 2024-05-31 | 山东省国土测绘院 | 一种跨区域地理实体数据协调处理方法及*** |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492606A (zh) * | 2018-11-26 | 2019-03-19 | 上海同繁勘测工程科技有限公司 | 多光谱矢量图获取方法及***、三维单体化方法及*** |
CN114049462A (zh) * | 2021-11-09 | 2022-02-15 | 中国人民解放军61646部队 | 一种三维模型单体化方法及装置 |
WO2022041226A1 (zh) * | 2020-08-31 | 2022-03-03 | 西门子(中国)有限公司 | 一种基于知识图谱的数据融合方法、装置及电子设备 |
CN114564966A (zh) * | 2022-03-04 | 2022-05-31 | 中国科学院地理科学与资源研究所 | 一种基于知识图谱的空间关系语义分析的方法 |
-
2023
- 2023-04-13 CN CN202310391296.3A patent/CN116108059B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492606A (zh) * | 2018-11-26 | 2019-03-19 | 上海同繁勘测工程科技有限公司 | 多光谱矢量图获取方法及***、三维单体化方法及*** |
WO2022041226A1 (zh) * | 2020-08-31 | 2022-03-03 | 西门子(中国)有限公司 | 一种基于知识图谱的数据融合方法、装置及电子设备 |
CN114049462A (zh) * | 2021-11-09 | 2022-02-15 | 中国人民解放军61646部队 | 一种三维模型单体化方法及装置 |
CN114564966A (zh) * | 2022-03-04 | 2022-05-31 | 中国科学院地理科学与资源研究所 | 一种基于知识图谱的空间关系语义分析的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116108059A (zh) | 2023-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116108059B (zh) | 地理测绘分幅矢量数据单体化方法、装置及电子设备 | |
US12032546B2 (en) | Systems and methods for populating a structured database based on an image representation of a data table | |
Du et al. | Large-scale urban functional zone mapping by integrating remote sensing images and open social data | |
CN113434623B (zh) | 一种基于多源异构空间规划数据的融合方法 | |
CN110990590A (zh) | 一种基于强化学习和迁移学习的动态金融知识图谱构建方法 | |
Duan et al. | Automatic alignment of contemporary vector data and georeferenced historical maps using reinforcement learning | |
CN109684428A (zh) | 空间数据建设方法、装置、设备及存储介质 | |
CN112347222A (zh) | 一种基于知识库推理的将非标准地址转换为标准地址的方法及*** | |
CN115424282A (zh) | 一种非结构化文本表格识别方法和*** | |
CN111143588B (zh) | 一种基于机器学习的图像时空索引快速检索方法 | |
CN116843028A (zh) | 多模态知识图谱构建方法、***、存储介质及电子设备 | |
CN111522892A (zh) | 地理要素的检索方法及装置 | |
Ortega et al. | Generating 3D city models from open LiDAR point clouds: Advancing towards smart city applications | |
CN114661744B (zh) | 一种基于深度学习的地形数据库更新方法及*** | |
CN115546809A (zh) | 基于单元格约束的表格结构识别方法及其应用 | |
CN114595302A (zh) | 空间要素的多层级空间关系构建方法、装置、介质及设备 | |
CN112711645B (zh) | 一种位置点信息扩展方法、装置、存储介质和电子设备 | |
Lei | Geospatial data conflation: A formal approach based on optimization and relational databases | |
CN112445976A (zh) | 一种基于拥堵指数图谱的城市地址定位方法 | |
Ben Ellefi et al. | Cultural heritage resources profiling: Ontology-based approach | |
Cerutti et al. | Architectural heritage semantic data managing and sharing in GIS | |
CN116431746A (zh) | 基于编码库的地址映射方法、装置、电子设备及存储介质 | |
CN112015937B (zh) | 一种图片地理定位方法及*** | |
Ma et al. | OSMsc: a framework for semantic 3D city modeling using OpenStreetMap | |
Zare Zardiny et al. | Sketch maps for searching in spatial data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |