CN116302488B - 一种地形图数据坐标多进程自动识别转换方法 - Google Patents

一种地形图数据坐标多进程自动识别转换方法 Download PDF

Info

Publication number
CN116302488B
CN116302488B CN202310075423.9A CN202310075423A CN116302488B CN 116302488 B CN116302488 B CN 116302488B CN 202310075423 A CN202310075423 A CN 202310075423A CN 116302488 B CN116302488 B CN 116302488B
Authority
CN
China
Prior art keywords
data
index
list
area
projection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310075423.9A
Other languages
English (en)
Other versions
CN116302488A (zh
Inventor
刘康甯
何宗
陈甲全
刘建
叶胜
王方民
瞿孟
余俊辰
唐亚洲
肖佳瑶
喻劲松
瞿晓雯
吕帅
陈阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Geographic Information And Remote Sensing Application Center (chongqing Surveying And Mapping Product Quality Inspection And Testing Center)
Original Assignee
Chongqing Geographic Information And Remote Sensing Application Center (chongqing Surveying And Mapping Product Quality Inspection And Testing Center)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Geographic Information And Remote Sensing Application Center (chongqing Surveying And Mapping Product Quality Inspection And Testing Center) filed Critical Chongqing Geographic Information And Remote Sensing Application Center (chongqing Surveying And Mapping Product Quality Inspection And Testing Center)
Priority to CN202310075423.9A priority Critical patent/CN116302488B/zh
Publication of CN116302488A publication Critical patent/CN116302488A/zh
Application granted granted Critical
Publication of CN116302488B publication Critical patent/CN116302488B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • G06F9/5016Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • G06F9/5022Mechanisms to release resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种地形图数据坐标多进程自动识别转换方法,包括步骤:基于建筑物数据构建参照数据,获得总体参照数据;构建投影关系选择器;地形图原始数据处理,获得运算数据集合;构建多进程运算机制并运行,通过进程池开辟多个进程,进行运算数据集合坐标***的识别与转换,所有进程结束后汇总最终成果并输出。其显著效果是:实现了从未知向已知的综合判定识别,构建了已知坐标***间的自动转换机制,实现了坐标***的自动识别与转化。

Description

一种地形图数据坐标多进程自动识别转换方法
技术领域
本发明涉及到空间坐标***自动识别与转换技术领域,具体涉及一种地形图数据坐标多进程自动识别转换方法。
背景技术
空间数据位置精确性是空间数据精度的核心指标,正确的空间坐标***对空间数据位置精度有着决定性影响,是空间数据能够正常投入科学研究和生产应用的前提条件。由于地形图测绘制图流程、行业习惯等因素,地形图多采用CAD文件存储方式进行生产。CAD图元文件本身不包含空间投影信息,仅通过简单文字标注的方式进行注记。当前部分数据生产或现存大量地形图资料(特别是大比例地形图资料)采用了各地的地方坐标系,同时由于测绘时段和政策要求不同,现存资料坐标***中包含Beijing54、Xian80等坐标***。部分数据资料生产、存储、处理、合图等操作过程中存在的技术流程不规范等情况,易造成投影信息注记缺失、文件坐标***不统一等突出问题,数据投入使用前,需进行繁杂的坐标***判读识别与转换,大大降低了工作效率,限制了数据价值的充分发挥。
现有方法中,坐标***自动转换方法多是在已知当前坐标***及目标坐标***的情况下进行转换算法优化或自动转化机制构建。基于有限数据如何进行坐标***的判定方面鲜有研究,难点在于有效实现未知向已知的判定过程。目前识别工作仍多采用人工辨别等方式进行,常用方法如:人工套合判别法、坐标范围判断法、图形范围叠加法等,存在适用性低、耗时长、人力成本高、精度不确定性显著等问题。具体缺陷如下:
(1)人工套合判别法:依赖人工完成,人力成本高,同时,对人员经验和个人能力具有依赖性,易引入判读误差,导致数据随处理人员变化而产生精度的不确定性;
(2)坐标范围判断法:根据坐标分为进行识别,多用于区分有限类别中具有显著差异的坐标***,应用范围具有较大局限性且判读准确率较难保证;
(3)图形范围叠加法:可以实现差异较大的坐标***的识别过程,但是对于如CGS2000和wgs84坐标***差异米级或亚米级差异时就无法适用,使用范围具有局限性,同样存在应对大数据量时的效率问题。
发明内容
针对现有技术的不足,本发明的目的是提供一种地形图数据坐标多进程自动识别转换方法,该方法结合FME转换工具和arcpy站点包,根据建筑图形特征等先验知识,构建建筑参照数据及投影关系选择器,设计吞吐式运算空间,通过构建要素集重合面积指数、要素集长轴与正东偏角差指数、要素中心点偏离指数、最临近要素面积差指数,形成多维评价指标体系,之后计算综合评价指标对数据坐标***进行吻合性评估,从而实现从未知向已知的综合判定识别,然后构建已知坐标***间的自动转换机制,可以实现坐标***的自动识别与转化。
为达到上述目的,本发明采用的技术方案如下:
一种地形图数据坐标多进程自动识别转换方法,其关键在于包括以下步骤:
步骤1、基于建筑物数据构建参照数据,获得总体参照数据;
步骤2、构建投影关系选择器;
步骤3、地形图原始数据处理,获得运算数据集合;
步骤4、构建多进程运算机制并运行,通过进程池开辟多个进程,进行运算数据集合坐标***的识别与转换,具体过程如下:
步骤4.1、吞吐式运算空间的构建与开辟,为每个进程的识别过程提供单独的数据运算空间;
步骤4.2、依据运算数据集合中运算数据的空间位置特征,从投影关系选择器中进行投影关系列表提取;
步骤4.3、遍历投影关系列表,对运算数据集合进行投影预设,并通过转换关系将其转换至CGS2000坐标***下,同时对总体参照数据进行裁切,获取参照数据;
步骤4.4、进行多维评价指标体系的构建,在遍历投影关系列表的过程中,对预设与转换后的运算数据集以及裁切后的参照数据进行多维评价指标计算,并在投影关系列表遍历结束后,通过多维评价指标计算综合评价指标,识别出运算数据对应的坐标***;
步骤4.5、将运算数据的识别结果进行反馈,同时根据识别结果对运算数据进行坐标***的转换;
步骤5、所有进程结束后汇总最终成果并输出。
进一步的,步骤1中总体参照数据的获取过程如下:
确定覆盖识别区域的建筑物数据作为构建参照数据的基本数据;
确定参照数据空间坐标***;
确定参照数据格式;
完成总体参照数据的构建。
进一步的,步骤2中所述投影关系选择器的构建过程为:
通过原投影名称、投影是否包含带号、原坐标***文件prj、转换关系gtf四个参数进行投影关系选择器构建,其中,原坐标***文件prj为原投影名称对应的prj文件名,转换关系gtf参数为原投影与CGS2000坐标***间的转换关系文件名,投影是否包含带号用于对投影关系选择器进行分组。
进一步的,步骤3中运算数据集合的获取步骤为:
对地形图原始数据采用“图形格式转换”的方式对面状图形进行转换,并将转换结果以继承文件名称的gdb数据库进行结构化存储;
利用arcpy站点包,根据图层信息,进行要素筛选提取出图层要素,获取建筑物面状要素层,获得运算数据集合。
进一步的,步骤4中所述多进程运算机制的构建步骤如下:
输入数据设计:运算数据集合以单独的数据库进行管理,每个运算数据均存储在其单独占有的数据库中;
吞吐式运算空间设计:对每一个进程都分配了一个单独的运算空间,其生命周期从进程产生后始,至进行结束前终止,投影预设与转换、总体参照数据裁切、多维评价指标计算均在该空间中独立进行;
结果整合机制设计:指定一个路径,用于保存每个进程的输出结果,并在所有进程均结束运算后启动结果整合机制,实现结果汇总。
进一步的,步骤4.4中所述多维评价指标包括要素集重合面积指数、要素集长轴与正东偏角差指数、要素中心点偏离指数、最临近要素面积差指数,各项评价指标的初始值均为-9999,且当要素集重合面积指数大于零时,进行剩余三项评价指标的计算,否则停止评价指标计算,剩余评价指标均保留为初始值。
进一步的,所述要素集重合面积指数的计算方式为:
Ioverlap-area=Area(Intersect(Featurescal_data,Featuresrefer_data)),
其中,Ioverlap-area为要素集重合面积指数,Featurescal_data为运算数据要素集,Featuresrefer_data为参照数据要素集,Intersect(x)为要素相交处理函数,Area(x)为面积计算函数;
所述要素集长轴与正东偏角差指数的计算方式为:
Idiff-θ=|fθ(MBR(Featurescal_data)-fθ(MBR(Featuresrefer_data)|,
其中,Idiff-θ为要素集长轴与正东偏角差指数,Featurescal_data为运算数据要素集,Featuresrefer_data为参照数据要素集,MBR(x)为要素最小外包矩形获取函数,fθ(x)为矩形长轴与坐标轴正东方向偏角计算函数;
所述要素中心点偏离指数的计算方式为:
其中,Icenterpoint-dev为要素中心点偏离指数,为获取运算数据第i个点状要素在参照数据点集中的最小距离并对运算数据中所有点状要素的最小距离值进行加和,fdis(p1,p2)为p1和p2间的欧式距离计算函数,count_cal为运算数据点集中的点状要素数量,count_refer为参照数据点集中的点状要素数量;
所述最临近要素面积差指数的计算方式为:
其中,Inearest-element-Area-dif为最临近要素面积差指数,Featurescal_data为运算数据要素集,Featuresrefer_data为参照数据要素集,Features_mindisrefer_data为Featurescal_data[i]中心位点距离最近的Featuresrefer_data中的要素,Area为面状要素的面积属性。
进一步的,所述综合评价指标的计算方式为:
Sortd(List_Icenterpoint-dev[k])+ω4*SortI(List_Inearest-element-Area-dif[k]),
其中,List_Icomprehensive为综合评价指标列表,List_Ioverlap-area为要素集重合面积指数列表,List_Idiff-θ为要素集长轴与正东偏角差指数列表,List_Icenterpoint-dev为要素中心点偏离指数列表,List_Inearest-element-Area-dif为最临近要素面积差指数列表,ω1、ω2、ω3、ω4分别为对应权重,k为投影关系对应的索引值,同时为四项指标在结果集中的索引值,Sorta为指标升序排序位次获取函数,Sortd为指标降序排序位次获取函数。
进一步的,所述指标升序排序位次获取函数Sorta以及指标降序排序位次获取函数Sortd的计算方式如下:
其中,List_I为四项指标分别对应的列表,k为投影关系对应的索引值,List_I_after_asort.index(x)为升序排序后数字在结果列表中对应的索引值,List_I_after_ dsort.index(x)为降序排序后数字在结果列表中对应的索引值。
进一步的,所述运算数据的识别结果获取过程为:
基于综合评价指标列表List_Icomprehensive,获取其中综合评价指标数值最大值,其对应的投影关系即认定为运算数据的识别结果。
本发明的显著效果是:
1.结合FME转换工具和arcpy站点包,根据建筑图形特征等先验知识,构建建筑参照数据及投影关系选择器,设计吞吐式运算空间,通过构建要素集重合面积指数、要素集长轴与正东偏角差指数、要素中心点偏离指数、最临近要素面积差指数,形成多维评价指标体系,计算综合评价指标对数据坐标***进行吻合性评估,从而实现从未知向已知的综合判定识别,构建了已知坐标***间的自动转换机制,实现了坐标***的自动识别与转化;
2.通过对运算数据构建最小外包矩形对总体参照数据进行裁切,获取与运算数据自身范围内相匹配的参照数据,从而减少了参与运算的数据量,实现了计算上的轻量化处理;
3.进行了吞吐式运算空间设计与构建,仅给参与运算的数据开辟出运算空间,且该运算空间中数据的生命周期仅持续单个运算过程,在外部循环过程中被反复释放和利用,从而实现内存空间和硬盘存储空间的释放和重复利用;
4.通过对算法进行多进程运算机制设计与改造,实现了运算的并行化,能够更好的提高运算效率,同时为算法提供了充分利用高性能计算机进行运算的有效机制,在提高算法自身运算效率的同时也提升了算法运算效率进一步扩展的可能;
5.从要素集维度和要素维度构建了四项具体指标,并结合上述四项指标进行了综合评价指标的构建,形成了多维评价指标体系,实现了对运算数据坐标***的精细化识别。
附图说明
图1是本发明的方法流程图;
图2是数据格式转换及提取流程图;
图3是多进程并行运算机制的示意图;
图4是吞吐式运算空间构建及运算内容的示意图;
图5是要素集长轴与正东方向偏角计算的示意图;
图6是要素中心点偏离指数及最临近要素面积差指数计算的示意图。
具体实施方式
下面结合附图对本发明的具体实施方式以及工作原理作进一步详细说明。
由于建筑数据具有显著的图形特征(面域图形、长轴偏角、中心点等)和属性特征(及面积、周长等),可以通过目视解译、电子地图建筑底图、图像识别等方式进行获取,目前建筑数据获取技术已十分成熟,建筑数据具有较强的实用性和可获取性。
因此,本实施例结合FME转换工具和arcpy站点包,根据建筑图形特征等先验知识,构建建筑参照数据及投影关系选择器,设计吞吐式运算空间,通过构建要素集重合面积指数、要素集长轴与正东偏角差指数、要素中心点偏离指数、最临近要素面积差指数,形成多维评价指标体系,计算综合评价指标对数据坐标***进行吻合性评估,从而实现从未知向已知的综合判定识别,然后构建已知坐标***间的自动转换机制,实现坐标***的自动识别与转化。
本例所述的一种地形图数据坐标多进程自动识别转换方法如图1所示,具体步骤如下:
步骤1、基于建筑物数据构建参照数据,获得Shapefile格式的总体参照数据(Refer_Data_All);
所述参照数据的构建过程为:
参照数据的构建主要涉及以下几个方面,一是数据范围上,本方法使用能够覆盖识别区域的建筑物数据作为构建参照数据的基本数据;二是参照数据空间坐标***方面,由于我国测绘成果空间坐标***统一要求为CGS2000坐标***,因此选择CGS2000坐标***作参照数据的坐标***;三是数据格式方面,为了更好的适配多进程运算机制,避免在多个进程调用过程中出现数据锁死的情况,因此参照数据格式选择为Shapefile格式。基于上述三个方面完成总体参照数据(Refer_Data_All)的构建。
步骤2、构建投影关系选择器;
我国常用投影包括CGS2000坐标系、Xian80坐标系、Beijing54坐标系及地方独立坐标系等,部分数据可能为WGS84等其他坐标***,地形图数据中图形的空间位置信息为投影坐标,投影坐标是地理坐标(球面坐标)按照一定的数学法则向平面坐标的映射,中央经线是一个非常重要的参数,因此,本实施例中将中央经线/带号设定为开放参数,以提高方法对不同区域的适用性。
在ESRI体系下,投影信息文件为“prj文件”,坐标转换关系文件为“gtf文件”:①“prj文件”是用来描述坐标***和投影的文件,文件中定义了坐标系的名称、长短半轴、基准面、投影参数等重要的信息;②“gtf文件”是用来描述坐标转换关系的文件,可通过自定义转换关系(Create Custom Geographic Tramsformation)等方式生成,该文件中包含了转换关系名称、原始坐标系名称及参数集合、目标坐标系名称及参数集合,以及两个坐标***转换的方法及参数等信息,是两投影坐标***存在椭球体差异时,进行椭球体数学转换的必要依据。
本方法中通过原投影名称、投影是否包含带号、原坐标***文件prj、转换关系gtf四个参数进行投影关系选择器构建,其中,原坐标***文件prj为原投影名称对应的prj文件名,转换关系gtf参数为原投影与CGS2000坐标***间的转换关系文件名,投影是否包含带号用于对投影关系选择器进行分组,通过X坐标数据位数及前两位数值可以进行是否存在坐标东移的判断依据,实现投影中是否包含带号的判断,达到精简投影关系的目的,从而实现投影关系选择器的合理选择。同时本实施例利用CSV文件给定参数修改模板(如表1所示),以便投影关系选择器的调整,提高方法灵活度。
表1投影关系选择器模板
步骤3、地形图原始数据处理(FME格式转换及Arcpy数据提取),获得以FileGDB为单元的运算数据集合;
居民地(JMD)图层是电子地形图中建筑数据的图层载体,其中存储了建筑物的图形及空间位置信息,由于地形图数据中要素图层较多,存储方式与arcpy数据格式存在明显差异。因此本实施例运算数据集合获取的具体步骤为(参见附图2):
首先通过FME进行数据格式的转换,并结合arcpy进行要素筛选,实现数据易读性的提高。利用FME中的GeometryFilter工具,采用“图形格式转换”的方式对面状图形进行转换,针对性的对polygon类型、mpolygon类型及region类型三种数据(具有polygon类型>mpolygon类型>region类型的优先级,仅当优先级较高数据不存在时,才对下一级数据进行转出)实施转换过程,同时继承原始文件名称及转出要素所在图层名称等信息,并将结果统一追加到polygons图层中,转换结果以继承文件名称的GDB数据库进行结构化存储;
利用arcpy站点包,根据图层信息,提取JMD图层要素,实现建筑数据的提取,获取建筑物面状要素层(JMD_polygon),从而完成数据格式转换流程构建,完成地形图原始数据集合向可进行识别运算的运算数据集合的转变。
步骤4、构建多进程运算机制并运行,通过进程池开辟多个进程,进行运算数据集合坐标***的识别与转换,
所述多进程运算机制的构建步骤如下:
运算效率是算法性能的重要表现方面,本实施例的处理对象为空间数据,相较于文本数据,空间图形数据的计算往往会造成更多的运算耗时,同时本实施例基于arcpy站点库进行设计与实现,调用了arcpy中封装的部分工具,其内部机制也可能带来较大的运算时间成本。通过深入分析,本实施例中的运算过程是CPU密集型而非IO密集型,使用多进程机制能够更好的提高运算效率,因此对算法进行多进程并行机制设计,参见附图3。
对本方法而言,实现多进程计算方式的关键在与解决多个进程对数据调用可能造成的锁死问题,通过对运算过程及数据存储方式进行合理设计,保障每个进程运算过程互不干扰,从而实现运算及数据调用的与多进程运算机制间的匹配,对运行机制设计主要内容如下:
①输入数据设计:一是运算数据集合以单独的数据库进行管理,每个运算数据均存储在其单独占有的数据库中,实现运算数据的独立性,同时也避免运算数据的一些前期运算引发错误,二是参照数据,采用Shapefile数据格式避免多进程调用出现问题;
②运算空间设计:对每一个进程都分配了一个单独的运算空间cal_space,其生命周期从进程产生后始,至进行结束前终止,预设投影与转换、参照数据裁切、识别指标计算均在该空间中独立进行;
③结果整合机制设计:指定一个路径,用于保存每个进程的输出结果,并在所有进程均结束运算后启动结果整合机制,实现结果汇总,避免在结果输出过程中读取同一文件造成报错。
多进程并行运算机制下的识别方法工作流程如图3所示。通过对多进程并行运算机制的构建,能够有效提升算法效率,同时为算法提供了充分利用高性能计算机进行运算的有效机制,在提高算法自身运算效率的同时也提升了算法运算效率进一步扩展的可能。利用计算机(配置为AMD16核处理器、64G运行内存)进行串行运算和并行运算测算,两种方式均处理32个数据的情况下,串行运算需要2198.83s,平均每个数据运算耗时为68.71s,而并行运算总耗时为198.59s,平均单个数据运算耗时仅为6.2s,效率提升了11倍。
基于构建的多进程运算机制,运算数据集合坐标***的识别与转换具体过程如下:
步骤4.1、吞吐式运算空间的构建与开辟,为每个进程的识别过程提供单独的数据运算空间;
数据运算过程中产生的过程数据会大量消耗计算机内存空间及存储空间,如果占用得不到及时释放则会导致计算计内存超出致使程序崩溃或造成大量硬盘空间占用,因此存储空间的合理使用和占用问题的有效解决放哪对算法稳定性有着非常关键的影响。针对这一问题,本实施例进行了吞吐式运算空间设计与构建,仅给参与运算的数据开辟出运算空间,且该运算空间中数据的生命周期仅持续单个运算过程,在外部循环过程中被反复释放和利用,从而实现内存空间和硬盘存储空间的释放和重复利用。
本方法数据处理基于arcpy站点包及ogr库,因此采用gdb数据库进行吞吐式运算空间构建(如图4所示)。在运算数据集合、参照数据集合、投影关系选择器均完成构建后,在运算数据路径下构建cal_space.gdb数据空间,将运算数据(cal_data)和对应的参照数据(refer_data)存入到该空间中,在该空间中执行投影关系列表提取、运算数据与参照数据多维度相似性评价等流程,并将最终的识别出的投影坐标系结果进行输出后,自动清空释放数据空间,外部循环中对结果进行汇总。
步骤4.2、依据运算数据集合中运算数据的空间位置特征,从投影关系选择器中进行投影关系列表提取,作为投影预设与识别过程的驱动引子;
投影关系列表提取:按照运算数据(cal_data)的坐标数值进行分析,判断是否具有带号特征,从投影关系选择器中选择合适的投影列表。
步骤4.3、遍历投影关系列表,对运算数据集合进行投影预设,并通过转换关系将其转换值CGS2000坐标***下,并生成最小外包矩形,对总体参照数据进行裁切,获取参照数据;
参与计算的地形图数据相较于总体参照数据,多呈现为空间范围相对较小的特征,若直接使用总体参照数据参与计算,则可能由于数据量较大带来计算冗余问题,拉低算法效率和稳定性,因此在参照数据构建过程中涉及了通过运算数据(cal_data)构建最小外包矩形对总体参照数据进行裁切,获取与运算数据自身范围内相匹配的参照数据(refer_data),从而降低参与运算的数据量,实现计算上的轻量化处理。
步骤4.4、进行多维评价指标体系的构建,在遍历投影关系列表的过程中,对预设与转换后的运算数据集以及裁切后的参照数据进行多维评价指标计算,并在投影关系列表遍历结束后,通过多维评价指标计算综合评价指标,根据综合评价指标识别出运算数据对应的坐标***的准确识别;
运算数据与参照数据多维度相似性评价:在要素集维度进行运算数据集合与参照数据集间的“要素集长轴与正东偏角差指数”计算及“要素集重合面积指数”计算,利用ogr函数库进行要素维度的“要素中心点偏离指数”计算和“最临近要素面积差指数”计算,并根据四项指标结构完成综合评价指标计算,进而识别出数据对应的坐标***,完成坐标***识别结果的输出。
(1)要素集重合面积指数(Ioverlap-area)
该项指标利用arcpy调用Intersect_analysis相交工具,实现要素集重叠分析,获取cal_data与refer_data两要素集重叠部分,通过SearchCursor游标,进行面积汇总,获取“要素集重合面积指数”。在运算过程中,按照投影关系选择器进行预设的投影***下的cal_data数据集与refer_data数据集间可能存在无重叠区域的情况,该情况即可表明当前预设投影***为错误坐标***,无需进行后续指标计算,为更好开展后续计算,结合四项指标值域范围,设计四项指标初始值均为-9999,且构建出当“要素集重合面积指数”大于零时,进行后续三项指标计算,反之则直接停止剩余三项指标计算,剩余三项指标均保留为初始值。所述要素集重合面积指数Ioverlap-area的计算方式为:
Ioverlap-area=Area(Intersect(Featurescal_data,Featuresrefer_data)),
其中,Ioverlap-area为要素集重合面积指数,Featurescal_data为运算数据要素集,Featuresrefer_data为参照数据要素集,Intersect(x)为要素相交处理函数,Area(x)为面积计算函数。
(2)要素集长轴与正东偏角差指数(Idiff-θ)
要素集长轴与正东方向的偏角可以反映出要素集整体在坐标***中相对于坐标系的偏转情况,本方法中基于要素基构建最小外包矩形(MBR),基于最小外包矩形获得要素集长轴,并进一步计算出长轴与坐标***正东方向夹角,通过对cal_data和refer_data进行分别计算,如图5所示,获取夹角θcal_data及θrefer_data,计算夹角差值的绝对值θdiff作为评价指标,即“要素集长轴与正东偏角差指数”。所述要素集长轴与正东偏角差指数Idiff-θ的计算方式为:
Idiff-θ=|fθ(MBR(Featurescal_data)-fθ(MBR(Featuresrefer_data)|,
其中,Idiff-θ为要素集长轴与正东偏角差指数,Featurescal_data为运算数据要素集,Featuresrefer_data为参照数据要素集,MBR(x)为要素最小外包矩形获取函数,fθ(x)为矩形长轴与坐标轴正东方向偏角计算函数;
在计算过程中MBR可能为正方形,该情况下会对该项指标的可信度产生影响,因此本方法特针对MBR为正方形的特殊情况构建了处理机制:构建1*2矩阵T,定义初始值为[-9999,-9999],当MBR不是正方形时,T矩阵为[θ,-9999],当MBR是正方形时,T矩阵为[θ1,θ2],进行差值计算时,仅对矩阵中数值不为-9999的单元进行θdif计算,并获取最小值,通过该机制消除MBR为正方形导致的长轴判断不明带来的影响,从而完善“要素集长轴与正东偏角差指数”指标设计。
(3)要素中心点偏离指数(Icenterpoint-dev)
坐标***不同带来的差异突出体现在空间位置上的变化,从平面上来看,即为X轴和Y轴偏量,具体到要素层面即为要素间的偏移距离,基于此,本方法进行指标构建:
①通过arcpy调用要素转点工具(FeatureToPoint_management)获得cal_data及refer_data的点状要素集cal_points及refer_points;
②利用ogr库进行点状数据读取,分别读取两点状要素集中各要素点的X坐标及Y坐标,通过距离计算,cal_points中第i个要素cal_points[i]与其在refer_points中最近点状要素refer_points[j]间的距离值的绝对值dis_p[i,j];
③对所有dis_p[i,j]进行汇总,进而获得“要素中心点偏离指数”,如图6所示。所述要素中心点偏离指数Icenterpoint-dev的计算方式为:
其中,Icenterpoint-dev为要素中心点偏离指数,为获取运算数据第i个点状要素在参照数据点集中的最小距离并对运算数据中所有点状要素的最小距离值进行加和,fdis(p1,p2)为p1和p2间的欧式距离计算函数,count_cal为运算数据点集中的点状要素数量,count_refer为参照数据点集中的点状要素数量。
(4)最临近要素面积差指数(Inearest-element-Area-dif)
“最临近要素面积差指数”有别于“要素集重合面积指数”:“要素集重合面积指数”计算的是要素在空间位置上的共有区域面积值,是空间图形上的重叠计算;“最临近要素面积差指数”聚焦到要素集内部的单个要素层面,计算最临近的两要素图形面积的差值,并进行汇总,是要素维度差异的综合表现,对要素的相似性和符合度进行更为精细的分析。
该指标的计算是“要素中心点偏离指数”计算过程中同步展开的:①在转点前分别给cal_data和refer_data数据创建要素面积属性Area_fc_cal、Area_fc_refer,计算要素面积,②利用转点工具将面状要素转为点状要素,并进行要素距离计算,该步骤与“要素中心点偏离指数”计算中的距离计算为同一过程,获取cal_points中第i个要素cal_points[i]与其在refer_points中最近点状要素refer_points[j];③利用继承的面积字段进行cal_points[i]与refer_points[j]的Area_fc_cal、Area_fc_refer属性进行计算,从而获得最临近要素面积差;⑤完成差值汇总,获得“最临近要素面积差指数”,如图6所示。所述最临近要素面积差指数的计算方式为:
其中,Inearest-element-Area-dif为最临近要素面积差指数,Featurescal_data为运算数据要素集,Featuresrefer_data为参照数据要素集,Features_mindisrefer_data为Featurescal_data[i]中心位点距离最近的Featuresrefer_data中的要素,Area为面状要素的面积属性。
(5)综合评价指标构建(Icomprehensive)
平面坐标体系间的差异可由四参数模型概括,即“X轴偏移量、Y轴偏移量、坐标系偏转角、尺度缩放”四个部分,其中要素集长轴与正东方向偏移角可以用于评估坐标系偏角、要素中心点偏移指数结合要素重合面积指数可以评估X、Y轴坐标偏移量,最临近要素面积差指数和要素集重合面积指数相结合可以评估尺度缩放情况。本方法中通过将四项评价指标进行加权组合,构建形成综合评价指标,从而实现相似度的精准评价,为实现坐标***自动识别过程提供判定依据。将投影关系列表List_trans中各投影对应获取的四项指标进行字典列表构建,形成结果集。
所述综合评价指标的计算方式为:
其中,List_Icomprehensive为综合评价指标列表,List_Ioverlap-area为要素集重合面积指数列表,List_Idiff-θ为要素集长轴与正东偏角差指数列表,List_Icenterpoint-dev为要素中心点偏离指数列表,List_Inearest-element-Area-dif为最临近要素面积差指数列表,ω1、ω2、ω3、ω4分别为对应权重,k为投影关系对应的索引值,同时为四项指标在结果集中的索引值,Sorta为指标升序排序位次获取函数,Sortd为指标降序排序位次获取函数。
同时为了与cal_data数据集与refer_data数据集间可能存在无重叠区域的情况良好结合,达到同时保障运算进度和运算效率的目的,本方法中对排序公式进行了设计,排序位次获取函数公式如下:
其中,List_I为四项指标分别对应的列表,k为投影关系对应的索引值,List_I_after_asort.index(x)为升序排序后数字在结果列表中对应的索引值,List_I_after_ dsort.index(x)为降序排序后数字在结果列表中对应的索引值。
步骤4.5、将运算数据的识别结果进行反馈,同时根据识别结果对运算数据进行坐标***的转换;
经过上述各个指标的计算,获取投影列表对应的综合评价指标列表List_Icomprehensive,获取其中综合评价指标数值最大值,其对应的投影关系即认定为数据的正确投影,进而实现坐标***的自动识别过程。
步骤5、所有进程结束后汇总最终成果并输出。
判定结果已以CSV形式进行输出,指明文件对应的坐标***,后通过FME进行CAD数据转换获取要素集,利用判定结果通过arcpy调用投影定义工具(DefineProjection_management)实现坐标自动转换。
综上,本实施例能够实现从未知向已知的综合判定识别,构建了已知坐标***间的自动转换机制,实现了坐标***的自动识别与转化;同时,从要素集维度和要素维度构建了四项具体指标,并结合上述四项指标进行了综合评价指标的构建,形成了多维评价指标体系,实现了对运算数据坐标***的精细化识别,此外,还通过对算法进行多进程运算机制设计与改造,实现了运算的并行化,能够更好的提高运算效率,同时为算法提供了充分利用高性能计算机进行运算的有效机制,在提高算法自身运算效率的同时也提升了算法运算效率进一步扩展的可能。
以上对本发明所提供的技术方案进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (6)

1.一种地形图数据坐标多进程自动识别转换方法,其特征在于包括以下步骤:
步骤1、基于建筑物数据构建参照数据,获得总体参照数据;
步骤2、构建投影关系选择器;
步骤3、地形图原始数据处理,获得运算数据集合;
步骤4、构建多进程运算机制并运行,通过进程池开辟多个进程,进行运算数据集合坐标***的识别与转换,具体过程如下:
步骤4.1、吞吐式运算空间的构建与开辟,为每个进程的识别过程提供单独的数据运算空间;
步骤4.2、依据运算数据集合中运算数据的空间位置特征,从投影关系选择器中进行投影关系列表提取;
步骤4.3、遍历投影关系列表,对运算数据集合进行投影预设,并通过转换关系将其转换至CGS2000坐标***下,同时对总体参照数据进行裁切,获取参照数据;
步骤4.4、进行多维评价指标体系的构建,在遍历投影关系列表的过程中,对预设与转换后的运算数据集以及裁切后的参照数据进行多维评价指标计算,并在投影关系列表遍历结束后,通过多维评价指标计算综合评价指标,识别出运算数据对应的坐标***;
步骤4.4中所述多维评价指标包括要素集重合面积指数、要素集长轴与正东偏角差指数、要素中心点偏离指数、最临近要素面积差指数,各项评价指标的初始值均为-9999,且当要素集重合面积指数大于零时,进行剩余三项评价指标的计算,否则停止评价指标计算,剩余评价指标均保留为初始值;
所述要素集重合面积指数的计算方式为:
Ioverlap-area=Area(Intersect(Featurescal_data,Featuresrefer_data)),
其中,Ioverlap-area为要素集重合面积指数,Featurescal_data为运算数据要素集,Featuresrefer_data为参照数据要素集,Intersect(x)为要素相交处理函数,Area(x)为面积计算函数;
所述要素集长轴与正东偏角差指数的计算方式为:
Idiff-θ=|fθ(MBR(Featurescal_data)-fθ(MBR(Featuresrefer_data)|,
其中,Idiff-θ为要素集长轴与正东偏角差指数,Featurescal_data为运算数据要素集,Featuresrefer_data为参照数据要素集,MBR(x)为要素最小外包矩形获取函数,fθ(x)为矩形长轴与坐标轴正东方向偏角计算函数;
所述要素中心点偏离指数的计算方式为:
其中,Icenterpoint-dev为要素中心点偏离指数,为获取运算数据第i个点状要素在参照数据点集中的最小距离并对运算数据中所有点状要素的最小距离值进行加和,fdis(p1,p2)为p1和p2间的欧式距离计算函数,count_cal为运算数据点集中的点状要素数量,count_refer为参照数据点集中的点状要素数量;
所述最临近要素面积差指数的计算方式为:
其中,Inearest-element-Area-dif为最临近要素面积差指数,Featurescal_data为运算数据要素集,Featuresrefer_data为参照数据要素集,Features_mindisrefer_data为Featurescal_data[i]中心位点距离最近的Featuresrefer_data中的要素,Area为面状要素的面积属性;
所述综合评价指标的计算方式为:
其中,List_Icomprehensive为综合评价指标列表,List_Ioverlap-area为要素集重合面积指数列表,List_Idiff-θ为要素集长轴与正东偏角差指数列表,List_Icenterpoint-dev为要素中心点偏离指数列表,List_Inearest-element-Area-dif为最临近要素面积差指数列表,ω1、ω2、ω3、ω4分别为对应权重,k为投影关系对应的索引值,同时为四项指标在结果集中的索引值,Sorta为指标升序排序位次获取函数,Sortd为指标降序排序位次获取函数;
所述指标升序排序位次获取函数Sorta以及指标降序排序位次获取函数Sortd的计算方式如下:
其中,List_I为四项指标分别对应的列表,k为投影关系对应的索引值,List_I_after_asort.index(x)为升序排序后数字在结果列表中对应的索引值,List_I_after_ dsort.index(x)为降序排序后数字在结果列表中对应的索引值;
步骤4.5、将运算数据的识别结果进行反馈,同时根据识别结果对运算数据进行坐标***的转换;
步骤5、所有进程结束后汇总最终成果并输出。
2.根据权利要求1所述的地形图数据坐标多进程自动识别转换方法,其特征在于:步骤1中总体参照数据的获取过程如下:
确定覆盖识别区域的建筑物数据作为构建参照数据的基本数据;
确定参照数据空间坐标***;
确定参照数据格式;
完成总体参照数据的构建。
3.根据权利要求1所述的地形图数据坐标多进程自动识别转换方法,其特征在于:步骤2中所述投影关系选择器的构建过程为:
通过原投影名称、投影是否包含带号、原坐标***文件prj、转换关系gtf四个参数进行投影关系选择器构建,其中,原坐标***文件prj为原投影名称对应的prj文件名,转换关系gtf参数为原投影与CGS2000坐标***间的转换关系文件名,投影是否包含带号用于对投影关系选择器进行分组。
4.根据权利要求1所述的地形图数据坐标多进程自动识别转换方法,其特征在于:步骤3中运算数据集合的获取步骤为:
对地形图原始数据采用“图形格式转换”的方式对面状图形进行转换,并将转换结果以继承文件名称的gdb数据库进行结构化存储;
利用arcpy站点包,根据图层信息,进行要素筛选,提取出图层要素,获取建筑物面状要素层,获得运算数据集。
5.根据权利要求1所述的地形图数据坐标多进程自动识别转换方法,其特征在于:步骤4中所述多进程运算机制的构建步骤如下:
输入数据设计:运算数据集合以单独的数据库进行管理,每个运算数据均存储在其单独占有的数据库中;
吞吐式运算空间设计:对每一个进程都分配了一个单独的运算空间,其生命周期从进程产生后始,至进行结束前终止,投影预设与转换、总体参照数据裁切、多维评价指标计算均在该空间中独立进行;
结果整合机制设计:指定一个路径,用于保存每个进程的输出结果,并在所有进程均结束运算后启动结果整合机制,实现结果汇总。
6.根据权利要求1所述的地形图数据坐标多进程自动识别转换方法,其特征在于:所述运算数据的识别结果获取过程为:
基于综合评价指标列表List_Icomprehensive,获取其中综合评价指标数值最大值,其对应的投影关系即认定为运算数据的识别结果。
CN202310075423.9A 2023-01-17 2023-01-17 一种地形图数据坐标多进程自动识别转换方法 Active CN116302488B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310075423.9A CN116302488B (zh) 2023-01-17 2023-01-17 一种地形图数据坐标多进程自动识别转换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310075423.9A CN116302488B (zh) 2023-01-17 2023-01-17 一种地形图数据坐标多进程自动识别转换方法

Publications (2)

Publication Number Publication Date
CN116302488A CN116302488A (zh) 2023-06-23
CN116302488B true CN116302488B (zh) 2024-01-23

Family

ID=86831399

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310075423.9A Active CN116302488B (zh) 2023-01-17 2023-01-17 一种地形图数据坐标多进程自动识别转换方法

Country Status (1)

Country Link
CN (1) CN116302488B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101663596A (zh) * 2006-11-03 2010-03-03 帕拉迪姆科学有限公司 用于降维坐标系中的全方位角域成像的***和方法
CN103678705A (zh) * 2013-12-30 2014-03-26 南京大学 一种VCT文件到shapefile文件的矢量数据并行转换方法
CN105279243A (zh) * 2015-09-28 2016-01-27 张新长 一种空间数据转换的方法及***
CN111242022A (zh) * 2020-01-10 2020-06-05 西安科技大学 基于低分辨率遥感产品降尺度的高分辨率fapar估算方法
CN111651711A (zh) * 2020-06-10 2020-09-11 中国煤炭地质总局勘查研究总院 一种地质勘查钻孔地理空间数据坐标转换方法
CN113379899A (zh) * 2021-06-22 2021-09-10 南京工程学院 一种建筑工程工作面区域图像自动提取方法
WO2021204026A1 (zh) * 2020-04-09 2021-10-14 速度时空信息科技股份有限公司 基于分布式***的海量dem金字塔切片并行构建方法
CN113884036A (zh) * 2021-09-22 2022-01-04 浙江省水利河口研究院(浙江省海洋规划设计研究院) 一种坐标转换方法及装置、电子设备、存储介质
CN114546941A (zh) * 2022-04-28 2022-05-27 长江水利委员会水文局 一种数字地形图空间坐标系与投影的全信息无损转换方法
CN115014368A (zh) * 2021-03-03 2022-09-06 北京四维图新科技股份有限公司 不同历元坐标自动转换方法、装置、存储介质及设备
CN115080682A (zh) * 2022-08-22 2022-09-20 中国铁路设计集团有限公司 一种空间数据库到铁路cad数字地形图全要素快速转换方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101663596A (zh) * 2006-11-03 2010-03-03 帕拉迪姆科学有限公司 用于降维坐标系中的全方位角域成像的***和方法
CN103678705A (zh) * 2013-12-30 2014-03-26 南京大学 一种VCT文件到shapefile文件的矢量数据并行转换方法
CN105279243A (zh) * 2015-09-28 2016-01-27 张新长 一种空间数据转换的方法及***
CN111242022A (zh) * 2020-01-10 2020-06-05 西安科技大学 基于低分辨率遥感产品降尺度的高分辨率fapar估算方法
WO2021204026A1 (zh) * 2020-04-09 2021-10-14 速度时空信息科技股份有限公司 基于分布式***的海量dem金字塔切片并行构建方法
CN111651711A (zh) * 2020-06-10 2020-09-11 中国煤炭地质总局勘查研究总院 一种地质勘查钻孔地理空间数据坐标转换方法
CN115014368A (zh) * 2021-03-03 2022-09-06 北京四维图新科技股份有限公司 不同历元坐标自动转换方法、装置、存储介质及设备
CN113379899A (zh) * 2021-06-22 2021-09-10 南京工程学院 一种建筑工程工作面区域图像自动提取方法
CN113884036A (zh) * 2021-09-22 2022-01-04 浙江省水利河口研究院(浙江省海洋规划设计研究院) 一种坐标转换方法及装置、电子设备、存储介质
CN114546941A (zh) * 2022-04-28 2022-05-27 长江水利委员会水文局 一种数字地形图空间坐标系与投影的全信息无损转换方法
CN115080682A (zh) * 2022-08-22 2022-09-20 中国铁路设计集团有限公司 一种空间数据库到铁路cad数字地形图全要素快速转换方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CAD下实现数字地形图坐标系转换;谢园园;王崇倡;;测绘与空间地理信息(第06期);全文 *
Integrated modeling of CityGML and IFC for city/neighborhood development for urban microclimates analysis;Steve Kardinal Jusuf;Energy Procedia;第122卷;全文 *
基于FME的DWG文件批量坐标转换设计与实现;李娜;张君华;郑颖;;测绘技术装备(第01期);全文 *

Also Published As

Publication number Publication date
CN116302488A (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
CN109684428A (zh) 空间数据建设方法、装置、设备及存储介质
CN113157665B (zh) 一种智能的多测合一地理信息***
JP2009128075A (ja) 物体認識方法
CN106021342A (zh) 城市空间年轮地图制作和分析方法
US7620528B2 (en) Method and program for labeling multi material data
CN115018249B (zh) 一种基于激光扫描技术的地铁站施工质量评价方法
CN115222873A (zh) 一种基于标注和空间语义的三维产权体图属批量关联方法
CN107562693B (zh) 土地利用/覆被要素多特征变化转移矩阵矢量化提取方法
US7333104B2 (en) Method and program of converting three-dimensional shape data into cell internal data
CN116302488B (zh) 一种地形图数据坐标多进程自动识别转换方法
CN107016147A (zh) 物品的设置空间搜索方法及通过记录有用于其的程序的计算机可读的记录介质
CN117668583A (zh) 一种基于人工智能投资研究的投资优化方法
CN112528428B (zh) 对工程结构的物理参数展示的方法、装置和计算机设备
CN111784801A (zh) 一种竣工单体建筑车位平面图自动化绘制方法及***
Zhou 3D urban modeling from city-scale aerial LiDAR data
CN112200857A (zh) 一种征地移民土地面积自动量算方法
CN109214486A (zh) 三维码、三维码的生成方法和装置、识别方法和装置
CN115774749A (zh) 一种AutoCAD平台与通用的GIS平台数据无损转换方法
CN116049501A (zh) 一种空间场景空间关系自然语言描述生成方法
CN114186603B (zh) 多源模型单体化融合方法及***、存储介质及终端
CN115979243A (zh) 一种基于bim信息的移动机器人导航地图转化方法与***
US7304642B2 (en) Analysis model producing/assisting apparatus
KR101091061B1 (ko) 수치지도 상 공간객체의 위치유사도 측정방법 및 이를 이용한 지도 매칭방법
US6850638B1 (en) System for naming faces and vertices in an adaptive hierarchical subdivision surface
CN101908062A (zh) Gis空间谓词判断方法及其***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant