CN108197134B - 大数据支持下的点群目标自动综合算法 - Google Patents

大数据支持下的点群目标自动综合算法 Download PDF

Info

Publication number
CN108197134B
CN108197134B CN201711048489.XA CN201711048489A CN108197134B CN 108197134 B CN108197134 B CN 108197134B CN 201711048489 A CN201711048489 A CN 201711048489A CN 108197134 B CN108197134 B CN 108197134B
Authority
CN
China
Prior art keywords
points
point
polygon
influence
point group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711048489.XA
Other languages
English (en)
Other versions
CN108197134A (zh
Inventor
闫浩文
禄小敏
王中辉
武芳
刘纪平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lanzhou Jiaotong University
Original Assignee
Lanzhou Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lanzhou Jiaotong University filed Critical Lanzhou Jiaotong University
Priority to CN201711048489.XA priority Critical patent/CN108197134B/zh
Publication of CN108197134A publication Critical patent/CN108197134A/zh
Application granted granted Critical
Publication of CN108197134B publication Critical patent/CN108197134B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

大数据支持下的点群目标自动综合算法,点的权重是点群自动综合的重要参数,但已有算法对它的确定缺乏充足的理论依据。大数据可以为点的权重提供丰富、实时的数据参考。为此,提出了一种大数据支持下的点群目标自动综合算法。基本原理如下:首先,引入影响范围与影响人群两种因素作为点的权重指标,获取相关数据并进行处理与可视化;其次,在遵循地图综合的基本原则基础上,以影响范围多边形面积及影响人群数量为依据,利用归一化及“同心圆”方法实现了点的取舍操作;最后,将综合结果与可视化图形进行了对比分析和实验验证。实验证明,该算法不仅继承了已有算法优点,而且科学地计算了点群的权重信息并将其运用到点群自动综合过程中,得到的结果更加合理且具有较强的实时性。

Description

大数据支持下的点群目标自动综合算法
技术领域
本发明属于地图学与地理信息科学技术领域,是一种基于大数据的点群目标自动综合算法。
背景技术
点群综合是地图综合的重要组成部分,其目的是在点数目减少的情况下尽量正确表达点群的整体信息,即采用一定的模型或算法从原始的点群中抽取出含有一定数量点的子集合。点的权重反映了点在空间点群整体中的个体重要程度,是点群综合的重要参数。而现有的点群综合算法中,有一类算法,例如基于Voronoi图的算法等,在综合过程中没有顾及到点的权重信息;另一类算法虽然顾及到了点的权重信息,但仍然具有以下两个缺陷:(1)权重值的确定不够精确且缺乏充足的计算依据,例如基于加权Voronoi图的算法,是目前为止比较完善的点群综合算法,但算法中点的权重值是通过专家经验给定的,例如将甲级医院权值设定为2,乙级医院设为1,灌溉用井权值设为2,其他井权值设为1;(2)权重值是预先给定并不会发生变化的。但是在实际地理空间中,随着时间的推移,点的权重值往往会发生改变,例如地图中用点表示的某乙级医院针对心脑血管病例大量增多的现状,引进人才大力发展相应专业,使得其规模及就医人数超越了诸多甲级医院,此时其权重值也应该随着变化。
大数据能够为目标事物提供丰富的实时信息,不仅可以为点的权重值的确定提供科学有效的参考,还使得点的权重值的实时改变成为可能。
发明内容
针对上述情况,本文引入大数据,作为计算点群权重的依据,在此基础上提出了一种点群目标自动综合算法。
点的权重数据选择
点群是空间地理目标的重要组成部分,当地图比例尺缩小时,许多空间地物都表现为点群,如居民地、医院、学校、超市、饭馆、树木等。对于以上点群,大多具有各自的影响范围等特征,诸如医院、学校、超市等点群都有各自的影响范围和影响人群。鉴于此,本文将点的影响范围和影响人群作为衡量点的权重的指标。
选取此两种因素作为点的权重指标,是因为点的影响范围和影响人群以及二者之间的关系反映了点群两方面性质:
(1)点对象等级的高低。对于一个点对象,其周围通常会有以它为中心扩散开来的服务范围,这个范围可以反映点对象的等级水平。如果这个范围相对较大同时影响人群数量较多就说明此点等级较高,例如一所医院影响范围广、影响人群数量多可以说明这所医院规模大、医疗设备先进、卫生服务水平高,现实生活中此类医院对应的等级也较高;相反,如果点对应的影响范围较小同时影响人群数量较少,则说明此点等级较低;
(2)点群局部密度大小。如果一个点对象的影响范围广而影响人群数量少就可以说明该点附近同类点群数目较少,局部密度较小。
在点的综合过程中,等级较高的点,其重要性程度也相对较高,应当予以保留;局部密度较小的点,为了尽可能保持空间点群的结构特征,也应该保留。
故在算法中,获取并处理的数据主要是空间点群的影响范围与影响人群。
大数据的获取与处理
本算法中选用了两个权重衡量指标,其获取方法如下:
(1)影响范围:获取影响范围数据的第一步是要获得影响人群的来源地信息,这些位置信息可以通过蜂窝网络手机轨迹跟踪数据获取、利用网络爬虫方式提取或者基于网络数据流等进行获取,当然也可以通过相应点的内部信息获取。例如对于医院的影响范围,可以以医院为起点进行轨迹跟踪,查询出轨迹终点记为影响人群来源地,也可以通过医院的挂号信息获取。
(2)影响人群数量:随着网络与社交软件等的普及,影响人群数量数据可以通过腾讯位置数据或者微博签到数据爬取,也可以利用点的内部信息获取。例如对于医院的影响人群数量数据,可以利用腾讯位置大数据近似推算,也可以利用一定时间段内某个点周围指定范围内微博签到数据而近似获得。
为了得到更精确有效的数据,要求对原始数据进行清洗。本文算法主要从以下两个方面对有效数据进行提取:(1)检验有效性。对数据的有效性进行检查,是否在合理范围之内,例如影响人群数量不能为负;(2)检验适用性。对于采集到的影响范围数据点,依据其经纬度导入ArcGIS分析平台,与研究区范围叠置,将研究区***的点删除。
影响范围的表示:影响范围由点周围的影响范围多边形表示。本算法规定,影响范围多边形由影响人群的来源地投影到地图上的点构成的分布边界多边形来表示[。影响范围多边形的构建过程如下:
Step1:影响人群来源地会有很大的偶然性,为了避免这种偶然性对范围的影响,记录采集到的数据点的出现频率,并将其降序排序,舍弃频率最小的10%的点,将剩余采集点投影到平面坐标作为原始点群。
Step2:扫描原始点群,利用带约束的Delaunay三角剖分构建其约束Delaunay三角网,再引入动态阈值“剥皮”法构建其分布边界多边形。
将原始点群存入数组pointArray,求得数组中每个点对应的分布边界多边形面积并将其依次存入数组areaArray。
(2)影响人群数量的表示:影响人群的大小由一段时间内访问该点所在区域的人数决定。为了便于表示并减小误差,本算法利用层次聚类算法将各点的影响人群数据进行聚类,使得处于同一簇中的点的影响人群数量差异较小,而位于不同簇之间的点的影响人群数量差异较大。将其表示在地图上,表现为渐变的影响范围多边形填充颜色,颜色越深代表相应点的影响人群数量越大,反之则对应点的影响人群数量越小。
同样,将点数组pointArray中的每个点对应的影响人群数量存入数组numArray。
3点的取舍
算法中点的权重由影响范围多边形面积与影响人群数量两个因素决定,在此基础上,将点划分为三种类型:高等级必须保留(Ⅰ型)、低等级直接舍弃(Ⅱ型)、介于两者之间参与选取竞争(Ⅲ型)。定义两种选取约束条件:
(1)级约束条件,依据影响范围及影响人群数量区分三种类型点,选取过程中保留Ⅰ型点,直接删除Ⅱ型点。其中:
TypeⅠ={P i |P i 对应的影响范围大or其影响人群数量大or(其影响范围大 and 其影响人群数量大)}
TypeⅡ={P i |P i 对应的影响范围小 and 其影响人群数量小}
(2)邻近关系约束条件,对于Ⅲ型点,将其按下式(1)求得的单位影响范围面积影响人数值升序排序后逐个删除,若某一点被删除,则将与其影响范围多边形邻近的多边形对应的点进行“固化”,寻找并处理下一个非“固化”点,直至满足删除结束条件;若直至范围内所有点均被“固化”,删除结束条件仍未满足,则解冻“固化”点,依次进行第2遍、第3遍删除操作。
点的取舍算法
根据以上约束条件,Ⅱ型点为点群中影响范围及影响人群数量都比较小的点,它的选取较Ⅰ型点和Ⅲ型点简单,故本算法在点的取舍过程中采取如下三种策略:
(1)按照开方根定律,选取指定数量的Ⅰ型点并将其删除,剩余点则构成综合后的结果;
(2)为了实现不同量纲数据之间的比较,分别将影响范围多边形面积和影响人群数量值利用归一化的方法转化为无量纲标量;
(3)将归一化的结果表示在以影响人群数量为横坐标、影响范围多边形面积为纵坐标的平面坐标系中,此时权重值越小的点(Ⅱ型点)越靠近坐标原点,故采用以原点为圆心做1/4同心圆的方法,依次选取权重值较小的点,对其进行判断和删除操作,后面称其为“同心圆”法。
点的删除的具体步骤描述如下:
(1)根据开方根定律求得综合过程中预删除点的数目n;
(2)以影响人群数量为横轴、影响范围多边形面积为纵轴建立平面直角坐标系,将影响人群数量数组numArray及影响范围多边形面积数组areaArray中的元素分别进行归一化,并将其结果一一对应表示在坐标系中,此时坐标系中的每一个点对应原始点群中一个点的权重属性值;
(3)以坐标原点为原点,以权重属性值点与坐标原点的最小值为初始半径在坐标系中画1/4圆,并将位于圆弧上的点添加删除标记“flag=’D’,将其存入“Ⅱ型”点数组secondType,对其影响范围多边形邻居多边形对应的点添加保留标记“flag=’R’”;
(4)以平面坐标系中权重属性值点之间的最小平面距离为增量,更新半径值,以原点为圆心做1/4同心圆,将其圆弧上及其与前一次的同心圆构成的圆环内没有任何标记的点添加删除标记,仍将其存入数组secondType,同时对其影响范围多边形邻居多边形对应的点添加保留标记;
(5)比较n与secondType数组中元素个数值的大小,若n值大,则返回(4);若两值相同,则转(6);否则,将上一轮加入数组secondType的点从数组中删除,并去掉对应点的删除标记,按上式2求得这些点的单位面积影响人数n p ,并将其升序排序,从前向后依次给序列中n p 值最小的没有任何标记的点添加删除标记,存入数组secondType,并对其影响范围多边形邻居添加保留标记,直至secondType数组中元素个数值与n值相同,则转(6);
(6)在原始点群中删除secondType数组中所有元素对应的点,剩余点群则为综合结果,算法结束。
附图说明
图1是 影响范围多边形构建
图2是影响人群的聚类
图3是算法流程图
图4是超市点群的综合过程
图5是点的删除过程
图6是某地部分医院的综合过程
图7是某地加油站的综合过程
图8是某地红绿灯的综合过程。

Claims (1)

1.一种大数据支持下的点群目标自动综合算法,其特征包括以下步骤:
(1)权重数据的获取与处理
影响范围与影响人群数据的获取
超市的影响范围为以超市为出发点,通过爬取一个月内移动手机轨迹数据终点识别信息及移动手机信号定位信息而获取;其影响人群数量信息用此一个月内超市对应点一定范围内的微博签到数据之和表示;
数据处理
将获取的信息进行清洗,删除研究区域以外的以及错误的数据点;对于处理后的原始点群中所有点的影响人群数量值进行层次聚类分析,将影响人群数量值相近的点归为一类,且加大类与类之间的数据差异;
在ArcGIS平台上标注超市所在的点,构建这些点的影响范围多边形,影响范围多边形由影响人群来源地投射到地图上的点构成的分布边界多边形来表示,影响范围多边形的构建过程如下:step1:记录采集到数据点的出现频率,并将其降序排序,舍弃排序最小的10%的点,将剩余采集点投影到平面坐标作为原始点群;step2:扫描原始点群,利用带约束的Delaunay三角剂分构建其约束Delaunay三角网,再引入动态阈值“剥皮”法构建其分布边界多边形:将原始点群存入pointArray,求得数组中每个点对应的分布边界多边形面积并将其依次存入数组areaArray;将影响人群数量值按照聚类结果降序排序并选取渐变色由深至浅填充对应点的影响范围多边形将点数组pointArray中的每个点对应的影响人群数量存入数组numArray;
(2)点的取舍
约束条件的定义与表达
算法中点的权重由影响范围多边形面积与影响人群数量两个因素决定,在此基础上,将点划分为三种类型:高等级必须保留Ⅰ型、低等级直接舍弃Ⅱ型、介于两者之间参与选取竞争Ⅲ型;
定义两种选取约束条件:
级约束条件,依据影响范围及影响人群数量区分三种类型点,选取过程中保留Ⅰ型点,直接删除Ⅱ型点;其中:TypeⅠ={Pi|Pi对应的影响范围大or其影响人群数量大or(其影响范围大and其影响人群数量大)}
TypeⅡ={Pi|Pi对应的影响范围小and其影响人群数量小}
邻近关系约束条件,对于Ⅲ型点,将其按单位影响范围面积影响人数值升序排序后逐个删除,若某一点被删除,则将与其影响范围多边形邻近的多边形对应的点进行“固化”,寻找并处理下一个非“固化”点,直至满足删除结束条件;若直至范围内所有点均被“固化”,删除结束条件仍未满足,则解冻“固化”点,依次进行第2遍、第3遍删除操作;
点的取舍算法
根据以上约束条件,Ⅱ型点为点群中影响范围及影响人群数量都比较小的点,它的选取较Ⅰ型点和Ⅲ型点简单,故本算法在点的取舍过程中采取如下三种策略:
a.按照开方根定律,选取指定数量的Ⅰ型点并将其删除,剩余点则构成综合后的结果;
b.为了实现不同量纲数据之间的比较,分别将影响范围多边形面积和影响人群数量值利用归一化的方法转化为无量纲标量;
c.将归一化的结果表示在以影响人群数量为横坐标、影响范围多边形面积为纵坐标的平面坐标系中,此时权重值越小的点(Ⅱ型点)越靠近坐标原点,故采用以原点为圆心做1/4同心圆的方法,依次选取权重值较小的点,对其进行判断和删除操作,后面称其为“同心圆”法;
点的删除的具体步骤描述如下:
a.根据开方根定律求得综合过程中预删除点的数目n;
b.以影响人群数量为横轴、影响范围多边形面积为纵轴建立平面直角坐标系,
将影响人群数量数组numArray及影响范围多边形面积数组areaArray中的元素分别进行归一化,并将其结果一一对应表示在坐标系中,此时坐标系中的每一个点对应原始点群中一个点的权重属性值;
c.以坐标原点为原点,以权重属性值点与坐标原点的最小值为初始半径在坐标系中画1/4圆,并将位于圆弧上的点添加删除标记“flag=’D’,将其存入“Ⅱ型”点数组secondType,对其影响范围多边形邻居多边形对应的点添加保留标记“flag=’R’”;
d.以平面坐标系中权重属性值点之间的最小平面距离为增量,更新半径值,以原点为圆心做1/4同心圆,将其圆弧上及其与前一次的同心圆构成的圆环内没有任何标记的点添加删除标记,仍将其存入数组secondType,同时对其影响范围多边形邻居多边形对应的点添加保留标记;
e.比较n与secondType数组中元素个数值的大小,若n值大,则返回(d);若两值相同,则转(f);否则,将上一轮加入数组secondType的点从数组中删除,并去掉对应点的删除标记,求得这些点的单位面积影响人数np‘,并将其升序排序,从前向后依次给序列中np‘值最小的没有任何标记的点添加删除标记,存入数组secondType,并对其影响范围多边形邻居添加保留标记,直至secondType数组中元素个数值与n值相同,则转(f);
f.在原始点群中删除secondType数组中所有元素对应的点,剩余点群则为综合结果,算法结束。
CN201711048489.XA 2017-10-31 2017-10-31 大数据支持下的点群目标自动综合算法 Active CN108197134B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711048489.XA CN108197134B (zh) 2017-10-31 2017-10-31 大数据支持下的点群目标自动综合算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711048489.XA CN108197134B (zh) 2017-10-31 2017-10-31 大数据支持下的点群目标自动综合算法

Publications (2)

Publication Number Publication Date
CN108197134A CN108197134A (zh) 2018-06-22
CN108197134B true CN108197134B (zh) 2021-09-07

Family

ID=62572953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711048489.XA Active CN108197134B (zh) 2017-10-31 2017-10-31 大数据支持下的点群目标自动综合算法

Country Status (1)

Country Link
CN (1) CN108197134B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111047019B (zh) * 2018-10-12 2022-09-23 兰州交通大学 一种基于改进脉冲耦合神经网络的网络加权Voronoi图构建方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102073981A (zh) * 2011-02-23 2011-05-25 中国测绘科学研究院 一种关联要素限制下的点群地理实体选取方法
CN105740381A (zh) * 2016-01-27 2016-07-06 北京工业大学 一种基于复杂网络特性及神经网络聚类挖掘用户兴趣的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10267645B2 (en) * 2016-02-17 2019-04-23 International Business Machines Corporation Method, apparatus and product for efficient solution of nearest object problems

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102073981A (zh) * 2011-02-23 2011-05-25 中国测绘科学研究院 一种关联要素限制下的点群地理实体选取方法
CN105740381A (zh) * 2016-01-27 2016-07-06 北京工业大学 一种基于复杂网络特性及神经网络聚类挖掘用户兴趣的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Dot Pattern Processing Using Voronoi Neighborhoods;Ahuja N;《IEEE》;20091231;全文 *
地图点群综合的加权Voronoi算法;闫浩文;《武汉大学学报(信息科技版)》;20130930;全文 *
基于约束Delaunay三角网的线、面群目标分布边界计算;禄小敏;《测绘工程》;20151231;全文 *
顾及道路目标stroke特征保持的路网自动综合方法;杨敏;《测绘学报》;20130831;全文 *

Also Published As

Publication number Publication date
CN108197134A (zh) 2018-06-22

Similar Documents

Publication Publication Date Title
CN110135351B (zh) 基于城市建筑空间数据的建成区边界识别方法及设备
CN111651545B (zh) 一种基于多源数据融合的城市边缘区提取方法
Koukoletsos et al. Assessing data completeness of VGI through an automated matching procedure for linear data
CN112949413B (zh) 基于街景图片的城市景观要素分类及地方性度量方法
CN108197583B (zh) 基于图割优化和影像结构特征的建筑物变化检测方法
CN106529469A (zh) 基于自适应坡度的无人机载LiDAR点云滤波方法
CN106326923B (zh) 一种顾及位置重复和密度峰值点的签到位置数据聚类方法
CN109118766A (zh) 一种基于交通卡口的同行车辆判别方法及装置
CN113360587B (zh) 一种基于gis技术的土地测绘设备及测绘方法
Dorigo et al. An application-oriented automated approach for co-registration of forest inventory and airborne laser scanning data
CN116595121B (zh) 一种基于遥感技术数据显示监测***
CN114926098B (zh) 基于移动定位数据的城乡生活圈快速划定方法及其***
CN111383286B (zh) 定位方法、装置、电子设备及可读存储介质
Werder et al. Semi-automatic interpretation of buildings and settlement areas in user-generated spatial data
CN108197134B (zh) 大数据支持下的点群目标自动综合算法
CN111708859B (zh) 一种基于空间数据的商圈边界识别方法
Longley et al. Beyond analogue models: Space filling and density measurement of an urban settlement
Aminipouri Object-oriented analysis of very high resolution orthophotos for estimating the population of slum areas, case of Dar-Es-Salaam, Tanzania
CN115979215B (zh) 一种楼层识别方法、装置及计算机可读存储介质
Meedeniya et al. Land‐Use Classification with Integrated Data
CN112015937B (zh) 一种图片地理定位方法及***
US20210140791A1 (en) Use of geospatial coordinate systems for modifying map and route information
Hwang et al. Automated extraction of community mobility measures from GPS stream data using temporal DBSCAN
Niccolai et al. Decision rule-based approach to automatic tree crown detection and size classification
CN117079124B (zh) 一种基于社群差异化的城乡景观意象量化及提升方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant