CN111723959A - 区域的划分方法、装置、存储介质及电子装置 - Google Patents
区域的划分方法、装置、存储介质及电子装置 Download PDFInfo
- Publication number
- CN111723959A CN111723959A CN201910209714.6A CN201910209714A CN111723959A CN 111723959 A CN111723959 A CN 111723959A CN 201910209714 A CN201910209714 A CN 201910209714A CN 111723959 A CN111723959 A CN 111723959A
- Authority
- CN
- China
- Prior art keywords
- area
- data set
- central point
- represented
- numbers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000015654 memory Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 15
- 230000011218 segmentation Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 6
- 238000002372 labelling Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 9
- 238000000638 solvent extraction Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000009193 crawling Effects 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 244000269722 Thea sinensis Species 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 235000009569 green tea Nutrition 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000013486 operation strategy Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
- G06Q10/043—Optimisation of two dimensional placement, e.g. cutting of clothes or wood
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2255—Hash tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- Remote Sensing (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例公开了一种区域的划分方法、装置、存储介质及电子装置。其中,该方法包括:对第一数据集中的纬度和经度进行编码,得到第二数据集,其中,第一数据集中记录了N组具有对应关系的纬度和经度,第二数据集中记录了N个地区编号,每个地区编号用于表示一个地理区域;根据第二数据集获取第三数据集,其中,第三数据集中记录了M组具有对应关系的地区编号、地区编号所表示的地理区域中的中心点纬度、地区编号所表示的地理区域中的中心点经度;根据第三数据集将M个地区编号所表示的地理区域划分为P个区域,其中,P为自然数,每个区域包括至少一个地区编号所表示的地理区域。本发明解决了相关技术中区域的划分效率较低的技术问题。
Description
技术领域
本发明涉及计算机领域,具体而言,涉及一种区域的划分方法、装置、存储介质及电子装置。
背景技术
目前已有的区域划分方法大多是根据人工调查的店铺信息、开设店铺的密度或者店铺的交易信息等将店铺所在的区域进行划分,发明人在研究过程中发现这种划分方式存在收集数据浪费人力资源,区域口径难以统一、更新不及时,门槛较高且计算量大,难以在地图上绘制出商圈范围,如有新的商户加入,则需要重新聚类等问题,导致区域的划分效率较低。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种区域的划分方法、装置、存储介质及电子装置,以至少解决相关技术中区域的划分效率较低的技术问题。
根据本发明实施例的一个方面,提供了一种区域的划分方法,包括:对第一数据集中的纬度和经度进行编码,得到第二数据集,其中,所述第一数据集中记录了N组具有对应关系的纬度和经度,N为自然数,所述第二数据集中记录了N个地区编号,每个所述地区编号用于表示一个地理区域;根据所述第二数据集获取第三数据集,其中,所述第三数据集中记录了M组具有对应关系的地区编号、所述地区编号所表示的地理区域中的中心点纬度、所述地区编号所表示的地理区域中的中心点经度,M为自然数、且为所述地区编号的数量;根据所述第三数据集将M个所述地区编号所表示的地理区域划分为P个区域,其中,P为自然数,每个所述区域包括至少一个所述地区编号所表示的地理区域。
根据本发明实施例的一方面,还提供了一种区域的划分装置,包括:编码模块,用于对第一数据集中的纬度和经度进行编码,得到第二数据集,其中,所述第一数据集中记录了N组具有对应关系的纬度和经度,N为自然数,所述第二数据集中记录了N个地区编号,每个所述地区编号用于表示一个地理区域;第一获取模块,用于根据所述第二数据集获取第三数据集,其中,所述第三数据集中记录了M组具有对应关系的地区编号、所述地区编号所表示的地理区域中的中心点纬度、所述地区编号所表示的地理区域中的中心点经度,M为自然数、且为所述地区编号的数量;划分模块,用于根据所述第三数据集将M个所述地区编号所表示的地理区域划分为P个区域,其中,P为自然数,每个所述区域包括至少一个所述地区编号所表示的地理区域。
可选地,划分模块包括:第一确定单元,用于在所述P个区域中存在第一区域的情况下,在所述P个区域确定与所述第一区域相邻的第二区域,其中,所述第一区域中包括的地理区域的个数小于第四预定阈值;更新单元,用于将所述第一区域中包括的地理区域更新为位于所述第二区域中。
可选地,编码模块包括:编码单元,用于对所述第一数据集中的纬度和经度进行GEOHASH编码,得到所述第二数据集,其中,所述第二数据集中记录了N组具有对应关系的地点名和GEOHASH码,所述地区编号为所述GEOHASH码。
可选地,第一获取模块包括:聚类单元,用于对所述第二数据集所记录的GEOHASH码进行聚类,得到M个互不相同的GEOHASH码;第二确定单元,用于确定所述M个互不相同的GEOHASH码中每个GEOHASH码所表示的地理区域中的中心点纬度,以及每个GEOHASH码所表示的地理区域中的中心点经度;记录单元,用于记录M组具有对应关系的GEOHASH码、所述GEOHASH码所表示的地理区域中的中心点纬度、所述GEOHASH码所表示的地理区域中的中心点经度,得到所述第三数据集。
可选地,所述装置还包括:第四获取模块,用于获取位于所述P个区域中的目标区域中包括的地点名,得到地点名集合;分词模块,用于对所述地点名集合中的每个地点名进行分词,得到分词结果;确定模块,用于在所述分词结果中出现次数大于第三预定阈值的地名词的情况下,将所述地名词确定为所述目标区域的区域名。
可选地,所述第三数据集中记录了M组具有对应关系的地区编号、所述地区编号所表示的地理区域中的中心点纬度、所述地区编号所表示的地理区域中的中心点经度以及所述地区编号所表示的地理区域中的地点数,其中,所述划分模块包括:划分单元,用于根据每个所述地区编号所表示的地理区域中的地点数,以及M个所述地区编号所表示的地理区域中的中心点之间的距离,将M个所述地区编号所表示的地理区域划分为P个区域。
可选地,划分单元包括:确定子单元,用于根据每个所述地区编号所表示的地理区域中的地点数确定每个所述地区编号所表示的地理区域中的第一中心点对应的权重值;标记子单元,用于根据每个第一中心点对应的权重值,以及以所述第一中心点为中心、以预定半径值为半径的范围内存在的除所述第一中心点之外的第二中心点的个数,将所述第一中心点标记为核心对象、非核心对象或者噪声对象;处理子单元,用于在所述第一中心点被标记为核心对象、且所述第一中心点以及位于所述范围内的第二中心点中存在一个中心点所在的地理区域已被记录为位于目标区域中的情况下,将所述第一中心点以及位于所述范围内的第二中心点所在的地理区域都记录为位于所述目标区域中;在所述第一中心点被标记为核心对象、且所述第一中心点以及位于所述范围内的第二中心点中的每个中心点所在的地理区域均未记录为位于所述区域中的情况下,将所述第一中心点以及位于所述范围内的第二中心点所在的地理区域都记录为位于同一个区域中。
可选地,确定子单元用于:确定所有所述地区编号所表示的地理区域中的地点数的均值,以及所有所述地区编号所表示的地理区域中的地点数的标准差;确定每个所述地区编号所表示的地理区域中的地点数与所述均值之间的差值;将所述差值与所述标准差之间的比值确定为每个所述地区编号所表示的地理区域中的第一中心点对应的权重值。
可选地,标记子单元用于:在所述权重值大于第一预定阈值的情况下,将所述第一中心点标记为核心对象;在所述权重值小于所述第一预定阈值且大于第二预定阈值的情况下,根据以所述第一中心点为中心、以预定半径值为半径的范围内存在的除所述第一中心点之外的第二中心点的个数,将所述第一中心点标记为核心对象、非核心对象或者噪声对象;在所述权重值小于所述第二预定阈值的情况下,根据以所述第一中心点为中心、以预定半径值为半径的范围内存在的除所述第一中心点之外的第二中心点的个数,将所述第一中心点标记为非核心对象或者噪声对象。
可选地,所述装置还包括:显示模块,用于在客户端显示的电子地图上标记所述P个区域和/或M个所述地区编号所表示的地理区域。
根据本发明实施例的一方面,还提供了一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项中所述的方法。
根据本发明实施例的一方面,还提供了一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行上述任一项中所述的方法。
在本发明实施例中,采用对第一数据集中的纬度和经度进行编码,得到第二数据集,其中,第一数据集中记录了N组具有对应关系的纬度和经度,N为自然数,第二数据集中记录了N个地区编号,每个地区编号用于表示一个地理区域;根据第二数据集获取第三数据集,其中,第三数据集中记录了M组具有对应关系的地区编号、地区编号所表示的地理区域中的中心点纬度、地区编号所表示的地理区域中的中心点经度,M为自然数、且为地区编号的数量;根据第三数据集将M个地区编号所表示的地理区域划分为P个区域,其中,P为自然数,每个区域包括至少一个地区编号所表示的地理区域的方式,按照地点的经纬度来表示地点,并根据经纬度与地区编号之间的位置关系对地点按照其所在地区进行聚类,再将聚类后的地区划分为P个不同区域,从而自动划分区域节省了人力资源,区域的划分标准统一,能够及时更新,计算量较小,易于在地图上绘制出区域范围,如有新的地点加入,则能够直接将其添加到所在位置的区域,从而实现了提高了区域的划分效率的技术效果,进而解决了相关技术中区域的划分效率较低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的区域的划分方法的示意图;
图2是根据本发明实施例的一种可选的区域的划分方法的应用环境示意图;
图3是根据本发明可选的实施方式的一种可选的区域的划分方法的示意图;
图4是根据本发明可选的实施方式的一种可选的区域的划分方法的示意图;
图5是根据本发明可选的实施方式的一种可选的区域的划分方法的示意图;
图6是根据本发明实施例的一种可选的区域的划分装置的示意图;
图7是根据本发明实施例的一种可选的区域的划分方法的示意图;以及
图8是根据本发明实施例的一种可选的电子装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例的一个方面,提供了一种区域的划分方法,如图1所示,该方法包括:
S102,对第一数据集中的纬度和经度进行编码,得到第二数据集,其中,第一数据集中记录了N组具有对应关系的纬度和经度,N为自然数,第二数据集中记录了N个地区编号,每个地区编号用于表示一个地理区域;
S104,根据第二数据集获取第三数据集,其中,第三数据集中记录了M组具有对应关系的地区编号、地区编号所表示的地理区域中的中心点纬度、地区编号所表示的地理区域中的中心点经度,M为自然数、且为地区编号的数量;
S106,根据第三数据集将M个地区编号所表示的地理区域划分为P个区域,其中,P为自然数,每个区域包括至少一个地区编号所表示的地理区域。
可选地,在本实施例中,上述区域的划分方法可以应用于如图2所示的计算机设备202所构成的硬件环境中。如图2所示,计算机设备202对第一数据集中的纬度和经度进行编码,得到第二数据集,其中,第一数据集中记录了N组具有对应关系的纬度和经度,N为自然数,第二数据集中记录了N个地区编号,每个地区编号用于表示一个地理区域;根据第二数据集获取第三数据集,其中,第三数据集中记录了M组具有对应关系的地区编号、地区编号所表示的地理区域中的中心点纬度、地区编号所表示的地理区域中的中心点经度,M为自然数、且为地区编号的数量;根据第三数据集将M个地区编号所表示的地理区域划分为P个区域,其中,P为自然数,每个区域包括至少一个地区编号所表示的地理区域。
可选地,在本实施例中,上述区域的划分方法可以但不限于应用于将待划分区域划分为多个子区域的场景中。其中,上述计算机设备可以但不限于为各种类型应用的服务器,例如,在线教育应用、即时通讯应用、社区空间应用、游戏应用、购物应用、浏览器应用、金融应用、多媒体应用、直播应用、导航应用、商户推荐应用等。上述仅是一种示例,本实施例中对此不做任何限定。
可选地,在本实施例中,上述区域可以但不限于包括:商业区域、城市街区、文化区域、景观区域、销售区域等等。比如:以商业区域为例,简称为商圈,即商户聚集区,是指城市中由商店、商场、餐馆、办公楼、酒店等商业设施,加上街道、车站、步行街等公共设施所有机组合而成的区域,为城市内主要的精华区与闹区。商圈是房地产开发的概念之一,在商业经营、小微企业风控、营销、商户搜索等场景都有重要的应用。由于经营商品、交通因素、地理位置、经营规模等方面的不同,各个商圈规模、商圈形态存在很大差别。
在商业经营中,商圈特征对商户的经营有关键性的影响,包括人流量、交通、基础设施、附近居民区或工作区、用户群差异、行业分布等,商户需要了解各商圈信息进行正确选址、并采取合适的经营策略,因此本实施例中提供的商圈的划分方法在商户选址、商户经营分析***中是重要的基础技术。如选址***中可以展示全国各地商圈的范围、商户数,如结合平台的其他数据,可以构建商圈的各种指标,如支付用户数、客单价、商户类型、用户群特征(性别、年龄、学历等),从而能帮助商户进行选址分析和经营分析。
在商业分析中,对一个商户的判断也需要了解商圈信息和商圈的变化,帮助正确评判商户的经营风险,本实施例中提供的商圈的划分方法有助于快速识别到商圈的变动,因此在小微企业贷款业务中有助于提高风险控制能力。如:去年识别的商圈范围有1000平方米,涉及500商户;而今年识别范围只有800平方米,涉及400商户;则有可能该商圈的人流和吸引力变差,在该地商户的经营能力也可能有下降风险。
此外,商圈信息可以帮助营销人员更好地选址进行营销、选择线下合作的商圈和商户,在互联网业务的运营中也有重要作用。
可选地,在本实施例中,第一数据集中记录了N组具有对应关系的纬度和经度,N为自然数。比如:第一数据集={(纬度1,经度1),(纬度2,经度2),……,(纬度n,经度n);n为商户总数}。
可选地,在本实施例中,第二数据集中记录了N个地区编号。比如:第二数据集中记录了N个GEOHASH码,地区编号为GEOHASH码。第二数据集={(GEOHASH码1),(GEOHASH码2),……,(GEOHASH码n);n为商户数量}。
可选地,在本实施例中,第三数据集中记录了M组具有对应关系的地区编号、所述地区编号所表示的地理区域中的中心点纬度、所述地区编号所表示的地理区域中的中心点经度。比如:第三数据集={(GEOHASH码1,中心点纬度1,中心点经度1),(GEOHASH码2,中心点纬度2,中心点经度2),……,(GEOHASH码m,中心点纬度m,中心点经度m);m为GEOHASH码数量}。
可选地,在本实施例中,按照地区编号对M个地区编号所表示的地理区域进行聚类,得到P个区域。P可以小于或者等于M。
可见,通过上述步骤,按照地点的经纬度来表示地点,并根据经纬度与地区编号之间的位置关系对地点按照其所在地区进行聚类,再将聚类后的地区划分为P个不同区域,从而自动划分区域节省了人力资源,区域的划分标准统一,能够及时更新,计算量较小,易于在地图上绘制出区域范围,如有新的地点加入,则能够直接将其添加到所在位置的区域,从而实现了提高了区域的划分效率的技术效果,进而解决了相关技术中区域的划分效率较低的技术问题。
作为一种可选的方案,在对第一数据集中的纬度和经度进行编码之前,还包括:
S1,获取待处理的N个地点名;
S2,通过调用地图应用的API接口获取N个地点名中每个地点名表示的地点所在的纬度和经度,以得到N组具有对应关系的地点名、纬度和经度;
S3,将N组具有对应关系的地点名、纬度和经度形成为第一数据集。
可选地,在本实施例中,第一数据集中可以记录N组具有对应关系的商户名、纬度和经度,N为自然数。比如:第一数据集={(商户名1,纬度1,经度1),(商户名2,纬度2,经度2),……,(商户名n,纬度n,经度n);n为商户总数}。
可选地,在本实施例中,N个地点名可以通过对已有业务数据进行的数据挖掘或者对网站爬取数据等方式进行获取。例如:从应用的支付业务数据中挖掘地点数据、从地点推荐类网站上爬取地点数据等。
可选地,在本实施例中,可以但不限于通过调用地图应用的API接口来对地点进行定位,从而得到地点的经纬度数据。地图应用可以是用于导航的应用,或者嵌入在其他应用中的导航功能。
作为一种可选的方案,根据第三数据集将M个地区编号所表示的地理区域划分为P个区域包括:
S1,在P个区域中存在第一区域的情况下,在P个区域确定与第一区域相邻的第二区域,其中,第一区域中包括的地理区域的个数小于第四预定阈值;
S2,将第一区域中包括的地理区域更新为位于第二区域中。
可选地,在本实施例中,对于较小的区域(比如:所包括的地理区域的个数小于第四预定阈值(比如5或10或20等等))可以将其合并到其周边的较大区域中,或者可以将其与其周边的较小区域合并为同一个区域。
作为一种可选的方案,对第一数据集中的纬度和经度进行编码,得到第二数据集包括:
S1,对第一数据集中的纬度和经度进行GEOHASH编码,得到第二数据集,其中,第二数据集中记录了N组具有对应关系的地点名和GEOHASH码,地区编号为GEOHASH码。
可选地,在本实施例中,编码方式可以但不限于包括:GEOHASH编码。GEOHASH编码是将二维的经纬度转换成字符串,如图3所示,展示了北京9个区域的GEOHASH字符串,分别是WX4ER,WX4G2、WX4G3等等,每一个字符串代表了某一矩形区域。GEOHASH编码的精度可以用字符串长度进行调整,字符串越长,表示的范围越精确。如5位的编码能表示10平方千米范围的矩形区域,而6位编码能表示更精细的区域(约0.34平方千米)。GEOHASH编码的精度如图4所示。
可选地,在本实施例中,对第一数据集中的纬度和经度进行GEOHASH编码,得到第二数据集,其中,第二数据集中记录了N组具有对应关系的商户名和GEOHASH码,地区编号为GEOHASH码。
可选地,在本实施例中,GEOHASH码的精度被设置为大于预定精度。
可选地,在本实施例中,第二数据集中记录了N组具有对应关系的商户名和地区编号。比如:第二数据集中记录了N组具有对应关系的商户名和GEOHASH码,地区编号为GEOHASH码。第二数据集={(商户名1,GEOHASH码1),(商户名2,GEOHASH码2),……,(商户名n,GEOHASH码n);n为商户数量}。
作为一种可选的方案,根据第二数据集获取第三数据集包括:
S1,对第二数据集所记录的GEOHASH码进行聚类,得到M个互不相同的GEOHASH码;
S2,确定M个互不相同的GEOHASH码中每个GEOHASH码所表示的地理区域中的中心点纬度,以及每个GEOHASH码所表示的地理区域中的中心点经度;
S3,记录M组具有对应关系的GEOHASH码、GEOHASH码所表示的地理区域中的中心点纬度、GEOHASH码所表示的地理区域中的中心点经度,得到第三数据集。
可选地,在本实施例中,第三数据集中记录了M组具有对应关系的地区编号、地区编号所表示的地理区域中的中心点纬度、地区编号所表示的地理区域中的中心点经度、地区编号所表示的地理区域中的商户数。比如:第三数据集={(GEOHASH码1,中心点纬度1,中心点经度1,商户数1),(GEOHASH码2,中心点纬度2,中心点经度2,商户数2),……,(GEOHASH码m,中心点纬度m,中心点经度m,商户数m);m为GEOHASH码数量}。
作为一种可选的方案,在根据第三数据集将M个地区编号所表示的地理区域划分为P个区域之后,还包括:
S11,获取位于P个区域中的目标区域中包括的地点名,得到地点名集合;
S12,对地点名集合中的每个地点名进行分词,得到分词结果;
S13,在分词结果中出现次数大于第三预定阈值的地名词的情况下,将地名词确定为目标区域的区域名。
可选地,在本实施例中,通过每个区域的中心点的经纬度,利用地图应用开放API,经过逆地址解析,获取目标区域中包括的地点名。对区域命名时以“周边知名区域->商圈->乡镇街道->一级地标->二级地标->交叉路口”的优先级次序决定区域名字,若有多个区域名字相同,则进入下一个优先级。如:多个区域的知名区域均相同,则使用商圈信息,若商圈信息再相同,则使用乡镇街道,以此类推。最终实现每个区域有一个唯一的名字。
可选地,在本实施例中,可以只保留有区别的名称作为商圈名。
作为一种可选的方案,第三数据集中记录了M组具有对应关系的地区编号、地区编号所表示的地理区域中的中心点纬度、地区编号所表示的地理区域中的中心点经度以及地区编号所表示的地理区域中的地点数,其中,根据第三数据集将M个地区编号所表示的地理区域划分为P个区域包括:
S1,根据每个地区编号所表示的地理区域中的地点数,以及M个地区编号所表示的地理区域中的中心点之间的距离,将M个地区编号所表示的地理区域划分为P个区域。
可选地,在本实施例中,可以但不限于根据地理区域之间的距离(例如以中心点之间的距离表示地理区域之间的距离)来划分区域,比如:距离较远的地理区域可能属于不同的区域,距离较近的地理区域属于同一区域。
作为一种可选的方案,根据每个地区编号所表示的地理区域中的地点数,以及M个地区编号所表示的地理区域中的中心点之间的距离,将M个地区编号所表示的地理区域划分为P个区域包括:
S1,根据每个地区编号所表示的地理区域中的地点数确定每个地区编号所表示的地理区域中的第一中心点对应的权重值;
S2,根据每个第一中心点对应的权重值,以及以第一中心点为中心、以预定半径值为半径的范围内存在的除第一中心点之外的第二中心点的个数,将第一中心点标记为核心对象、非核心对象或者噪声对象;
S3,在第一中心点被标记为核心对象、且第一中心点以及位于范围内的第二中心点中存在一个中心点所在的地理区域已被记录为位于目标区域中的情况下,将第一中心点以及位于范围内的第二中心点所在的地理区域都记录为位于目标区域中;在第一中心点被标记为核心对象、且第一中心点以及位于范围内的第二中心点中的每个中心点所在的地理区域均未记录为位于区域中的情况下,将第一中心点以及位于范围内的第二中心点所在的地理区域都记录为位于同一个区域中。
可选地,在本实施例中,由于每个地理区域内的商户数不同,加入权重W,能够更好的描述类内点的密度,优化聚类结果。
作为一种可选的方案,根据每个所述地区编号所表示的地理区域中的地点数确定每个所述地区编号所表示的地理区域中的第一中心点对应的权重值包括:
S1,确定所有所述地区编号所表示的地理区域中的地点数的均值,以及所有所述地区编号所表示的地理区域中的地点数的标准差;
S2,确定每个所述地区编号所表示的地理区域中的地点数与所述均值之间的差值;
S3,将所述差值与所述标准差之间的比值确定为每个所述地区编号所表示的地理区域中的第一中心点对应的权重值。
例如:权重W经过标准化处理:
其中,Ni为第i个区域的商户数,μ为所有区域商户数的均值,σ为所有区域商户数的标准差。
作为一种可选的方案,根据每个第一中心点对应的权重值,以及以所述第一中心点为中心、以预定半径值为半径的范围内存在的除所述第一中心点之外的第二中心点的个数,将所述第一中心点标记为核心对象、非核心对象或者噪声对象包括:
在所述权重值大于第一预定阈值的情况下,将所述第一中心点标记为核心对象;
在所述权重值小于所述第一预定阈值且大于第二预定阈值的情况下,根据以所述第一中心点为中心、以预定半径值为半径的范围内存在的除所述第一中心点之外的第二中心点的个数,将所述第一中心点标记为核心对象、非核心对象或者噪声对象;
在所述权重值小于所述第二预定阈值的情况下,根据以所述第一中心点为中心、以预定半径值为半径的范围内存在的除所述第一中心点之外的第二中心点的个数,将所述第一中心点标记为非核心对象或者噪声对象。
可选地,在本实施例中,在判断中心点是否为核心对象时,如果权重大于某阈值(经验值为5,表示商户数比均值大5σ),会直接标注其为核心对象;如果权重低于另一阈值(经验值为0,表示商户数低于平均水平),则不会被判断为核心对象。
在一个可选的实施方式中,以划分商圈为例,对M个地区编号所表示的地理区域中的中心点重复执行以下步骤,直到每个地区编号所表示的地理区域中的中心点被标识,从而得到P个商圈:
Sa,从M个中心点中选择出一个未被标识的中心点作为当前中心点;
Sb,根据以当前中心点为中心、以预定半径值为半径的范围内存在的除当前中心点之外的中心点的个数,将当前中心点标记为核心对象、非核心对象或者噪声对象;
Sc,在当前中心点被标记为核心对象、且当前中心点以及位于范围内的中心点中存在一个中心点所在的地理区域已被记录为位于目标商圈中的情况下,将当前中心点以及位于范围内的中心点所在的地理区域都记录为位于目标商圈中;在当前中心点被标记为核心对象、且当前中心点以及位于范围内的中心点中的每个中心点所在的地理区域均未记录为位于商圈中的情况下,将当前中心点以及位于范围内的中心点所在的地理区域都记录为位于同一个商圈中。
可选地,在本实施方式中,可以但不限于采用以下方式标记核心对象、非核心对象或者噪声对象:
S1,根据当前中心点所在的地理区域中的商户数确定当前中心点所对应的权重值;
S2,在权重值大于第一预定阈值的情况下,将当前中心点标记为核心对象;
S3,在权重值小于第一预定阈值且大于第二预定阈值的情况下,根据以当前中心点为中心、以预定半径值为半径的范围内存在的除当前中心点之外的中心点的个数,将当前中心点标记为核心对象、非核心对象或者噪声对象;
S4,在权重值小于第二预定阈值的情况下,根据以当前中心点为中心、以预定半径值为半径的范围内存在的除当前中心点之外的中心点的个数,将当前中心点标记为非核心对象或者噪声对象。
可选地,在本实施方式中,在权重值小于第一预定阈值且大于第二预定阈值的情况下,可以但不限于采用以下方式,标记核心对象、非核心对象或者噪声对象:
S1,在以当前中心点为中心、以预定半径值为半径的范围内存在的除当前中心点之外的中心点的个数大于第五预定阈值的情况下,将当前中心点以及位于范围内的中心点进行标记,其中,当前中心点被标记为核心对象;
S2,在以当前中心点为中心、以预定半径值为半径的范围内存在的除当前中心点之外的中心点的个数小于等于第五预定阈值、且大于等于1的情况下,将当前中心点标记为非核心对象;
S3,在以当前中心点为中心、以预定半径值为半径的范围内除当前中心点之外不存在任何中心点的情况下,将当前中心点标记为噪声对象。
可选地,在本实施例中,对于权重值小于第一预定阈值且大于第二预定阈值的情况,可以但不限于采用DBSCAN聚类算法确定其为核心对象、非核心对象或者噪声对象中的哪一种对象。
可选地,在本实施方式中,在权重值小于第二预定阈值的情况下,可以但不限于采用以下方式标记非核心对象或者噪声对象:
S1,在以当前中心点为中心、以预定半径值为半径的范围内存在的除当前中心点之外的其他中心点的情况下,将当前中心点标记为非核心对象;
S2,在以当前中心点为中心、以预定半径值为半径的范围内除当前中心点之外不存在任何中心点的情况下,将当前中心点标记为噪声对象。
可选地,在本实施例中,对于权重值小于第二预定阈值的情况,可以但不限于采用DBSCAN聚类算法确定其为非核心对象或者噪声对象。
作为一种可选的方案,在根据第三数据集将M个地区编号所表示的地理区域划分为P个区域之后,还包括
S1,在客户端显示的电子地图上标记P个区域和/或M个地区编号所表示的地理区域。
可选地,在本实施例中,可以将划分的区域信息传输至客户端进行显示。
例如:如图5所示,每一个格子表示一个GEOHASH区域,数字编码表示所属区域编号。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
根据本发明实施例的一个方面,还提供了一种用于实施上述区域的划分方法的区域的划分装置,如图6所示,该装置包括:
1)编码模块62,用于对第一数据集中的纬度和经度进行编码,得到第二数据集,其中,所述第一数据集中记录了N组具有对应关系的纬度和经度,N为自然数,所述第二数据集中记录了N个地区编号,每个所述地区编号用于表示一个地理区域;
2)第一获取模块64,用于根据所述第二数据集获取第三数据集,其中,所述第三数据集中记录了M组具有对应关系的地区编号、所述地区编号所表示的地理区域中的中心点纬度、所述地区编号所表示的地理区域中的中心点经度,M为自然数、且为所述地区编号的数量;
3)划分模块66,用于根据所述第三数据集将M个所述地区编号所表示的地理区域划分为P个区域,其中,P为自然数,每个所述区域包括至少一个所述地区编号所表示的地理区域。
可选地,上述装置还包括:
第二获取模块,用于获取待处理的N个地点名;
第三获取模块,用于通过调用地图应用的API接口获取N个地点名中每个地点名表示的地点所在的纬度和经度,以得到N组具有对应关系的地点名、纬度和经度;
形成模块,用于将N组具有对应关系的地点名、纬度和经度形成为第一数据集。
可选地,划分模块包括:第一确定单元,用于在P个区域中存在第一区域的情况下,在P个区域确定与第一区域相邻的第二区域,其中,第一区域中包括的地理区域的个数小于第四预定阈值;更新单元,用于将第一区域中包括的地理区域更新为位于第二区域中。
可选地,编码模块包括:编码单元,用于对第一数据集中的纬度和经度进行GEOHASH编码,得到第二数据集,其中,第二数据集中记录了N组具有对应关系的地点名和GEOHASH码,地区编号为GEOHASH码。
可选地,第一获取模块包括:聚类单元,用于对第二数据集所记录的GEOHASH码进行聚类,得到M个互不相同的GEOHASH码;第二确定单元,用于确定M个互不相同的GEOHASH码中每个GEOHASH码所表示的地理区域中的中心点纬度,以及每个GEOHASH码所表示的地理区域中的中心点经度;记录单元,用于记录M组具有对应关系的GEOHASH码、GEOHASH码所表示的地理区域中的中心点纬度、GEOHASH码所表示的地理区域中的中心点经度,得到第三数据集。
可选地,装置还包括:第四获取模块,用于获取位于P个区域中的目标区域中包括的店铺的地点名,得到地点名集合;分词模块,用于对地点名集合中的每个地点名进行分词,得到分词结果;确定模块,用于在分词结果中出现次数大于第三预定阈值的地名词的情况下,将地名词确定为目标区域的区域名。
可选地,第三数据集中记录了M组具有对应关系的地区编号、地区编号所表示的地理区域中的中心点纬度、地区编号所表示的地理区域中的中心点经度以及地区编号所表示的地理区域中的地点数,其中,划分模块包括:划分单元,用于根据每个地区编号所表示的地理区域中的地点数,以及M个地区编号所表示的地理区域中的中心点之间的距离,将M个地区编号所表示的地理区域划分为P个区域。
可选地,划分单元包括:确定子单元,用于根据每个地区编号所表示的地理区域中的地点数确定每个地区编号所表示的地理区域中的第一中心点对应的权重值;标记子单元,用于根据每个第一中心点对应的权重值,以及以第一中心点为中心、以预定半径值为半径的范围内存在的除第一中心点之外的第二中心点的个数,将第一中心点标记为核心对象、非核心对象或者噪声对象;处理子单元,用于在第一中心点被标记为核心对象、且第一中心点以及位于范围内的第二中心点中存在一个中心点所在的地理区域已被记录为位于目标区域中的情况下,将第一中心点以及位于范围内的第二中心点所在的地理区域都记录为位于目标区域中;在第一中心点被标记为核心对象、且第一中心点以及位于范围内的第二中心点中的每个中心点所在的地理区域均未记录为位于区域中的情况下,将第一中心点以及位于范围内的第二中心点所在的地理区域都记录为位于同一个区域中。
可选地,确定子单元用于:确定所有地区编号所表示的地理区域中的地点数的均值,以及所有地区编号所表示的地理区域中的地点数的标准差;确定每个地区编号所表示的地理区域中的地点数与均值之间的差值;将差值与标准差之间的比值确定为每个地区编号所表示的地理区域中的第一中心点对应的权重值。
可选地,标记子单元用于:在权重值大于第一预定阈值的情况下,将第一中心点标记为核心对象;在权重值小于第一预定阈值且大于第二预定阈值的情况下,根据以第一中心点为中心、以预定半径值为半径的范围内存在的除第一中心点之外的第二中心点的个数,将第一中心点标记为核心对象、非核心对象或者噪声对象;在权重值小于第二预定阈值的情况下,根据以第一中心点为中心、以预定半径值为半径的范围内存在的除第一中心点之外的第二中心点的个数,将第一中心点标记为非核心对象或者噪声对象。
可选地,装置还包括:显示模块,用于在客户端显示的电子地图上标记P个区域和/或M个地区编号所表示的地理区域。
作为一种可选的实施例,上述区域的划分方法可以但不限于应用于如图7所示的为商户划分商圈的场景中。在本场景中,通过商户位置数据,基于GEOHASH和DBSCAN聚类算法为城市划分商圈。通过商户的经纬度数据,即可获得各个城市的商圈划分情况、商圈地理范围,如有商户名或地图数据,还可以自动生成商圈名。无须对每个城市进行线下调查、或采集其他维度数据,大大提高商圈识别的效率,同时能够及时更新、对新开商户能直接判断所属商圈,让商圈信息能更有效地使用到商户分析***、营销等场景。
在本场景中,根据商户的位置数据,对城市的地理区域进行划分,并进行商圈名命名。商户的位置数据是地图***息,商圈根据各个区域范围的商户数量、密度进行划分,能随商圈变化及时变更,商圈结果是对区域的判断,当有新商户进入时可以快速判断属于哪个商圈。
如图7所示,该流程包括以下步骤:
步骤a,获取商户的经纬度数据,可以根据已有的商户名数据,通过地图应用的开发API获得商户对应的经纬度数据。获得商户经纬度数据集:S={(商户名1,纬度1,经度1),(商户名2,纬度2,经度2),……,(商户名n,纬度n,经度n);n为商户总数}。
步骤b,对经纬度数据进行GEOHASH编码。编码精度可以根据数据质量调整,如数据量足够大而精确,可以采用精细的精度,反之可以选择更粗的精度。例如:图5中中展示的商圈结果是采用精度7进行划分的(即每一个GEOHASH区域代表152.9m*152.4m),经过对部分城市的抽查检验,已能较好的捕捉商圈的形状。获得商户GEOHASH码数据集S’={(商户名1,GEOHASH码1),(商户名2,GEOHASH码2),……,(商户名n,GEOHASH码n);n为商户数量}。
步骤c,计算每个GEOHASH码的中心点、商户数。获得商户GEOHASH码数据集:G={(GEOHASH码1,中心点纬度1,中心点经度1,商户数1),(GEOHASH码2,中心点纬度2,中心点经度2,商户数2),……,(GEOHASH码m,中心点纬度m,中心点经度m,商户数m);m为GEOHASH码数量}。
步骤d,采用DBSCAN算法进行聚类。
步骤e,得到各GEOHASH区域所属商圈。聚类得到结果后,还可以根据实际应用需求,对聚类结果进行微调,使划分结果更符合实际认知,微调后得到各GEOHASH区域所属商圈。调整的方式如下:
1)商圈合并:如商圈只有4个以下GEOHASH区域,检查是否与其他大商圈“相邻”,有则归类到大商圈,避免商圈过于零散。
对于相邻GEOHASH区域的判断方法可以是:GEOHASH码解码获取该区域四个角的经纬度,这些经纬度加上GEOHASH固定的长宽,即可获取周围8个GEOHASH区域中心的经纬度,再次转码即可获得每个GEOHASH区域的相邻区域。
2)参数调整:针对不同的数据情况,可以对GEOHASH的精度、聚类的参数进行适当的调整,找到最佳参数。调整参数过程可以通过与有标识的商圈数据进行对比,或者在地图上绘制划分结果,根据分析经验进行判断。尝试多种参数的组合,可找到最佳参数。
步骤f,识别商圈名称。如数据有商户的名称,可以根据商户名数据,为各个商圈进行命名。可以采用提取商户名中疑似商圈名的高频词的方式,商圈名通常出现在分店名中,如绿茶(海岸城店)、肯德基-海岸城店。对商户名进行分词获取候选词并计算商圈中每个词的出现频次,设置频次的阈值,如有满足条件的地名词,则作为该商圈的名字,阈值则需要视数据质量调整。也可以通过每个商圈的中心点的经纬度,利用地图应用开放API,经过逆地址解析,获取对坐标位置进行描述的信息,包括周边知名区域、商圈、乡镇街道、一级地标、二级地标、交叉路口。对商圈命名时以“周边知名区域->商圈->乡镇街道->一级地标->二级地标->交叉路口”的优先级次序决定商圈名字,若有多个商圈名字相同,则进入下一个优先级。如:多个商圈的知名区域均相同,则使用商圈信息,若商圈信息再相同,则使用乡镇街道,以此类推。最终实现每个商圈有一个唯一的名字。
根据本发明实施例的一个方面,还提供了一种用于实施上述商圈的划分的电子装置,如图8所示,该电子装置包括:一个或多个(图中仅示出一个)处理器802、存储器804、传感器806、编码器808以及传输装置810,该存储器中存储有计算机程序,该处理器被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,对第一数据集中的纬度和经度进行编码,得到第二数据集,其中,第一数据集中记录了N组具有对应关系的纬度和经度,N为自然数,第二数据集中记录了N个地区编号,每个地区编号用于表示一个地理区域;
S2,根据第二数据集获取第三数据集,其中,第三数据集中记录了M组具有对应关系的地区编号、地区编号所表示的地理区域中的中心点纬度、地区编号所表示的地理区域中的中心点经度,M为自然数、且为地区编号的数量;
S3,根据第三数据集将M个地区编号所表示的地理区域划分为P个区域,其中,P为自然数,每个区域包括至少一个地区编号所表示的地理区域。
可选地,本领域普通技术人员可以理解,图8所示的结构仅为示意,电子装置也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图8其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图8中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图8所示不同的配置。
其中,存储器802可用于存储软件程序以及模块,如本发明实施例中的区域的划分方法和装置对应的程序指令/模块,处理器804通过运行存储在存储器802内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的目标组件的控制方法。存储器802可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器802可进一步包括相对于处理器804远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置810用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置810包括一个网络适配器(NetworkInterface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置810为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器802用于存储应用程序。
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,对第一数据集中的纬度和经度进行编码,得到第二数据集,其中,第一数据集中记录了N组具有对应关系的纬度和经度,N为自然数,第二数据集中记录了N个地区编号,每个地区编号用于表示一个地理区域;
S2,根据第二数据集获取第三数据集,其中,第三数据集中记录了M组具有对应关系的地区编号、地区编号所表示的地理区域中的中心点纬度、地区编号所表示的地理区域中的中心点经度,M为自然数、且为地区编号的数量;
S3,根据第三数据集将M个地区编号所表示的地理区域划分为P个区域,其中,P为自然数,每个区域包括至少一个地区编号所表示的地理区域。
可选地,存储介质还被设置为存储用于执行上述实施例中的方法中所包括的步骤的计算机程序,本实施例中对此不再赘述。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (15)
1.一种区域的划分方法,其特征在于,包括:
对第一数据集中的纬度和经度进行编码,得到第二数据集,其中,所述第一数据集中记录了N组具有对应关系的纬度和经度,N为自然数,所述第二数据集中记录了N个地区编号,每个所述地区编号用于表示一个地理区域;
根据所述第二数据集获取第三数据集,其中,所述第三数据集中记录了M组具有对应关系的地区编号、所述地区编号所表示的地理区域中的中心点纬度、所述地区编号所表示的地理区域中的中心点经度,M为自然数、且为所述地区编号的数量;
根据所述第三数据集将M个所述地区编号所表示的地理区域划分为P个区域,其中,P为自然数,每个所述区域包括至少一个所述地区编号所表示的地理区域。
2.根据权利要求1所述的方法,其特征在于,在对第一数据集中的纬度和经度进行编码之前,还包括:
获取待处理的N个地点名;
通过调用地图应用的API接口获取所述N个地点名中每个地点名表示的地点所在的纬度和经度,以得到N组具有对应关系的地点名、纬度和经度;
将所述N组具有对应关系的地点名、纬度和经度形成为所述第一数据集。
3.根据权利要求1所述的方法,其特征在于,根据所述第三数据集将M个所述地区编号所表示的地理区域划分为P个区域包括:
在所述P个区域中存在第一区域的情况下,在所述P个区域中确定与所述第一区域相邻的第二区域,其中,所述第一区域中包括的地理区域的个数小于第四预定阈值;
将所述第一区域中包括的地理区域更新为位于所述第二区域中。
4.根据权利要求2所述的方法,其特征在于,对第一数据集中的纬度和经度进行编码,得到第二数据集包括:
对所述第一数据集中的纬度和经度进行GEOHASH编码,得到所述第二数据集,其中,所述第二数据集中记录了N组具有对应关系的地点名和GEOHASH码,所述地区编号为所述GEOHASH码。
5.根据权利要求4所述的方法,其特征在于,根据所述第二数据集获取所述第三数据集包括:
对所述第二数据集所记录的GEOHASH码进行聚类,得到M个互不相同的GEOHASH码;
确定所述M个互不相同的GEOHASH码中每个GEOHASH码所表示的地理区域中的中心点纬度,以及每个GEOHASH码所表示的地理区域中的中心点经度;
记录M组具有对应关系的GEOHASH码、所述GEOHASH码所表示的地理区域中的中心点纬度、所述GEOHASH码所表示的地理区域中的中心点经度,得到所述第三数据集。
6.根据权利要求1所述的方法,其特征在于,在根据所述第三数据集将M个所述地区编号所表示的地理区域划分为P个区域之后,还包括:
获取位于所述P个区域中的目标区域中包括的地点名,得到地点名集合;
对所述地点名集合中的每个地点名进行分词,得到分词结果;
在所述分词结果中出现次数大于第三预定阈值的地名词的情况下,将所述地名词确定为所述目标区域的区域名。
7.根据权利要求1所述的方法,其特征在于,所述第三数据集中记录了M组具有对应关系的地区编号、所述地区编号所表示的地理区域中的中心点纬度、所述地区编号所表示的地理区域中的中心点经度以及所述地区编号所表示的地理区域中的地点数,其中,根据所述第三数据集将M个所述地区编号所表示的地理区域划分为P个区域包括:
根据每个所述地区编号所表示的地理区域中的地点数,以及M个所述地区编号所表示的地理区域中的中心点之间的距离,将M个所述地区编号所表示的地理区域划分为P个区域。
8.根据权利要求7所述的方法,其特征在于,根据每个所述地区编号所表示的地理区域中的地点数,以及M个所述地区编号所表示的地理区域中的中心点之间的距离,将M个所述地区编号所表示的地理区域划分为P个区域包括:
根据每个所述地区编号所表示的地理区域中的地点数确定每个所述地区编号所表示的地理区域中的第一中心点对应的权重值;
根据每个第一中心点对应的权重值,以及以所述第一中心点为中心、以预定半径值为半径的范围内存在的除所述第一中心点之外的第二中心点的个数,将所述第一中心点标记为核心对象、非核心对象或者噪声对象;
在所述第一中心点被标记为核心对象、且所述第一中心点以及位于所述范围内的第二中心点中存在一个中心点所在的地理区域已被记录为位于目标区域中的情况下,将所述第一中心点以及位于所述范围内的第二中心点所在的地理区域都记录为位于所述目标区域中;在所述第一中心点被标记为核心对象、且所述第一中心点以及位于所述范围内的第二中心点中的每个中心点所在的地理区域均未记录为位于所述区域中的情况下,将所述第一中心点以及位于所述范围内的第二中心点所在的地理区域都记录为位于同一个区域中。
9.根据权利要求8所述的方法,其特征在于,根据每个所述地区编号所表示的地理区域中的地点数确定每个所述地区编号所表示的地理区域中的第一中心点对应的权重值包括:
确定所有所述地区编号所表示的地理区域中的地点数的均值,以及所有所述地区编号所表示的地理区域中的地点数的标准差;
确定每个所述地区编号所表示的地理区域中的地点数与所述均值之间的差值;
将所述差值与所述标准差之间的比值确定为每个所述地区编号所表示的地理区域中的第一中心点对应的权重值。
10.根据权利要求8所述的方法,其特征在于,根据每个第一中心点对应的权重值,以及以所述第一中心点为中心、以预定半径值为半径的范围内存在的除所述第一中心点之外的第二中心点的个数,将所述第一中心点标记为核心对象、非核心对象或者噪声对象包括:
在所述权重值大于第一预定阈值的情况下,将所述第一中心点标记为核心对象;
在所述权重值小于所述第一预定阈值且大于第二预定阈值的情况下,根据以所述第一中心点为中心、以预定半径值为半径的范围内存在的除所述第一中心点之外的第二中心点的个数,将所述第一中心点标记为核心对象、非核心对象或者噪声对象;
在所述权重值小于所述第二预定阈值的情况下,根据以所述第一中心点为中心、以预定半径值为半径的范围内存在的除所述第一中心点之外的第二中心点的个数,将所述第一中心点标记为非核心对象或者噪声对象。
11.根据权利要求1至10中任一项所述的方法,其特征在于,在根据所述第三数据集将M个所述地区编号所表示的地理区域划分为P个区域之后,还包括:
在客户端显示的电子地图上标记所述P个区域和/或M个所述地区编号所表示的地理区域。
12.一种区域的划分装置,其特征在于,包括:
编码模块,用于对第一数据集中的纬度和经度进行编码,得到第二数据集,其中,所述第一数据集中记录了N组具有对应关系的纬度和经度,N为自然数,所述第二数据集中记录了N个地区编号,每个所述地区编号用于表示一个地理区域;
第一获取模块,用于根据所述第二数据集获取第三数据集,其中,所述第三数据集中记录了M组具有对应关系的地区编号、所述地区编号所表示的地理区域中的中心点纬度、所述地区编号所表示的地理区域中的中心点经度,M为自然数、且为所述地区编号的数量;
划分模块,用于根据所述第三数据集将M个所述地区编号所表示的地理区域划分为P个区域,其中,P为自然数,每个所述区域包括至少一个所述地区编号所表示的地理区域。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取待处理的N个地点名;
第三获取模块,用于通过调用地图应用的API接口获取所述N个地点名中每个地点名表示的地点所在的纬度和经度,以得到N组具有对应关系的地点名、纬度和经度;
形成模块,用于将所述N组具有对应关系的地点名、纬度和经度形成为所述第一数据集。
14.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至11任一项中所述的方法。
15.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至11任一项中所述的方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910209714.6A CN111723959B (zh) | 2019-03-19 | 2019-03-19 | 区域的划分方法、装置、存储介质及电子装置 |
JP2021519699A JP7210086B2 (ja) | 2019-03-19 | 2020-03-09 | エリアの分割方法と装置、電子装置およびプログラム |
PCT/CN2020/078351 WO2020187070A1 (zh) | 2019-03-19 | 2020-03-09 | 区域的划分方法、装置、存储介质及电子装置 |
US17/320,013 US11966424B2 (en) | 2019-03-19 | 2021-05-13 | Method and apparatus for dividing region, storage medium, and electronic device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910209714.6A CN111723959B (zh) | 2019-03-19 | 2019-03-19 | 区域的划分方法、装置、存储介质及电子装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111723959A true CN111723959A (zh) | 2020-09-29 |
CN111723959B CN111723959B (zh) | 2023-12-12 |
Family
ID=72519006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910209714.6A Active CN111723959B (zh) | 2019-03-19 | 2019-03-19 | 区域的划分方法、装置、存储介质及电子装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11966424B2 (zh) |
JP (1) | JP7210086B2 (zh) |
CN (1) | CN111723959B (zh) |
WO (1) | WO2020187070A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112861972A (zh) * | 2020-10-26 | 2021-05-28 | 平安科技(深圳)有限公司 | 一种展业区域的选址方法、装置、计算机设备和介质 |
CN112907275A (zh) * | 2021-01-21 | 2021-06-04 | 长沙市到家悠享网络科技有限公司 | 商圈围栏配置方法、服务信息分配方法及设备、介质 |
CN113793171A (zh) * | 2021-08-27 | 2021-12-14 | 浙江新再灵科技股份有限公司 | 基于多维数据的区域划分方法、装置、存储介质及设备 |
CN114925069A (zh) * | 2022-05-30 | 2022-08-19 | 重庆长安汽车股份有限公司 | 大数据gps离线解析方法 |
CN116132486A (zh) * | 2023-04-13 | 2023-05-16 | 山东慧创信息科技有限公司 | 一种基于物联网高精度的天空地一体化数据获取*** |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114385627A (zh) * | 2021-12-08 | 2022-04-22 | 北京大数元科技发展有限公司 | 一种基于gis地图的数据分析方法、装置及存储介质 |
CN117195016B (zh) * | 2023-11-07 | 2024-02-06 | 长江三峡集团实业发展(北京)有限公司 | 污水处理模式确定方法、装置、计算机设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130097163A1 (en) * | 2011-10-18 | 2013-04-18 | Nokia Corporation | Methods and apparatuses for facilitating interaction with a geohash-indexed data set |
US20160321351A1 (en) * | 2015-04-30 | 2016-11-03 | Verint Systems Ltd. | System and method for spatial clustering using multiple-resolution grids |
CN108269087A (zh) * | 2018-01-12 | 2018-07-10 | 阿里巴巴集团控股有限公司 | 位置信息的处理方法及装置 |
CN108363733A (zh) * | 2018-01-17 | 2018-08-03 | 阿里巴巴集团控股有限公司 | 内容推荐方法及装置 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6609062B2 (en) * | 1996-08-22 | 2003-08-19 | Wgrs Licensing Company, Llc | Nesting grid structure for a geographic referencing system and method of creating and using the same |
JP5155081B2 (ja) * | 2008-09-29 | 2013-02-27 | 日本たばこ産業株式会社 | 巡回ポイント分類システムおよび巡回ポイント分類方法 |
US8060582B2 (en) | 2008-10-22 | 2011-11-15 | Google Inc. | Geocoding personal information |
CA2712028C (en) | 2010-08-25 | 2011-12-20 | Ibm Canada Limited - Ibm Canada Limitee | Geospatial database integration using business models |
US9141641B2 (en) * | 2010-10-28 | 2015-09-22 | Sap Se | Aggregating based on hierarchy and scaling input |
JP2012113625A (ja) | 2010-11-26 | 2012-06-14 | Sony Corp | 情報処置装置、情報処置方法およびプログラム |
US8669884B2 (en) * | 2011-02-02 | 2014-03-11 | Mapquest, Inc. | Systems and methods for generating electronic map displays with points of-interest information |
JP5797419B2 (ja) | 2011-02-16 | 2015-10-21 | 株式会社 ミックウェア | 地図情報処理装置、ナビゲーション装置、地図情報処理方法、およびプログラム |
JP5747673B2 (ja) | 2011-06-10 | 2015-07-15 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
CN103944932B (zh) | 2013-01-18 | 2017-07-14 | 阿里巴巴集团控股有限公司 | 搜索、确定活跃区域的方法与服务器 |
CN103902655B (zh) | 2014-02-28 | 2017-01-04 | 小米科技有限责任公司 | 聚类方法、装置及终端设备 |
US11138243B2 (en) * | 2014-03-06 | 2021-10-05 | International Business Machines Corporation | Indexing geographic data |
JP5806364B1 (ja) | 2014-05-28 | 2015-11-10 | 日本電信電話株式会社 | バースト領域抽出装置、バースト領域抽出方法及びバースト領域抽出プログラム |
CA2976122A1 (en) * | 2015-02-10 | 2016-08-18 | Beijing Didi Infinity Technology And Development Co., Ltd. | Methods and systems for pushing orders |
US10094675B2 (en) * | 2015-06-07 | 2018-10-09 | Apple Inc. | Map application with transit navigation mode |
CN107273376B (zh) * | 2016-04-07 | 2020-08-04 | 阿里巴巴集团控股有限公司 | 目标位置搜索方法和装置 |
US11380441B1 (en) * | 2016-05-10 | 2022-07-05 | Privacy Analytics Inc. | Geo-clustering for data de-identification |
US11194873B1 (en) * | 2016-05-18 | 2021-12-07 | United Services Automobile Association (Usaa) | Grid-based ranking of location data |
CN106528597B (zh) * | 2016-09-23 | 2019-07-05 | 百度在线网络技术(北京)有限公司 | 兴趣点的标注方法以及装置 |
US20180232840A1 (en) * | 2017-02-15 | 2018-08-16 | Uber Technologies, Inc. | Geospatial clustering for service coordination systems |
CN108540988B (zh) * | 2017-03-06 | 2020-10-09 | ***通信集团公司 | 一种场景划分方法及装置 |
CN107193918B (zh) * | 2017-05-15 | 2020-07-14 | 浙江正泰中自控制工程有限公司 | 一种基于开源地图的分布式gis状态监控*** |
CN108960694B (zh) * | 2017-05-19 | 2022-04-12 | 北京京东振世信息技术有限公司 | 配送区域确定方法和装置 |
CN111434150B (zh) * | 2017-08-28 | 2024-02-13 | K·阿穆里斯 | 针对移动自组织网络的多层级的、密度感知的、基于位置的信道指定和自适应功率控制方法 |
CN109102334A (zh) * | 2018-08-07 | 2018-12-28 | 长沙市到家悠享家政服务有限公司 | 商圈划分方法、装置及电子设备 |
CN109992633B (zh) * | 2019-02-20 | 2020-08-07 | 北京三快在线科技有限公司 | 基于用户位置的地理围栏确定方法、装置、电子设备 |
US10848407B2 (en) * | 2019-04-22 | 2020-11-24 | Oath Inc. | Efficient density based geo clustering |
CN110335068A (zh) * | 2019-06-18 | 2019-10-15 | 平安普惠企业管理有限公司 | 一种商户聚集区域确定方法及装置 |
US11349850B2 (en) * | 2019-12-03 | 2022-05-31 | Blackberry Limited | Systems and methods for managing mobile devices based on device location data |
-
2019
- 2019-03-19 CN CN201910209714.6A patent/CN111723959B/zh active Active
-
2020
- 2020-03-09 JP JP2021519699A patent/JP7210086B2/ja active Active
- 2020-03-09 WO PCT/CN2020/078351 patent/WO2020187070A1/zh active Application Filing
-
2021
- 2021-05-13 US US17/320,013 patent/US11966424B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130097163A1 (en) * | 2011-10-18 | 2013-04-18 | Nokia Corporation | Methods and apparatuses for facilitating interaction with a geohash-indexed data set |
US20160321351A1 (en) * | 2015-04-30 | 2016-11-03 | Verint Systems Ltd. | System and method for spatial clustering using multiple-resolution grids |
CN108269087A (zh) * | 2018-01-12 | 2018-07-10 | 阿里巴巴集团控股有限公司 | 位置信息的处理方法及装置 |
CN108363733A (zh) * | 2018-01-17 | 2018-08-03 | 阿里巴巴集团控股有限公司 | 内容推荐方法及装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112861972A (zh) * | 2020-10-26 | 2021-05-28 | 平安科技(深圳)有限公司 | 一种展业区域的选址方法、装置、计算机设备和介质 |
WO2021203728A1 (zh) * | 2020-10-26 | 2021-10-14 | 平安科技(深圳)有限公司 | 一种展业区域的选址方法、装置、计算机设备和介质 |
CN112861972B (zh) * | 2020-10-26 | 2023-09-26 | 平安科技(深圳)有限公司 | 一种展业区域的选址方法、装置、计算机设备和介质 |
CN112907275A (zh) * | 2021-01-21 | 2021-06-04 | 长沙市到家悠享网络科技有限公司 | 商圈围栏配置方法、服务信息分配方法及设备、介质 |
CN113793171A (zh) * | 2021-08-27 | 2021-12-14 | 浙江新再灵科技股份有限公司 | 基于多维数据的区域划分方法、装置、存储介质及设备 |
CN113793171B (zh) * | 2021-08-27 | 2023-11-07 | 浙江新再灵科技股份有限公司 | 基于多维数据的区域划分方法、装置、存储介质及设备 |
CN114925069A (zh) * | 2022-05-30 | 2022-08-19 | 重庆长安汽车股份有限公司 | 大数据gps离线解析方法 |
CN116132486A (zh) * | 2023-04-13 | 2023-05-16 | 山东慧创信息科技有限公司 | 一种基于物联网高精度的天空地一体化数据获取*** |
Also Published As
Publication number | Publication date |
---|---|
CN111723959B (zh) | 2023-12-12 |
WO2020187070A1 (zh) | 2020-09-24 |
JP7210086B2 (ja) | 2023-01-23 |
US11966424B2 (en) | 2024-04-23 |
JP2022504597A (ja) | 2022-01-13 |
US20210263957A1 (en) | 2021-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111723959B (zh) | 区域的划分方法、装置、存储介质及电子装置 | |
CN103493044B (zh) | 使用在区域中的3d模型活动对场所排名的扩展 | |
US8185135B2 (en) | WiFi and GSM landmarks and neighborhoods for location based services | |
US10587711B2 (en) | Method and apparatus for pushing information | |
KR102121361B1 (ko) | 사용자가 위치되는 지리적 위치의 유형을 식별하기 위한 방법 및 디바이스 | |
CN110347777B (zh) | 一种兴趣点poi的分类方法、装置、服务器及存储介质 | |
Hochmair et al. | Data quality of points of interest in selected mapping and social media platforms | |
CN111949834A (zh) | 选址方法和选址平台 | |
CN103703458A (zh) | 创建并监视针对地理区域的警告 | |
JP2015521327A (ja) | モバイルアプリケーションのユーザの関心プロファイル | |
CN112861972B (zh) | 一种展业区域的选址方法、装置、计算机设备和介质 | |
CN109033128A (zh) | 一种地理位置识别方法及装置 | |
CN103250151A (zh) | 服务器、信息管理方法、信息管理程序以及记录该程序的计算机可读取的记录介质 | |
CN105989024A (zh) | 确定用户所在的位置区域的方法和装置 | |
KR20210114903A (ko) | 부동산 시세 추정 시스템 및 방법 | |
Yin et al. | A deep learning approach for rooftop geocoding | |
CN107291784B (zh) | 地理围栏类别的获取方法、装置及业务设备 | |
Pafi et al. | Measuring the accessibility of urban green areas | |
CN112819544A (zh) | 基于大数据的广告投放方法、装置、设备及存储介质 | |
CN107025246B (zh) | 一种目标地理区域的识别方法和装置 | |
Vargas et al. | Environmental and geographical biases in plant specimen data from the Colombian Andes | |
CN111209487B (zh) | 用户数据分析方法、服务器及计算机可读存储介质 | |
CN111242723B (zh) | 用户子女情况判断方法、服务器及计算机可读存储介质 | |
Chima et al. | Assessment of Nigeriasat-1 satellite data for urban land use/land cover analysis using object-based image analysis in Abuja, Nigeria | |
KR102116167B1 (ko) | Gis를 기반으로 하는 지역 종합 안내 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |