CN106021336A - 一种对批量地址信息进行自动行政区划划分的方法 - Google Patents

一种对批量地址信息进行自动行政区划划分的方法 Download PDF

Info

Publication number
CN106021336A
CN106021336A CN201610299934.9A CN201610299934A CN106021336A CN 106021336 A CN106021336 A CN 106021336A CN 201610299934 A CN201610299934 A CN 201610299934A CN 106021336 A CN106021336 A CN 106021336A
Authority
CN
China
Prior art keywords
administrative
information
division
community
address information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610299934.9A
Other languages
English (en)
Inventor
钟昌贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Sifang Zhongxin Technology Co Ltd
Original Assignee
Xiamen Sifang Zhongxin Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Sifang Zhongxin Technology Co Ltd filed Critical Xiamen Sifang Zhongxin Technology Co Ltd
Priority to CN201610299934.9A priority Critical patent/CN106021336A/zh
Publication of CN106021336A publication Critical patent/CN106021336A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种对批量地址信息进行自动行政区划划分的方法,包括以下步骤:10.准备阶段:获取各行政区名称,将各行政区名称、树形关联以及编码存入数据库中;20.开始阶段,包括21.获取批量原始地址信息,并各个原始地址进行优化,优化包括筛查与漏检;22.调用地图API获取各原始地址的经纬度信息;23.调用地图API,采用地图搜索功能;24.根据树形关联获取匹配结果,该匹配结果是与该地址关联的所有级别行政区名称。30.结束阶段,包括31.将匹配成功的结果存入数据库;32.将匹配失败的结果输出日志;33.统计匹配数量并计算命中。本发明只需要地址信息作为依据条件便可支持多级同时查找、批量查找,最大限度地提升结果匹配的命中率,非常实用及高效。

Description

一种对批量地址信息进行自动行政区划划分的方法
技术领域
本发明涉及一种对批量地址信息进行自动行政区划划分的方法。
背景技术
在互联网应用技术、软件开发等技术蓬勃发展的今天,常常会大批量地对各种个样的数据进行处理,而地理信息处理便是其中一种,在软件设计和开发过程中,基于业务需求,常常会遇到根据用户地址获取地址所属行政区域信息的需要,中国现行行政区划,即省级、地级、县级、乡级、村级、组级,其中省、 县、 乡三级为基本行政区。在各种行业软件开发或互联网网站建设等过程中,经常会有需要对地址进行行政区划分的需求,例如各级政府网站、城市环卫建设、物流派件***的行政区划分类、电子商务网站的地区分类等。
目前,现有方法主要是利用电子地图通过输入地址信息来逐一查找,或者通过中华人民共和国民政部的官网输入省、市等行政区信息,后查看地图通过肉眼判断,从而获得开发者想要行政区划信息,现有方法存在以下缺点:
(1)不支持一次性同时对地址进行市、区,街道,社区四个级别的行政区查询,需要分不同的过滤条件查询地址周边;
(2)人工输入效率低下,一人一次只能匹配一条,无法做到自动化批量匹配。
本发明人经过深入研究,提出一种对批量地址信息进行自动行政区划划分的方法。
发明内容
本发明为解决上述问题,提供了一种对批量地址信息进行自动行政区划划分的方法,其是针对于省级以下,包含市、区、街道/镇、社区/村最常见的四个小级别的行政区划自动划分的方法,只需要地址信息作为依据条件便可支持多级同时查找、批量查找,最大限度地提升结果匹配的命中率,非常实用及高效。
为实现上述目的,本发明采用的技术方案为:
一种对批量地址信息进行自动行政区划划分的方法,包括以下步骤:
10.准备阶段:获取各行政区名称,根据市>区>街道/镇>社区/村的上下级关系建立树形关联,关联规则是上级对下级为一对多,将各行政区名称、树形关联以及编码存入数据库中;
20.开始阶段,包括以下步骤:
21.获取批量原始地址信息,并各个原始地址进行优化,优化包括筛查与漏检;
22.调用地图API获取各原始地址的经纬度信息,若获取经纬度信息失败,则结束;
23.调用地图API,采用地图搜索功能,搜索“经纬度信息+关键词”,获取匹配该经纬度信息+关键词的社区/村级行政区域信息,若搜索失败则切换下一个关键词;
24.截取匹配成功的社区/村级行政区域信息,解析出社区/村的名称,将解析出的社区/村名称与数据库存储的各行政区名称进行逐级向上匹配,根据树形关联获取匹配结果,该匹配结果是与该社区/村的名称关联的所有级别行政区名称;
30.结束阶段,包括以下步骤:
31.将匹配成功的结果存入数据库;
32.将匹配失败的结果输出日志;
33.统计匹配数量并计算命中率。
所述步骤10中还包括:对各行政区进行编码,赋予个行政区一个PID值,该PID值为该行政区的上一级的编码。
所述步骤21的筛查与漏检地址过程为:过滤地址信息里面的特殊字符串,补充完整市级信息。
所述步骤23的关键词可以是“社区”、“居委会”、“村”或“农场”。
所述步骤24采用的解析规则是:选取所有匹配结果在地图的中心点,根据各匹配地址与中心点的距离远近升序排列,选择距离最近的坐标点的名称作为解析结果。
采用上述方案后,本发明的有益效果是:
本发明解决了各类软件开发、网站建设等过程中,获取各级行政区划信息时,因方法有限而导致的工作效率低下,命中率不高,处理数据量小等问题,大大提高了行政区划信息匹配效率,命中率高。
附图说明
图1是本发明的流程简图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图及实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明揭示的一种对批量地址信息进行自动行政区划划分的方法,其包括以下步骤:
10.准备阶段:获取各行政区名称,根据市>区>街道/镇>社区/村的上下级关系建立树形关联,关联规则是上级对下级为一对多,将各行政区名称、树形关联以及编码存入数据库中;
20.开始阶段,包括以下步骤:
21.获取批量原始地址信息,并各个原始地址进行优化,优化包括筛查与漏检;
22.调用地图API获取各原始地址的经纬度信息,若获取经纬度信息失败,则结束;
23.调用地图API,采用地图搜索功能,搜索“经纬度信息+关键词”,获取匹配该经纬度信息+关键词的社区/村级行政区域信息,若搜索失败则切换下一个关键词;
24.截取匹配成功的社区/村级行政区域信息,解析出社区/村的名称,将解析出的社区/村名称与数据库存储的各行政区名称进行逐级向上匹配,根据树形关联获取匹配结果,该匹配结果是与该社区/村的名称关联的所有级别行政区名称;
30.结束阶段,包括以下步骤:
31.将匹配成功的结果存入数据库;
32.将匹配失败的结果输出日志;
33.统计匹配数量并计算命中率。
所述步骤10中还包括:对各行政区进行编码,赋予个行政区一个PID值,该PID值为该行政区的上一级的编码。
所述步骤21的筛查与漏检地址过程为:过滤地址信息里面的特殊字符串,补充完整市级信息。
所述步骤23的关键词可以是“社区”、“居委会”、“村”或“农场”。
所述步骤24采用的解析规则是:选取所有匹配结果在地图的中心点,根据各匹配地址与中心点的距离远近升序排列,选择距离最近的坐标点的名称作为解析结果。
以下为依据本发明的划分方法的一个应用实例,下表是对来自于厦门市的原始地址划分结果。
上述说明示出并描述了本发明的优选实施例,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (5)

1.一种对批量地址信息进行自动行政区划划分的方法,其特征在于,包括以下步骤:
10.准备阶段:获取各行政区名称,根据市>区>街道/镇>社区/村的上下级关系建立树形关联,关联规则是上级对下级为一对多,将各行政区名称、树形关联以及编码存入数据库中;
20.开始阶段,包括以下步骤:
21.获取批量原始地址信息,并各个原始地址进行优化,优化包括筛查与漏检;
22.调用地图API获取各原始地址的经纬度信息,若获取经纬度信息失败,则结束;
23.调用地图API,采用地图搜索功能,搜索“经纬度信息+关键词”,获取匹配该经纬度信息+关键词的社区/村级行政区域信息,若搜索失败则切换下一个关键词;
24.截取匹配成功的社区/村级行政区域信息,解析出社区/村的名称,将解析出的社区/村名称与数据库存储的各行政区名称进行逐级向上匹配,根据树形关联获取匹配结果,该匹配结果是与该社区/村的名称关联的所有级别行政区名称;
30.结束阶段,包括以下步骤:
31.将匹配成功的结果存入数据库;
32.将匹配失败的结果输出日志;
33.统计匹配数量并计算命中率。
2.如权利要求1所述的一种对批量地址信息进行自动行政区划划分的方法,其特征在于:所述步骤10中还包括:对各行政区进行编码,赋予个行政区一个PID值,该PID值为该行政区的上一级的编码。
3.如权利要求1所述的一种对批量地址信息进行自动行政区划划分的方法,其特征在于,所述步骤21的筛查与漏检地址过程为:过滤地址信息里面的特殊字符串,补充完整市级信息。
4.如权利要求1所述的一种对批量地址信息进行自动行政区划划分的方法,其特征在于:所述步骤23的关键词可以是“社区”、“居委会”、“村”或“农场”。
5.如权利要求1所述的一种对批量地址信息进行自动行政区划划分的方法,其特征在于:所述步骤24采用的解析规则是:选取所有匹配结果在地图的中心点,根据各匹配地址与中心点的距离远近升序排列,选择距离最近的坐标点的名称作为解析结果。
CN201610299934.9A 2016-05-09 2016-05-09 一种对批量地址信息进行自动行政区划划分的方法 Pending CN106021336A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610299934.9A CN106021336A (zh) 2016-05-09 2016-05-09 一种对批量地址信息进行自动行政区划划分的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610299934.9A CN106021336A (zh) 2016-05-09 2016-05-09 一种对批量地址信息进行自动行政区划划分的方法

Publications (1)

Publication Number Publication Date
CN106021336A true CN106021336A (zh) 2016-10-12

Family

ID=57099117

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610299934.9A Pending CN106021336A (zh) 2016-05-09 2016-05-09 一种对批量地址信息进行自动行政区划划分的方法

Country Status (1)

Country Link
CN (1) CN106021336A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599303A (zh) * 2016-12-29 2017-04-26 苏碧云 一种地址匹配方法及***
CN106649803A (zh) * 2016-12-29 2017-05-10 华南师范大学 一种地址匹配方法及***
CN107832441A (zh) * 2017-11-17 2018-03-23 北京锐安科技有限公司 一种解析地址的方法以及装置
CN109426415A (zh) * 2017-08-31 2019-03-05 北京国双科技有限公司 一种生成级联选择器的方法及装置
CN110378634A (zh) * 2018-07-09 2019-10-25 北京京东尚科信息技术有限公司 一种生成配送地址的方法和装置
CN111639493A (zh) * 2020-05-22 2020-09-08 上海微盟企业发展有限公司 一种地址信息标准化方法、装置、设备及可读存储介质
CN111949706A (zh) * 2020-08-03 2020-11-17 北京吉威空间信息股份有限公司 面向土地大数据分布式挖掘分析的存储方法
CN112330281A (zh) * 2020-11-05 2021-02-05 南京师范大学 一种面向沿革数据的中国行政区划关联方法
CN112434863A (zh) * 2020-11-30 2021-03-02 上海富勒信息科技有限公司 一种配送调度方法
CN113723654A (zh) * 2020-12-31 2021-11-30 京东城市(北京)数字科技有限公司 基于多源数据的救灾物资需求评估方法、装置及计算机设备
CN117251517A (zh) * 2023-09-12 2023-12-19 河南省农业科学院农业经济与信息研究所 大数据视野下的年鉴行政区划信息匹配方法和模型
CN117271693A (zh) * 2023-10-17 2023-12-22 中运科技股份有限公司 基于大数据分析的交通线路到站归属地自动判定方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102169498A (zh) * 2011-04-14 2011-08-31 中国测绘科学研究院 一种地址模型的构建方法,以及地址匹配的方法和***
CN104281578A (zh) * 2013-07-02 2015-01-14 威盛电子股份有限公司 数据文件的地域标记方法以及装置
CN104537102A (zh) * 2015-01-13 2015-04-22 蔡树彬 一种获取经纬度的正向地理编码服务方法及***
CN105512121A (zh) * 2014-09-23 2016-04-20 北京汇通天下物联科技有限公司 基于关键词的地址查询方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102169498A (zh) * 2011-04-14 2011-08-31 中国测绘科学研究院 一种地址模型的构建方法,以及地址匹配的方法和***
CN104281578A (zh) * 2013-07-02 2015-01-14 威盛电子股份有限公司 数据文件的地域标记方法以及装置
CN105512121A (zh) * 2014-09-23 2016-04-20 北京汇通天下物联科技有限公司 基于关键词的地址查询方法
CN104537102A (zh) * 2015-01-13 2015-04-22 蔡树彬 一种获取经纬度的正向地理编码服务方法及***

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599303A (zh) * 2016-12-29 2017-04-26 苏碧云 一种地址匹配方法及***
CN106649803A (zh) * 2016-12-29 2017-05-10 华南师范大学 一种地址匹配方法及***
CN109426415A (zh) * 2017-08-31 2019-03-05 北京国双科技有限公司 一种生成级联选择器的方法及装置
CN107832441A (zh) * 2017-11-17 2018-03-23 北京锐安科技有限公司 一种解析地址的方法以及装置
CN110378634A (zh) * 2018-07-09 2019-10-25 北京京东尚科信息技术有限公司 一种生成配送地址的方法和装置
CN111639493A (zh) * 2020-05-22 2020-09-08 上海微盟企业发展有限公司 一种地址信息标准化方法、装置、设备及可读存储介质
CN111949706A (zh) * 2020-08-03 2020-11-17 北京吉威空间信息股份有限公司 面向土地大数据分布式挖掘分析的存储方法
CN111949706B (zh) * 2020-08-03 2023-11-14 北京吉威空间信息股份有限公司 面向土地大数据分布式挖掘分析的存储方法
CN112330281A (zh) * 2020-11-05 2021-02-05 南京师范大学 一种面向沿革数据的中国行政区划关联方法
CN112434863A (zh) * 2020-11-30 2021-03-02 上海富勒信息科技有限公司 一种配送调度方法
CN113723654A (zh) * 2020-12-31 2021-11-30 京东城市(北京)数字科技有限公司 基于多源数据的救灾物资需求评估方法、装置及计算机设备
CN117251517A (zh) * 2023-09-12 2023-12-19 河南省农业科学院农业经济与信息研究所 大数据视野下的年鉴行政区划信息匹配方法和模型
CN117251517B (zh) * 2023-09-12 2024-05-17 河南省农业科学院农业经济与信息研究所 大数据视野下的年鉴行政区划信息匹配方法和模型
CN117271693A (zh) * 2023-10-17 2023-12-22 中运科技股份有限公司 基于大数据分析的交通线路到站归属地自动判定方法
CN117271693B (zh) * 2023-10-17 2024-04-26 中运科技股份有限公司 基于大数据分析的交通线路到站归属地自动判定方法

Similar Documents

Publication Publication Date Title
CN106021336A (zh) 一种对批量地址信息进行自动行政区划划分的方法
CN109145169B (zh) 一种基于统计分词的地址匹配方法
CN108628811B (zh) 地址文本的匹配方法和装置
CN101313300B (zh) 本地搜索
CN101454748B (zh) 用于改进对网页的信息检索的***和方法
CN104572645B (zh) 兴趣点数据关联方法及装置
CN102483748A (zh) 用于地图搜索的查询解析
CN102253972B (zh) 基于网络爬虫的地名数据库维护方法
CN102023984B (zh) 甄别重复实体数据的方法和装置
CN101984422B (zh) 一种容错文本查询的方法和设备
CN102289467A (zh) 确定目标网点的方法和装置
CN106055650A (zh) 地址标准化方法和装置
CN106874384B (zh) 一种异构地址标准转换及匹配方法
CN101350012A (zh) 一种地址匹配的方法和***
CN104751232B (zh) 酒店自动匹配方法
CN109634959B (zh) 一种区块索引方法及区块索引装置
CN102682046A (zh) 社交网络的节点搜索和分析方法及搜索***
CN101299217A (zh) 一种地图信息处理的方法、装置和***
CN107463711B (zh) 一种数据的标签匹配方法及装置
CN102804180A (zh) 表征未经注册域名
CN107766433A (zh) 一种基于Geo‑BTree的范围查询方法及装置
CN106874287A (zh) 一种兴趣点poi地址编码的处理方法及装置
US8650024B1 (en) Generating address term synonyms
CN104679801A (zh) 一种兴趣点搜索方法和装置
CN106021556A (zh) 地址信息处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20161012