CN106021336A - 一种对批量地址信息进行自动行政区划划分的方法 - Google Patents
一种对批量地址信息进行自动行政区划划分的方法 Download PDFInfo
- Publication number
- CN106021336A CN106021336A CN201610299934.9A CN201610299934A CN106021336A CN 106021336 A CN106021336 A CN 106021336A CN 201610299934 A CN201610299934 A CN 201610299934A CN 106021336 A CN106021336 A CN 106021336A
- Authority
- CN
- China
- Prior art keywords
- administrative
- information
- division
- community
- address information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种对批量地址信息进行自动行政区划划分的方法,包括以下步骤:10.准备阶段:获取各行政区名称,将各行政区名称、树形关联以及编码存入数据库中;20.开始阶段,包括21.获取批量原始地址信息,并各个原始地址进行优化,优化包括筛查与漏检;22.调用地图API获取各原始地址的经纬度信息;23.调用地图API,采用地图搜索功能;24.根据树形关联获取匹配结果,该匹配结果是与该地址关联的所有级别行政区名称。30.结束阶段,包括31.将匹配成功的结果存入数据库;32.将匹配失败的结果输出日志;33.统计匹配数量并计算命中。本发明只需要地址信息作为依据条件便可支持多级同时查找、批量查找,最大限度地提升结果匹配的命中率,非常实用及高效。
Description
技术领域
本发明涉及一种对批量地址信息进行自动行政区划划分的方法。
背景技术
在互联网应用技术、软件开发等技术蓬勃发展的今天,常常会大批量地对各种个样的数据进行处理,而地理信息处理便是其中一种,在软件设计和开发过程中,基于业务需求,常常会遇到根据用户地址获取地址所属行政区域信息的需要,中国现行行政区划,即省级、地级、县级、乡级、村级、组级,其中省、
县、 乡三级为基本行政区。在各种行业软件开发或互联网网站建设等过程中,经常会有需要对地址进行行政区划分的需求,例如各级政府网站、城市环卫建设、物流派件***的行政区划分类、电子商务网站的地区分类等。
目前,现有方法主要是利用电子地图通过输入地址信息来逐一查找,或者通过中华人民共和国民政部的官网输入省、市等行政区信息,后查看地图通过肉眼判断,从而获得开发者想要行政区划信息,现有方法存在以下缺点:
(1)不支持一次性同时对地址进行市、区,街道,社区四个级别的行政区查询,需要分不同的过滤条件查询地址周边;
(2)人工输入效率低下,一人一次只能匹配一条,无法做到自动化批量匹配。
本发明人经过深入研究,提出一种对批量地址信息进行自动行政区划划分的方法。
发明内容
本发明为解决上述问题,提供了一种对批量地址信息进行自动行政区划划分的方法,其是针对于省级以下,包含市、区、街道/镇、社区/村最常见的四个小级别的行政区划自动划分的方法,只需要地址信息作为依据条件便可支持多级同时查找、批量查找,最大限度地提升结果匹配的命中率,非常实用及高效。
为实现上述目的,本发明采用的技术方案为:
一种对批量地址信息进行自动行政区划划分的方法,包括以下步骤:
10.准备阶段:获取各行政区名称,根据市>区>街道/镇>社区/村的上下级关系建立树形关联,关联规则是上级对下级为一对多,将各行政区名称、树形关联以及编码存入数据库中;
20.开始阶段,包括以下步骤:
21.获取批量原始地址信息,并各个原始地址进行优化,优化包括筛查与漏检;
22.调用地图API获取各原始地址的经纬度信息,若获取经纬度信息失败,则结束;
23.调用地图API,采用地图搜索功能,搜索“经纬度信息+关键词”,获取匹配该经纬度信息+关键词的社区/村级行政区域信息,若搜索失败则切换下一个关键词;
24.截取匹配成功的社区/村级行政区域信息,解析出社区/村的名称,将解析出的社区/村名称与数据库存储的各行政区名称进行逐级向上匹配,根据树形关联获取匹配结果,该匹配结果是与该社区/村的名称关联的所有级别行政区名称;
30.结束阶段,包括以下步骤:
31.将匹配成功的结果存入数据库;
32.将匹配失败的结果输出日志;
33.统计匹配数量并计算命中率。
所述步骤10中还包括:对各行政区进行编码,赋予个行政区一个PID值,该PID值为该行政区的上一级的编码。
所述步骤21的筛查与漏检地址过程为:过滤地址信息里面的特殊字符串,补充完整市级信息。
所述步骤23的关键词可以是“社区”、“居委会”、“村”或“农场”。
所述步骤24采用的解析规则是:选取所有匹配结果在地图的中心点,根据各匹配地址与中心点的距离远近升序排列,选择距离最近的坐标点的名称作为解析结果。
采用上述方案后,本发明的有益效果是:
本发明解决了各类软件开发、网站建设等过程中,获取各级行政区划信息时,因方法有限而导致的工作效率低下,命中率不高,处理数据量小等问题,大大提高了行政区划信息匹配效率,命中率高。
附图说明
图1是本发明的流程简图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图及实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明揭示的一种对批量地址信息进行自动行政区划划分的方法,其包括以下步骤:
10.准备阶段:获取各行政区名称,根据市>区>街道/镇>社区/村的上下级关系建立树形关联,关联规则是上级对下级为一对多,将各行政区名称、树形关联以及编码存入数据库中;
20.开始阶段,包括以下步骤:
21.获取批量原始地址信息,并各个原始地址进行优化,优化包括筛查与漏检;
22.调用地图API获取各原始地址的经纬度信息,若获取经纬度信息失败,则结束;
23.调用地图API,采用地图搜索功能,搜索“经纬度信息+关键词”,获取匹配该经纬度信息+关键词的社区/村级行政区域信息,若搜索失败则切换下一个关键词;
24.截取匹配成功的社区/村级行政区域信息,解析出社区/村的名称,将解析出的社区/村名称与数据库存储的各行政区名称进行逐级向上匹配,根据树形关联获取匹配结果,该匹配结果是与该社区/村的名称关联的所有级别行政区名称;
30.结束阶段,包括以下步骤:
31.将匹配成功的结果存入数据库;
32.将匹配失败的结果输出日志;
33.统计匹配数量并计算命中率。
所述步骤10中还包括:对各行政区进行编码,赋予个行政区一个PID值,该PID值为该行政区的上一级的编码。
所述步骤21的筛查与漏检地址过程为:过滤地址信息里面的特殊字符串,补充完整市级信息。
所述步骤23的关键词可以是“社区”、“居委会”、“村”或“农场”。
所述步骤24采用的解析规则是:选取所有匹配结果在地图的中心点,根据各匹配地址与中心点的距离远近升序排列,选择距离最近的坐标点的名称作为解析结果。
以下为依据本发明的划分方法的一个应用实例,下表是对来自于厦门市的原始地址划分结果。
上述说明示出并描述了本发明的优选实施例,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (5)
1.一种对批量地址信息进行自动行政区划划分的方法,其特征在于,包括以下步骤:
10.准备阶段:获取各行政区名称,根据市>区>街道/镇>社区/村的上下级关系建立树形关联,关联规则是上级对下级为一对多,将各行政区名称、树形关联以及编码存入数据库中;
20.开始阶段,包括以下步骤:
21.获取批量原始地址信息,并各个原始地址进行优化,优化包括筛查与漏检;
22.调用地图API获取各原始地址的经纬度信息,若获取经纬度信息失败,则结束;
23.调用地图API,采用地图搜索功能,搜索“经纬度信息+关键词”,获取匹配该经纬度信息+关键词的社区/村级行政区域信息,若搜索失败则切换下一个关键词;
24.截取匹配成功的社区/村级行政区域信息,解析出社区/村的名称,将解析出的社区/村名称与数据库存储的各行政区名称进行逐级向上匹配,根据树形关联获取匹配结果,该匹配结果是与该社区/村的名称关联的所有级别行政区名称;
30.结束阶段,包括以下步骤:
31.将匹配成功的结果存入数据库;
32.将匹配失败的结果输出日志;
33.统计匹配数量并计算命中率。
2.如权利要求1所述的一种对批量地址信息进行自动行政区划划分的方法,其特征在于:所述步骤10中还包括:对各行政区进行编码,赋予个行政区一个PID值,该PID值为该行政区的上一级的编码。
3.如权利要求1所述的一种对批量地址信息进行自动行政区划划分的方法,其特征在于,所述步骤21的筛查与漏检地址过程为:过滤地址信息里面的特殊字符串,补充完整市级信息。
4.如权利要求1所述的一种对批量地址信息进行自动行政区划划分的方法,其特征在于:所述步骤23的关键词可以是“社区”、“居委会”、“村”或“农场”。
5.如权利要求1所述的一种对批量地址信息进行自动行政区划划分的方法,其特征在于:所述步骤24采用的解析规则是:选取所有匹配结果在地图的中心点,根据各匹配地址与中心点的距离远近升序排列,选择距离最近的坐标点的名称作为解析结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610299934.9A CN106021336A (zh) | 2016-05-09 | 2016-05-09 | 一种对批量地址信息进行自动行政区划划分的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610299934.9A CN106021336A (zh) | 2016-05-09 | 2016-05-09 | 一种对批量地址信息进行自动行政区划划分的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106021336A true CN106021336A (zh) | 2016-10-12 |
Family
ID=57099117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610299934.9A Pending CN106021336A (zh) | 2016-05-09 | 2016-05-09 | 一种对批量地址信息进行自动行政区划划分的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106021336A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106599303A (zh) * | 2016-12-29 | 2017-04-26 | 苏碧云 | 一种地址匹配方法及*** |
CN106649803A (zh) * | 2016-12-29 | 2017-05-10 | 华南师范大学 | 一种地址匹配方法及*** |
CN107832441A (zh) * | 2017-11-17 | 2018-03-23 | 北京锐安科技有限公司 | 一种解析地址的方法以及装置 |
CN109426415A (zh) * | 2017-08-31 | 2019-03-05 | 北京国双科技有限公司 | 一种生成级联选择器的方法及装置 |
CN110378634A (zh) * | 2018-07-09 | 2019-10-25 | 北京京东尚科信息技术有限公司 | 一种生成配送地址的方法和装置 |
CN111639493A (zh) * | 2020-05-22 | 2020-09-08 | 上海微盟企业发展有限公司 | 一种地址信息标准化方法、装置、设备及可读存储介质 |
CN111949706A (zh) * | 2020-08-03 | 2020-11-17 | 北京吉威空间信息股份有限公司 | 面向土地大数据分布式挖掘分析的存储方法 |
CN112330281A (zh) * | 2020-11-05 | 2021-02-05 | 南京师范大学 | 一种面向沿革数据的中国行政区划关联方法 |
CN112434863A (zh) * | 2020-11-30 | 2021-03-02 | 上海富勒信息科技有限公司 | 一种配送调度方法 |
CN113723654A (zh) * | 2020-12-31 | 2021-11-30 | 京东城市(北京)数字科技有限公司 | 基于多源数据的救灾物资需求评估方法、装置及计算机设备 |
CN117251517A (zh) * | 2023-09-12 | 2023-12-19 | 河南省农业科学院农业经济与信息研究所 | 大数据视野下的年鉴行政区划信息匹配方法和模型 |
CN117271693A (zh) * | 2023-10-17 | 2023-12-22 | 中运科技股份有限公司 | 基于大数据分析的交通线路到站归属地自动判定方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102169498A (zh) * | 2011-04-14 | 2011-08-31 | 中国测绘科学研究院 | 一种地址模型的构建方法,以及地址匹配的方法和*** |
CN104281578A (zh) * | 2013-07-02 | 2015-01-14 | 威盛电子股份有限公司 | 数据文件的地域标记方法以及装置 |
CN104537102A (zh) * | 2015-01-13 | 2015-04-22 | 蔡树彬 | 一种获取经纬度的正向地理编码服务方法及*** |
CN105512121A (zh) * | 2014-09-23 | 2016-04-20 | 北京汇通天下物联科技有限公司 | 基于关键词的地址查询方法 |
-
2016
- 2016-05-09 CN CN201610299934.9A patent/CN106021336A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102169498A (zh) * | 2011-04-14 | 2011-08-31 | 中国测绘科学研究院 | 一种地址模型的构建方法,以及地址匹配的方法和*** |
CN104281578A (zh) * | 2013-07-02 | 2015-01-14 | 威盛电子股份有限公司 | 数据文件的地域标记方法以及装置 |
CN105512121A (zh) * | 2014-09-23 | 2016-04-20 | 北京汇通天下物联科技有限公司 | 基于关键词的地址查询方法 |
CN104537102A (zh) * | 2015-01-13 | 2015-04-22 | 蔡树彬 | 一种获取经纬度的正向地理编码服务方法及*** |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106599303A (zh) * | 2016-12-29 | 2017-04-26 | 苏碧云 | 一种地址匹配方法及*** |
CN106649803A (zh) * | 2016-12-29 | 2017-05-10 | 华南师范大学 | 一种地址匹配方法及*** |
CN109426415A (zh) * | 2017-08-31 | 2019-03-05 | 北京国双科技有限公司 | 一种生成级联选择器的方法及装置 |
CN107832441A (zh) * | 2017-11-17 | 2018-03-23 | 北京锐安科技有限公司 | 一种解析地址的方法以及装置 |
CN110378634A (zh) * | 2018-07-09 | 2019-10-25 | 北京京东尚科信息技术有限公司 | 一种生成配送地址的方法和装置 |
CN111639493A (zh) * | 2020-05-22 | 2020-09-08 | 上海微盟企业发展有限公司 | 一种地址信息标准化方法、装置、设备及可读存储介质 |
CN111949706A (zh) * | 2020-08-03 | 2020-11-17 | 北京吉威空间信息股份有限公司 | 面向土地大数据分布式挖掘分析的存储方法 |
CN111949706B (zh) * | 2020-08-03 | 2023-11-14 | 北京吉威空间信息股份有限公司 | 面向土地大数据分布式挖掘分析的存储方法 |
CN112330281A (zh) * | 2020-11-05 | 2021-02-05 | 南京师范大学 | 一种面向沿革数据的中国行政区划关联方法 |
CN112434863A (zh) * | 2020-11-30 | 2021-03-02 | 上海富勒信息科技有限公司 | 一种配送调度方法 |
CN113723654A (zh) * | 2020-12-31 | 2021-11-30 | 京东城市(北京)数字科技有限公司 | 基于多源数据的救灾物资需求评估方法、装置及计算机设备 |
CN117251517A (zh) * | 2023-09-12 | 2023-12-19 | 河南省农业科学院农业经济与信息研究所 | 大数据视野下的年鉴行政区划信息匹配方法和模型 |
CN117251517B (zh) * | 2023-09-12 | 2024-05-17 | 河南省农业科学院农业经济与信息研究所 | 大数据视野下的年鉴行政区划信息匹配方法和模型 |
CN117271693A (zh) * | 2023-10-17 | 2023-12-22 | 中运科技股份有限公司 | 基于大数据分析的交通线路到站归属地自动判定方法 |
CN117271693B (zh) * | 2023-10-17 | 2024-04-26 | 中运科技股份有限公司 | 基于大数据分析的交通线路到站归属地自动判定方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106021336A (zh) | 一种对批量地址信息进行自动行政区划划分的方法 | |
CN109145169B (zh) | 一种基于统计分词的地址匹配方法 | |
CN108628811B (zh) | 地址文本的匹配方法和装置 | |
CN101313300B (zh) | 本地搜索 | |
CN101454748B (zh) | 用于改进对网页的信息检索的***和方法 | |
CN104572645B (zh) | 兴趣点数据关联方法及装置 | |
CN102483748A (zh) | 用于地图搜索的查询解析 | |
CN102253972B (zh) | 基于网络爬虫的地名数据库维护方法 | |
CN102023984B (zh) | 甄别重复实体数据的方法和装置 | |
CN101984422B (zh) | 一种容错文本查询的方法和设备 | |
CN102289467A (zh) | 确定目标网点的方法和装置 | |
CN106055650A (zh) | 地址标准化方法和装置 | |
CN106874384B (zh) | 一种异构地址标准转换及匹配方法 | |
CN101350012A (zh) | 一种地址匹配的方法和*** | |
CN104751232B (zh) | 酒店自动匹配方法 | |
CN109634959B (zh) | 一种区块索引方法及区块索引装置 | |
CN102682046A (zh) | 社交网络的节点搜索和分析方法及搜索*** | |
CN101299217A (zh) | 一种地图信息处理的方法、装置和*** | |
CN107463711B (zh) | 一种数据的标签匹配方法及装置 | |
CN102804180A (zh) | 表征未经注册域名 | |
CN107766433A (zh) | 一种基于Geo‑BTree的范围查询方法及装置 | |
CN106874287A (zh) | 一种兴趣点poi地址编码的处理方法及装置 | |
US8650024B1 (en) | Generating address term synonyms | |
CN104679801A (zh) | 一种兴趣点搜索方法和装置 | |
CN106021556A (zh) | 地址信息处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20161012 |