CN115952163A - 一种标准地址与经纬度信息的匹配方法、装置及电子设备 - Google Patents
一种标准地址与经纬度信息的匹配方法、装置及电子设备 Download PDFInfo
- Publication number
- CN115952163A CN115952163A CN202211358674.XA CN202211358674A CN115952163A CN 115952163 A CN115952163 A CN 115952163A CN 202211358674 A CN202211358674 A CN 202211358674A CN 115952163 A CN115952163 A CN 115952163A
- Authority
- CN
- China
- Prior art keywords
- standard address
- standard
- address
- target
- latitude
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种标准地址与经纬度信息的匹配方法、装置及电子设备。标准地址与经纬度信息的匹配方法包括:根据预设标准地址规范,确定标准地址库以及标准地址库对应的标准地址索引:标准地址库包括历史标准地址、街道标准地址以及兴趣点标准地址;标准地址索引是由预设标准地址规范中的关键词索引构成的;将待检测的非标准地址输入标准地址库,并根据标准地址索引,确定目标标准地址;根据目标标准地址和预设经纬度数据库,确定目标区域下目标标准地址的目标经纬度,并将目标经纬度与目标区域下的目标标准地址进行匹配。本申请实现了对非标准地址的地址标准化,并且能够实现准确定位待检测的非标准地址的经纬度信息。
Description
技术领域
本申请涉及数据处理技术领域,尤其是涉及一种标准地址与经纬度信息的匹配方法、装置及电子设备。
背景技术
对地址进行标准化处理的过程中,存在标准不清晰、规范不明确的情况。但是随着行业标准的发展,愈来愈多的城市提出了自己的标准地址。
目前,对于各自的标准地址没有一套统一的衡量标准。当用户输入一个地址,如果这个地址的标准是自定义的,则需要准确获取当前地址的经纬度,但是由于自定义了一些级别信息,输入的地址无法很好的定位到准确的经纬度,需要人工对地址进行处理,才能获取准确的经纬度,这样的方式在业务***中使用不智能,不能根据用户需求快速获取经纬度。
发明内容
有鉴于此,本申请的目的在于提供一种标准地址与经纬度信息的匹配方法、装置及电子设备,实现了对非标准地址的地址标准化,并且能够实现准确定位待检测的非标准地址的经纬度信息。
本申请实施例提供了一种标准地址与经纬度信息的匹配方法,所述标准地址与经纬度信息的匹配方法包括:
根据预设标准地址规范,确定标准地址库以及所述标准地址库对应的标准地址索引:所述标准地址库包括历史标准地址、街道标准地址以及兴趣点标准地址;所述标准地址索引是由预设标准地址规范中的关键词索引构成的;
将待检测的非标准地址输入标准地址库,并根据所述标准地址索引,确定目标标准地址;
根据所述目标标准地址和预设经纬度数据库,确定目标区域下所述目标标准地址的目标经纬度,并将所述目标经纬度与所述目标区域下的所述目标标准地址进行匹配。
进一步的,所述将待检测的非标准地址输入标准地址库,并根据所述标准地址索引,确定目标标准地址,包括:
将待检测的非标准地址输入标准地址库,并根据标准地址索引,确定所述非标准地址中的全部关键词索引;
根据各个所述关键词索引,确定各个候选标准地址的地址索引分数;
基于各个所述候选标准地址的所述地址索引分数,确定目标标准地址。
进一步的,所述基于各个所述候选标准地址的所述地址索引分数,确定目标标准地址,包括:
根据非标准地址中的全部关键词索引,确定所述非标准地址中除全部所述关键词索引外的号码关键词;
针对所述号码关键词进行规范化处理,生成所述非标准地址对应的标准号码;
根据各个所述候选标准地址的所述地址索引分数和所述标准号码,确定目标标准地址。
进一步的,所述根据各个所述候选标准地址的所述地址索引分数和所述标准号码,确定目标标准地址,包括:
根据各个所述候选标准地址的所述地址索引分数和所述标准号码,确定初始标准地址;
根据标准地址库,建立标准地址图谱;
将所述初始标准地址按照关键词索引在所述标准地址图谱中进行节点关键词搜索,确定所述初始标准地址中的全部目标节点关键词;
针对所述目标节点关键词进行规范化处理,确定目标标准地址。
进一步的,所述针对所述目标节点关键词进行规范化处理,确定目标标准地址,包括:
针对所述目标节点关键词进行规范化处理,确定目标节点关键词和标准地址图谱中任一标准地址的对比结果;
根据所述对比结果,确定目标标准地址。
进一步的,通过以下方式确定预设经纬度数据库:
根据标准地址库,确定标准地址库中所有标准地址对应的经纬度数据;
根据所有标准地址对应的所述经纬度数据,确定预设经纬度数据库。
进一步的,所述根据所述目标标准地址和预设经纬度数据库,确定目标区域下所述目标标准地址的目标经纬度,并将所述目标经纬度与所述目标区域下的所述目标标准地址进行匹配,包括:
根据所述目标标准地址和预设经纬度数据库,确定目标区域下所述目标标准地址的初始经纬度;
基于第三方经纬度采集设备,对所述初始经纬度进行校验,确定目标区域下所述目标标准地址的目标经纬度,并将所述目标经纬度与所述目标区域下的所述目标标准地址进行匹配。
本申请实施例还提供了一种标准地址与经纬度信息的匹配装置,所述标准地址与经纬度信息的匹配装置包括:
第一确定模块,用于根据预设标准地址规范,确定标准地址库以及所述标准地址库对应的标准地址索引:所述标准地址库包括历史标准地址、街道标准地址以及兴趣点标准地址;所述标准地址索引是由预设标准地址规范中的关键词索引构成的;
第二确定模块,用于将待检测的非标准地址输入标准地址库,并根据所述标准地址索引,确定目标标准地址;
第三确定模块,用于根据所述目标标准地址和预设经纬度数据库,确定目标区域下所述目标标准地址的目标经纬度,并将所述目标经纬度与所述目标区域下的所述目标标准地址进行匹配。
本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的标准地址与经纬度信息的匹配方法的步骤。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的标准地址与经纬度信息的匹配方法的步骤。
本申请实施例提供的标准地址与经纬度信息的匹配方法、装置即电子设备,与现有技术中相比,本申请提供的实施例通过预设标准地址规范,确定标准地址库以及所述标准地址库对应的标准地址索引,并通过标准地址索引,确定待检测的非标准地址所对应的目标标准地址,以及根据目标标准地址和预设经纬度数据库,确定目标区域下所述目标标准地址的目标经纬度,实现了对非标准地址的地址标准化,并且能够实现准确定位待检测的非标准地址的经纬度信息。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种标准地址与经纬度信息的匹配方法的流程图之一;
图2示出了本申请实施例所提供的一种标准地址与经纬度信息的匹配方法的流程图之二;
图3示出了本申请实施例所提供的一种标准地址与经纬度信息的匹配装置的结构示意图;
图4示出了本申请实施例所提供的一种电子设备的结构示意图。
图中:
300-标准地址与经纬度信息的匹配装置;310-第一确定模块;320-第二确定模块;330-第三确定模块;331-第一确定单元;332-第二确定单元;400-电子设备;410-处理器;420-存储器;430-总线。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
首先,对本申请可适用的应用场景进行介绍。本申请可应用于数据处理技术领域。
经研究发现,目前,对于各自的标准地址没有一套同一的衡量标准。当用户输入一个地址,如果这个地址的标准是自定义的,则需要准确获取当前地址的经纬度,但是由于自定义了一些级别信息,输入的地址无法很好的定位到准确的经纬度,需要人工对地址进行处理,才能获取准确的经纬度,这样的方式在业务***中使用不智能,不能根据用户需求快速获取经纬度。
自定义的级别信息包括但不限制于包括一些特定的坐标系中,如以及百度地理坐标(BD-09)坐标系等。
百度坐标系,在地理坐标系的基础上再次加密,其中BD09LL表示百度经纬度坐标,BD09MC表示百度墨卡托米制坐标。
其中,火星坐标系,是由***制定的地理坐标***中的经纬度信息加密后得到的坐标系。
且在现有技术中,对于标准地址的匹配会应用到众多的应用场景当中,如在公安业务***的应用场景中,现有技术中常用的公安业务***中存储的区域下的地址信息均是非标准化的实口地址,即实地址(实地址,具有实际物理位置的地址代码),而如何将这些实口地址进行标准化,且标准化后的地址与其他各个不同地区或区域下的现有的其他自定义下的标准地址进行匹配是一个难题,且现有技术中,对于庞大的实口地址进行标准化的工程量比较难于快速将项目赋能。
基于此,本申请实施例提供了一种标准地址与经纬度信息的匹配方法、装置及是电子设备,实现了对非标准地址的地址标准化,并且能够实现准确定位待检测的非标准地址的经纬度信息。
请参阅图1,图1为本申请实施例所提供的一种标准地址与经纬度信息的匹配方法的流程图之一。所如图1中所示,本申请实施例提供的标准地址与经纬度信息的匹配方法,包括以下步骤:
S101、根据预设标准地址规范,确定标准地址库以及所述标准地址库对应的标准地址索引:所述标准地址库包括历史标准地址、街道标准地址以及兴趣点标准地址;所述标准地址索引是由预设标准地址规范中的关键词索引构成的。
该步骤中,首先根据预设标准地址规范对历史标准地址、街道标准地址以及兴趣点标准地址进行规范化处理,确定标准地址库以及所述标准地址库对应的标准地址索引。
这里,标准地址索引是由预设标准地址规范中的关键词组成的索引。
其中,历史标准地址包括但不限制于不同地区已有的各个标准地址;街道标准地址为非居住的街道/路/巷等覆盖不全的街道标准地址;兴趣点标准地址可以具体为标准地址(xx路xx号)上的某个建筑、机构以及商店等具体的标志性物体,如医院、宿舍、饭店以及小区等。
上述中,对于街道标准地址的获取方式,可以通过数据挖掘及自然语言方法,挖掘街道对应的前三级地址(即省市区),形成初步可用的街道标准地址。
现有技术中传统的标准地址中不会涉及有关于兴趣点类似的标准地址的搜索方式,而由于用户在输入兴趣点的地址时,会直接说出如胜鹏大厦这种类似的地址信息,而不会说出瑞金北路128号这种有关于兴趣点的标准地址,因此,设置有关于兴趣点的兴趣点标准地址来进行标准地址的定位是很有必要的,可以用于提升用户体验。
对于兴趣点标准地址数量的设定可根据不用区域下的不同需求来进行自定义的设置,如:本申请提供的实施例中的兴趣点标准地址的数量可以但不限制于设置为了0.98万个兴趣点标准地址。
这样,将所述类型的地址按照预设标准地址规范进行规范化处理,确定标准地址库。
其中,预设标准地址规范可以具体为按照13级别划分的地址规范,如按照:省、市、区/县、镇/办事处/服务中心、居委会、路、号、社区/组团/网格、栋/幢、单元/号楼/号裙楼、层/负层/附层/商业层、房号以及其他划分的地址规范。
由于现有技术中,是通过不同区域下的自定义的“构建地址标注器-形成海量地址的标准规范”的策略来规范标准化地址信息的,且构建地址标注器需要大量的标准数据;形成的地址标准规范,需要通过数据自行挖掘出来的,其准确性以及可用性是否满足实际应用需求并不清晰;而且,由于此规范没有经过相关业务机关验证,规范的框架也存在不明确性,而本申请提供的实施例中的根据预设标准地址规范,确定的述标准地址库是通过使不同区域下的地址共用一套统一的标准地址规范,实现准确性以及可用性满足实际应用的需求。
S102、将待检测的非标准地址输入标准地址库,并根据所述标准地址索引,确定目标标准地址。
该步骤中,用户在标准地址库中输入待检测的非标准地址,此时,待检测的非标准地址将与标准地址索引中的关键词索引进行一一的匹配,并根据匹配结果确定目标标准地址。
S103、根据所述目标标准地址和预设经纬度数据库,确定目标区域下所述目标标准地址的目标经纬度,并将所述目标经纬度与所述目标区域下的所述目标标准地址进行匹配。
该步骤中,在确定检测的非标准地址所对应的目标标准地址后,将目标区域下的目标标准地址输入预设经纬度数据库,确定目标标准地址在预设经纬度数据库中对应的目标经纬度,并将目标经纬度与所述目标区域下的所述目标标准地址进行一一匹配,并标记,可具体用于后续用户的再次查找和显示,提升了标准地址与经纬度信息之间匹配的准确性和效率。
这里,通过以下方式确定预设经纬度数据库:
根据标准地址库,确定标准地址库中所有标准地址对应的经纬度数据。
这里,获取目标区域下的所有标准地址,并将所述标准地址按照不同的分类标准进行划分,如本申请提供的实施例中,将目标区域下的所有标准地址按照区域的层级进行划分,并将该划分后的标准地址作为键,以及将划分后的标准地址的经纬度作为值,构建键-值对对应的元数据。
其中,本申请提供的实施例中获取经纬度的方式可以采用但不限制于采用GPS全球定位***下的坐标***的加密方式来实现,即(通过WGS84加密)。
根据所有标准地址对应的所述经纬度数据,确定预设经纬度数据库。
这里,将上述所有标准地址对应的键-值对对应的元数据进行排列组合和存储,生成存储有大量键-值对的预设经纬度数据库。
可选的,所述根据所述目标标准地址和预设经纬度数据库,确定目标区域下所述目标标准地址的目标经纬度,并将所述目标经纬度与所述目标区域下的所述目标标准地址进行匹配,包括:
根据所述目标标准地址和预设经纬度数据库,确定目标区域下所述目标标准地址的初始经纬度。
这里,将通过预设经纬度数据库确定匹配后的目标标准地址对应的经纬度信息确定为目标标准地址下的初始经纬度。
基于第三方经纬度采集设备,对所述初始经纬度进行校验,确定目标区域下所述目标标准地址的目标经纬度,并将所述目标经纬度与所述目标区域下的所述目标标准地址进行匹配。
这里,将目标标准地址下的初始经纬度与第三方经纬度采集设备中采集的该目标标准地址下的标准经纬度信息进行比较以及校验,并在校验后确定目标标准地址的目标经纬度,并将该目标经纬度与目标区域下的所述目标标准地址进行匹配。
其中,如果目标标准地址下的初始经纬度与第三方经纬度采集设备中采集的该目标标准地址下的标准经纬度信息一致,则直接将该目标经纬度确定为标准经纬度,用于与目标区域下的所述目标标准地址进行匹配。
如果目标标准地址下的初始经纬度与第三方经纬度采集设备中采集的该目标标准地址下的标准经纬度信息不一致,则使用第三方经纬度采集设备采集的标准经纬度信息对上述该目标标准地址进行校验,并交后的经纬度信息确定为标准经纬度信息,用于与目标区域下的所述目标标准地址进行匹配。
且具体的校验方式可以根据不同的使用场景进行自定义的设置,如本申请提供的实施例中的校验方式可以具体为:
使用数据挖掘分类(K-Nearest Neighbor,KNN)算法来计算该目标标准地址和预设经纬度数据库的距离,获取距离最近的经纬度作为当前目标地址的标准经纬度。
其中,数据挖掘分类算法中的K就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻近值来代表。算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。
本申请实施例提供的标准地址与经纬度信息的匹配方法,与现有技术相比,本申请提供的实施例通过预设标准地址规范,确定标准地址库以及所述标准地址库对应的标准地址索引,并通过标准地址索引,确定待检测的非标准地址所对应的目标标准地址,以及根据目标标准地址和预设经纬度数据库,确定目标区域下所述目标标准地址的目标经纬度,实现了对非标准地址的地址标准化,并且能够实现准确定位待检测的非标准地址的经纬度信息。
且相比于现有技术中,在已经形成海量地址的标准规范上,继续利用地址标注器,结合一些规范上的规则,实现对地址的标准化。本申请提供的实施例能够基于预设标准地址规范和预设经纬度数据库,快速的确定待检测的非标准地址对应的目标标准地址。
且相比于现有技术中,基于现有的坐标系,并通过自定义标准地址获取经纬度信息,通过人工校验经纬度准确性,构建一个地址对应经纬度的数据源,并以将输入地址进行标准化,以及通过机器学习算法对输出地址和数据源中的地址进行分析,获取地址对应的经纬度的方式,本申请提供的实施例能够迭代优化地址标准化的准确率。
请参阅图2,图2为本申请一实施例提供的一种标准地址与经纬度信息的匹配方法的流程图之二。如图2中所示,本申请实施例提供的标准地址与经纬度信息的匹配方法,包括以下步骤:
S201、根据预设标准地址规范,确定标准地址库以及所述标准地址库对应的标准地址索引:所述标准地址库包括历史标准地址、街道标准地址以及兴趣点标准地址;所述标准地址索引是由预设标准地址规范中的关键词索引构成的。
S202、将待检测的非标准地址输入标准地址库,并根据标准地址索引,确定所述非标准地址中的全部关键词索引。
该步骤中,将待检测的非标准地址输入标准地址库,确定非标准地址中的全部关键词索引,如“贵州省”的全部关键词索引包含贵州省及贵州,“瑞金北路”的全部关键词索引包含瑞金北路及瑞金北等。
这里,将待检测的非标准地址输入标准地址库进行全部关键词索引的遍历,找出所有可能的关键词。
S203、根据各个所述关键词索引,确定各个候选标准地址的地址索引分数。
该步骤中,根据各个关键词索引,召回所有关键词索引对应的全部候选标准地址。
S204、基于各个所述候选标准地址的所述地址索引分数,确定目标标准地址。
该步骤中,针对召回的全部候选标准地址进行地址分数的计算,对分数进行排序,获取分数最高的选标准地址,将分数最高的选标准地址确定为目标标准地址。
S205、根据所述目标标准地址和预设经纬度数据库,确定目标区域下所述目标标准地址的目标经纬度,并将所述目标经纬度与所述目标区域下的所述目标标准地址进行匹配。
其中,S201和S205的描述可以参照S101和S103的描述,并且能达到相同的技术效果,对此不做赘述。
可选的,所述基于各个所述候选标准地址的所述地址索引分数,确定目标标准地址:
根据非标准地址中的全部关键词索引,确定所述非标准地址中除全部所述关键词索引外的号码关键词。
这里,在将非标准地址中的全部关键词索引找出之后,确定非标准地址中除关键词索引外的号码关键词,并将所述号码关键词进行号码规范化输出。
其中,将所述号码关键词进行号码规范化输出,可具体为:针对号码关键词进行层级划分,编写号码输出规则,基于号码输出规则将号码关键词对应的层级进行规范化输出。
根据各个所述候选标准地址的所述地址索引分数和所述标准号码,确定目标标准地址。
这里,将每个候选标准地址的地址索引分数和规范化输出日的标准号码进行组合,确定每个候选标准地址的组合地址,并以此确定与待检测的非标准地址相对应的目标标准地址。
可选的,所述根据各个所述候选标准地址的所述地址索引分数和所述标准号码,确定目标标准地址,包括:
根据各个所述候选标准地址的所述地址索引分数和所述标准号码,确定初始标准地址。
根据标准地址库,建立标准地址图谱。
将所述初始标准地址按照关键词索引在所述标准地址图谱中进行节点关键词搜索,确定所述初始标准地址中的全部目标节点关键词。
这里,将所述初始标准地址按照关键词索引在所述标准地址图谱中进行节点关键词搜索,包括:
将所述初始标准地址按照关键词索引在所述标准地址图谱中进行节点关键词搜索,确定能够搜索到的全部节点关键词,直到搜索不上结束,此时,获取能够搜索到的全部节点关键词。
针对所述目标节点关键词进行规范化处理,确定目标标准地址。
这里,针对目标节点关键词进行规范化处理,处理成统一的描述方式(例如,本申请提供的实施例中的规范化处理方式包括但不限制于包括将目标节点关键词的数字大写转小写以及获取节点中的数字和字母等)。
可选的,所述针对所述目标节点关键词进行规范化处理,确定目标标准地址,包括:
针对所述目标节点关键词进行规范化处理,确定目标节点关键词和标准地址图谱中任一标准地址的对比结果。
这里,将规范化处理后的目标节点关键词和标准地址图谱中任一标准地址进行逐一比对,确定全部目标节点关键词最为匹配的标准地址信息。
根据所述对比结果,确定目标标准地址。
这里,将上述中全部目标节点关键词最为匹配的标准地址信息确定为待检测的非标准地址所对应的目标标准地址。
下面以一个具体的实施例说明本申请提供的标准地址与经纬度信息的匹配方法:
步骤1、将待检测的“贵州省贵阳市南明区台湾大厦3-301”输入标准地址库。
步骤2、根据标准地址索引,确定“贵州省贵阳市南明区台湾大厦3-301”中的关键词索引,包括贵州省、贵阳市、南明区以及兴趣点台湾大厦。
步骤3、获取标准地址库中包括贵州省、贵阳市、南明区或兴趣点台湾大厦中至少一个关键词的候选标准地址。
步骤4、将上述包括至少一个关键词的候选标准地址进行地址分数的计算,确定每个候选标准地址对应的地址分数。
步骤5、将待检测的“贵州省贵阳市南明区台湾大厦3/301”中的号码关键词进行输出。
步骤6、将号码关键词按照“楼号-楼层”的格式进行规范化输出,生成“贵州省贵阳市南明区台湾大厦3-301”。
步骤7、将“贵州省贵阳市南明区台湾大厦3-301”按照关键词索引在标准地址图谱中进行节点关键词搜索,确定所述初始标准地址中的全部目标节点关键词,进而确定“台湾大厦3-301”属于“八中华南路”,并将“八中华南路”添加至“贵州省贵阳市南明区台湾大厦3-301”,生成目标标准地址“贵州省贵阳市南明区八中华南路台湾大厦3-301”。
步骤8、将目标标准地址“贵州省贵阳市南明区八中华南路台湾大厦3-301”输入预设经纬度数据库,确定“贵州省贵阳市南明区八中华南路台湾大厦3-301”对应的目标经纬度。
本申请实施例提供的标准地址与经纬度信息的匹配方法,与现有技术相比,本申请提供的实施例通过预设标准地址规范,确定标准地址库以及所述标准地址库对应的标准地址索引,并通过标准地址索引,确定待检测的非标准地址所对应的目标标准地址,以及根据目标标准地址和预设经纬度数据库,确定目标区域下所述目标标准地址的目标经纬度,实现了对非标准地址的地址标准化,并且能够实现准确定位待检测的非标准地址的经纬度信息。
且相比于现有技术中,在已经形成海量地址的标准规范上,继续利用地址标注器,结合一些规范上的规则,实现对地址的标准化。本申请提供的实施例能够基于预设标准地址规范和预设经纬度数据库,快速的确定待检测的非标准地址对应的目标标准地址。
且相比于现有技术中,基于现有的坐标系,并通过自定义标准地址获取经纬度信息,通过人工校验经纬度准确性,构建一个地址对应经纬度的数据源,并以将输入地址进行标准化,以及通过机器学习算法对输出地址和数据源中的地址进行分析,获取地址对应的经纬度的方式,本申请提供的实施例能够迭代优化地址标准化的准确率。
请参阅图3,图3为本申请实施例所提供的一种标准地址与经纬度信息的匹配装置的结构示意图。如图3中所示,所述标准地址与经纬度信息的匹配装置300包括:
第一确定模块310,用于根据预设标准地址规范,确定标准地址库以及所述标准地址库对应的标准地址索引:所述标准地址库包括历史标准地址、街道标准地址以及兴趣点标准地址;所述标准地址索引是由预设标准地址规范中的关键词索引构成的。
第二确定模块320,用于将待检测的非标准地址输入标准地址库,并根据所述标准地址索引,确定目标标准地址。
可选的,所述第二确定模块320,具体用于:
将待检测的非标准地址输入标准地址库,并根据标准地址索引,确定所述非标准地址中的全部关键词索引。
根据各个所述关键词索引,确定各个地址索引分数。
基于各个所述候选标准地址的所述地址索引分数,确定目标标准地址。
可选的,所述基于各个所述候选标准地址的所述地址索引分数,确定目标标准地址,包括:
根据非标准地址中的全部关键词索引,确定所述非标准地址中除全部所述关键词索引外的号码关键词。
针对所述号码关键词进行规范化处理,生成所述非标准地址对应的标准号码。
根据各个所述候选标准地址的所述地址索引分数和所述标准号码,确定目标标准地址。
可选的,所述根据各个所述候选标准地址的所述地址索引分数和所述标准号码,确定目标标准地址包括:
根据各个所述候选标准地址的所述地址索引分数和所述标准号码,确定初始标准地址。
根据标准地址库,建立标准地址图谱。
将所述初始标准地址按照关键词索引在所述标准地址图谱中进行节点关键词搜索,确定所述初始标准地址中的全部目标节点关键词。
针对所述目标节点关键词进行规范化处理,确定目标标准地址。
可选的,所述针对所述目标节点关键词进行规范化处理,确定目标标准地址,包括:
针对所述目标节点关键词进行规范化处理,确定目标节点关键词和标准地址图谱中任一标准地址的对比结果。
根据所述对比结果,确定目标标准地址。
可选的,通过以下方式确定预设经纬度数据库:
根据标准地址库,确定标准地址库中所有标准地址对应的经纬度数据。
根据所有标准地址对应的所述经纬度数据,确定预设经纬度数据库。
第三确定模块330,用于根据所述目标标准地址和预设经纬度数据库,确定目标区域下所述目标标准地址的目标经纬度,并将所述目标经纬度与所述目标区域下的所述目标标准地址进行匹配。
可选的,所述第三确定模块330,包括:
第一确定单元331,用于根据所述目标标准地址和预设经纬度数据库,确定目标区域下所述目标标准地址的初始经纬度。
第二确定单元332,用于基于第三方经纬度采集设备,对所述初始经纬度进行校验,确定目标区域下所述目标标准地址的目标经纬度,并将所述目标经纬度与所述目标区域下的所述目标标准地址进行匹配。
本申请实施例提供的标准地址与经纬度信息的匹配装置300,与现有技术中相比,本申请提供的实施例通过预设标准地址规范,确定标准地址库以及所述标准地址库对应的标准地址索引,并通过标准地址索引,确定待检测的非标准地址所对应的目标标准地址,以及根据目标标准地址和预设经纬度数据库,确定目标区域下所述目标标准地址的目标经纬度,实现了对非标准地址的地址标准化,并且能够实现准确定位待检测的非标准地址的经纬度信息。
且相比于现有技术中,在已经形成海量地址的标准规范上,继续利用地址标注器,结合一些规范上的规则,实现对地址的标准化。本申请提供的实施例能够基于预设标准地址规范和预设经纬度数据库,快速的确定待检测的非标准地址对应的目标标准地址。
且相比于现有技术中,基于现有的坐标系,并通过自定义标准地址获取经纬度信息,通过人工校验经纬度准确性,构建一个地址对应经纬度的数据源,并以将输入地址进行标准化,以及通过机器学习算法对输出地址和数据源中的地址进行分析,获取地址对应的经纬度的方式,本申请提供的实施例能够迭代优化地址标准化的准确率。
请参阅图4,图4为本申请实施例所提供的一种电子设备的结构示意图。如图4中所示,所述电子设备400包括处理器、存储器420和总线430。
所述存储器420存储有所述处理器410可执行的机器可读指令,当电子设备400运行时,所述处理器410与所述存储器420之间通过总线430通信,所述机器可读指令被所述处理器410执行时,可以执行如上述图1以及图2所示方法实施例中的标准地址与经纬度信息的匹配方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图1以及图2所示方法实施例中的标准地址与经纬度信息的匹配方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种标准地址与经纬度信息的匹配方法,其特征在于,所述标准地址与经纬度信息的匹配方法包括:
根据预设标准地址规范,确定标准地址库以及所述标准地址库对应的标准地址索引:所述标准地址库包括历史标准地址、街道标准地址以及兴趣点标准地址;所述标准地址索引是由预设标准地址规范中的关键词索引构成的;
将待检测的非标准地址输入标准地址库,并根据所述标准地址索引,确定目标标准地址;
根据所述目标标准地址和预设经纬度数据库,确定目标区域下所述目标标准地址的目标经纬度,并将所述目标经纬度与所述目标区域下的所述目标标准地址进行匹配。
2.根据权利要求1所述的标准地址与经纬度信息的匹配方法,其特征在于,所述将待检测的非标准地址输入标准地址库,并根据所述标准地址索引,确定目标标准地址,包括:
将待检测的非标准地址输入标准地址库,并根据标准地址索引,确定所述非标准地址中的全部关键词索引;
根据各个所述关键词索引,确定各个候选标准地址的地址索引分数;
基于各个所述候选标准地址的所述地址索引分数,确定目标标准地址。
3.根据权利要求2所述的标准地址与经纬度信息的匹配方法,其特征在于,所述基于各个所述候选标准地址的所述地址索引分数,确定目标标准地址,包括:
根据非标准地址中的全部关键词索引,确定所述非标准地址中除全部所述关键词索引外的号码关键词;
针对所述号码关键词进行规范化处理,生成所述非标准地址对应的标准号码;
根据各个所述候选标准地址的所述地址索引分数和所述标准号码,确定目标标准地址。
4.根据权利要求3所述的标准地址与经纬度信息的匹配方法,其特征在于,所述根据各个所述候选标准地址的所述地址索引分数和所述标准号码,确定目标标准地址,包括:
根据各个所述候选标准地址的所述地址索引分数和所述标准号码,确定初始标准地址;
根据标准地址库,建立标准地址图谱;
将所述初始标准地址按照关键词索引在所述标准地址图谱中进行节点关键词搜索,确定所述初始标准地址中的全部目标节点关键词;
针对所述目标节点关键词进行规范化处理,确定目标标准地址。
5.根据权利要求4所述的标准地址与经纬度信息的匹配方法,其特征在于,所述针对所述目标节点关键词进行规范化处理,确定目标标准地址,包括:
针对所述目标节点关键词进行规范化处理,确定目标节点关键词和标准地址图谱中任一标准地址的对比结果;
根据所述对比结果,确定目标标准地址。
6.根据权利要求1所述的标准地址与经纬度信息的匹配方法,其特征在于,通过以下方式确定预设经纬度数据库:
根据标准地址库,确定标准地址库中所有标准地址对应的经纬度数据;
根据所有标准地址对应的所述经纬度数据,确定预设经纬度数据库。
7.根据权利要求1所述的标准地址与经纬度信息的匹配方法,其特征在于,所述根据所述目标标准地址和预设经纬度数据库,确定目标区域下所述目标标准地址的目标经纬度,并将所述目标经纬度与所述目标区域下的所述目标标准地址进行匹配,包括:
根据所述目标标准地址和预设经纬度数据库,确定目标区域下所述目标标准地址的初始经纬度;
基于第三方经纬度采集设备,对所述初始经纬度进行校验,确定目标区域下所述目标标准地址的目标经纬度,并将所述目标经纬度与所述目标区域下的所述目标标准地址进行匹配。
8.一种标准地址与经纬度信息的匹配装置,其特征在于,所述标准地址与经纬度信息的匹配装置包括:
第一确定模块,用于根据预设标准地址规范,确定标准地址库以及所述标准地址库对应的标准地址索引:所述标准地址库包括历史标准地址、街道标准地址以及兴趣点标准地址;所述标准地址索引是由预设标准地址规范中的关键词索引构成的;
第二确定模块,用于将待检测的非标准地址输入标准地址库,并根据所述标准地址索引,确定目标标准地址;
第三确定模块,用于根据所述目标标准地址和预设经纬度数据库,确定目标区域下所述目标标准地址的目标经纬度,并将所述目标经纬度与所述目标区域下的所述目标标准地址进行匹配。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线进行通信,所述机器可读指令被所述处理器运行时执行如权利要求1-7任一所述的标准地址与经纬度信息的匹配方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1-7任一所述的标准地址与经纬度信息的匹配方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211358674.XA CN115952163A (zh) | 2022-11-01 | 2022-11-01 | 一种标准地址与经纬度信息的匹配方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211358674.XA CN115952163A (zh) | 2022-11-01 | 2022-11-01 | 一种标准地址与经纬度信息的匹配方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115952163A true CN115952163A (zh) | 2023-04-11 |
Family
ID=87285143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211358674.XA Pending CN115952163A (zh) | 2022-11-01 | 2022-11-01 | 一种标准地址与经纬度信息的匹配方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115952163A (zh) |
-
2022
- 2022-11-01 CN CN202211358674.XA patent/CN115952163A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Brovelli et al. | Towards an automated comparison of OpenStreetMap with authoritative road datasets | |
KR102079860B1 (ko) | 텍스트 주소 처리 방법 및 장치 | |
CN108628811B (zh) | 地址文本的匹配方法和装置 | |
WO2022105111A1 (zh) | 区域画像图生成方法、装置、计算机设备及存储介质 | |
CN105409252A (zh) | 用于标识和传送位置的方法和装置 | |
CN101350012A (zh) | 一种地址匹配的方法和*** | |
CN110020144B (zh) | 一种推荐模型建立方法及其设备、存储介质、服务器 | |
KR20170001546A (ko) | 새로운 공급처의 주소를 확정하는 방법 및 장치 | |
CN112861972B (zh) | 一种展业区域的选址方法、装置、计算机设备和介质 | |
CN105209858B (zh) | 企业场所数据的非确定性消岐和匹配 | |
WO2020052312A1 (zh) | 一种定位方法、装置、电子设备及可读存储介质 | |
WO2021189977A1 (zh) | 地址编码方法、装置、计算机设备及计算机可读存储介质 | |
CN111597279B (zh) | 基于深度学习的信息预测方法及相关设备 | |
CN107451461B (zh) | 移动设备的设备指纹处理方法、装置、服务器及存储介质 | |
CN113868351A (zh) | 一种地址聚类方法、装置、电子设备及存储介质 | |
CN111896016A (zh) | 位置信息的处理方法及装置、存储介质、终端 | |
CN106202440B (zh) | 数据处理方法、装置及设备 | |
CN111460044B (zh) | 地理位置数据处理方法及装置 | |
CN110688995A (zh) | 地图查询的处理方法,计算机可读存储介质和移动终端 | |
CN115292962B (zh) | 基于轨迹抽稀的路径相似度匹配方法、设备及存储介质 | |
CN116361552A (zh) | 校园图书检索方法、装置、设备及可读存储介质 | |
CN115952163A (zh) | 一种标准地址与经纬度信息的匹配方法、装置及电子设备 | |
Du et al. | Similarity measurements on multi‐scale qualitative locations | |
CN114463499A (zh) | 建筑物三维建模方法及装置 | |
JP5790768B2 (ja) | 検索方法及び情報管理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |