CN101719128A - 一种基于模糊匹配的中文地理编码确定方法 - Google Patents

一种基于模糊匹配的中文地理编码确定方法 Download PDF

Info

Publication number
CN101719128A
CN101719128A CN200910156650A CN200910156650A CN101719128A CN 101719128 A CN101719128 A CN 101719128A CN 200910156650 A CN200910156650 A CN 200910156650A CN 200910156650 A CN200910156650 A CN 200910156650A CN 101719128 A CN101719128 A CN 101719128A
Authority
CN
China
Prior art keywords
address
matching
rule
chinese
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910156650A
Other languages
English (en)
Other versions
CN101719128B (zh
Inventor
张贵军
吴海涛
洪榛
俞立
郭海峰
何尚秋
陈宁宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN2009101566504A priority Critical patent/CN101719128B/zh
Publication of CN101719128A publication Critical patent/CN101719128A/zh
Application granted granted Critical
Publication of CN101719128B publication Critical patent/CN101719128B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于模糊匹配的中文地理编码确定方法,包括以下步骤:A1、读入描述性中文地址信息,以行政区级别为断点,采用正向最大搜索方法,对原始地址进行切分,得到原始地址元素数组;A2、将原始地址元素通过地址词典进行标准化;A3、读取标准地址树,采用分支定界算法,对原始地址元素数组进行匹配;同时,应用模糊规则对匹配操作进行控制:在获取原始地址切分后的关键字后;评价分数最高的作为最相近匹配结果,即得到更为精确的匹配地址。本发明提供一种地址模型合理、匹配率较高、快速性良好的基于模糊匹配的中文地理编码确定方法。

Description

一种基于模糊匹配的中文地理编码确定方法
技术领域
本发明涉及一种地理信息数据处理、计算机应用领域,尤其涉及的是,一种基于模糊匹配的地理编码方法。
背景技术
地址编码是建立地址描述与坐标对应关系的过程,也即是地点空间位置和地点描述之间的转换工具。长期以来由于缺乏有效的空间分析技术的支持,空间数据的分析处理无法满足科学决策和管理的需要,导致空间数据在决策管理中的价值始终不能体现。通过地址匹配可以实现地理信息***和空间信息的融合,促进城市空间信息化,进而更有效、更方便的进行空间分析和决策应用。
近年来,随着地理信息技术的不断发展和完善,地理编码技术也在不断改进。国外在这方面的研究已经比较成熟,如Davis提出了一种多模式交叉定位的理念,但只是针对拥有地理编码标准的区域,而且多个空间信息数据库也造成了空间信息冗余,降低了匹配效率;Duncan提出了等面积单元格统一编码方案,但是中国城市各地区的地址编码规范各不相同,这种复杂的编码规范一经形成,一旦发生变化将牵扯的大规模的改动,成本太高;Bakshi等人提出了一种基于文本记号分割方案的地理编码技术,对英文地址来说这种匹配方案取得了较好的效果,但是由于中文录入方式和英文存在着较大差异,因此对于中文的地址匹配效果并不明显。对于国内来说,地址匹配技术刚刚起步,仅仅在应用方面做了比较多的工作。如北京长地计算机公司的“寻址神”,北大方正数码公司的Map Searcher等,但是此类应用***在对特定城市的应用中存在着地址模型单一、匹配率不够高等问题。
因此,现有的技术在针对特定城市的中文地址编码方面存在着缺陷,需要改进。
发明内容
为了克服已有的中文地理位置编码方法的地址模型单一、匹配率不够高、速度慢的不足,本发明提供一种地址模型合理、匹配率较高、快速性良好的基于模糊匹配的中文地理编码确定方法。
本发明解决其技术问题所采用的技术方案是:
一种基于模糊匹配的中文地理编码确定方法,包括以下步骤:
A1、读入描述性中文地址信息,以行政区级别为断点,采用正向最大搜索方法,对原始地址进行切分,得到原始地址元素数组;
A2、将原始地址元素通过地址词典进行标准化;
A3、读取标准地址树,采用分支定界算法,对原始地址元素数组进行匹配:建立地址树存储格式的地址数据库,根据中国行政区的层次化划分,建立树状地址存储树,级别最高的行政区单位作为地址树的根结点,其下属行政区作为子结点进行保存;依据对描述性中文地址信息切分后的地址要素和门牌号,在匹配过程中,首先读取标准地址树R,判断通过切分后的候选地址要素中最高行政级别的关键字,与标准地址树R的对应行政级别的地址结点进行匹配,匹配成功后舍弃不相关分支树,保留相关分支树进行下一行政级别匹配;
同时,应用模糊规则对匹配操作进行控制:在获取原始地址切分后的关键字后,还包括:
采用模糊匹配规则对匹配操作进行优化,模糊匹配规则定义如下:假定匹配字段为字符串address,长度为h;标准字段为字符串std_address,长度为H;定义满足address∩std_address≠Φ的std_address集合为满足匹配条件的集合,其中,address∩std_address≠Φ表示字符串address与标准字段字符串std_address交集不为空,最后保留隶属度高的集合元素;定义如下匹配规则:
①标准字符串std_address和匹配字符串address中i个字符相同,则隶属度为i/H;
②标准字符串std_address包含匹配字符串address,则隶属度为1;
得到隶属度之后,设定μ为匹配隶属度,按照映射规则f:sc→μ转化为量化分值,映射函数:f(μ)=10×μ,将sc作为该候选记录的评价分数;
评价分数最高的作为最相近匹配结果,即得到更为精确的匹配地址。
作为优选的一种方案:所述中文地理编码确定方法还包括:
A4、如果匹配地址包含的门牌号,进行空间定位:设定城市道路门牌号以以下规则分布:按照单双号规则分布于道路的两侧,正向左侧为单号,右侧为双号;正向右侧为单号,左侧为双号;记录道路拐点门牌号以及其地理坐标信息,获取原始地址中的门牌号信息后,判断处于哪两个拐点之间,假定匹配地址门牌号位于拐点A、B之间,以A、B为参照点,进行最小二乘法线性插值,得到该门牌号位于道路的具体地理坐标,最后定位到地图。
进一步,所述步骤A3中,通过标准化操作,取得原始地址标准化后的候选地址数组定义为address[i],0<i<N;标准地址结点与对应层次候选元素的匹配分值设为sci,i表示该结点所属层次,N表示初始地址树的深度;匹配评判规则如下:
规则1:地址树结点与候选元素进行精确匹配,Y→精确匹配,N→模糊匹配;
规则2:精确匹配后查找可行解,Y→匹配算法下移,N→返回上一级结点查找近似解;
规则3:判断是否存在缺省项,Y→保存上一级分支树,N→保存当前级分支树;
规则4:判断是否存在缺省项,sci=0,i为缺省项所在层数;
规则5:候选记录最终得分为其每一层结点匹配得分之和:
sc=∑sci
再进一步,所述步骤A3中,设置辅助地名数据库,对于拥有第二特征身份的比较重要同时使用较为频繁的地理位置进行单独建库。
在步骤A1中,获取的原始地址,以原始地址的第一个字符为起始点,对地址数据库进行搜索查找对应的标准地址名称,存在则读取地址信息保留,同时将该字符在原始地址字符串切除,否则读取下一字符与上一个字符组成字符串,继续在地址数据库中搜索对应标准地址名称,依次进行读取,确定所有行政级别的地址要素。
在步骤A2中,如果切分后的候选地址数组存在缺省项,依据下一级别的地址元素,在地址数据库获取其上级地址,写入候选地址要素数组中。
在步骤A2中,设计地址简称、别名信息数据库,保存当前所有的标准地址信息与其别名、简称的专门信息数据库。
在步骤A2中,切分后的地址元素的错别字纠错,假定录入的地址信息中存在错别字,即切分后的地址元素在地址词典中无法找到完全对应的标准地址名称,取与录入的地址信息最相近的标准地址名称返回,并取代录入的地址信息。
本发明的技术构思为:首先获取原始录入地址信息,然后采用分词算法对文字录入的原始地址进行切分,获得与原始地址相对应的空间位置的描述关键字;将城市的标准地址数据以K叉树形式进行存储,其中K值由各级别行政单位具体数量决定,对获得的关键字在标准地址树中进行匹配,匹配过程中采用分支定界算法对匹配算法进行优化,同时应用模糊规则对匹配操作进行精确控制并对匹配结果进行评分筛选,获得至少一条与原始地址完全相符或近似相符的地址信息。应用基于树状地址信息存储模式的分支定界匹配算法,减小了地址树的规模,优化了地址匹配过程的算法复杂度,提高了地址的效率和准确率。
本发明的有益效果主要表现在:本发明优化了地理编码过程的算法复杂度,提高了地理编码的效率和准确率。
附图说明
图1是基于模糊匹配的中文地理编码确定方法的流程图。
图2是标准地址树的示意图。
图3是匹配规则的示意图。
图4是道路的单双号规则分布的示意图。
图5是加载初始地址树,精确匹配成功后提取以“浙江”为根结点的分支树,删除无效分支树的示意图。
图6是判断address[2]=“杭州”,精确匹配成功后,提取以“杭州”为根结点的分支树;再判断address[3]=“东湖”,精确匹配成功后,提取以“东湖”为根结点的分支树的示意图。
图7是判断address[4]=“留下”,当前分支树没有可行解,返回当前根结点“东湖”的父结点,启用模糊匹配模式,得到满足部分匹配条件的分支树,重新匹配关键词“留下”的示意图。
图8是判断address[5]=“留合”,当前分支树根结点的子结点无法精确匹配,启动模糊匹配模式,得到部分匹配分支树,判断address[6]=“288”,所有部分匹配分支树进行匹配的示意图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1~图8,
一种基于模糊匹配的中文地理编码方法,如图1所示,其中包含以下步骤:
A1、读入描述性中文地址信息,以行政区级别为断点,采用正向最大搜索方法,对原始地址进行切分,得到原始地址元素数组。A2、将原始地址元素通过地址词典进行标准化,得到经过简称或别称纠正、拼写错误修改、缺省项填充等标准化操作后的地址元素数组。A3、读取标准地址树,采用分支定界算法,对原始地址元素数组进行匹配,同时应用模糊规则对匹配操作进行控制,得到更为精确的匹配地址。A4、对于匹配地址包含的门牌号,采用拐点参照插值算法进行空间定位。
所述的方法,其中,在步骤A1中,针对中文地址信息,参考中国行政区域划分标准,设定标准录入模式:
行政地址模式:省(直辖市)→市→区(县、县级市);区域地址模式:街(镇)→村(路)方位名词→门牌号。如标准地址信息:浙江省杭州市西湖区留下镇留和北路288号。
所述的方法,其中,在步骤A1中,获取的原始地址,以原始地址的第一个字符为起始点,对地址数据库进行搜索查找对应的标准地址名称,存在则读取地址信息保留,同时将该字符在原始地址字符串切除,否则读取下一字符与上一个字符组成字符串,继续在地址数据库中搜索对应标准地址名称。依次进行读取,确定所有行政级别的地址要素。
所述的方法,其中,在步骤A2中,如果切分后的候选地址数组存在缺省项,依据下一级别的地址元素,在地址数据库获取其上级地址,写入候选地址要素数组中。
所述的方法,其中,在步骤A2中,设计地址简称、别名信息数据库,保存当前所有的标准地址信息与其别名、简称的专门信息数据库。如果切分后的候选地址存在别名或简称,辨别并将其标准化为标准名称,如将“鲁”标准化为“山东”,“沪”标准化为“上海”。
所述的方法,其中,在步骤A2中,切分后的地址元素的错别字纠错,假定录入的地址信息中存在错别字,即切分后的地址元素在地址词典中无法找到完全对应的标准地址名称,取与录入的地址信息最相近的标准地址名称返回,并取代录入的地址信息。如录入“留合路”,地址词典中不存在“留合路”,只存在“留和路”,取“留和路”取代“留合路”。
所述的方法,其中,在步骤A3中,包含以下步骤,读取地址数据库,并将地址数据库以地址树形式进行存储,级别最高的行政区单位作为地址树的根结点,其下属行政区作为子结点进行保存吗,如图2所示。
所述的方法,其中,在步骤A3中,还包含以下步骤,在地址信息树状存储前提下,采用分支定界算法对匹配过程进行优化,即首先匹配候选地址元素中的最高行政级别的关键字与对应地址树中对应级别的地址信息,匹配成功则保留对应的地址树中的匹配结点及其分支树,舍弃其他同级不相关地址信息结点及其分支树。通过标准化操作,取得原始地址标准化后的候选地址数组定义为address[i],0<i<N。标准地址结点与对应层次候选元素的匹配分值设为sci,i表示该结点所属层次,N表示初始地址树的深度。匹配评判规则如下:
规则1:地址树结点与候选元素进行精确匹配,Y→精确匹配,N→模糊匹配;
规则2:精确匹配后查找可行解,Y→匹配算法下移,N→返回上一级结点查找近似解;
规则3:判断是否存在缺省项,Y→保存上一级分支树,N→保存当前级分支树;
规则4:判断是否存在缺省项,sci=0,i为缺省项所在层数;
规则5:候选记录最终得分为其每一层结点匹配得分之和:
sc=∑sci
所述的方法,其中,在步骤A3中,还包含以下步骤,应用模糊规则控制匹配操作,如果对于地址树中同级地址信息结点无法完全匹配成果,则启用模糊规则,获取近似匹配结果。如县级录入关键字为“东湖”,而地址树中县级结点只存在“西湖”,则获取结点“西湖”及其分支树作为匹配结果保留,舍弃其他同级结点及其分支树。
所述的方法,其中,在步骤A3中,还包含以下步骤,对匹配结果进行量化评分。完全匹配和近似匹配赋予不同的分值,分值高的作为最相近匹配结果返回,分值低的作为较为相近匹配结果返回。量化规则如下:
假定匹配字段为字符串address,长度为h;标准字段为字符串std_address,长度为H。定义满足address∩std_address≠Φ的std_address集合为满足匹配条件的集合,其中,address∩std_address≠Φ表示字符串address与标准字段字符串std_address交集不为空,最后保留隶属度高的集合元素。定义如下匹配规则图3):
①标准字符串std_address和匹配字符串address中i个字符相同,则隶属度为i/H;
②标准字符串std_address包含匹配字符串address,则隶属度为1。
得到隶属度之后,设定μ为匹配隶属度,按照映射规则f:sc→μ转化为量化分值,映射函数:f(μ)=1O×μ,将sc作为该候选记录的评价分数。
所述的方法,其中,在步骤A3中,还包含以下步骤,设置辅助地名数据库,对于一些拥有第二特征身份的比较重要同时使用较为频繁的地理位置进行单独建库,如“浙江省杭州市西湖区留下镇留和路288号”的第二特征身份是“浙江工业大学屏峰校区”,如果录入原始地址信息为“浙江工业大学屏峰校区”,则直接定位到“浙江省杭州市西湖区留下镇留和路288号”的地理位置。
所述的方法,其中,在步骤A4中,包含以下步骤,获取最终匹配结果后,根据门牌号信息进行空间插值定位。如果不存在门牌号信息,则定位到原始地址信息最低行政单位的区域几何中心,如原始地址信息精确到街道,则将位置定位到该街道的几何空间中心。如果存在门牌号信息,设定道路设定城市道路门牌号以以下规则分布:按照单双号规则分布于道路的两侧:正向左侧为单号,右侧为双号;正向右侧为单号,左侧为双号(图4)。记录道路拐点门牌号以及其地理坐标信息,获取原始地址中的门牌号信息后,判断处于哪两个拐点之间,假定匹配地址门牌号位于拐点A、B之间,以A、B为参照点,进行最小二乘法线性插值,得到该门牌号位于道路的具体地理坐标,最后空间地理坐标定位到地图。
本发明中基于树状地址信息存储模式的分支定界匹配算法平均时间复杂度为logK N,其中N表示K叉地址树的叶子结点数。
本实施例中,设定原始录入地址信息为“浙江省杭州市东湖区留下镇留合路288号”原始地址经切分后得到候选地址数组address[](表1)。
表1候选地址数组
  层次   省   市   区   镇   路   门牌号
  值域   浙江   杭州   东湖   留下   留合   288
考虑到更好的表达算法思想,匹配地址树中加入一些扰乱数据,引入分支界定算法后匹配过程如下:
Step1:加载初始地址树,判断address[1]=“浙江”,精确匹配成功后,提取以“浙江”为根结点的分支树,删除无效分支树,其中sc表示每一个结点与候选地址词段匹配后的总得分,如图5所示。
Step2:判断address[2]=“杭州”,精确匹配成功后,提取以“杭州”为根结点的分支树。判断address[3]=“东湖”,精确匹配成功后,提取以“东湖”为根结点的分支树,如图6所示。
Step3:判断address[4]=“留下”,当前分支树没有可行解,返回当前根结点“东湖”的父结点,启用模糊匹配模式,得到满足部分匹配条件的分支树,重新匹配关键词“留下”,如图7所示。
Step4:判断address[5]=“留合”,当前分支树根结点的子结点无法精确匹配,启动模糊匹配模式,得到部分匹配分支树,判断address[6]=“288”,所有部分匹配分支树进行匹配,如图8所示。
候选地址数组中所有词段匹配完成后,将各地址记录的最后评价得分进行排序,得到评分最高的地址记录作为最终匹配结果返回,如图9实线部分所示。
Step5:获取门牌号信息,读取最终匹配地址信息中街道地理信息,包括拐点门牌号数据,如图9所示。判断初始门牌号“288号”位于拐点A“268号”和拐点B“296号”之间。以拐点A、B为参照点进行最小二乘法插值,得到原始门牌号在街道中的空间位置,见图10中“*”位置。
以上阐述的是本发明给出的一个实施例表现出来的优良优化效果,显然本发明不仅适合上述实施例,在不偏离本发明基本精神及不超出本发明实质内容所涉及内容的前提下可对其做种种变化加以实施。

Claims (8)

1.一种基于模糊匹配的中文地理编码确定方法,其特征在于:所述中文地理编码确定方法包括以下步骤:
A1、读入描述性中文地址信息,以行政区级别为断点,采用正向最大搜索方法,对原始地址进行切分,得到原始地址元素数组;
A2、将原始地址元素通过地址词典进行标准化;
A3、读取标准地址树,采用分支定界算法,对原始地址元素数组进行匹配:建立地址树存储格式的地址数据库,根据中国行政区的层次化划分,建立树状地址存储树,级别最高的行政区单位作为地址树的根结点,其下属行政区作为子结点进行保存;依据对描述性中文地址信息切分后的地址要素和门牌号,在匹配过程中,首先读取标准地址树R,判断通过切分后的候选地址要素中最高行政级别的关键字,与标准地址树R的对应行政级别的地址结点进行匹配,匹配成功后舍弃不相关分支树,保留相关分支树进行下一行政级别匹配;
同时,应用模糊规则对匹配操作进行控制:在获取原始地址切分后的关键字后,还包括:
采用模糊匹配规则对匹配操作进行优化,模糊匹配规则定义如下:假定匹配字段为字符串address,长度为h;标准字段为字符串std_address,长度为H;定义满足address∩std_address≠Φ的std_address集合为满足匹配条件的集合,其中,address∩std_address≠Φ表示字符串address与标准字段字符串std_address交集不为空,最后保留隶属度高的集合元素;定义如下匹配规则:
①标准字符串std_address和匹配字符串address中i个字符相同,则隶属度为i/H;
②标准字符串std_address包含匹配字符串address,则隶属度为1;
得到隶属度之后,设定μ为匹配隶属度,按照映射规则f:sc→μ转化为量化分值,映射函数:f(μ)=10×μ,将sc作为该候选记录的评价分数;
评价分数最高的作为最相近匹配结果,即得到更为精确的匹配地址。
2.如权利要求1所述的一种基于模糊匹配的中文地理编码确定方法,其特征在于:所述中文地理编码确定方法还包括:
A4、如果匹配地址包含的门牌号,进行空间定位:设定城市道路门牌号以以下规则分布:按照单双号规则分布于道路的两侧,正向左侧为单号,右侧为双号;正向右侧为单号,左侧为双号;记录道路拐点门牌号以及其地理坐标信息,获取原始地址中的门牌号信息后,判断处于哪两个拐点之间,假定匹配地址门牌号位于拐点A、B之间,以A、B为参照点,进行最小二乘法线性插值,得到该门牌号位于道路的具体地理坐标,最后定位到地图。
3.如权利要求1或2所述的一种基于模糊匹配的中文地理编码确定方法,其特征在于:所述步骤A3中,通过标准化操作,取得原始地址标准化后的候选地址数组定义为address[i],0<i<N;标准地址结点与对应层次候选元素的匹配分值设为sci,i表示该结点所属层次,N表示初始地址树的深度;匹配评判规则如下:
规则1:地址树结点与候选元素进行精确匹配,Y→精确匹配,N→模糊匹配;
规则2:精确匹配后查找可行解,Y→匹配算法下移,N→返回上一级结点查找近似解;
规则3:判断是否存在缺省项,Y→保存上一级分支树,N→保存当前级分支树;
规则4:判断是否存在缺省项,sci=0,i为缺省项所在层数;
规则5:候选记录最终得分为其每一层结点匹配得分之和:
sc=∑sci
4.如权利要求1或2所述的一种基于模糊匹配的中文地理编码确定方法,其特征在于:所述步骤A3中,设置辅助地名数据库,对于拥有第二特征身份的比较重要同时使用较为频繁的地理位置进行单独建库。
5.如权利要求1或2所述的一种基于模糊匹配的中文地理编码确定方法,其特征在于:在步骤A1中,获取的原始地址,以原始地址的第一个字符为起始点,对地址数据库进行搜索查找对应的标准地址名称,存在则读取地址信息保留,同时将该字符在原始地址字符串切除,否则读取下一字符与上一个字符组成字符串,继续在地址数据库中搜索对应标准地址名称,依次进行读取,确定所有行政级别的地址要素。
6.如权利要求1或2所述的一种基于模糊匹配的中文地理编码确定方法,其特征在于:在步骤A2中,如果切分后的候选地址数组存在缺省项,依据下一级别的地址元素,在地址数据库获取其上级地址,写入候选地址要素数组中。
7.如权利要求6所述的一种基于模糊匹配的中文地理编码确定方法,其特征在于:在步骤A2中,设计地址简称、别名信息数据库,保存当前所有的标准地址信息与其别名、简称的专门信息数据库。
8.如权利要求7所述的一种基于模糊匹配的中文地理编码确定方法,其特征在于:在步骤A2中,切分后的地址元素的错别字纠错,假定录入的地址信息中存在错别字,即切分后的地址元素在地址词典中无法找到完全对应的标准地址名称,取与录入的地址信息最相近的标准地址名称返回,并取代录入的地址信息。
CN2009101566504A 2009-12-31 2009-12-31 一种基于模糊匹配的中文地理编码确定方法 Expired - Fee Related CN101719128B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009101566504A CN101719128B (zh) 2009-12-31 2009-12-31 一种基于模糊匹配的中文地理编码确定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101566504A CN101719128B (zh) 2009-12-31 2009-12-31 一种基于模糊匹配的中文地理编码确定方法

Publications (2)

Publication Number Publication Date
CN101719128A true CN101719128A (zh) 2010-06-02
CN101719128B CN101719128B (zh) 2012-05-23

Family

ID=42433702

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101566504A Expired - Fee Related CN101719128B (zh) 2009-12-31 2009-12-31 一种基于模糊匹配的中文地理编码确定方法

Country Status (1)

Country Link
CN (1) CN101719128B (zh)

Cited By (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101980208A (zh) * 2010-11-10 2011-02-23 百度在线网络技术(北京)有限公司 地址查询方法及***
CN101996247A (zh) * 2010-11-10 2011-03-30 百度在线网络技术(北京)有限公司 地址数据库的建构方法及装置
CN102024024A (zh) * 2010-11-10 2011-04-20 百度在线网络技术(北京)有限公司 地址数据库的建构方法及装置
CN102169498A (zh) * 2011-04-14 2011-08-31 中国测绘科学研究院 一种地址模型的构建方法,以及地址匹配的方法和***
CN102289467A (zh) * 2011-07-22 2011-12-21 浙江百世技术有限公司 确定目标网点的方法和装置
CN102298585A (zh) * 2010-06-24 2011-12-28 高德软件有限公司 一种地址切分及级别标注方法和地址切分及级别标注装置
CN102393937A (zh) * 2011-10-12 2012-03-28 深圳市络道科技有限公司 一种基于反向生成的地址树的地址匹配方法及匹配***
CN102402533A (zh) * 2010-09-13 2012-04-04 方正国际软件有限公司 地址匹配方法及***
CN102446186A (zh) * 2010-10-13 2012-05-09 上海众恒信息产业股份有限公司 中文地理编码及解码方法和装置
CN102880650A (zh) * 2012-08-27 2013-01-16 中国工商银行股份有限公司 一种数据匹配方法及装置
CN102955832A (zh) * 2011-08-31 2013-03-06 深圳市华傲数据技术有限公司 一种通讯地址识别、标准化的***
CN103383682A (zh) * 2012-05-01 2013-11-06 刘龙 一种地理编码方法、位置查询***及方法
CN103413215A (zh) * 2013-07-12 2013-11-27 广州银联网络支付有限公司 一种基于矩阵相似度算法的电子联行号匹配方法
CN103440311A (zh) * 2013-08-27 2013-12-11 深圳市华傲数据技术有限公司 一种地名实体识别的方法及***
CN103558926A (zh) * 2013-11-12 2014-02-05 金蝶软件(中国)有限公司 一种地名录入方法及装置
CN103593468A (zh) * 2013-11-27 2014-02-19 北京金和软件股份有限公司 一种音频内容推送方法
CN104021184A (zh) * 2014-06-10 2014-09-03 广州品唯软件有限公司 一种定位方法与***
CN104092613A (zh) * 2014-07-15 2014-10-08 山东超越数控电子有限公司 一种基于模糊匹配的快速查表方法
CN104182510A (zh) * 2014-08-20 2014-12-03 国家电网公司 一种面向对象的地址建模方法
CN104182509A (zh) * 2014-08-20 2014-12-03 国家电网公司 一种面向对象地址建模的方法
WO2016050088A1 (zh) * 2014-09-30 2016-04-07 华为技术有限公司 一种地址搜索方法和设备
CN105659637A (zh) * 2013-09-30 2016-06-08 三星电子株式会社 在设备上缓存位置
CN105760360A (zh) * 2014-12-16 2016-07-13 高德软件有限公司 一种地址纠正方法和装置
WO2016165538A1 (zh) * 2015-04-13 2016-10-20 阿里巴巴集团控股有限公司 一种地址数据的管理方法和装置
CN106055635A (zh) * 2016-05-30 2016-10-26 深圳市华傲数据技术有限公司 地址信息查找方法及装置
CN106296209A (zh) * 2015-06-05 2017-01-04 阿里巴巴集团控股有限公司 地址输入控制方法及装置
CN106502978A (zh) * 2016-09-19 2017-03-15 浪潮软件股份有限公司 一种中文地址分词方法及装置
CN106528605A (zh) * 2016-09-27 2017-03-22 武汉工程大学 一种基于规则的中文地址解析方法
CN106649464A (zh) * 2016-09-26 2017-05-10 深圳市数字城市工程研究中心 一种中文地址树的构建方法及装置
CN106709065A (zh) * 2017-01-19 2017-05-24 国家电网公司 一种地址信息标准化处理方法及装置
CN106875264A (zh) * 2017-03-31 2017-06-20 北京京东尚科信息技术有限公司 订单信息管理方法、装置和订单分拣***
CN106874384A (zh) * 2017-01-10 2017-06-20 广东精规划信息科技股份有限公司 一种异构地址标准转换及匹配方法
CN107748778A (zh) * 2017-10-20 2018-03-02 浪潮软件股份有限公司 一种提取地址的方法及装置
CN108369582A (zh) * 2018-03-02 2018-08-03 福建联迪商用设备有限公司 一种地址纠错方法及终端
CN108959244A (zh) * 2018-06-07 2018-12-07 北京京东尚科信息技术有限公司 地址分词的方法和装置
CN109255564A (zh) * 2017-07-13 2019-01-22 菜鸟智能物流控股有限公司 一种取件点地址推荐方法及装置
CN109254964A (zh) * 2018-08-20 2019-01-22 中国平安人寿保险股份有限公司 地址标准化方法、装置、计算机设备和存储介质
CN109344213A (zh) * 2018-08-28 2019-02-15 浙江工业大学 一种基于字典树的中文地理编码方法
CN109784308A (zh) * 2019-02-01 2019-05-21 腾讯科技(深圳)有限公司 一种地址纠错方法、装置及存储介质
CN109933797A (zh) * 2019-03-21 2019-06-25 东南大学 基于Jieba分词及地址词库的地理编码方法和***
CN110099246A (zh) * 2019-02-18 2019-08-06 深度好奇(北京)科技有限公司 监控调度方法、装置、计算机设备及存储介质
CN110674367A (zh) * 2019-09-09 2020-01-10 广州易起行信息技术有限公司 一种基于旅游行业产品的单汉字检索方法及装置
CN110704564A (zh) * 2019-09-27 2020-01-17 北京沃东天骏信息技术有限公司 一种地址纠错方法和装置
CN110895651A (zh) * 2018-08-23 2020-03-20 北京京东金融科技控股有限公司 地址标准化处理方法、装置、设备及计算机可读存储介质
CN111144117A (zh) * 2019-12-26 2020-05-12 同济大学 知识图谱中文地址消除歧义方法
CN111291277A (zh) * 2020-01-14 2020-06-16 浙江邦盛科技有限公司 一种基于语义识别和高级语言搜索的地址标准化方法
CN111414357A (zh) * 2019-01-07 2020-07-14 阿里巴巴集团控股有限公司 地址数据处理方法、装置、***和存储介质
CN111753515A (zh) * 2020-06-24 2020-10-09 广东科杰通信息科技有限公司 一种实现实体定位的地址信息提取及匹配方法
CN111859849A (zh) * 2020-07-01 2020-10-30 邦道科技有限公司 一种用电地址的管理方法和装置
CN112052413A (zh) * 2020-08-28 2020-12-08 上海谋乐网络科技有限公司 Url模糊匹配方法、装置和***
CN112364113A (zh) * 2020-11-13 2021-02-12 北京明略软件***有限公司 一种地址纠错方法及***
CN112417179A (zh) * 2020-11-23 2021-02-26 杭州橙鹰数据技术有限公司 地址处理方法及装置
CN112925922A (zh) * 2019-12-06 2021-06-08 农业农村部信息中心 获取地址的方法、装置、电子设备及介质
CN113204606A (zh) * 2021-04-30 2021-08-03 武汉大学 一种基于语义位置网的地址位置推测方法
CN113656450A (zh) * 2021-07-12 2021-11-16 大箴(杭州)科技有限公司 地址处理方法及装置、电子设备、存储介质
CN114091454A (zh) * 2021-11-29 2022-02-25 重庆市地理信息和遥感应用中心 一种互联网文本中地名信息提取及空间定位方法
CN116910386A (zh) * 2023-09-14 2023-10-20 深圳市智慧城市科技发展集团有限公司 地址补全方法、终端设备及计算机可读存储介质
CN117874309A (zh) * 2024-03-12 2024-04-12 北京全路通信信号研究设计院集团有限公司 一种列控数据处理方法、装置、电子设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101350012B (zh) * 2007-07-18 2013-01-16 北京灵图软件技术有限公司 一种地址匹配的方法和***
CN101350013A (zh) * 2007-07-18 2009-01-21 北京灵图软件技术有限公司 一种地理信息的搜索方法和***
CN100535907C (zh) * 2007-08-21 2009-09-02 北京大学 一种文本上下文中实体地址信息的提取方法
CN101393544A (zh) * 2008-10-07 2009-03-25 南京师范大学 面向地址编码的中文地址语义解析方法

Cited By (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102298585A (zh) * 2010-06-24 2011-12-28 高德软件有限公司 一种地址切分及级别标注方法和地址切分及级别标注装置
CN102298585B (zh) * 2010-06-24 2016-01-13 高德软件有限公司 一种地址切分及级别标注方法和地址切分及级别标注装置
CN102402533A (zh) * 2010-09-13 2012-04-04 方正国际软件有限公司 地址匹配方法及***
CN102446186B (zh) * 2010-10-13 2016-03-30 上海众恒信息产业股份有限公司 中文地理编码及解码方法和装置
CN102446186A (zh) * 2010-10-13 2012-05-09 上海众恒信息产业股份有限公司 中文地理编码及解码方法和装置
CN101980208A (zh) * 2010-11-10 2011-02-23 百度在线网络技术(北京)有限公司 地址查询方法及***
CN102024024A (zh) * 2010-11-10 2011-04-20 百度在线网络技术(北京)有限公司 地址数据库的建构方法及装置
CN101996247A (zh) * 2010-11-10 2011-03-30 百度在线网络技术(北京)有限公司 地址数据库的建构方法及装置
CN101996247B (zh) * 2010-11-10 2013-02-20 百度在线网络技术(北京)有限公司 地址数据库的建构方法及装置
CN102024024B (zh) * 2010-11-10 2013-07-10 百度在线网络技术(北京)有限公司 地址数据库的建构方法及装置
CN102169498A (zh) * 2011-04-14 2011-08-31 中国测绘科学研究院 一种地址模型的构建方法,以及地址匹配的方法和***
CN102289467A (zh) * 2011-07-22 2011-12-21 浙江百世技术有限公司 确定目标网点的方法和装置
CN102955832A (zh) * 2011-08-31 2013-03-06 深圳市华傲数据技术有限公司 一种通讯地址识别、标准化的***
CN102955832B (zh) * 2011-08-31 2015-11-25 深圳市华傲数据技术有限公司 一种通讯地址识别、标准化的***
CN102393937A (zh) * 2011-10-12 2012-03-28 深圳市络道科技有限公司 一种基于反向生成的地址树的地址匹配方法及匹配***
CN103383682B (zh) * 2012-05-01 2017-12-26 刘龙 一种地理编码方法、位置查询***及方法
CN103383682A (zh) * 2012-05-01 2013-11-06 刘龙 一种地理编码方法、位置查询***及方法
CN102880650B (zh) * 2012-08-27 2015-11-18 中国工商银行股份有限公司 一种数据匹配方法及装置
CN102880650A (zh) * 2012-08-27 2013-01-16 中国工商银行股份有限公司 一种数据匹配方法及装置
CN103413215A (zh) * 2013-07-12 2013-11-27 广州银联网络支付有限公司 一种基于矩阵相似度算法的电子联行号匹配方法
CN103413215B (zh) * 2013-07-12 2017-02-08 广州银联网络支付有限公司 一种基于矩阵相似度算法的电子联行号匹配方法
CN103440311A (zh) * 2013-08-27 2013-12-11 深圳市华傲数据技术有限公司 一种地名实体识别的方法及***
WO2015027836A1 (zh) * 2013-08-27 2015-03-05 深圳市华傲数据技术有限公司 一种地名实体识别的方法及***
CN105659637A (zh) * 2013-09-30 2016-06-08 三星电子株式会社 在设备上缓存位置
CN103558926A (zh) * 2013-11-12 2014-02-05 金蝶软件(中国)有限公司 一种地名录入方法及装置
CN103593468A (zh) * 2013-11-27 2014-02-19 北京金和软件股份有限公司 一种音频内容推送方法
CN103593468B (zh) * 2013-11-27 2016-11-16 北京金和软件股份有限公司 一种音频内容推送方法
CN104021184B (zh) * 2014-06-10 2017-07-11 广州品唯软件有限公司 一种定位方法与***
CN104021184A (zh) * 2014-06-10 2014-09-03 广州品唯软件有限公司 一种定位方法与***
CN104092613A (zh) * 2014-07-15 2014-10-08 山东超越数控电子有限公司 一种基于模糊匹配的快速查表方法
CN104182509A (zh) * 2014-08-20 2014-12-03 国家电网公司 一种面向对象地址建模的方法
CN104182510A (zh) * 2014-08-20 2014-12-03 国家电网公司 一种面向对象的地址建模方法
US10783171B2 (en) 2014-09-30 2020-09-22 Huawei Technologies Co., Ltd. Address search method and device
CN105528372A (zh) * 2014-09-30 2016-04-27 华为技术有限公司 一种地址搜索方法和设备
WO2016050088A1 (zh) * 2014-09-30 2016-04-07 华为技术有限公司 一种地址搜索方法和设备
CN105760360A (zh) * 2014-12-16 2016-07-13 高德软件有限公司 一种地址纠正方法和装置
CN105760360B (zh) * 2014-12-16 2018-09-11 高德软件有限公司 一种地址纠正方法和装置
CN106156145A (zh) * 2015-04-13 2016-11-23 阿里巴巴集团控股有限公司 一种地址数据的管理方法和装置
WO2016165538A1 (zh) * 2015-04-13 2016-10-20 阿里巴巴集团控股有限公司 一种地址数据的管理方法和装置
CN106296209A (zh) * 2015-06-05 2017-01-04 阿里巴巴集团控股有限公司 地址输入控制方法及装置
CN106296209B (zh) * 2015-06-05 2021-02-02 菜鸟智能物流控股有限公司 地址输入控制方法及装置
CN106055635B (zh) * 2016-05-30 2019-11-19 深圳市华傲数据技术有限公司 地址信息查找方法及装置
CN106055635A (zh) * 2016-05-30 2016-10-26 深圳市华傲数据技术有限公司 地址信息查找方法及装置
CN106502978A (zh) * 2016-09-19 2017-03-15 浪潮软件股份有限公司 一种中文地址分词方法及装置
CN106649464A (zh) * 2016-09-26 2017-05-10 深圳市数字城市工程研究中心 一种中文地址树的构建方法及装置
CN106649464B (zh) * 2016-09-26 2019-08-30 深圳市数字城市工程研究中心 一种中文地址树的构建方法及装置
CN106528605A (zh) * 2016-09-27 2017-03-22 武汉工程大学 一种基于规则的中文地址解析方法
CN106874384B (zh) * 2017-01-10 2020-12-04 航天精一(广东)信息科技有限公司 一种异构地址标准转换及匹配方法
CN106874384A (zh) * 2017-01-10 2017-06-20 广东精规划信息科技股份有限公司 一种异构地址标准转换及匹配方法
CN106709065A (zh) * 2017-01-19 2017-05-24 国家电网公司 一种地址信息标准化处理方法及装置
CN106709065B (zh) * 2017-01-19 2020-08-04 国家电网公司 一种地址信息标准化处理方法及装置
CN106875264A (zh) * 2017-03-31 2017-06-20 北京京东尚科信息技术有限公司 订单信息管理方法、装置和订单分拣***
CN109255564A (zh) * 2017-07-13 2019-01-22 菜鸟智能物流控股有限公司 一种取件点地址推荐方法及装置
CN107748778A (zh) * 2017-10-20 2018-03-02 浪潮软件股份有限公司 一种提取地址的方法及装置
CN107748778B (zh) * 2017-10-20 2021-03-23 浪潮软件股份有限公司 一种提取地址的方法及装置
CN108369582B (zh) * 2018-03-02 2021-06-25 福建联迪商用设备有限公司 一种地址纠错方法及终端
WO2019165644A1 (zh) * 2018-03-02 2019-09-06 福建联迪商用设备有限公司 一种地址纠错方法及终端
CN108369582A (zh) * 2018-03-02 2018-08-03 福建联迪商用设备有限公司 一种地址纠错方法及终端
CN108959244B (zh) * 2018-06-07 2022-08-09 北京京东尚科信息技术有限公司 地址分词的方法和装置
CN108959244A (zh) * 2018-06-07 2018-12-07 北京京东尚科信息技术有限公司 地址分词的方法和装置
CN109254964A (zh) * 2018-08-20 2019-01-22 中国平安人寿保险股份有限公司 地址标准化方法、装置、计算机设备和存储介质
CN110895651B (zh) * 2018-08-23 2024-02-02 京东科技控股股份有限公司 地址标准化处理方法、装置、设备及计算机可读存储介质
CN110895651A (zh) * 2018-08-23 2020-03-20 北京京东金融科技控股有限公司 地址标准化处理方法、装置、设备及计算机可读存储介质
CN109344213A (zh) * 2018-08-28 2019-02-15 浙江工业大学 一种基于字典树的中文地理编码方法
CN109344213B (zh) * 2018-08-28 2021-06-18 浙江工业大学 一种基于字典树的中文地理编码方法
CN111414357A (zh) * 2019-01-07 2020-07-14 阿里巴巴集团控股有限公司 地址数据处理方法、装置、***和存储介质
CN109784308A (zh) * 2019-02-01 2019-05-21 腾讯科技(深圳)有限公司 一种地址纠错方法、装置及存储介质
CN109784308B (zh) * 2019-02-01 2020-09-29 腾讯科技(深圳)有限公司 一种地址纠错方法、装置及存储介质
CN110099246A (zh) * 2019-02-18 2019-08-06 深度好奇(北京)科技有限公司 监控调度方法、装置、计算机设备及存储介质
CN109933797A (zh) * 2019-03-21 2019-06-25 东南大学 基于Jieba分词及地址词库的地理编码方法和***
CN110674367A (zh) * 2019-09-09 2020-01-10 广州易起行信息技术有限公司 一种基于旅游行业产品的单汉字检索方法及装置
CN110674367B (zh) * 2019-09-09 2022-02-01 广州易起行信息技术有限公司 一种基于旅游行业产品的单汉字检索方法及装置
CN110704564A (zh) * 2019-09-27 2020-01-17 北京沃东天骏信息技术有限公司 一种地址纠错方法和装置
CN112925922A (zh) * 2019-12-06 2021-06-08 农业农村部信息中心 获取地址的方法、装置、电子设备及介质
CN111144117B (zh) * 2019-12-26 2023-08-29 同济大学 知识图谱中文地址消除歧义方法
CN111144117A (zh) * 2019-12-26 2020-05-12 同济大学 知识图谱中文地址消除歧义方法
CN111291277A (zh) * 2020-01-14 2020-06-16 浙江邦盛科技有限公司 一种基于语义识别和高级语言搜索的地址标准化方法
CN111753515A (zh) * 2020-06-24 2020-10-09 广东科杰通信息科技有限公司 一种实现实体定位的地址信息提取及匹配方法
CN111859849A (zh) * 2020-07-01 2020-10-30 邦道科技有限公司 一种用电地址的管理方法和装置
CN111859849B (zh) * 2020-07-01 2023-11-24 邦道科技有限公司 一种用电地址的管理方法和装置
CN112052413A (zh) * 2020-08-28 2020-12-08 上海谋乐网络科技有限公司 Url模糊匹配方法、装置和***
CN112052413B (zh) * 2020-08-28 2024-02-13 上海谋乐网络科技有限公司 Url模糊匹配方法、装置和***
CN112364113A (zh) * 2020-11-13 2021-02-12 北京明略软件***有限公司 一种地址纠错方法及***
CN112417179A (zh) * 2020-11-23 2021-02-26 杭州橙鹰数据技术有限公司 地址处理方法及装置
CN113204606A (zh) * 2021-04-30 2021-08-03 武汉大学 一种基于语义位置网的地址位置推测方法
CN113656450A (zh) * 2021-07-12 2021-11-16 大箴(杭州)科技有限公司 地址处理方法及装置、电子设备、存储介质
CN114091454A (zh) * 2021-11-29 2022-02-25 重庆市地理信息和遥感应用中心 一种互联网文本中地名信息提取及空间定位方法
CN116910386B (zh) * 2023-09-14 2024-02-02 深圳市智慧城市科技发展集团有限公司 地址补全方法、终端设备及计算机可读存储介质
CN116910386A (zh) * 2023-09-14 2023-10-20 深圳市智慧城市科技发展集团有限公司 地址补全方法、终端设备及计算机可读存储介质
CN117874309A (zh) * 2024-03-12 2024-04-12 北京全路通信信号研究设计院集团有限公司 一种列控数据处理方法、装置、电子设备及存储介质
CN117874309B (zh) * 2024-03-12 2024-05-24 北京全路通信信号研究设计院集团有限公司 一种列控数据处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN101719128B (zh) 2012-05-23

Similar Documents

Publication Publication Date Title
CN101719128B (zh) 一种基于模糊匹配的中文地理编码确定方法
CN103914544A (zh) 一种基于地址特征词的多层次快速中文地址匹配方法
Mark Geographic information science: Defining the field
CN108369582B (zh) 一种地址纠错方法及终端
CN112612863B (zh) 一种基于中文分词器的地址匹配方法及***
US20050177563A1 (en) Method and apparatus for retrieving data representing a postal address from a plurality of postal addresses
CN103605752A (zh) 一种基于语义识别的地址匹配方法
CN104679801B (zh) 一种兴趣点搜索方法和装置
CN109933797A (zh) 基于Jieba分词及地址词库的地理编码方法和***
CN112528174A (zh) 基于知识图谱和多重匹配的地址修整补全方法及应用
CN104346444B (zh) 一种基于路网反空间关键字查询的最佳选址方法
CN105209858A (zh) 企业场所数据的非确定性消岐和匹配
CN107766433A (zh) 一种基于Geo‑BTree的范围查询方法及装置
CN103345496A (zh) 多媒体信息检索方法和***
CN111291099B (zh) 一种地址模糊匹配方法、***及计算机设备
CN103970842A (zh) 一种面向防洪减灾领域的水利大数据存取***及方法
CN110990520A (zh) 一种地址编码方法、装置、电子设备和存储介质
CN114780680A (zh) 基于地名地址数据库的检索与补全方法及***
CN114168705B (zh) 一种基于地址要素索引的中文地址匹配方法
CN113505190B (zh) 地址信息修正方法、装置、计算机设备和存储介质
Machanavajjhala et al. Collective extraction from heterogeneous web lists
CN111311173A (zh) 一种全国县级单元经济整理与空间化方法
CN102385597B (zh) 一种poi的容错搜索方法
CN104598887A (zh) 用于非规范格式手写中文地址的识别方法
CN114201480A (zh) 一种基于nlp技术的多源poi融合方法、装置及可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120523