CN103970911A - 一种基于地名库的智能分词查询方法及*** - Google Patents

一种基于地名库的智能分词查询方法及*** Download PDF

Info

Publication number
CN103970911A
CN103970911A CN201410231560.8A CN201410231560A CN103970911A CN 103970911 A CN103970911 A CN 103970911A CN 201410231560 A CN201410231560 A CN 201410231560A CN 103970911 A CN103970911 A CN 103970911A
Authority
CN
China
Prior art keywords
bank
place name
geographical names
user
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410231560.8A
Other languages
English (en)
Inventor
周为群
黄晖
王康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Digital Map Network Technology Co Ltd
Original Assignee
Suzhou Digital Map Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Digital Map Network Technology Co Ltd filed Critical Suzhou Digital Map Network Technology Co Ltd
Priority to CN201410231560.8A priority Critical patent/CN103970911A/zh
Publication of CN103970911A publication Critical patent/CN103970911A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Remote Sensing (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种基于地名库的智能分词查询方法及***,所述方法包括以下步骤。S1.建立包括已知地名的地名库,根据用户输入的内容,查询地名库中是否存在与用户输入内容相同的地名。S2.若否,将用户输入内容与地名库中地名进行自动匹配,并输出匹配结果。S3.用户根据所述匹配结果,查询所需查询地址。

Description

一种基于地名库的智能分词查询方法及***
技术领域
本发明属于地理信息***领域,具体涉及一种基于地名库的智能分词查询方法及***。
背景技术
早在石器时代,人类便开始制作地图。在互联网大行其道,信息技术高速发展的今天,地理信息***赋予了地图更加广阔、更加灵活、更加丰富的含义。地理信息***(Geographic Information System或Geo-Informationsystem,GIS)是一门综合性学科,结合地理学与地图学以及遥感和计算机科学,已经广泛的应用在不同的领域,是用于输入、存储、查询、分析和显示地理数据的计算机***。
在GIS的引导下,地图已不再局限于传统意义上的地理描述,而是和人们的生活紧密相连。通过地图搜索服务,用户可以通过关键词查找地址信息、公交地铁、餐饮美食等,这些都极大的方便了人们的出行和日常生活。然而,现有的地理信息***的相应技术中,多采用基于词组的地址查询方式,因而大部分的地图搜索引擎还存在着许多问题。大部分情况下,当用户输入一个模糊的地名的时候,难以找到准确的最终结果,又或者出现许多毫不相干甚至根本不存在的地址。
现有技术中,基于词组的智能分词查询方法是业内常见的一种地图搜索方法,该方案的问题在于:当我们搜索一些比较生僻的地名的时候,因为基于词组的缘故,***会出现无法识别的现象。比如,在某知名地图搜索中输入地名“炙鱼”,搜索结果显示没有找到相关地点,而把“炙鱼”二字拆为“炙”和“鱼”两个单独的字眼,便能查到相关信息。此漏洞会让用户误认为所搜索的地名不存在、地图中没有该地名的信息等,最终导致用户无法找到需要的地理信息。
为解决上述问题,本发明提供一种基于地名库的智能分词查询方法及***。
发明内容
本发明提供一种基于地名库的智能分词查询方法,包括以下步骤:
S1、建立包括已知地名的地名库,根据用户输入的内容,查询地名库中是否存在与用户输入内容相同的地名;
S2、若否,将用户输入内容与地名库中地名进行自动匹配,并输出匹配结果;
S3、用户根据所述匹配结果,查询所需查询地址。
优选的,在步骤S1中,若地名库中存在与用户输入内容相同的地名,则直接向用户输出所述地名。
优选的,步骤S2还包括:若用户输入内容为分隔查询的内容,则将分隔的各部分内容分别与地名库中地名进行匹配组合后,输出相应结果。
优选的,当输入内容中含有非汉字或非字母的字符时,即判定为分隔查询,且所述输入内容由所述非汉字或非字母的字符分隔。
优选的,步骤S2还包括:若将用户输入内容与地名库中地名进行自动匹配时,输入内容与地名库中地名相比为音近字或形近字,则将地名库中对应的地名作为匹配结果输出。
本发明还提供一种基于地名库的智能分词查询***,包括查询模块、匹配模块及输出模块,所述查询模块连接匹配模块,所述匹配模块连接输出模块。所述查询模块,用于根据用户输入的内容,查询地名库中是否存在与用户输入内容相同的地名。所述匹配模块,用于将用户输入内容与地名库中地名进行自动匹配,并将匹配结果传送给输出模块。所述输出模块,用于向用户输出匹配结果。
根据本发明提供的基于地名库的智能分词查询方法及***,通过现有的地名库,并根据用户输入的内容查询地名库中是否存在相应的地名,避免了基于词组查询地址的缺陷。当在地名库中不存在相应地名时,便将用户输入内容与地名库中地名进行自动匹配,并输出匹配结果以供用户查询使用。如此,大大提高了用户通过电子地图查询地址的效率,并为人们出行提供了便利。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明较佳实施例提供的基于地名库的智能分词查询方法流程图;
图2是本发明较佳实施例提供的生僻地名查询结果示意图;
图3是本发明较佳实施例提供的分隔查询内容查询结果示意图;
图4是本发明较佳实施例提供的近似查询内容查询结果示意图;
图5是本发明较佳实施例提供的基于地名库的智能分词查询***示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
图1是本发明较佳实施例提供的基于地名库的智能分词查询方法流程图。如图1所示,本发明较佳实施例提供的基于地名库的智能分词查询方法包括步骤S1~S3。
步骤S1:建立包括已知地名的地名库,根据用户输入的内容,查询地名库中是否存在与用户输入内容相同的地名。
具体而言,本实施例中,若地名库中存在与用户输入内容相同的地名,则直接向用户输出所述地名,以供用户查询使用。
图2是本发明较佳实施例提供的生僻地名查询结果示意图。如图2所示,打开苏州地图网(http://www.sz-map.com),在首页中选择地图搜索模块,然后在搜索栏中输入生僻地名“炙鱼”,通过地名库查询,仍可直接搜索到正确地址。
通过本实施例提供的基于地名库的智能分词查询方法,用户即使搜索一些生活中不常见的生僻地名仍然能快速准确的搜索到相关结果,不会发生类似基于词组的智能分词查询方法所出现的无法找到相关地点的情况。
步骤S2:若否,将用户输入内容与地名库中地名进行自动匹配,并输出匹配结果。
具体而言,若用户输入内容为分隔查询的内容,则将分隔的各部分内容分别与地名库中地名进行匹配组合后,输出相应结果。于此,当输入内容中含有非汉字或非字母的字符时,即判定为分隔查询,且所述输入内容由所述非汉字或非字母的字符分隔。
此外,若将用户输入内容与地名库中地名进行自动匹配时,输入内容与地名库中地名相比为音近字或形近字,则将地名库中对应的地名作为匹配结果输出。
针对本步骤中上述两种情况,下面给出两个实施例予以说明。
图3是本发明较佳实施例提供的分隔查询内容查询结果示意图。如图3所示,当在搜索栏中输入“人民路银行”后,由于查询内容由空格分隔,搜索结果将显示所有和“人民路”、“银行”相关的地理信息。
此外,当用户输入的地名中出现错别字,尤其是错别字包含音近字或形近字的情况下,***会自动纠错,提示与用户搜索内容类似的地名,供用户选择。图4是本发明较佳实施例提供的近似查询内容查询结果示意图。如图4所示,当用户输入“管钱街”时,由于查询内容中包含有音近字,故输出结果为“观前街”。
步骤S3:用户根据所述匹配结果,查询所需查询地址。
具体而言,用户根据返回的相应结果,判断是否为所需查询的正确地址,并进行下一步操作。
图2是本发明较佳实施例提供的基于地名库的智能分词查询***示意图。如图2所示,本发明较佳实施例提供的基于地名库的智能分词查询***包括查询模块1、匹配模块2及输出模块3,所述查询模块1连接匹配模块2,所述匹配模块2连接输出模块3。所述查询模块1,用于根据用户输入的内容,查询地名库中是否存在与用户输入内容相同的地名。所述匹配模块2,用于将用户输入内容与地名库中地名进行自动匹配,并将匹配结果传送给输出模块3。所述输出模块3,用于向用户输出匹配结果。关于上述***的操作流程与上述方法类似,故于此不再赘述。
综上所述,根据本发明较佳实施例提供的基于地名库的智能分词查询方法及***,通过现有的地名库,并根据用户输入的内容查询地名库中是否存在相应的地名,避免了基于词组查询地址的缺陷。当在地名库中不存在相应地名时,便将用户输入内容与地名库中地名进行自动匹配,并输出匹配结果以供用户查询使用。如此,大大提高了用户通过电子地图查询地址的效率,并为人们出行提供了便利。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (6)

1.一种基于地名库的智能分词查询方法,其特征在于,包括以下步骤:
S1、建立包括已知地名的地名库,根据用户输入的内容,查询地名库中是否存在与用户输入内容相同的地名;
S2、若否,将用户输入内容与地名库中地名进行自动匹配,并输出匹配结果;
S3、用户根据所述匹配结果,查询所需查询地址。
2.根据权利要求1所述的方法,其特征在于,在步骤S1中,若地名库中存在与用户输入内容相同的地名,则直接向用户输出所述地名。
3.根据权利要求1所述的方法,其特征在于,步骤S2还包括:若用户输入内容为分隔查询的内容,则将分隔的各部分内容分别与地名库中地名进行匹配组合后,输出相应结果。
4.根据权利要求3所述的方法,其特征在于,当输入内容中含有非汉字或非字母的字符时,即判定为分隔查询,且所述输入内容由所述非汉字或非字母的字符分隔。
5.根据权利要求1所述的方法,其特征在于,步骤S2还包括:若将用户输入内容与地名库中地名进行自动匹配时,输入内容与地名库中地名相比为音近字或形近字,则将地名库中对应的地名作为匹配结果输出。
6.一种基于地名库的智能分词查询***,其特征在于,包括查询模块、匹配模块及输出模块,所述查询模块连接匹配模块,所述匹配模块连接输出模块,
所述查询模块,用于根据用户输入的内容,查询地名库中是否存在与用户输入内容相同的地名;
所述匹配模块,用于将用户输入内容与地名库中地名进行自动匹配,并将匹配结果传送给输出模块;
所述输出模块,用于向用户输出匹配结果。
CN201410231560.8A 2014-05-28 2014-05-28 一种基于地名库的智能分词查询方法及*** Pending CN103970911A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410231560.8A CN103970911A (zh) 2014-05-28 2014-05-28 一种基于地名库的智能分词查询方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410231560.8A CN103970911A (zh) 2014-05-28 2014-05-28 一种基于地名库的智能分词查询方法及***

Publications (1)

Publication Number Publication Date
CN103970911A true CN103970911A (zh) 2014-08-06

Family

ID=51240409

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410231560.8A Pending CN103970911A (zh) 2014-05-28 2014-05-28 一种基于地名库的智能分词查询方法及***

Country Status (1)

Country Link
CN (1) CN103970911A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105701133A (zh) * 2014-11-28 2016-06-22 方正国际软件(北京)有限公司 一种地址输入的方法和设备
CN105975099A (zh) * 2016-04-28 2016-09-28 百度在线网络技术(北京)有限公司 输入法的实现方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101206121A (zh) * 2006-09-20 2008-06-25 高德软件有限公司 地名检索装置
WO2008156600A1 (en) * 2007-06-18 2008-12-24 Geographic Services, Inc. Geographic feature name search system
CN101840406A (zh) * 2009-03-20 2010-09-22 富士通株式会社 地名搜索装置和***
CN103714081A (zh) * 2012-09-29 2014-04-09 北京百度网讯科技有限公司 一种专有地名的识别方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101206121A (zh) * 2006-09-20 2008-06-25 高德软件有限公司 地名检索装置
WO2008156600A1 (en) * 2007-06-18 2008-12-24 Geographic Services, Inc. Geographic feature name search system
CN101840406A (zh) * 2009-03-20 2010-09-22 富士通株式会社 地名搜索装置和***
CN103714081A (zh) * 2012-09-29 2014-04-09 北京百度网讯科技有限公司 一种专有地名的识别方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李艳红,庞小平,李海亭: "地名分词搜索的词典设计与匹配方法研究", 《测绘信息与工程》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105701133A (zh) * 2014-11-28 2016-06-22 方正国际软件(北京)有限公司 一种地址输入的方法和设备
CN105975099A (zh) * 2016-04-28 2016-09-28 百度在线网络技术(北京)有限公司 输入法的实现方法和装置
CN105975099B (zh) * 2016-04-28 2020-02-04 百度在线网络技术(北京)有限公司 输入法的实现方法和装置

Similar Documents

Publication Publication Date Title
CN103491205B (zh) 一种基于视频搜索的关联资源地址的推送方法和装置
CN103514299B (zh) 信息搜索方法和装置
CN109657068B (zh) 面向智慧博物馆的文物知识图谱生成与可视化方法
CN103488724A (zh) 一种面向图书的阅读领域知识图谱构建方法
CN105069047A (zh) 一种地理信息的检索方法及装置
CN107861753B (zh) App生成索引、检索方法和***及可读存储介质
US20120323905A1 (en) Ranking data utilizing attributes associated with semantic sub-keys
CN103544267A (zh) 一种基于搜索建议词进行搜索的方法以及装置
CN103544266A (zh) 一种搜索建议词生成的方法以及装置
CN110019617B (zh) 地址标识的确定方法和装置、存储介质、电子装置
US20110119261A1 (en) Searching using semantic keys
JP2022532451A (ja) 百科知識ベースと単語の埋め込みに基づく中国語地名語義の曖昧性解消方法
CN111324679A (zh) 地址信息的处理方法、装置和***
CN107818487A (zh) 一种产品信息处理方法、装置、设备及客户端
CN105095391A (zh) 利用分词程序识别机构名称的装置及方法
US20230049839A1 (en) Question Answering Method for Query Information, and Related Apparatus
CN110717019A (zh) 问答处理方法、问答***、电子设备及介质
US20120317141A1 (en) System and method for ordering of semantic sub-keys
CN115168401A (zh) 数据分级处理方法及装置、电子设备及计算机可读介质
CN105159885A (zh) 一种兴趣点名称的识别方法和装置
CN103970911A (zh) 一种基于地名库的智能分词查询方法及***
US8745022B2 (en) Full text search based on interwoven string tokens
CN105787099A (zh) 一种获取学习资料的方法及装置
US20120323904A1 (en) Automatic generation of a search query
CN103970732B (zh) 新词译文的挖掘方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140806

WD01 Invention patent application deemed withdrawn after publication