CN101350013A - 一种地理信息的搜索方法和*** - Google Patents
一种地理信息的搜索方法和*** Download PDFInfo
- Publication number
- CN101350013A CN101350013A CNA2007101192210A CN200710119221A CN101350013A CN 101350013 A CN101350013 A CN 101350013A CN A2007101192210 A CNA2007101192210 A CN A2007101192210A CN 200710119221 A CN200710119221 A CN 200710119221A CN 101350013 A CN101350013 A CN 101350013A
- Authority
- CN
- China
- Prior art keywords
- address
- space
- information
- search
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种地理信息的搜索方法和***,该方法可以包括:接收查询请求信息;对查询请求信息进行分词,获取有效地址和关键词;查询预置数据库,获取该有效地址的空间几何信息;依据所述空间几何信息确定待搜索空间区域;在所述待搜索空间区域内,以该关键词进行搜索;输出搜索结果。本发明有机的将空间索引和全文搜索结合起来,能够有效的提高地理信息搜索的准确度和丰富程度。
Description
技术领域
本发明涉及信息搜索领域,特别是涉及一种地理信息的搜索方法和***。
背景技术
随着互联网的普及和信息技术的迅速发展,人们对各种信息,特别是地理信息的依赖越来越大。据统计,现在人们80%以上的活动都跟空间位置有关,因此,如何从海量的地理信息数据中准确、迅速地找到自己需要的信息,成为当前迫切需要解决的问题。
目前,国内外都有不少公司推出了地图搜索服务,例如,Google公司和Baidu公司等等;但是这些搜索引擎大多数都是基于全文检索技术实现,即只能根据用户输入的文字名称在数据库中模糊匹配、搜索相应地物。例如,用户输入查询词“北京市海龙大厦”,则得到搜索结果中包括了所有的在数据库中的地物名称或者具体地址信息中包括了“北京市”和“海龙大厦”的匹配结果,而其中有两条结果在地图上标注的具体地理位置离真实的“海龙大厦”的地理坐标非常远,明显不符合用户的检索要求;但却由于其地址信息中有“海龙大厦”的字样,所以出现在了搜索结果列表中,并且排序靠前。
那么,迫切需要本领域技术人员解决的一个技术问题就是:提出一种创新的地理信息搜索方法,能够有效的提高地理信息搜索的准确度,满足人们更多的搜索需求。
发明内容
本发明所要解决的技术问题是提供一种地理信息搜索方法和***,能够有效的提高地理信息搜索的准确度,满足人们更多的搜索需求。
为了解决上述问题,本发明公开了一种地理信息的搜索方法,包括:接收查询请求信息;对查询请求信息进行分词,获取有效地址和关键词;查询预置数据库,获取该有效地址的空间几何信息;依据所述空间几何信息确定待搜索空间区域;在所述待搜索空间区域内,以该关键词进行搜索;输出搜索结果。
优选的,可以通过以下步骤完成分词过程:以预置的地址分词库为参照词典,对所述查询请求信息进行分词,获得有效地址;所述地址分词库中存储有多个标准地址词条;分词得到查询请求信息中的非地址词条,将分词结果中的非地址词条作为关键词。
进一步,当分词结果包括至少两个地址词条时,还可以包括:判断分词结果中前后两个地址词条是否符合预置的父子级别关系,如果是,则确定为有效地址;所述父子级别关系存储在所述的地址分词库中。优选的,还包括:将地址词条在预置的地物数据库中进行查询,如果能够完全匹配,则确定为有效地址。
优选的,可以通过以下步骤完成在所述待搜索空间区域内的搜索:通过经纬度计算,建立空间四叉索引中的网格和所述待搜索空间区域的关联关系;在相应网格所包含的地物中,以所述关键词进行检索,获得目标地物。
进一步,所述方法还可以包括:将搜索结果所涉及的地物在地物数据库中的第一标识号转换为第二标识号,作为搜索结果的一部分输出给用户。
另一个方面,本发明还提供了一种地理信息的搜索方法,包括:接收查询请求信息;以预置的地址分词库为参照词典,对所述查询请求信息进行分词,获得有效地址;所述地址分词库中存储有多个标准地址词条;查询预置数据库,获取该有效地址的空间几何信息;依据所述空间几何信息确定待搜索空间区域;在所述待搜索空间区域内进行搜索;输出搜索结果。
优选的,当分词结果包括至少两个地址词条时,还包括:判断分词结果中前后两个地址词条是否符合预置的父子级别关系,如果是,则确定为有效地址;所述父子级别关系存储在所述的地址分词库中。
进一步,通可以过以下步骤完成在所述待搜索空间区域内的搜索:通过经纬度计算,建立空间四叉索引中的网格和所述待搜索空间区域的关联关系;在相应网格所包含的地物中进行检索,获得目标地物。
进一步,所述方法还可以包括:将搜索结果所涉及的地物在地物数据库中的第一标识号转换为第二标识号,作为搜索结果的一部分输出给用户。
根据本发明的又一个方面,还提供了一种地理信息的搜索***,包括:
接收器,用于接收查询请求信息;
分词器,用于对查询请求信息进行分词,获取有效地址和关键词;
几何信息获取模块,用于查询预置数据库,获取该有效地址的空间几何信息;
搜索区域确定模块,用于依据所述空间几何信息确定待搜索空间区域;
搜索器,用于在所述待搜索空间区域内,以该关键词进行搜索;
结果输出器,用于输出搜索结果。
优选的,所述分词器可以进一步包括:地址分词模块,用于以预置的地址分词库为参照词典,对所述查询请求信息进行分词,获得有效地址;所述地址分词库中存储有多个标准地址词条;普通分词模块,用于分词得到查询请求信息中的非地址词条,将分词结果中的非地址词条作为关键词。
进一步,当分词结果包括至少两个地址词条时,所述分词器还包括:父子级别判断模块,用于判断分词结果中前后两个地址词条是否符合预置的父子级别关系,如果是,则确定为有效地址;所述父子级别关系存储在所述的地址分词库中。
优选的,所述***还可以包括:地址词条匹配模块,用于将地址词条在预置的地物数据库中进行查询,如果能够完全匹配,则确定为有效地址。
优选的,所述搜索器进一步包括:关联模块,用于通过经纬度计算,建立空间四叉索引中的网格和所述待搜索空间区域的关联关系;关键词搜索模块,用于在相应网格所包含的地物中,以所述关键词进行检索,获得目标地物。
优选的,所述***还可以包括:标识转换模块,用于将搜索结果所涉及的地物在地物数据库中的第一标识号转换为第二标识号,作为搜索结果的一部分输出给用户。
依据本发明的另一实施例,公开了一种地理信息的搜索***,包括:
接收器,用于接收查询请求信息;
地址分词器,用于以预置的地址分词库为参照词典,对所述查询请求信息进行分词,获得有效地址;所述地址分词库中存储有多个标准地址词条;
几何信息获取模块,用于查询预置数据库,获取该有效地址的空间几何信息;
搜索区域确定模块,用于依据所述空间几何信息确定待搜索空间区域;
搜索器,用于在所述待搜索空间区域内进行搜索;
结果输出器,用于输出搜索结果。
优选的,当分词结果包括至少两个地址词条时,所述分词器还包括:父子级别判断模块,用于判断分词结果中前后两个地址词条是否符合预置的父子级别关系,如果是,则确定为有效地址;所述父子级别关系存储在所述的地址分词库中。
优选的,所述搜索器进一步包括:关联模块,用于通过经纬度计算,建立空间四叉索引中的网格和所述待搜索空间区域的关联关系;搜索模块,用于在相应网格所包含的地物中进行检索,获得目标地物。
本发明还要求保护一种地理信息的搜索方法,包括:接收用户的坐标输入或者在地图上的区域选择,确定用户所需的待搜索区域;接收查询关键词;通过经纬度计算,建立空间四叉索引中的网格和所述待搜索区域的关联关系;在相应网格所包含的地物中,以所述关键词进行检索,获得目标地物;输出搜索结果。
与现有技术相比,本发明具有以下优点:
本发明所述的地理信息搜索方法和***,能够有效的提高地理信息搜索的准确度,满足人们更多的、更深层次的搜索需求。例如,可以由用户指定、选定或者通过输入坐标确定一个坐标区域范围,就能实现地物搜索;或者,也可以由用户输入地址词条,本发明的技术通过对地址词条的识别,可以将地理名词转化为地理坐标,然后在所确定的区域内再作相应的关键词搜索处理。
附图说明
图1是本发明一种地理信息搜索的方法实施例1的步骤流程图;
图2是本发明一种地理信息搜索的方法实施例2的步骤流程图;
图3是本发明一种地理信息搜索的***实施例3的结构框图;
图4是本发明一种地理信息搜索的***实施例4的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明可用于众多通用或专用的计算***环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器***、基于微处理器的***、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何***或设备的分布式计算环境等等。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本发明所述的地理信息搜索可以应用于客户端-服务器的架构,也可以应用于本地搜索。
参照图1,示出了本发明一种地理信息搜索的方法实施例1,具体可以包括:
步骤101、接收查询请求信息;
步骤102、对查询请求信息进行分词,获取有效地址和关键词;
下面对中文分词技术进行简单介绍。
众所周知,英文是以词为单位的,词和词之间是靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描述一个意思。例如,英文句子I am astudent,用中文则为:“我是一个学生”。计算机可以很简单通过空格知道student是一个单词,但是不能很容易明白“学”、“生”两个字合起来才表示一个词。把中文的汉字序列切分成有意义的词,就是中文分词。例如,我是一个学生,分词的结果是:我是一个学生。下面介绍一些常用的分词方法:
1、基于字符串匹配的分词方法:是指按照一定的策略将待分析的汉字串与一个预置的机器词典中的词条进行匹配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。实际使用的分词***,都是把机械分词作为一种初分手段,还需通过利用各种其它的语言信息来进一步提高切分的准确率。
2、基于特征扫描或标志切分的分词方法:是指优先在待分析字符串中识别和切分出一些带有明显特征的词,以这些词作为断点,可将原字符串分为较小的串再来进机械分词,从而减少匹配的错误率;或者将分词和词类标注结合起来,利用丰富的词类信息对分词决策提供帮助,并且在标注过程中又反过来对分词结果进行检验、调整,从而提高切分的准确率。
3、基于理解的分词方法:是指通过让计算机模拟人对句子的理解,达到识别词的效果。其基本思想就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来处理歧义现象。它通常包括三个部分:分词子***、句法语义子***、总控部分。在总控部分的协调下,分词子***可以获得有关词、句子等的句法和语义信息来对分词歧义进行判断,即它模拟了人对句子的理解过程。这种分词方法需要使用大量的语言知识和信息。
4、基于统计的分词方法:是指,中文信息中由于字与字相邻共现的频率或概率能够较好的反映成词的可信度,所以可以对语料中相邻共现的各个字的组合的频度进行统计,计算它们的互现信息,以及计算两个汉字X、Y的相邻共现概率。互现信息可以体现汉字之间结合关系的紧密程度。当紧密程度高于某一个阈值时,便可认为此字组可能构成了一个词。这种方法只需对语料中的字组频度进行统计,不需要切分词典。
对于本发明而言,由于地址词条一般都比较特殊,因此,主要采用预置参照词典的方式进行,一般可以在所述的地址分词库中预置存储多个标准地址词条。例如,在地址分词库中预先存储有一个标准地址词条——“中关村软件园”,则根据二者的匹配关系,可以从查询请求信息“中关村软件园5号楼”中识别出一个地址要素“中关村软件园”。
对于查询请求信息中的普通词条,则可以从前述的各种方法中选用或者组合使用,优选的,可以在地址分词库中预置用于普通分词的标准词条
一般的,最终得到的分词结果中除了地址词条以外的词条就可以认为是关键词。例如,分词结果为:“建国门外大街+餐厅”,则地址词条为“建国门外大街”,关键词为“餐厅”。如果没有更进一步的优化步骤,则可以确定该地址词条“建国门外大街”为本发明所述的有效地址。
优选的,为了确保该地址的准确或者正确,则本实施例还可以包括一些针对地址词条的筛选步骤,经过筛选的地址词条才可以确定为有效地址进入下一步骤。
筛选方式1。当分词结果包括至少两个地址词条时,还可以包括的筛选步骤为:判断分词结果中前后两个地址词条是否符合预置的父子级别关系,如果是,则确定为有效地址;所述父子级别关系存储在所述的地址分词库中。当然,所述父子级别关系也可以存储在其他数据库中,只不过存储在所述的地址分词库中是一种简单的实现方式而已。
采用上述的父子级别关系的筛选步骤,可以去除一些错误的分词结果或者错误的查询请求,避免得到的搜索结果是错误的,还浪费了计算资源。例如,得到的分词结果为“北京市+海淀区+亚运村+华堂商场”,其中“华堂商场”为关键词,其他的为地址词条;通过判断父子级别关系,发现地址词条“亚运村”与其上级地址词条“海淀区”不符合父子级别关系,因为实际中的“亚运村”属于“朝阳区”,因此,不能确定为“北京市+海淀区+亚运村”有效地址。
筛选方式2。当分词结果的地址词条可以唯一的匹配,不存在同名问题时,则可以确定该地址词条为有效地址,例如,分词结果为“北京市+海龙大厦”,则由于海龙大厦只在北京才有,所以可以确定“北京市+海龙大厦”为有效地址。优选的,可以直接在地址分词库中存储“海龙大厦”相应的经纬度信息,通过查询地址分词库而获得“海龙大厦”的空间几何信息(即完成步骤103)。
当某个地址词条在多个地区都存在,例如“南京路”在上海和广州都有,则在地址分词库中仅仅存储一“南京路”词条即可,而不会存储两个“南京路”词条,因为地址分词库的主要作用是在分词时作为参照词典,而一般不需要在其中作进一步的计算。因此,在此时,就不能确定“上海市+南京路”为有效地址,为了确定有效地址,则需要进一步到地物数据库中进行匹配计算,因为地物数据库中针对每一个地物都存储有一条记录。
筛选方式3。因为方式2中在同名的情况下还是需要到地物数据库中进行匹配计算,所以本方式直接针对分词结果(例如,“上海市+南京路”),在地物数据库中进行匹配计算,如果找到完全一致的地物记录,则确定其为一条有效地址。例如,对于“北京市+南京路”,在地物数据库中就不能找到完全一致的地物记录,则不能确定其为一条有效地址。
本发明并不限于上述的几种筛选方式,仅仅用于说明本发明的思想而已。
当不能确定地址词条为有效地址时,可以有多种处理方式:一是直接返回出错信息;二是依据数据库记录对原地址词条进行校正,然后依据校正后的有效地址返回搜索结果;三是依据数据库记录返回多个可能的有效地址,请用户手动选择。而实际上,根据商业情况的需要,本领域技术人员还可以设计出其他可行的处理方式,在此本发明不能一一描述了。
步骤103、查询预置数据库,获取该有效地址的空间几何信息;
通过上述对筛选步骤的描述,易于得知:一种情况,可以通过查询地址分词库,得到相应的空间几何信息;另一种情况,可以通过查询地物数据库,得到相应的空间几何信息。对于“海龙大厦”这类点记录而言,其空间几何信息可以为点的经纬度信息,对于“中关村大街”这样的线记录而言,则其空间几何信息可以为道路的经纬度点集。
步骤104、依据所述空间几何信息确定待搜索空间区域;
在一个实施例中,可以通过预置规则,确定待搜索空间区域。例如,如果是点坐标,则待搜索空间区域为以该点坐标为中心,以500米为半径形成的圆形区域;如果是点坐标的集合,则待搜索空间区域为以所述点坐标的集合形成的线为轴线,分别向两侧扩展形成的多边形区域。
在另一个实施例中,则可以提供界面,由用户手动确定。
具体的步骤104可以由一个独立的模块完成,也可以由用于完成空间搜索的装置完成,即将空间几何信息和关键词传送给该装置,该装置自行确定待搜索空间区域,并完成搜索即可。
步骤105、在所述待搜索空间区域内,以该关键词进行搜索;
空间搜索一般可以通过建立空间索引的方式实现,空间索引是指在存储空间数据时依据空间对象的位置和形状或空间对象之间的某种空间关系,按一定顺序排列的一种数据结构,其中包含空间对象的概要信息如对象的标识、外接矩形及指向空间对象实体的指针等。目前GIS中常用的索引方式有格网索引,R树索引、四叉树索引等。通过空间索引的筛选作用,可以迅速排除大量与特定空间操作无关的空间对象,从而提高空间操作的速度和效率。
例如,依据“中关村软件园”所对应的地理坐标区域,从四叉树索引中获取所涉及的所有地物的存储位置,然后依据关键词(地物名称,例如“汉王大厦”)在地物基础数据库中的相应位置进行搜索匹配。地物基础数据库是用来存储地物名称及其各种属性信息的。实际上,在地物基础数据库中的匹配,就是一种全文检索技术,例如,可以将地物名称或者地物属性信息中包含关键词的地物都作为搜索结果输出。
以四叉树索引为例,四叉树索引的思想就是将所有要素的总范围划分为2×2的网格,分析每一个网格只要该网格内的要素个数大于规定值就将该网格进一步分割,即树的深度加1。四叉树缺点是当要素各图形范围大小差异很大或要素空间分布不均匀是,四叉树的分割层次可能很深,但是对于地图而言恰好是非常合适。假设针对中国整个地图建立的四叉树索引,则顶层网格就是将中国这个大区域均等划分成一定数量的大网格(比如每个大网格可以是6个经度,5个纬度),四叉网格则是在每个大网格之下进行的多极四叉细分。
一般的,采用空间索引技术的情况下,可以通过以下步骤完成在所述待搜索空间区域内的搜索:
步骤a、通过经纬度计算,建立空间四叉索引中的网格和所述待搜索空间区域的关联关系;
步骤b、在相应网格所包含的地物中,以所述关键词进行检索,获得目标地物。
简单的情况下,可以在网格所包含的地物集合中,以所述关键词进行检索,此时给出的搜索结果的范围会稍微宽泛一些,但是效率会高一些。当然,也可以进一步计算得到所述待搜索空间区域所包含的地物集合,以满足更为精确的搜索要求。
步骤106、输出搜索结果。
本发明的地理信息搜索结果可以通过文字列表的方式展示,或者也可以通过图示的方式展示,本发明不需要对搜索结果的展示方式加以限制。本发明的地理信息搜索结果可以提供给个人计算机终端,也可以提供给各种移动计算设备,当然,由于不同的设备应用的协议或者数据格式不同,则需要将搜索结果转换为相应格式。例如,按照一定的XML格式,将搜索结果字符集发送给移动终端。
所述的搜索结果可以为各种地物名称,或者各种地物相应的起点和终点坐标。当然,所述搜索结果还可以包括该地物的部分属性信息。
如果用户希望针对搜索结果中的某个地物进行详细了解,则可以点击该地物,查询预置的地物数据库,获取该地物相关的属性信息。当然,连接预置的地物数据库进行查询的依据可以为该地物的标识号。
为了防止具体的地物数据信息被恶意从网络抓取,优选的,将搜索结果所涉及的地物在地物数据库中的第一标识号转换为第二标识号,作为搜索结果的一部分输出给用户。用户通过转换后的第二标识号,向服务器端的地物数据库要求更详细的信息。其中,将第一标识号转换为第二标识号的方式可以多种多样,例如,将第一标识号通过加密算法结合地物名称、类型等属性,转换为非明文的标识号;或者,直接依据特定算法进行转换等等。
优选的,实施例1还可以包括搜索结果过滤步骤,用于针对得到的搜索结果集,按照一定的预置规则进行过滤。例如,过滤实际地理位置不在所需的空间区域内的搜索结果(例如,不属于所需的行政区划或者离中心点的距离超过阈值);或者,过滤地物类别明显不符合查询需求的搜索结果等等。当然,根据实际需要,本领域技术人员还可以提出其他的过滤策略,本发明并不需要对此加以限定。
进一步,实施例1还可以包括结果排序步骤,用于针对搜索结果集进行符合用户通常习惯的优化排序。例如,按照匹配度由高到低的顺序排列搜索结果;按照离中心点的距离由小到大的顺序排列搜索结果;或者按照地物的级别顺序排列搜索结果(例如,在某个区域内搜索餐厅,则按照星级顺序排列);或者依据某个用户的使用习惯提供个性化的排序等等。本发明对具体的排序规则也无需限定。
在上面的描述中,本发明提供了一种先通过空间搜索确定一些区域,然后在该区域内进行关键词全文搜索的地理信息搜索方法实施例,下面本发明再提供另一中地理信息搜索方法实施例,主要应用于空间搜索的情况。
参照图2,示出了地理信息搜索方法实施例2,具体可以包括:
步骤201、接收查询请求信息;
步骤202、对查询请求信息进行分词,获取有效地址;优选的,以预置的地址分词库为参照词典,对所述查询请求信息进行分词,获得有效地址;所述地址分词库中存储有多个标准地址词条;
进一步,当分词结果包括至少两个地址词条时,还可以包括:判断分词结果中前后两个地址词条是否符合预置的父子级别关系,如果是,则确定为有效地址;
步骤203、查询预置数据库,获取该有效地址的空间几何信息;
步骤204、依据所述空间几何信息确定待搜索空间区域;
步骤205、在所述待搜索空间区域内进行搜索;
步骤206、输出搜索结果。
实施例2和实施例1的主要区别在于,可以应用于仅仅需要空间搜索的情境下,例如,用户希望知道“芳草地西街”的具体地理位置以及周边地物情况,则应用实施例2是更为合适的。当然,实际上,实施例2可以看作是实施例1的特殊情况,即实施例1中关键词为空的情况就是实施例2,所以这两个实施例相同或者相似之处,就不再赘述了。
实施例2进行空间搜索的具体策略以及返回的搜索结果,和实施例1会有所不同,因为其满足的是不同的用户需求。例如,分词后得到的有效地址为“芳草地西街”,则返回的搜索结果可以包括:该条道路从起点到终点的经纬度信息(可以采用数据集的方式,也可以采用在地图上突出显示的方式),针对该条道路的介绍,该条道路周边一些特色地物及其属性信息或者该条道路周边一定区域内的所有地物及其属性信息等等。
本发明的另一实施例是,首先,接收用户的坐标输入或者在地图上的区域选择,确定用户所需的待搜索区域;以及,接收查询关键词;然后,通过经纬度计算,建立空间四叉索引中的网格和所述待搜索区域的关联关系;以及,在相应网格所包含的地物中,以所述关键词进行检索,获得目标地物;最后输出相应的搜索结果。该实施例可以满足某些用户的特殊需求,例如,用户用拉框选择一个矩形(坐标范围是:RECT(116123453912345,117123454012345)),然后在该区域内搜索关键词。
参照图3,示出了一种地理信息的搜索***实施例3,实施例3是相应于实施例1的,具体可以包括:
接收器301,用于接收查询请求信息;
分词器302,用于对查询请求信息进行分词,获取有效地址和关键词;
几何信息获取模块303,用于查询预置数据库,获取该有效地址的空间几何信息;
搜索区域确定模块304,用于依据所述空间几何信息确定待搜索空间区域;
组合搜索器305,用于在所述待搜索空间区域内,以该关键词进行搜索;
结果输出器306,用于输出搜索结果。
优选的,所述分词器302进一步包括:
地址分词模块,用于以预置的地址分词库为参照词典,对所述查询请求信息进行分词,获得有效地址;所述地址分词库中存储有多个标准地址词条;
普通分词模块,用于分词得到查询请求信息中的非地址词条,将分词结果中的非地址词条作为关键词。对于普通分词模块所采用的具体的分词技术,本发明并不需要限定。
进一步,当分词结果包括至少两个地址词条时,所述分词器302还可以包括:父子级别判断模块,用于判断分词结果中前后两个地址词条是否符合预置的父子级别关系,如果是,则确定为有效地址;所述父子级别关系存储在所述的地址分词库中。
一种优选的实现方式是:在地址分词库中既存储标准地址词条,也包括标准普通词条。针对标准地址词条可以对应多个字段的信息,例如,包括标准地址词条的名称、地址级别、父地址所在位置序号、经纬度信息、城市ID号、别名地址位置序号等等。其中,地址级别可以用来确定该地址要素是区域(面)、道路(线)或者具***置(点);城市ID号和父地址所在位置序号可以用来判定父子级别关系是否正确。
针对地址词条不存在同名的情况下,可以直接确定为有效地址,从地址分词库中获取相应的空间几何信息,例如,经纬度信息字段等。优选的,为了避免地址同名时,难以简单确定有效地址的情况,则进一步,本实施例还可以包括:地址词条匹配模块,用于将地址词条在预置的地物数据库中进行查询,如果能够完全匹配,则确定为有效地址。地物数据库用于存储各个地物及其相应的属性信息,例如,地物数据的存储采用固定的各字段索引(包括该字段值的起点和长度)和压缩的XML字符串方式存储;其包括对点,线、面的地理数据的结构化存储,存储的字段可以包括:地物名称、地址、电话、经纬度、空间几何信息等。
所述组合搜索器305可以采用各种空间搜索的技术实现,在本发明的一个优选实施例中,所述组合搜索器采用空间索引的方式实现。此时,所述组合搜索器305进一步可以包括:关联模块,用于通过经纬度计算,建立空间四叉索引中的网格和所述待搜索空间区域的关联关系;关键词搜索模块,用于在相应网格所包含的地物中,以所述关键词进行检索,获得目标地物。
组合搜索器305完成的主要工作就是通过空间搜索,确定待搜索的地物数据集合,然后通过全文搜索技术完成在该范围内的关键词搜索。
进一步,为了对地物基础数据的保密,本实施例可以进一步包括:标识转换模块,用于将搜索结果所涉及的地物在地物数据库中的第一标识号转换为第二标识号,作为搜索结果的一部分输出给用户。
对于具体的关键词搜索过程,可以采用各种全文搜索的技术实现,在本发明的一个优选实施例中,关键词搜索模块可以进一步包括:逆波兰表达式生成器,可对经过分词器拆分后的单词进行逆波兰表达式生成,以供逻辑组合器进行逻辑运算;单词匹配器,可对单词中的各个字进行倒排索引查找,并把各个字的倒排索引组合,得到单词的倒排索引集合;逻辑组合器,可对各个单词的倒排索引集合通过运算符做逻辑运算。这些模块间的关系可以为:从分词器过来的词组数据经过逆波兰表达式生成器处理完以后,形成一个表达式的计算规则,通过这个规则,逻辑组合器将由每个词组经过单词匹配器后的查询结果,进行两两逻辑组合,并形成最终的结果集。
下面对倒排索引简单介绍:
倒排索引是一种面向单词的索引机制,利用它可以提高检索时的速度。通常情况下,倒排索引结构由“词典”和“出现情况”两部分组成。对于每一个单词,都会有一个词汇列表记录单词在所有文档中出现的位置,这些位置可以是单词的位置(文本中的第几个单词)也可以是字符的位置(文本中的第几个字符)。也就是说,倒排索引技术建立的是“单词到文档”的映射关系。
需要说明的是,对关键词搜索过程而言,还可以用于属性搜索,例如,从各种途径收集到地物基础数据之后,将名称中带有“美食、餐厅、饭店、小吃”等地物归于属性类:饮食;,则当用户搜索“吃饭、餐厅、美食”等关键词时,可以返回饮食属性类的地物作为搜索结果,而不是机械的返回名称中含有相同关键词的地物为搜索结果,从而更好的满足用户的搜索需求。
进一步,上述实施例还可以包括:用于针对搜索结果集按照预置条件进行过滤的过滤器;以及,针对搜索结果集按照预置规则进行优化排序的排序器。
参照图4,示出了一种地理信息的搜索***实施例4,实施例4可以应用于仅仅需要空间搜索的情境下,该***具体可以包括:
接收器401,用于接收查询请求信息;
地址分词器402,用于以预置的地址分词库为参照词典,对所述查询请求信息进行分词,获得有效地址;所述地址分词库中存储有多个标准地址词条;
优选的,当分词结果包括至少两个地址词条时,所述分词器还包括:父子级别判断模块,用于判断分词结果中前后两个地址词条是否符合预置的父子级别关系,如果是,则确定为有效地址;所述父子级别关系存储在所述的地址分词库中;
几何信息获取模块403,用于查询预置数据库,获取该有效地址的空间几何信息;
搜索区域确定模块404,用于依据所述空间几何信息确定待搜索空间区域;
空间搜索器405,用于在所述待搜索空间区域内进行搜索;优选的,所述搜索器进一步包括:关联模块,用于通过经纬度计算,建立空间四叉索引中的网格和所述待搜索空间区域的关联关系;搜索模块,用于在相应网格所包含的地物中进行检索,获得目标地物;
结果输出器406,用于输出搜索结果。一种简单的情况就是,返回所述待搜索空间区域内所包含的所有地物。
在实际应用的过程中,本发明所述的地理信息搜索***还可以包括:参数解析器,用于对外部传来的参数进行解析,获得所需的原始地址信息。所述的外部参数中可能包括匹配结果的页面显示参数等其他参数。比如:start(起始页),pagecap(每页的条数)等。
下面对应用上述实施例针对一次查询请求的执行流程进行简单介绍:
1、终端发送查询请求至服务端;
2、服务端经过apache的处理,记录下查询日志,启动搜索进程;
3、由参数解析器对接收的参数字符进行解析,提取各个参数值,例如:原始查询请求信息、电话、匹配模式、分页等信息;
4、针对原始查询请求信息,利用地址分词库进行分词,得到分词结果;
5、根据分词结果,分别执行以下操作:
A、如果只有有效地址,则直接进行空间搜索;
B、如果只有关键词,则直接进行全文检索;
C、如果包括有效地址和关键词,则先通过空间搜索确定待搜索区域,然后在该区域范围内进行全文检索;
6、如果有过滤条件,则调用过滤器对搜索结果集进行各种条件的过滤;
7、如果需要排序,则调用排序器,对搜索结果集进行优化排序;
8、针对最终的搜索结果集,按照请求参数,构建XML字符串并返回终端。
其中的服务器可以采用Apache HTTP服务器,该类服务器是一个模块化(或说积木式)的程序,管理员可以选择一些模块来增加服务器的某些功能。这些模块,可以在创建服务器程序时静态地编译到HTTP服务器的二进制代码中,也可以编译成一些独立于服务器程序的Dynamic Shared Objects(DSO)文件。其中,DSO文件可以在编译服务器程序时创建,也可以在以后利用Apache扩展工具APXS来单独创建。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于***实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本发明所提供的一种地理信息搜索的方法和***,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (11)
1、一种地理信息的搜索方法,其特征在于,包括:
接收查询请求信息;
对查询请求信息进行分词,获取有效地址和关键词;
查询预置数据库,获取该有效地址的空间几何信息;
依据所述空间几何信息确定待搜索空间区域;
在所述待搜索空间区域内,以该关键词进行搜索;
输出搜索结果。
2、如权利要求1所述的方法,其特征在于,通过以下步骤完成分词过程:
以预置的地址分词库为参照词典,对所述查询请求信息进行分词,获得有效地址;所述地址分词库中存储有多个标准地址词条;
分词得到查询请求信息中的非地址词条,将分词结果中的非地址词条作为关键词。
3、如权利要求1所述的方法,其特征在于,通过以下步骤完成在所述待搜索空间区域内的搜索:
通过经纬度计算,建立空间四叉索引中的网格和所述待搜索空间区域的关联关系;
在相应网格所包含的地物中,以所述关键词进行检索,获得目标地物。
4、如权利要求1所述的方法,其特征在于,还包括:
将搜索结果所涉及的地物在地物数据库中的第一标识号转换为第二标识号,作为搜索结果的一部分输出给用户。
5、一种地理信息的搜索方法,其特征在于,包括:
接收查询请求信息;
以预置的地址分词库为参照词典,对所述查询请求信息进行分词,获得有效地址;所述地址分词库中存储有多个标准地址词条;
查询预置数据库,获取该有效地址的空间几何信息;
依据所述空间几何信息确定待搜索空间区域;
在所述待搜索空间区域内进行搜索;
输出搜索结果。
6、一种地理信息的搜索***,其特征在于,包括:
接收器,用于接收查询请求信息;
分词器,用于对查询请求信息进行分词,获取有效地址和关键词;
几何信息获取模块,用于查询预置数据库,获取该有效地址的空间几何信息;
搜索区域确定模块,用于依据所述空间几何信息确定待搜索空间区域;
搜索器,用于在所述待搜索空间区域内,以该关键词进行搜索;
结果输出器,用于输出搜索结果。
7、如权利要求6所述的***,其特征在于,所述分词器进一步包括:
地址分词模块,用于以预置的地址分词库为参照词典,对所述查询请求信息进行分词,获得有效地址;所述地址分词库中存储有多个标准地址词条;
普通分词模块,用于分词得到查询请求信息中的非地址词条,将分词结果中的非地址词条作为关键词。
8、如权利要求6所述的***,其特征在于,所述搜索器进一步包括:
关联模块,用于通过经纬度计算,建立空间四叉索引中的网格和所述待搜索空间区域的关联关系;
关键词搜索模块,用于在相应网格所包含的地物中,以所述关键词进行检索,获得目标地物。
9、如权利要求6所述的***,其特征在于,还包括:
标识转换模块,用于将搜索结果所涉及的地物在地物数据库中的第一标识号转换为第二标识号,作为搜索结果的一部分输出给用户。
10、一种地理信息的搜索***,其特征在于,包括:
接收器,用于接收查询请求信息;
地址分词器,用于以预置的地址分词库为参照词典,对所述查询请求信息进行分词,获得有效地址;所述地址分词库中存储有多个标准地址词条;
几何信息获取模块,用于查询预置数据库,获取该有效地址的空间几何信息;
搜索区域确定模块,用于依据所述空间几何信息确定待搜索空间区域;
搜索器,用于在所述待搜索空间区域内进行搜索;
结果输出器,用于输出搜索结果。
11、一种地理信息的搜索方法,其特征在于,包括:
接收用户的坐标输入或者在地图上的区域选择,确定用户所需的待搜索区域;
接收查询关键词;
通过经纬度计算,建立空间四叉索引中的网格和所述待搜索区域的关联关系;
在相应网格所包含的地物中,以所述关键词进行检索,获得目标地物;
输出搜索结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2007101192210A CN101350013A (zh) | 2007-07-18 | 2007-07-18 | 一种地理信息的搜索方法和*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2007101192210A CN101350013A (zh) | 2007-07-18 | 2007-07-18 | 一种地理信息的搜索方法和*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101350013A true CN101350013A (zh) | 2009-01-21 |
Family
ID=40268808
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2007101192210A Pending CN101350013A (zh) | 2007-07-18 | 2007-07-18 | 一种地理信息的搜索方法和*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101350013A (zh) |
Cited By (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101777082A (zh) * | 2010-03-01 | 2010-07-14 | 苏州数字地图网络科技有限公司 | 一种文字信息与地理信息的关联方法及*** |
CN101794277A (zh) * | 2010-03-01 | 2010-08-04 | 苏州数字地图网络科技有限公司 | 一种网络文字信息中嵌入地理标签的方法及*** |
CN102163214A (zh) * | 2011-03-07 | 2011-08-24 | 北京百度网讯科技有限公司 | 一种数字地图生成装置及方法 |
CN102184230A (zh) * | 2011-05-11 | 2011-09-14 | 北京百度网讯科技有限公司 | 一种搜索结果的展示方法及装置 |
CN102200902A (zh) * | 2010-03-24 | 2011-09-28 | 卡西欧计算机株式会社 | 地图显示控制设备、地图显示控制方法和计算机可读介质 |
CN102262630A (zh) * | 2010-05-31 | 2011-11-30 | 国际商业机器公司 | 进行扩展化搜索的方法和装置 |
CN101719128B (zh) * | 2009-12-31 | 2012-05-23 | 浙江工业大学 | 一种基于模糊匹配的中文地理编码确定方法 |
CN102483748A (zh) * | 2009-07-07 | 2012-05-30 | 谷歌公司 | 用于地图搜索的查询解析 |
CN102639961A (zh) * | 2009-10-08 | 2012-08-15 | 泰为信息科技公司 | 具有地图压缩的导航***和其操作的方法 |
CN102867004A (zh) * | 2011-07-06 | 2013-01-09 | 高德软件有限公司 | 一种地址匹配的方法及设备 |
CN103064904A (zh) * | 2011-12-18 | 2013-04-24 | 微软公司 | 查询构件的基于地图的选择 |
CN103092853A (zh) * | 2011-10-31 | 2013-05-08 | ***通信集团公司 | 一种空间索引的建立方法、使用方法及装置 |
CN103092844A (zh) * | 2011-10-28 | 2013-05-08 | 腾讯科技(深圳)有限公司 | 一种索引建立方法和***、搜索方法和*** |
CN103279602A (zh) * | 2013-05-20 | 2013-09-04 | 桂林理工大学 | 一种规则地理实体空间几何数据的精细组织方法 |
CN103345489A (zh) * | 2013-06-25 | 2013-10-09 | 百度在线网络技术(北京)有限公司 | 一种事件查询请求处理方法及装置 |
CN103353894A (zh) * | 2013-07-19 | 2013-10-16 | 武汉睿数信息技术有限公司 | 一种基于语义分析的数据搜索方法和*** |
CN103412947A (zh) * | 2013-08-26 | 2013-11-27 | 浙江大学 | 针对空间大数据的多边形搜索方法 |
CN103455160A (zh) * | 2012-05-29 | 2013-12-18 | 阿里巴巴集团控股有限公司 | 一种根据地理位置推荐候选词的方法和装置 |
CN103631844A (zh) * | 2012-08-23 | 2014-03-12 | 佳能株式会社 | 文件搜索装置、文件搜索方法及图像搜索装置 |
CN103714080A (zh) * | 2012-09-29 | 2014-04-09 | 北京百度网讯科技有限公司 | 基于空间索引结构树提供空间对象搜索结果的方法和设备 |
CN103714092A (zh) * | 2012-09-29 | 2014-04-09 | 北京百度网讯科技有限公司 | 一种地理位置的搜索方法和装置 |
CN103838734A (zh) * | 2012-11-21 | 2014-06-04 | 腾讯科技(北京)有限公司 | 一种网页信息交互的***、方法及用户终端 |
CN103853769A (zh) * | 2012-12-03 | 2014-06-11 | 北京百度网讯科技有限公司 | 一种地图查询请求处理方法及装置 |
CN104077322A (zh) * | 2013-03-30 | 2014-10-01 | 百度在线网络技术(北京)有限公司 | 基于问题的地理信息挖掘方法及*** |
US8874604B2 (en) | 2009-08-31 | 2014-10-28 | International Business Machines Corporation | Method and system for searching an electronic map |
CN104268201A (zh) * | 2014-09-23 | 2015-01-07 | 山东鲁能软件技术有限公司 | 基于gis平台的空间海量多元数据统一索引方法 |
CN105338427A (zh) * | 2015-09-25 | 2016-02-17 | 北京奇艺世纪科技有限公司 | 一种对移动设备进行视频推荐的方法及装置 |
CN105893570A (zh) * | 2016-03-31 | 2016-08-24 | 北京奇虎科技有限公司 | 搜索结果的摘要生成方法及装置 |
CN106202028A (zh) * | 2015-04-30 | 2016-12-07 | 阿里巴巴集团控股有限公司 | 一种地址信息识别方法及装置 |
CN106447724A (zh) * | 2016-09-12 | 2017-02-22 | 厦门大学 | 一种基于扫描转换算法和网格压缩的区域限定判断方法 |
CN106997354A (zh) * | 2016-01-25 | 2017-08-01 | 北京四维图新科技股份有限公司 | 一种poi数据检索方法及装置 |
CN107273376A (zh) * | 2016-04-07 | 2017-10-20 | 阿里巴巴集团控股有限公司 | 目标位置搜索方法和装置 |
CN107491525A (zh) * | 2017-08-17 | 2017-12-19 | 小草数语(北京)科技有限公司 | 分布式地址比对方法和装置 |
CN107766574A (zh) * | 2017-11-13 | 2018-03-06 | 天津开心生活科技有限公司 | 数据查询方法及装置、数据存储方法及装置 |
CN108875982A (zh) * | 2017-05-15 | 2018-11-23 | 北京嘀嘀无限科技发展有限公司 | 网络约车地点的搜索方法和装置 |
CN109255564A (zh) * | 2017-07-13 | 2019-01-22 | 菜鸟智能物流控股有限公司 | 一种取件点地址推荐方法及装置 |
CN103927310B (zh) * | 2013-01-14 | 2019-03-08 | 百度在线网络技术(北京)有限公司 | 一种地图数据搜索建议生成方法及装置 |
CN109446207A (zh) * | 2018-08-28 | 2019-03-08 | 广州城市信息研究所有限公司 | 一种标准地址数据库更新方法和地址匹配方法 |
CN109522345A (zh) * | 2018-11-19 | 2019-03-26 | 百度在线网络技术(北京)有限公司 | 用于显示信息的方法及装置 |
CN110399566A (zh) * | 2018-04-20 | 2019-11-01 | 北京搜狗科技发展有限公司 | 一种位置搜索方法、装置和电子设备 |
CN110674134A (zh) * | 2019-09-16 | 2020-01-10 | 腾讯大地通途(北京)科技有限公司 | 一种地理信息数据存储方法、查询方法及装置 |
CN110909128A (zh) * | 2019-11-08 | 2020-03-24 | 深圳市彬讯科技有限公司 | 一种利用词根表进行数据查询的方法、设备、及存储介质 |
CN111026787A (zh) * | 2019-11-22 | 2020-04-17 | 中国银行股份有限公司 | 网点检索方法、装置及*** |
CN111311996A (zh) * | 2020-03-27 | 2020-06-19 | 湖南有色金属职业技术学院 | 基于大数据的线上教育信息化教学*** |
CN111651535A (zh) * | 2019-09-24 | 2020-09-11 | 北京嘀嘀无限科技发展有限公司 | 信息查询处理方法、装置、电子设备及可读存储介质 |
CN111949706A (zh) * | 2020-08-03 | 2020-11-17 | 北京吉威空间信息股份有限公司 | 面向土地大数据分布式挖掘分析的存储方法 |
CN112699195A (zh) * | 2020-12-29 | 2021-04-23 | 广州城市信息研究所有限公司 | 地理空间数据处理方法、装置、计算机设备及存储介质 |
CN113779432A (zh) * | 2021-11-12 | 2021-12-10 | 微脉技术有限公司 | 一种本地化机构搜索的方法、电子设备和存储介质 |
CN113836445A (zh) * | 2021-09-16 | 2021-12-24 | 北京百度网讯科技有限公司 | 语义化方法、装置、电子设备及可读存储介质 |
CN115713080A (zh) * | 2022-10-18 | 2023-02-24 | 中科星图数字地球合肥有限公司 | 地址匹配方法、装置、计算机设备和存储介质 |
-
2007
- 2007-07-18 CN CNA2007101192210A patent/CN101350013A/zh active Pending
Cited By (74)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102483748B (zh) * | 2009-07-07 | 2016-04-20 | 谷歌公司 | 用于地图搜索的方法和*** |
CN102483748A (zh) * | 2009-07-07 | 2012-05-30 | 谷歌公司 | 用于地图搜索的查询解析 |
US8874604B2 (en) | 2009-08-31 | 2014-10-28 | International Business Machines Corporation | Method and system for searching an electronic map |
CN102639961A (zh) * | 2009-10-08 | 2012-08-15 | 泰为信息科技公司 | 具有地图压缩的导航***和其操作的方法 |
CN101719128B (zh) * | 2009-12-31 | 2012-05-23 | 浙江工业大学 | 一种基于模糊匹配的中文地理编码确定方法 |
CN101794277A (zh) * | 2010-03-01 | 2010-08-04 | 苏州数字地图网络科技有限公司 | 一种网络文字信息中嵌入地理标签的方法及*** |
CN101777082A (zh) * | 2010-03-01 | 2010-07-14 | 苏州数字地图网络科技有限公司 | 一种文字信息与地理信息的关联方法及*** |
CN102200902A (zh) * | 2010-03-24 | 2011-09-28 | 卡西欧计算机株式会社 | 地图显示控制设备、地图显示控制方法和计算机可读介质 |
US9092480B2 (en) | 2010-05-31 | 2015-07-28 | International Business Machines Corporation | Method and apparatus for performing extended search |
CN102262630A (zh) * | 2010-05-31 | 2011-11-30 | 国际商业机器公司 | 进行扩展化搜索的方法和装置 |
US9020919B2 (en) | 2010-05-31 | 2015-04-28 | International Business Machines Corporation | Method and apparatus for performing extended search |
US10268771B2 (en) | 2010-05-31 | 2019-04-23 | International Business Machines Corporation | Method and apparatus for performing extended search |
CN102163214B (zh) * | 2011-03-07 | 2012-10-10 | 北京百度网讯科技有限公司 | 一种数字地图生成装置及方法 |
CN102163214A (zh) * | 2011-03-07 | 2011-08-24 | 北京百度网讯科技有限公司 | 一种数字地图生成装置及方法 |
CN102184230A (zh) * | 2011-05-11 | 2011-09-14 | 北京百度网讯科技有限公司 | 一种搜索结果的展示方法及装置 |
CN102867004B (zh) * | 2011-07-06 | 2016-06-29 | 高德软件有限公司 | 一种地址匹配的方法及设备 |
CN102867004A (zh) * | 2011-07-06 | 2013-01-09 | 高德软件有限公司 | 一种地址匹配的方法及设备 |
CN103092844A (zh) * | 2011-10-28 | 2013-05-08 | 腾讯科技(深圳)有限公司 | 一种索引建立方法和***、搜索方法和*** |
CN103092844B (zh) * | 2011-10-28 | 2016-04-13 | 腾讯科技(深圳)有限公司 | 一种索引建立方法和***、搜索方法和*** |
CN103092853B (zh) * | 2011-10-31 | 2016-12-07 | ***通信集团公司 | 一种空间索引的建立方法、使用方法及装置 |
CN103092853A (zh) * | 2011-10-31 | 2013-05-08 | ***通信集团公司 | 一种空间索引的建立方法、使用方法及装置 |
CN103064904B (zh) * | 2011-12-18 | 2017-03-01 | 微软技术许可有限责任公司 | 查询构件的基于地图的选择 |
CN103064904A (zh) * | 2011-12-18 | 2013-04-24 | 微软公司 | 查询构件的基于地图的选择 |
CN103455160A (zh) * | 2012-05-29 | 2013-12-18 | 阿里巴巴集团控股有限公司 | 一种根据地理位置推荐候选词的方法和装置 |
CN107589855A (zh) * | 2012-05-29 | 2018-01-16 | 阿里巴巴集团控股有限公司 | 一种根据地理位置推荐候选词的方法和装置 |
US10095711B2 (en) | 2012-05-29 | 2018-10-09 | Alibaba Group Holding Limited | Method and apparatus of recommending candidate terms based on geographical location |
US9332380B2 (en) | 2012-05-29 | 2016-05-03 | Alibaba Group Holding Limited | Method and apparatus of recommending candidate terms based on geographical location |
CN103631844A (zh) * | 2012-08-23 | 2014-03-12 | 佳能株式会社 | 文件搜索装置、文件搜索方法及图像搜索装置 |
CN103714080A (zh) * | 2012-09-29 | 2014-04-09 | 北京百度网讯科技有限公司 | 基于空间索引结构树提供空间对象搜索结果的方法和设备 |
CN103714080B (zh) * | 2012-09-29 | 2018-07-06 | 北京百度网讯科技有限公司 | 基于空间索引结构树提供空间对象搜索结果的方法和设备 |
CN103714092A (zh) * | 2012-09-29 | 2014-04-09 | 北京百度网讯科技有限公司 | 一种地理位置的搜索方法和装置 |
CN103838734A (zh) * | 2012-11-21 | 2014-06-04 | 腾讯科技(北京)有限公司 | 一种网页信息交互的***、方法及用户终端 |
CN103853769B (zh) * | 2012-12-03 | 2018-11-09 | 北京百度网讯科技有限公司 | 一种地图查询请求处理方法及装置 |
CN103853769A (zh) * | 2012-12-03 | 2014-06-11 | 北京百度网讯科技有限公司 | 一种地图查询请求处理方法及装置 |
CN103927310B (zh) * | 2013-01-14 | 2019-03-08 | 百度在线网络技术(北京)有限公司 | 一种地图数据搜索建议生成方法及装置 |
CN104077322A (zh) * | 2013-03-30 | 2014-10-01 | 百度在线网络技术(北京)有限公司 | 基于问题的地理信息挖掘方法及*** |
CN103279602A (zh) * | 2013-05-20 | 2013-09-04 | 桂林理工大学 | 一种规则地理实体空间几何数据的精细组织方法 |
CN103279602B (zh) * | 2013-05-20 | 2016-03-02 | 桂林理工大学 | 一种规则地理实体空间几何数据的精细组织方法 |
CN103345489A (zh) * | 2013-06-25 | 2013-10-09 | 百度在线网络技术(北京)有限公司 | 一种事件查询请求处理方法及装置 |
CN103353894A (zh) * | 2013-07-19 | 2013-10-16 | 武汉睿数信息技术有限公司 | 一种基于语义分析的数据搜索方法和*** |
CN103412947A (zh) * | 2013-08-26 | 2013-11-27 | 浙江大学 | 针对空间大数据的多边形搜索方法 |
CN104268201A (zh) * | 2014-09-23 | 2015-01-07 | 山东鲁能软件技术有限公司 | 基于gis平台的空间海量多元数据统一索引方法 |
CN106202028A (zh) * | 2015-04-30 | 2016-12-07 | 阿里巴巴集团控股有限公司 | 一种地址信息识别方法及装置 |
CN106202028B (zh) * | 2015-04-30 | 2019-10-11 | 阿里巴巴集团控股有限公司 | 一种地址信息识别方法及装置 |
CN105338427A (zh) * | 2015-09-25 | 2016-02-17 | 北京奇艺世纪科技有限公司 | 一种对移动设备进行视频推荐的方法及装置 |
CN106997354A (zh) * | 2016-01-25 | 2017-08-01 | 北京四维图新科技股份有限公司 | 一种poi数据检索方法及装置 |
CN105893570A (zh) * | 2016-03-31 | 2016-08-24 | 北京奇虎科技有限公司 | 搜索结果的摘要生成方法及装置 |
CN107273376A (zh) * | 2016-04-07 | 2017-10-20 | 阿里巴巴集团控股有限公司 | 目标位置搜索方法和装置 |
CN107273376B (zh) * | 2016-04-07 | 2020-08-04 | 阿里巴巴集团控股有限公司 | 目标位置搜索方法和装置 |
US11151210B2 (en) | 2016-04-07 | 2021-10-19 | Advanced New Technologies Co., Ltd. | Target location search method and apparatus |
CN106447724A (zh) * | 2016-09-12 | 2017-02-22 | 厦门大学 | 一种基于扫描转换算法和网格压缩的区域限定判断方法 |
CN108875982A (zh) * | 2017-05-15 | 2018-11-23 | 北京嘀嘀无限科技发展有限公司 | 网络约车地点的搜索方法和装置 |
CN109255564A (zh) * | 2017-07-13 | 2019-01-22 | 菜鸟智能物流控股有限公司 | 一种取件点地址推荐方法及装置 |
CN107491525A (zh) * | 2017-08-17 | 2017-12-19 | 小草数语(北京)科技有限公司 | 分布式地址比对方法和装置 |
CN107766574A (zh) * | 2017-11-13 | 2018-03-06 | 天津开心生活科技有限公司 | 数据查询方法及装置、数据存储方法及装置 |
CN110399566A (zh) * | 2018-04-20 | 2019-11-01 | 北京搜狗科技发展有限公司 | 一种位置搜索方法、装置和电子设备 |
CN110399566B (zh) * | 2018-04-20 | 2024-06-07 | 北京搜狗科技发展有限公司 | 一种位置搜索方法、装置和电子设备 |
CN109446207A (zh) * | 2018-08-28 | 2019-03-08 | 广州城市信息研究所有限公司 | 一种标准地址数据库更新方法和地址匹配方法 |
CN109522345A (zh) * | 2018-11-19 | 2019-03-26 | 百度在线网络技术(北京)有限公司 | 用于显示信息的方法及装置 |
CN110674134A (zh) * | 2019-09-16 | 2020-01-10 | 腾讯大地通途(北京)科技有限公司 | 一种地理信息数据存储方法、查询方法及装置 |
CN110674134B (zh) * | 2019-09-16 | 2024-02-13 | 腾讯大地通途(北京)科技有限公司 | 一种地理信息数据存储方法、查询方法及装置 |
CN111651535B (zh) * | 2019-09-24 | 2021-08-17 | 北京嘀嘀无限科技发展有限公司 | 信息查询处理方法、装置、电子设备及可读存储介质 |
CN111651535A (zh) * | 2019-09-24 | 2020-09-11 | 北京嘀嘀无限科技发展有限公司 | 信息查询处理方法、装置、电子设备及可读存储介质 |
CN110909128B (zh) * | 2019-11-08 | 2023-08-11 | 土巴兔集团股份有限公司 | 一种利用词根表进行数据查询的方法、设备、及存储介质 |
CN110909128A (zh) * | 2019-11-08 | 2020-03-24 | 深圳市彬讯科技有限公司 | 一种利用词根表进行数据查询的方法、设备、及存储介质 |
CN111026787A (zh) * | 2019-11-22 | 2020-04-17 | 中国银行股份有限公司 | 网点检索方法、装置及*** |
CN111311996A (zh) * | 2020-03-27 | 2020-06-19 | 湖南有色金属职业技术学院 | 基于大数据的线上教育信息化教学*** |
CN111949706A (zh) * | 2020-08-03 | 2020-11-17 | 北京吉威空间信息股份有限公司 | 面向土地大数据分布式挖掘分析的存储方法 |
CN111949706B (zh) * | 2020-08-03 | 2023-11-14 | 北京吉威空间信息股份有限公司 | 面向土地大数据分布式挖掘分析的存储方法 |
CN112699195A (zh) * | 2020-12-29 | 2021-04-23 | 广州城市信息研究所有限公司 | 地理空间数据处理方法、装置、计算机设备及存储介质 |
CN112699195B (zh) * | 2020-12-29 | 2023-12-19 | 广州城市信息研究所有限公司 | 地理空间数据处理方法、装置、计算机设备及存储介质 |
CN113836445A (zh) * | 2021-09-16 | 2021-12-24 | 北京百度网讯科技有限公司 | 语义化方法、装置、电子设备及可读存储介质 |
CN113779432A (zh) * | 2021-11-12 | 2021-12-10 | 微脉技术有限公司 | 一种本地化机构搜索的方法、电子设备和存储介质 |
CN115713080A (zh) * | 2022-10-18 | 2023-02-24 | 中科星图数字地球合肥有限公司 | 地址匹配方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101350013A (zh) | 一种地理信息的搜索方法和*** | |
CN101350012B (zh) | 一种地址匹配的方法和*** | |
CN103491205B (zh) | 一种基于视频搜索的关联资源地址的推送方法和装置 | |
CN102395965B (zh) | 用于在数据库中搜索对象的方法 | |
US20020156779A1 (en) | Internet search engine | |
CN101777082A (zh) | 一种文字信息与地理信息的关联方法及*** | |
CN100511230C (zh) | 基于网页页面文本的图像检索及显示方法 | |
CN101313300A (zh) | 本地搜索 | |
CN101344881A (zh) | 海量文件型数据的索引生成方法及装置和搜索*** | |
CN104375992A (zh) | 一种地址匹配的方法和装置 | |
CN102483748A (zh) | 用于地图搜索的查询解析 | |
CN101794277B (zh) | 一种网络文字信息中嵌入地理标签的方法及*** | |
CN112328910A (zh) | 一种涵盖aoi和poi标准地址匹配引擎的方法及*** | |
Souza et al. | The role of gazetteers in geographic knowledge discovery on the web | |
JP5639549B2 (ja) | 情報検索装置及び方法及びプログラム | |
Shi et al. | Thematic data extraction from Web for GIS and applications | |
Fränti et al. | Location-based search engine for multimedia phones | |
Wang et al. | Geo-store: a spatially-augmented sparql query evaluation system | |
Manguinhas et al. | A geo-temporal web gazetteer integrating data from multiple sources | |
Lee et al. | Optimization of geographic area to a web page for two-dimensional range query processing | |
Laddha et al. | Semantic tourism information retrieval interface | |
Asadi et al. | Using local popularity of web resources for geo-ranking of search engine results | |
Lai et al. | Design and realization of the intangible cultural heritage information management system based on web map service | |
GENTILE | Using Flickr geotags to find similar tourism destinations | |
CN117271577B (zh) | 一种基于智能分析的关键字检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20090121 |