CN103885950B - 一种获取缩略词与poi间对应关系的方法和装置 - Google Patents

一种获取缩略词与poi间对应关系的方法和装置 Download PDF

Info

Publication number
CN103885950B
CN103885950B CN201210555427.9A CN201210555427A CN103885950B CN 103885950 B CN103885950 B CN 103885950B CN 201210555427 A CN201210555427 A CN 201210555427A CN 103885950 B CN103885950 B CN 103885950B
Authority
CN
China
Prior art keywords
poi
initialism
corresponding relation
standard
query words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210555427.9A
Other languages
English (en)
Other versions
CN103885950A (zh
Inventor
张庆斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Autonavi Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Autonavi Software Co Ltd filed Critical Autonavi Software Co Ltd
Priority to CN201210555427.9A priority Critical patent/CN103885950B/zh
Publication of CN103885950A publication Critical patent/CN103885950A/zh
Application granted granted Critical
Publication of CN103885950B publication Critical patent/CN103885950B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Navigation (AREA)

Abstract

本发明公开了一种获取缩略词与POI间对应关系的方法和装置,该方法包括:从用户搜索日志中搜集POI查询成功记录,并将搜索到的当前POI查询成功记录中的查询词确定为标准POI查询词;将当前POI查询成功记录与前一次POI查询成功记录之间的POI查询失败记录中的查询词确定为待确定缩略词;在组成该待确定缩略词的单字均包含在所述标准POI查询词且在两词中的先后顺序相同时,将该待确定缩略词确定为缩略词;建立所述缩略词与所述标准POI查询词的对应关系并确定为缩略词与POI间对应关系。通过本发明的技术方案,可以使得获取的对应关系更加准确,从而用户根据该对应关系就可以通过缩略词准确地查找到地图中对应的POI。

Description

一种获取缩略词与POI间对应关系的方法和装置
技术领域
本发明涉及地图搜索领域,特别涉及一种获取缩略词与POI间对应关系的方法和装置。
背景技术
随着地图搜索技术的不断发展,人们可以方便地使用地图查询到所需地点的地理位置以及周边的地理环境。在地图搜素技术领域中,用户所需的地点称之为兴趣点,也称POI(Point ofInterest的缩写);在地图信息库中,一个POI点对应的信息包括有地点的全称、类别、经度、纬度等信息。用户在地图中搜索POI时,输入地点的全称,然后服务器查找信息中具有该全称的对应POI,最后将查找结果输出给用户,从而实现通过地图搜索查找POI的功能。
用户在使用地图搜索POI的时候,为了输入简便,往往输入的地点名称并不是该地点的全称,而是该地点的缩略词。而由于POI信息库中的POI全称基本都是地点的全称,所以在用户输入缩略词时往往查询不到POI。为了解决这一问题,需要在终端或服务器中设置缩略词和POI间的对应关系。用户在输入缩略词时,终端或服务器可以先在对应关系中查找到能够查询到其对应的POI的查询词,再根据该查询词查找得到POI,从而实现通过缩略词查找POI的功能。其中,该查询词可以是POI全称,也可以是通过目前***能够查询到对应POI的其他词。
现有技术中,获取缩略词与POI间对应关系的方式是:通过自造或经验而获取的候选语料库,对候选语料库利用缩略词、POI全称的长度及对齐规则进行搜索匹配,或者采用训练学习的方法进行匹配,最后得到缩略词与POI间对应关系。虽然采用这种方式能使用户方便地通过输入缩略词来搜索到POI,但是,由于地图中地理信息的变化较快以及用户所使用的缩略词存在差别,而通过自造或经验的候选语料库难以与之同步更新,所以获取的对应关系往往并不准确,因此,在利用通过这种不准确的对应关系查找POI时,用户就会查找不到POI或者查找到的POI并不是缩略词对应的POI,也即查找的POI不准确。这样,用户就需要不断修改输入的名称来重新查找准确的POI,这不仅增加了用户与终端之间的交互次数,也增加了终端响应用户操作和服务器响应终端的次数,进而影响服务器***性能。
发明内容
本发明要解决的问题是提供一种获取缩略词与POI间对应关系的方法和装置,以克服现有技术中依据由自造或经验的候选语料库而获取的缩略词与POI间对应关系来查找POI不准确的缺陷,进一步的,克服用户、终端和服务器之间的交互次数过多而造成的影响服务器***性能的缺陷。
为达到上述目的,本发明提供了一种获取缩略词与POI间对应关系的方法,所述方法包括以下步骤:
从用户搜索日志中,搜集POI查询成功记录,并将当前搜索到的POI查询成功记录中的查询词确定为标准POI查询词;
在当前搜索到的POI查询成功记录与前一次搜索到的POI查询成功记录之间存在POI查询失败记录时,将POI查询失败记录中的查询词确定为待确定缩略词;
在组成所述待确定缩略词的单字均包含在所述标准POI查询词中,且各单字在所述待确定缩略词中的先后顺序与在所述标准POI查询词中出现的先后顺序相同时,将所述待确定缩略词确定为所述标准POI查询词的缩略词;
建立所述缩略词与所述标准POI查询词的对应关系,并将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系。
优选的,将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系之后,还包括:
对所述缩略词和所述标准POI查询词进行分词,得到缩略词分词集合和标准POI查询词分词集合;
确定所述缩略词分词集合与所述标准POI查询词分词集合中相同的分词,并分别将确定出的相同分词从所述缩略词分词集合和所述标准POI查询词分词集合中删除;
将所述缩略词分词集合中保留的分词,依次按照各分词在所述缩略词中的先后顺序,组合成修正缩略词;将所述标准POI查询词分词集合中保留的分词,依次按照各分词在所述标准POI查询词中的先后顺序,组合成修正标准POI查询词;
建立所述修正缩略词与所述修正标准POI查询词的对应关系,并以所述修正缩略词与修正标准POI查询词的对应关系更新所述缩略词与POI间对应关系。
优选的,将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系之后,还包括:
判断所述缩略词与POI间对应关系是否为已存储的对应关系,如果是,则删除所述缩略词与POI间对应关系,如果否,则存储所述缩略词与所述标准POI查询词间对应关系。
优选的,将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系之后,还包括:
将所述缩略词与POI间对应关系预存到待存储对应关系集合中;
记录所述缩略词与POI间对应关系在待存储对应关系集合中出现的次数;
判断所述缩略词与POI间对应关系出现次数是否超过预设的频次阈值;
如果是,则存储所述缩略词与POI间对应关系。
本发明还提供了一种查询POI的方法,预先存储采用前述任一项所述的方法得到的缩略词与POI间对应关系,所述方法包括:
接收用户输入的查询词;
根据所述查询词在POI数据库中查询对应的POI;
判断是否查找到POI;
如果是,则输出查询得到的POI;如果否,则从预先存储的缩略词与POI间对应关系中获取所述查询词对应的标准POI查询词,并根据所述标准POI查询词在所述POI数据库中查询对应的POI。
本发明还提供了一种获取缩略词与POI间的对应关系的装置,所述装置包括:
成功查询日志搜索模块,用于从用户搜索日志中,搜集POI查询成功记录;
标准POI查询词确定模块,用于将当前搜索到的POI查询成功记录中的查询词确定为标准POI查询词;
待确定缩略词确定模块,用于在当前搜索到的POI查询成功记录与前一次搜索到的POI查询成功记录之间存在POI查询失败记录时,将POI查询失败记录中的查询词确定为待确定缩略词;
缩略词确定模块,用于在组成所述待确定缩略词的单字均包含在所述标准POI查询词中,且,各单字在所述待确定缩略词中的先后顺序与在所述标准POI查询词中出现的先后顺序相同时,将所述待确定缩略词确定为所述标准POI查询词的缩略词;
对应关系建立模块,用于建立所述缩略词与所述标准POI查询词的对应关系;
对应关系确定模块,用于将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系。
优选的,所述装置还包括:
分词集合形成子模块,用于对所述缩略词和所述标准POI查询词进行分词,得到缩略词分词集合和标准POI查询词分词集合;
分词删除模块,用于确定所述缩略词分词集合与所述标准POI查询词分词集合中相同的分词,并分别将确定出的相同分词从所述缩略词分词集合和所述标准POI查询词分词集合中删除;
修正词生成模块,用于将所述缩略词分词集合中保留的分词,依次按照各分词在所述缩略词中的先后顺序,组合成修正缩略词,和,将所述标准POI查询词分词集合中保留的分词,依次按照各分词在所述标准POI查询词中的先后顺序,组合成修正标准POI查询词;
修正对应关系建立模块,用于建立所述修正缩略词与所述修正标准POI查询词的对应关系;
对应关系更新模块,用于以所述修正缩略词与修正标准POI查询词的对应关系更新所述缩略词与POI间对应关系。
优选的,所述装置还包括:
对应关系判断模块,用于判断所述缩略词与POI间的对应关系是否为已存储的对应关系;
第一删除对应关系模块,用于在所述对应关系判断模块的判断结果为是的情况下,删除所述缩略词与POI间对应关系;
第一存储对应关系模块,用于在所述对应关系判断模块的判断结果为否的情况下,存储所述缩略词与POI间对应关系。
优选的,所述装置还包括:
预存模块,用于将所述缩略词与POI间对应关系预存到待存储对应关系集合中;
频次记录模块,用于记录所述缩略词与POI间对应关系在待存储对应关系集合中出现的次数;
频次判断模块,用于判断所述缩略词与POI间对应关系出现的次数是否超过预设的频次阈值;
第二存储对应关系模块,用于在所述频次判断模块的判断结果为是的情况下,存储所述缩略词与POI间对应关系。
本发明还提供了一种查询POI的***,所述***包括:
对应关系预先存储单元,用于预先存储采用前述任一项所述的装置获取的缩略词与POI间对应关系;
查询词接收单元,用于接收用户输入的查询词;
第一POI查找单元,根据所述查询词在POI数据库中查询对应的POI;
查找判断单元,用于判断是否查找到POI;
POI输出单元,用于在查找判断单元的判断结果为是的情况下,输出查询得到的POI;
标准POI查询词获取单元,用于在所述查找判断单元的判断结果为否的情况下,从预先存储的缩略词与POI间对应关系中获取所述查询词对应的标准POI查询词;
第二POI查找单元,用于根据所述标准POI查询词在所述POI数据库中查询对应的POI。
与现有技术相比,本发明具有以下优点:
采用本发明的技术方案,从用户搜索日志中搜索POI查询成功记录,并将当前搜索到的成功记录中查询词作为标准POI查询词,然后将当前成功记录与前一次成功记录之间的POI查询失败记录中的查询词确定为待确定缩略词,进而在待确定缩略词中的单字都包含在标准POI查询词中且出现顺序相同时将所述待确定缩略词确定为所述标准POI查询词的缩略词,最后建立所述缩略词与所述标准POI查询词的对应关系,并将所述对应关系为缩略词与POI间对应关系。由于大量用户的实际查询能够及时反映地图中地理信息的变化以及用户所使用的缩略词的差别,通过上述技术方案,缩略词与POI间的对应关系通过用户实际搜索POI产生的日志来获取,就可以使得对应关系的更新能够及时的与地图的变化和用户的差别进行同步,因此,获取的缩略词与POI的对应关系更加准确,从而用户根据该对应关系就可以准确地查找到用户想要查找的POI。
附图说明
图1是本发明获取缩略词与POI间对应关系方法实施例一的基本流程图;
图2是本发明避免对应关系中缩略词与标准POI查询词繁琐的一实施方式的基本流程图;
图3是本发明存储对应关系的实施方式一的基本流程图;
图4是本发明存储对应关系的实施方式二的基本流程图;
图5是本发明存储对应关系的实施方式三的基本流程图;
图6是本发明通过缩略词查询POI的方法实施例一的基本流程图;
图7是本发明获取缩略词与POI间的对应关系的装置实施例一的结构图;
图8是本发明获取缩略词与POI间的对应关系的装置实施例二的结构图;
图9是本发明获取缩略词与POI间的对应关系的装置实施例三的结构图;
图10是本发明获取缩略词与POI间的对应关系的装置实施例四的结构图;
图11是本发明通过缩略词查询POI的***实施例一的结构图。
具体实施方式
下面我们将结合附图,对本发明的最佳实施方案进行详细描述。首先要指出的是,本发明中用到的术语、字词及权利要求的含义不能仅仅限于其字面和普通的含义去理解,还包括进而与本发明的技术相符的含义和概念,这是因为我们作为发明者,要适当地给出术语的定义,以便对我们的发明进行最恰当的描述。因此,本说明和附图中给出的配置,只是本发明的首选实施方案,而不是要列举本发明的所有技术特性。我们要认识到,还有各种各样的可以取代我们方案的同等方案或修改方案。
在大多数情况下,用户在输入缩略词查询不到对应的POI时,会再次输入更完整的查询词来查询对应的POI。基于这一应用场景,本发明的基本思想是:搜索用户搜索日志,将搜索日志中查询成功记录中的查询词作为标准POI查询词,与该成功记录之前的一个成功记录之间的失败记录作为缩略词,再依据获取的缩略词与标准POI查询词建立缩略词与标准POI查询词的对应关系;由于大量用户的实际查询能够及时反映地图中地理信息的变化以及用户所使用的缩略词的差别,通过上述技术方案,缩略词与POI间的对应关系通过用户实际搜索POI产生的日志来获取,就可以使得对应关系的更新能够及时的与地图的变化和用户的差别进行同步,因此,获取的缩略词与POI的对应关系更加准确,从而用户根据该对应关系就可以准确地查找到用户想要查找的POI。
下面结合附图,通过具体实施例详细说明本发明获取缩略词与POI间对应关系的方法和装置的具体实施方式。
图1所示的是本发明获取缩略词与POI间对应关系的方法实施例一的基本流程图,本实施例具体可以包括:
步骤101、从用户搜索日志中,搜集POI查询成功记录,并将当前搜索到的POI查询成功记录中的查询词确定为标准POI查询词。
本发明实施例可以应用于用户先输入缩略的查询词未查询到对应POI而后再次输入更完整的查询词能够查询到对应POI的应用场景。为了实现对上述场景中用户输入的查询词进行获取,可以从用户搜索日志中进行搜索。而为了便于在日户搜索中查找上述场景,可以先在用户搜索日志中查找所有的查询POI成功记录,并将成功记录中能够查询到POI的查询词作为标准POI查询词。本发明实施例中的标准POI查询词是指在POI数据库中能够查询到POI的查询词。
步骤102、在当前搜索到的POI查询成功记录与前一次搜索到的POI查询成功记录之间存在POI查询失败记录时,将POI查询失败记录中的查询词确定为待确定缩略词。
为了在用户搜索日志中查询到上述应用场景,可以在查找到查询成功记录之后,在当前成功记录与前一次成功记录之间查找POI查询失败记录,如果存在,则可以初步确定满足上述应用场景。具体地,为了使场景查找更准确,可以只将当前成功记录的前一次查询记录为失败记录的情况初步确定为满足上述应用场景。在初步确定满足应用场景后,可以将该POI查询失败记录中的查询词作为待确定缩略词。
步骤103、在组成所述待确定缩略词的单字均包含在所述标准POI查询词中,且,各单字在所述待确定缩略词中的先后顺序与在所述标准POI查询词中出现的先后顺序相同时,将所述待确定缩略词确定为所述标准POI查询词的缩略词。
由于上述的查询成功记录与查询失败记录可能并不是查找的同一个POI,所以,在获取对应关系之前,需要进一步确定该待确定缩略词是不是该标准POI查询词的缩略词。通过本步骤103,只有在待确定缩略词中的单字都包含在标准POI查询词且各单字在两个词中出现的顺序相同时,才确定该待确定缩略词是标准POI查询词的缩略词。例如,待确定缩略词为“北京市理工大”,标准POI查询词为“北京理工大学”,由于待确定缩略词中具有未包含在标准POI查询词中的单字“市”,因此待确定缩略词将不被确定为标准POI查询词的缩略词。再如,待确定缩略词为“电子二十所”,标准POI查询词为“电子科技十二研究所”,虽然待确定缩略词的所有单字都包含在标准POI查询词中,但是单字“二”和“十”在待确定缩略词与标准POI查询词中的组成顺序是相反的,因此该待确定缩略词将不被确定为标准POI查询词的缩略词。再如待确定缩略词为“北师大”,标准POI查询词为“北京师范大学”,由于缩略词的单字均包含在标准POI查询词中,且单字在缩略词中的先后顺序与在标准POI查询词的先后顺序相同,因此,可以确定“北师大”是“北京师范大学”的缩略词。
步骤104、建立所述缩略词与所述标准POI查询词的对应关系,并将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系。
建立缩略词与标准POI查询词的对应关系的方式,可以是将缩略词与对应的POI全称组成一个映射集合,如{北大,北京大学}。
由于通过标准POI查询词已经可以在现有的***中查询到对应的POI,所以,用户实际输入缩略词通过从缩略词与标准POI查询词的对应关系中确定对应的标准POI查询词就可以查询到POI,因此,本实施例中可以将缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系。
另外,通过用户搜索日志,采用本实施例的技术方案一般可以获得多个对应关系,在这些对应关系中,一个标准POI查询词可以只与一个缩略词建立对应关系,也可以与多个不同的缩略词分别建立对应关系。由于一个地址的名称会可能有几个不同常用缩略词,而这些缩略词都有用户在使用,因此用户搜索日志都记录了以这些缩略词作为查询词的查询记录,这样一个标准POI查询词就可能会出现在多个对应关系,这时,该标准POI查询词就对应了多个不同的缩略词。
需要说明的是,在步骤104执行完成之后,缩略词与POI间对应关系已经被获取。由于步骤104中是直接将从用户搜索日志中获取的查询词作为对应关系中的缩略词与标准POI查询词,因此,这两词可能会很繁琐,具有重复的分词,这样不利于节省对应关系的存储空间以及其他用户查找时对对应关系的再次调用。因此,本实施例中为解决上述问题,可以在步骤104之后,包括如图2所示的步骤:
步骤201、对所述缩略词和所述标准POI查询词进行分词,得到缩略词分词集合和标准POI查询词分词集合;
步骤202、确定所述缩略词分词集合与所述标准POI查询词分词集合中相同的分词,并分别将确定出的相同分词从所述缩略词分词集合和所述标准POI查询词分词集合中删除;
步骤203、将所述缩略词分词集合中保留的分词,依次按照各分词在所述缩略词中的先后顺序,组合成修正缩略词;将所述标准POI查询词分词集合中保留的分词,依次按照各分词在所述标准POI查询词中的先后顺序,组合成修正标准POI查询词;
步骤204、建立所述修正缩略词与所述修正标准POI查询词的对应关系,并以所述修正缩略词与修正标准POI查询词的对应关系更新所述缩略词与POI间对应关系。
其中,步骤201中对缩略词和标准POI查询词进行分词时,可以是采用现有的分词器对缩略词和标准POI查询词进行分词,但为了分词更加准确,还需对现有分词器进行调整。例如,对对应关系{九堡客运站,九堡客运中心站}进行分词时,按照现有分词器分成{九堡,客运,站}和{九堡,客运,中心,站}显然不合适,本实施例中需要调整现有分词器,将单字的末尾分词与前一分词合并,从而使分词结果为{九堡,客运站}和{九堡,客运中心站}。再如,对对应关系{北京国航中心,北京国际航运中心}进行分词时,需要调整现有分词器使分词结果为{北京,国航中心}和{北京,国际航运中心}。
下面以一个实例来说明图2的实施方式。在该实例中,确定的缩略词与对应关系为{昌平中行,昌平中国银行},则图2所示的实施方式具体为:将缩略词“昌平中行”和标准POI查询词“昌平中国银行”分词,形成缩略词分词集合{昌平,中行}和标准POI查询词分词集合{昌平,中国,银行};删除两个集合中都包含有的分词“昌平”;按照标准POI查询词“昌平中国银行”的组词顺序,将两个集合中剩余的分词分别组成修正缩略词“中行”和修正标准POI查询词“中国银行”;将缩略词与POI间对应关系更新为{中行,中国银行}。
需要说明的是,经过图2所示的实施方式确定缩略词与标准POI查询词间的对应关系之后,实际上是使缩略词和标准POI查询词只保留核心的内容,而具体地点的名称都会被简化或被删除,也即,对应关系中缩略词对应的并不是能查询到对应POI的标准POI查询词,而是标准POI查询词的简化词。而用户在具体查找具体地点的POI时,可以将用户输入的缩略词也做上述的分词处理,利用形成的修正缩略词在对应关系中查找对应的修正标准POI查询词,再将分词简化或删除的分词重新加入查找到的修正标准POI查询词,以此最后得到标准POI查询词再去查找地图中的POI。例如,{昌平中行,昌平中国银行}这一对应关系经过图2所示的实施方式处理之后,被更新为{中行,中国银行},而在用户输入“昌平中行”的时候,先对将输入词分词成{昌平,中行},然后在上述对应关系中获取到“中行”对应的“中国银行”,然后再与“昌平”合并成“昌平中国银行”,再以“昌平中国银行”去查询POI。由于原先获取的不同对应关系在简化以后有些会变成相同的对应关系,所以,通过图2所示实施方式,可以在保证用户准确查找POI的同时,简化和减少需要保存的对应关系,进而用户通过缩略词查找POI全称时搜索的对应关系数量得以减少,从而提高用户搜索POI时的效率。
在步骤104获取缩略词与POI间对应关系之后,为了以后用户通过缩略词搜索POI时可以利用该对应关系需要对该对应关系存储为用户可用的缩略词与POI间对应关系。
为了使保存的对应关系不重复,可以在步骤104之后,采用图3所示的方式来完成存储获取的对应关系:
步骤301、判断所述缩略词与POI间对应关系是否为已存储的对应关系,如果是,进入步骤302,如果否,进入步骤303;
步骤302、删除所述缩略词与POI间对应关系;
步骤303、存储所述缩略词与POI间对应关系。
通过上述方式保存对应关系,提供给用户搜索时使用的对应关系中不会存在重复的对应关系,用户在搜索对应关系查找对应POI全称时***处理时间较短。
为了使存储的对应关系准确,可以在步骤104之后,采用图4所示的方式来完成存储获取的对应关系:
步骤401、判断所述缩略词所对应的POI是否为所述标准POI查询词所对应的POI,如果否,进入步骤402,如果是,进入步骤403;
步骤402、删除所述缩略词与POI间对应关系;
步骤403、存储所述缩略词与POI间对应关系。
通过上述方式保存对应关系,可以是存储的对应关系中剔除缩略词与标准POI查询词本身并不是指代同一地点POI的对应关系。例如,{42研究所,428研究所},缩略词与标准POI查询词指的是两个不同的研究所,按照上述步骤,该对应关系被获取后会在存储前被剔除。
为了使存储的对应关系更具有可用性,可以在步骤104之后,采用图5所示的方式来完成存储获取的对应关系:
步骤501、将所述缩略词与POI间对应关系预存到待存储对应关系集合中;
步骤502、记录所述缩略词与POI间对应关系在待存储对应关系集合中出现的次数;
步骤503、判断所述缩略词与POI间对应关系出现的次数是否超过预设的频次阈值,如果是,进入步骤504;
步骤504、存储所述缩略词与POI间对应关系。
需要说明的是,步骤501中预存的对应关系是不提供给用户搜索时使用的对应关系,这里的预存是对应关系在提供给用户使用之前的一个状态。而步骤504中的存储是存储为提供给用户使用的对应关系,具体地,可以是存储到提供给用户使用的可用对应关系数据库或数据表中。而在步骤503中,如果缩略词与POI间对应关系出现的次数未超过预设的频次阈值,一般并不删除该对应关系,而是继续使其预存在待存储对应关系集合中,随着对用户搜索日志不断搜索而获取更多的对应关系预存到带存储对应关系集合中,该对应关系出现的次数可能会逐渐增大,从而在该次数超过频次阈值时,再将该对应关系存储。
另外,在存储的对应关系中也可以继续保留记录该对应关系在用户搜索日志中被获取的次数,进而在用户搜索POI的时候,输出的POI可以按照对应的对应关系被调用次数的顺序排列。
通过上述方式存储对应关系,则提供给用户搜索时使用的对应关系均是之前用户搜索次数较多的对应关系,用户使用的频率较大,能够提高***搜索对应关系的效率。
下面以一个具体场景来详细说明根据用户搜索的POI日志内容,经过本实施例的技术方案处理之后,获取的缩略词与POI全称间的对应关系。在该场景中,保存对应关系的频次阈值为2。表1为提取自用户日志的用户通过缩略词搜索POI的内容,表2为根据表1的内容获取并保存的对应关系。
表1
在先输入的查询词 再后输入的查询词 用户查询频次
九堡客运站 九堡客运中心站 4
宁波国航中心 宁波国际航运中心 4
昌平区计生委 昌平区计划生育委员会 3
杭州儿保医院 杭州儿童保健医院 1
表2
对应关系 缩略词 标准POI查询词 用户查询频次
{客运站,客运中心站} 客运站 客运中心站 4
{国航中心,国际航运中心} 国航中心 国际航运中心 4
{计生委,计划生育委员会} 计生委 计划生育委员会 3
其中,表1中“杭州儿保医院”的用户记录对应获取的对应关系为{儿保,儿童保健},但该缩略词的查询频次未超过频次阈值,因此,暂时未保存该对应关系。
通过本实施例的实施方式,根据用户搜索日志中用户实际查询输入的查询词来获取的缩略词与POI间对应关系,对应关系的更新可以同步与地图的变化和用户的差别,因此,获取的对应关系更加准确,从而用户根据该对应关系就可以通过缩略词准确地查找到地图中对应的POI。此外,通过将重复的、指代不同地点的和出现次数不高的对应关系不存储为提供给用户使用的对应关系,用户在通过缩略词搜索POI时,所需搜索的对应关系得以减少,调用对应关系的时间得以减少,搜索POI的耗时得以缩小,从而***性能得以提升。
对应于获取缩略词与POI间对应关系的方法实施例,本发明还提供了一种通过缩略词查询POI的方法。如图6,示出了该方法实施例一的基本流程,本实施例具体可以包括:
步骤601、预先存储采用前述图1~图5所示的任一方法得到的缩略词与POI间对应关系;
需要说明的是,本步骤中缩略词与标准POI查询词间的对应关系为预先采用前述实施例中图1~图5所示的任一方法获取的对应关系。
步骤602、接收用户输入的查询词;
步骤603、根据所述查询词在POI数据库中查询对应的POI;
步骤604、判断是否查找到POI;如果是,进入步骤605,如果否,进入步骤606;
步骤605、从预先存储的缩略词与POI间对应关系中获取所述查询词对应的标准POI查询词,并根据所述标准POI查询词在所述POI数据库中查询对应的POI。
在步骤605查找到POI后,可以将查找到的POI作为所述缩略词对应的POI输出给用户。在查找到多个POI时,优选的,可以按照当前记录中对应关系的查询频次将对应POI按照从高频到低频的顺序输出给用户。
通过本实施例的技术方案,用户在通过缩略词查询POI时,所采用的缩略词与POI间对应关系是通过用户搜索日志中用户实际查询输入的查询词而获取的,所以,对应关系的更新可以同步与地图的变化和用户的差别,从而用户根据该对应关系就可以通过缩略词准确地查找到地图中对应的POI。
对应方法实施例,本发明还提供了一种获取缩略词与POI间对应关系的装置。如图7,示出了该装置实施例一的结构图,本实施例具体可以包括:
成功查询日志搜索模块701,用于从用户搜索日志中,搜集POI查询成功记录;
标准POI查询词确定模块702,用于将当前搜索到的POI查询成功记录中的查询词确定为标准POI查询词;
待确定缩略词确定模块703,用于在当前搜索到的POI查询成功记录与前一次搜索到的POI查询成功记录之间存在POI查询失败记录时,将POI查询失败记录中的查询词确定为待确定缩略词;
缩略词确定模块704,用于在组成所述待确定缩略词的单字均包含在所述标准POI查询词中,且,各单字在所述待确定缩略词中的先后顺序与在所述标准POI查询词中出现的先后顺序相同时,将所述待确定缩略词确定为所述标准POI查询词的缩略词;
对应关系建立模块705,用于建立所述缩略词与所述标准POI查询词的对应关系;
对应关系确定模块706,用于将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系。
图8所示的是该装置实施例二的结构图,除了图7所示装置实施例一的结构外,还可以包括:
分词集合形成模块801,用于对所述缩略词和所述标准POI查询词进行分词,得到缩略词分词集合和标准POI查询词分词集合;
分词删除模块802,用于确定所述缩略词分词集合与所述标准POI查询词分词集合中相同的分词,并分别将确定出的相同分词从所述缩略词分词集合和所述标准POI查询词分词集合中删除;
修正词生成模块803,用于将所述缩略词分词集合中保留的分词,依次按照各分词在所述缩略词中的先后顺序,组合成修正缩略词,和,将所述标准POI查询词分词集合中保留的分词,依次按照各分词在所述标准POI查询词中的先后顺序,组合成修正标准POI查询词;
修正对应关系建立模块804,用于建立所述修正缩略词与所述修正标准POI查询词的对应关系;
对应关系更新模块805,用于以所述修正缩略词与修正标准POI查询词的对应关系更新所述缩略词与POI间对应关系。
图9所示的是该装置实施例三的结构图,除了图7和图8所示的结构,还可在图7和图8的基础上还包括对应关系判断模块901、第一删除对应关系模块902和第一存储对应关系模块903,如图9所示即为在图7的结构上还包括前述三个模块:
对应关系判断模块901,用于判断所述缩略词与POI间的对应关系是否为已存储的对应关系;
第一删除对应关系模块902,用于在所述对应关系判断模块901的判断结果为是的情况下,删除所述缩略词与POI间对应关系;
第一存储对应关系模块903,用于在所述对应关系判断模块901的判断结果为否的情况下,存储所述缩略词与POI间对应关系。
图10所示的该装置实施例四的结构图,除了图7和图8所示的结构之外,还可以在图7、图8的基础上还包括预存模块1001、频次记录模块1002、频次判断模块1003和第二存储对应关系模块1004,如图10所示是在图7的结构上还包括前述四个模块:
预存模块1001,用于将所述缩略词与POI间对应关系预存到待存储对应关系集合中;
频次记录模块1002,用于记录所述缩略词与POI间对应关系在待存储对应关系集合中出现的次数;
频次判断模块1003,用于判断所述缩略词与POI间对应关系出现的次数是否超过预设的频次阈值;
第二存储对应关系模块1004,用于在所述频次判断模块1004的判断结果为是的情况下,存储所述缩略词与POI间对应关系。
对应方法实施例,本发明还提供了一种通过缩略词查询POI的***。如图11,示出了该***实施例一的结构图,本实施例具体可以包括:
对应关系预先存储单元1101,用于预先存储采用图7~图10所示的任一装置获取的缩略词与POI间对应关系;
查询词接收单元1102,用于接收用户输入的查询词;
第一POI查找单元1103,根据所述查询词在POI数据库中查询对应的POI;
查找判断单元1104,用于判断是否查找到POI;
POI输出单元1105,用于在查找判断单元1104的判断结果为是的情况下,输出查询得到的POI;
标准POI查询词获取单元1106,用于在所述查找判断单元1104的判断结果为否的情况下,从预先存储的缩略词与POI间对应关系中获取所述查询词对应的标准POI查询词;
第二POI查找单元1107,用于根据所述标准POI查询词在所述POI数据库中查询对应的POI。
通过本发明的装置实施例和***实施例,通过用户搜索日志中用户实际查询输入的查询词来获取的缩略词与POI的对应关系,由于大量用户的实际查询能够及时反映地图中地理信息的变化以及用户所使用的缩略词的差别,通过上述技术方案,缩略词与POI间的对应关系通过用户实际搜索POI产生的日志来获取,就可以使得对应关系的更新能够及时的与地图的变化和用户的差别进行同步,因此,获取的缩略词与POI的对应关系更加准确,从而用户根据该对应关系就可以准确地查找到用户想要查找的POI。
对于本发明中的装置实施例和***实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例和***实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种获取缩略词与POI间对应关系的方法,其特征在于,包括:
从用户搜索日志中,搜集POI查询成功记录,并将当前搜索到的POI查询成功记录中的查询词确定为标准POI查询词;
在当前搜索到的POI查询成功记录与前一次搜索到的POI查询成功记录之间存在POI查询失败记录时,将POI查询失败记录中的查询词确定为待确定缩略词;
在组成所述待确定缩略词的单字均包含在所述标准POI查询词中,且各单字在所述待确定缩略词中的先后顺序与在所述标准POI查询词中出现的先后顺序相同时,将所述待确定缩略词确定为所述标准POI查询词的缩略词;
建立所述缩略词与所述标准POI查询词的对应关系,并将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系。
2.根据权利要求1所述的方法,其特征在于,将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系之后,还包括:
对所述缩略词和所述标准POI查询词进行分词,得到缩略词分词集合和标准POI查询词分词集合;
确定所述缩略词分词集合与所述标准POI查询词分词集合中相同的分词,并分别将确定出的相同分词从所述缩略词分词集合和所述标准POI查询词分词集合中删除;
将所述缩略词分词集合中保留的分词,依次按照各分词在所述缩略词中的先后顺序,组合成修正缩略词;将所述标准POI查询词分词集合中保留的分词,依次按照各分词在所述标准POI查询词中的先后顺序,组合成修正标准POI查询词;
建立所述修正缩略词与所述修正标准POI查询词的对应关系,并以所述修正缩略词与修正标准POI查询词的对应关系更新所述缩略词与POI间对应关系。
3.根据权利要求1或2所述的方法,其特征在于,将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系之后,还包括:
判断所述缩略词与POI间对应关系是否为已存储的对应关系,如果是,则删除所述缩略词与POI间对应关系,如果否,则存储所述缩略词与所述标准POI查询词间对应关系。
4.根据权利要求1或2所述的方法,其特征在于,将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系之后,还包括:
将所述缩略词与POI间对应关系预存到待存储对应关系集合中;
记录所述缩略词与POI间对应关系在待存储对应关系集合中出现的次数;
判断所述缩略词与POI间对应关系出现次数是否超过预设的频次阈值;
如果是,则存储所述缩略词与POI间对应关系。
5.一种查询POI的方法,其特征在于,预先存储采用权利要求1~4任一项所述的方法得到的缩略词与POI间对应关系,所述方法包括:
接收用户输入的查询词;
根据所述查询词在POI数据库中查询对应的POI;
判断是否查找到POI;
如果是,则输出查询得到的POI;如果否,则从预先存储的缩略词与POI间对应关系中获取所述查询词对应的标准POI查询词,并根据所述标准POI查询词在所述POI数据库中查询对应的POI。
6.一种获取缩略词与POI间的对应关系的装置,其特征在于,所述装置包括:
成功查询日志搜索模块,用于从用户搜索日志中,搜集POI查询成功记录;
标准POI查询词确定模块,用于将当前搜索到的POI查询成功记录中的查询词确定为标准POI查询词;
待确定缩略词确定模块,用于在当前搜索到的POI查询成功记录与前一次搜索到的POI查询成功记录之间存在POI查询失败记录时,将POI查询失败记录中的查询词确定为待确定缩略词;
缩略词确定模块,用于在组成所述待确定缩略词的单字均包含在所述标准POI查询词中,且,各单字在所述待确定缩略词中的先后顺序与在所述标准POI查询词中出现的先后顺序相同时,将所述待确定缩略词确定为所述标准POI查询词的缩略词;
对应关系建立模块,用于建立所述缩略词与所述标准POI查询词的对应关系;
对应关系确定模块,用于将所述缩略词与标准POI查询词的对应关系确定为缩略词与POI间对应关系。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
分词集合形成子模块,用于对所述缩略词和所述标准POI查询词进行分词,得到缩略词分词集合和标准POI查询词分词集合;
分词删除模块,用于确定所述缩略词分词集合与所述标准POI查询词分词集合中相同的分词,并分别将确定出的相同分词从所述缩略词分词集合和所述标准POI查询词分词集合中删除;
修正词生成模块,用于将所述缩略词分词集合中保留的分词,依次按照各分词在所述缩略词中的先后顺序,组合成修正缩略词,和,将所述标准POI查询词分词集合中保留的分词,依次按照各分词在所述标准POI查询词中的先后顺序,组合成修正标准POI查询词;
修正对应关系建立模块,用于建立所述修正缩略词与所述修正标准POI查询词的对应关系;
对应关系更新模块,用于以所述修正缩略词与修正标准POI查询词的对应关系更新所述缩略词与POI间对应关系。
8.根据权利要求6或7所述的装置,其特征在于,所述装置还包括:
对应关系判断模块,用于判断所述缩略词与POI间的对应关系是否为已存储的对应关系;
第一删除对应关系模块,用于在所述对应关系判断模块的判断结果为是的情况下,删除所述缩略词与POI间对应关系;
第一存储对应关系模块,用于在所述对应关系判断模块的判断结果为否的情况下,存储所述缩略词与POI间对应关系。
9.根据权利要求6或7所述的装置,其特征在于,所述装置还包括:
预存模块,用于将所述缩略词与POI间对应关系预存到待存储对应关系集合中;
频次记录模块,用于记录所述缩略词与POI间对应关系在待存储对应关系集合中出现的次数;
频次判断模块,用于判断所述缩略词与POI间对应关系出现的次数是否超过预设的频次阈值;
第二存储对应关系模块,用于在所述频次判断模块的判断结果为是的情况下,存储所述缩略词与POI间对应关系。
10.一种查询POI的***,其特征在于,所述***包括:
对应关系预先存储单元,用于预先存储采用权利要求6~9任一项所述的装置获取的缩略词与POI间对应关系;
查询词接收单元,用于接收用户输入的查询词;
第一POI查找单元,根据所述查询词在POI数据库中查询对应的POI;
查找判断单元,用于判断是否查找到POI;
POI输出单元,用于在查找判断单元的判断结果为是的情况下,输出查询得到的POI;
标准POI查询词获取单元,用于在所述查找判断单元的判断结果为否的情况下,从预先存储的缩略词与POI间对应关系中获取所述查询词对应的标准POI查询词;
第二POI查找单元,用于根据所述标准POI查询词在所述POI数据库中查询对应的POI。
CN201210555427.9A 2012-12-19 2012-12-19 一种获取缩略词与poi间对应关系的方法和装置 Active CN103885950B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210555427.9A CN103885950B (zh) 2012-12-19 2012-12-19 一种获取缩略词与poi间对应关系的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210555427.9A CN103885950B (zh) 2012-12-19 2012-12-19 一种获取缩略词与poi间对应关系的方法和装置

Publications (2)

Publication Number Publication Date
CN103885950A CN103885950A (zh) 2014-06-25
CN103885950B true CN103885950B (zh) 2017-07-28

Family

ID=50954845

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210555427.9A Active CN103885950B (zh) 2012-12-19 2012-12-19 一种获取缩略词与poi间对应关系的方法和装置

Country Status (1)

Country Link
CN (1) CN103885950B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106959958B (zh) 2016-01-11 2020-04-07 阿里巴巴集团控股有限公司 地图兴趣点简称获取方法和装置
CN107423298B (zh) * 2016-05-24 2021-02-19 北京百度网讯科技有限公司 一种搜索方法和装置
CN108345611B (zh) * 2017-01-24 2022-12-13 北京搜狗信息服务有限公司 一种地图搜索的运行监控方法、装置及电子设备
CN109284446A (zh) * 2018-08-01 2019-01-29 昆明理工大学 一种poi信息融合方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101963961A (zh) * 2009-07-23 2011-02-02 高德软件有限公司 兴趣点数据关联方法及装置
CN102456055A (zh) * 2010-10-28 2012-05-16 腾讯科技(深圳)有限公司 兴趣点检索的方法及装置
CN102685662A (zh) * 2011-03-17 2012-09-19 高德软件有限公司 基于位置的优惠券管理平台、发布方法、***及智能终端

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080048786A (ko) * 2006-11-29 2008-06-03 팅크웨어(주) 목적지 주변의 관심지점 제공 방법 및 시스템

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101963961A (zh) * 2009-07-23 2011-02-02 高德软件有限公司 兴趣点数据关联方法及装置
CN102456055A (zh) * 2010-10-28 2012-05-16 腾讯科技(深圳)有限公司 兴趣点检索的方法及装置
CN102685662A (zh) * 2011-03-17 2012-09-19 高德软件有限公司 基于位置的优惠券管理平台、发布方法、***及智能终端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于LBS的兴趣点查询与更新机制研究;周春辉等;《微计算机信息》;20091231;第143-145页 *

Also Published As

Publication number Publication date
CN103885950A (zh) 2014-06-25

Similar Documents

Publication Publication Date Title
CN110704411B (zh) 适用于艺术领域的知识图谱搭建方法及装置、电子设备
CN104376053B (zh) 一种基于海量气象数据的存储与检索方法
CN103124966B (zh) 聚集和链接位置数据的方法和设备
CN104052661B (zh) 容器名服务器和容器名解析方法
CN104009920B (zh) 数据源移动的处理方法、转发报文的方法及其装置
US9336235B2 (en) Location-based recommendations
CN103885950B (zh) 一种获取缩略词与poi间对应关系的方法和装置
CN105138592A (zh) 一种基于分布式架构的日志数据存储和检索方法
CN104484477B (zh) 一种电子地图搜索方法、装置及***
CN104537107A (zh) 一种网址存储匹配方法及装置
CN104572873B (zh) 信息处理方法及装置
CN103955533B (zh) 一种基于缓冲队列的页面树形数据获取装置及方法
CN103957282B (zh) 一种域内终端用户域名解析加速***及其方法
CN102193983B (zh) 图形数据库基于关系路径的节点数据过滤方法
US20180089241A1 (en) Context enhanced indexing
CN107862757A (zh) 一种基于Wi‑Fi指纹的移动考勤方法及***
CN103902705B (zh) 一种基于元数据的跨机构云端数字内容集成***和方法
CN105138608A (zh) 基于电子地图的活动展示***及方法
CN100483413C (zh) 电子地图的图文和多媒体数据扩展和查询的方法
CN105808627A (zh) Poi信息更新、检索、poi数据包生成方法及装置
CN105653576A (zh) 信息搜索的方法及装置、人工座席服务方法及***
KR101556743B1 (ko) 웹 수집에 기반한 관심 정보 생성 장치 및 그 방법
CN107862068A (zh) 数据处理方法、装置及计算机可读存储介质
KR100902934B1 (ko) 전자 지도의 업데이트 방법 및 장치
Choudhary et al. Spatial configurations of the urban cores in central India

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200512

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: Alibaba (China) Co.,Ltd.

Address before: 102200, No. 8, No., Changsheng Road, Changping District science and Technology Park, Beijing, China. 1-5

Patentee before: AUTONAVI SOFTWARE Co.,Ltd.

TR01 Transfer of patent right