CN101350154A - 一种电子地图数据的排序方法及装置 - Google Patents

一种电子地图数据的排序方法及装置 Download PDF

Info

Publication number
CN101350154A
CN101350154A CNA2008102224228A CN200810222422A CN101350154A CN 101350154 A CN101350154 A CN 101350154A CN A2008102224228 A CNA2008102224228 A CN A2008102224228A CN 200810222422 A CN200810222422 A CN 200810222422A CN 101350154 A CN101350154 A CN 101350154A
Authority
CN
China
Prior art keywords
map data
electronic map
keyword
web page
importance degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008102224228A
Other languages
English (en)
Other versions
CN101350154B (zh
Inventor
董正斌
佟子健
王云峰
王登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN 200810222422 priority Critical patent/CN101350154B/zh
Publication of CN101350154A publication Critical patent/CN101350154A/zh
Application granted granted Critical
Publication of CN101350154B publication Critical patent/CN101350154B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种电子地图数据的排序方法及装置,以解决传统的人工排序方法造成排序效果差、耗费人力、成本太高的问题。所述方法包括:提取出每个电子地图数据的关键词;利用所述关键词进行搜索,获取对应每个电子地图数据的搜索结果网页集合;根据每个电子地图数据的相应搜索结果网页集合,计算该电子地图数据的重要度;按照所述重要度对所述电子地图数据进行排序。本发明利用互联网的网络知名度来刻画POI数据的重要程度,由于这种刻画代表了广大网民乃至广大群众的认识,因此这种排序效果比较好,具有很好的群众基础和合理性。而且,使用机器自动对POI数据进行打分和排序,极大地节省了人力,效率更高,成本非常低廉。

Description

一种电子地图数据的排序方法及装置
技术领域
本发明涉及网络技术领域,特别是涉及一种电子地图数据的排序方法及装置。
背景技术
随着地理信息***的发展与完善,电子地图的设计开发技术也日趋成熟。电子地图中,有一类数据称为兴趣点数据(即Point of Interest,POI数据),是指人们感兴趣的数据,如餐馆、公园、商场等建筑物的地理信息,或是一些街道的信息等等。通常,POI数据包括名称、类别、经度、纬度四个方面的信息,有时也包括其他一些信息,如地址,电话、邮编等等。POI数据是电子地图最重要的元素之一,也是人们使用电子地图时最为关注的信息。
一个电子地图通常包含很多的POI数据,这些POI数据涵盖了该地图范围内的绝大部分地理信息。但是,该电子地图中地理信息的重要程度有所不同,如“天安门广场”比“中关村广场”重要,“北京大学”比“北京大学附属中学”重要,这种地理信息重要性的不同导致POI数据的重要性存在差异。
POI排序是指根据POI数据重要性的不同对POI数据进行的排序,POI数据的重要性体现在其所指代地理信息的重要性。POI排序可应用在搜索引擎的排序中,即根据POI数据的重要性对电子地图的查询结果进行排序展示。
目前,还没有比较成熟的POI排序方法。传统上,电子地图的开发商会请一些编辑或者普通民众,根据人们对POI数据的熟悉程度来对POI数据进行排序,这种根据熟悉程度进行排序的核心思想是:如果一个POI数据所指代的地理位置非常重要,则它一定为人们所熟悉。这一思想具有一定的合理性,由于电子地图乃至实际的地理信息的使用者是普通民众,因此被普通民众熟悉的地理信息应该具有较高的重要性。
但是,这种方法存在如下问题:
第一,虽然可以用熟悉程度来刻画POI数据的重要程度,但是如何计算熟悉程度是一个非常困难的问题。因此,上述人工排序的方法由于只有极小一部分人参与,无法代表广大用户,所以排序效果没有保障,排序效果差;而且,由于人数较少,所以错误率也比较高。
第二,由于POI数据量极大,而且更新很快,所以采用人工进行排序非常耗费人力,而且成本非常昂贵。
因此,这种人工排序方法无法得到实际使用。
发明内容
本发明所要解决的技术问题是提供一种电子地图数据的排序方法及装置,以解决传统的人工排序方法造成排序效果差、耗费人力、成本太高的问题。
为解决上述技术问题,根据本发明提供的具体实施例,本发明公开了以下技术方案:
一种电子地图数据的排序方法,包括:
提取出每个电子地图数据的关键词;
利用所述关键词进行搜索,获取对应每个电子地图数据的搜索结果网页集合;
根据每个电子地图数据的相应搜索结果网页集合,计算该电子地图数据的重要度;
按照所述重要度对所述电子地图数据进行排序。
其中,所述根据每个电子地图数据的相应搜索结果网页集合,计算该电子地图数据的重要度,具体包括:针对集合中每个搜索结果网页,分别计算用于表示网页重要程度的第一数值和用于表示网页与关键词匹配程度的第二数值;根据相应集合中所有搜索结果网页的第一数值和第二数值,计算该电子地图数据的重要度。
其中,所述根据相应集合中所有搜索结果网页的第一数值和第二数值,计算该电子地图数据的重要度,具体包括:将集合中每个搜索结果网页的第一数值和第二数值相乘,然后再将集合中所有搜索结果网页的相乘结果求和,得到该电子地图数据的重要度。
优选的,所述第一数值通过计算网页级别得到。
优选的,所述计算该电子地图数据的重要度之后,还包括:根据电子地图数据所属类别所具有的不同权重,将该电子地图数据的重要度乘以该电子地图数据所属类别的权重值,得到调整后的结果数据,用于排序。
其中,所述提取出每个电子地图数据的关键词,具体包括:提取出每个电子地图数据的名称作为关键词。
优选的,还包括:提取出每个电子地图数据的地址信息,与名称一同作为关键词。
优选的,所述提取出每个电子地图数据的关键词之前,还包括:对原始的电子地图数据进行预处理,所述预处理包括去除无关符号、字符编码转换、调整统一格式;将预处理结果用于关键词的提取;
优选的,按照所述重要度对所述电子地图数据进行排序之后,还包括:在电子地图检索中,根据用户输入的查询词返回相匹配的检索结果,将检索结果中排序靠前的电子地图数据优先显示。
优选的,按照所述重要度对所述电子地图数据进行排序之后,还包括:在图层显示时,选取显示范围内排序靠前的电子地图数据进行显示。
优选的,按照所述重要度对所述电子地图数据进行排序之后,还包括:对排序靠前的电子地图数据进行优先更新。
本发明还提供了一种电子地图数据的排序装置,包括:
关键词提取单元,用于提取出每个电子地图数据的关键词;
查询单元,用于利用所述关键词进行搜索,获取对应每个电子地图数据的搜索结果网页集合;
计算单元,用于根据每个电子地图数据的相应搜索结果网页集合,计算该电子地图数据的重要度;
排序单元,用于按照所述重要度对所述电子地图数据进行排序。
其中,所述计算单元具体包括:第一计算子单元,用于针对集合中每个搜索结果网页,分别计算用于表示网页重要程度的第一数值;第二计算子单元,用于针对集合中每个搜索结果网页,分别计算用于表示网页与关键词匹配程度的第二数值;综合计算子单元,用于根据每个电子地图数据相应集合中的所有搜索结果网页的第一数值和第二数值,计算该电子地图数据的重要度。
其中,所述综合计算子单元将集合中每个搜索结果网页的第一数值和第二数值相乘,然后再将集合中所有搜索结果网页的相乘结果求和,得到该电子地图数据的重要度。
优选的,所述第一计算子单元通过计算网页级别得到第一数值。
优选的,所述装置还包括:调整单元,用于根据电子地图数据所属类别所具有的不同权重,将该电子地图数据的重要度乘以该电子地图数据所属类别的权重值,得到调整后的结果数据,并输出到排序单元用于排序。
其中,所述关键词提取单元将提取出的电子地图数据的名称作为关键词。
优选的,所述关键词提取单元还将提取出的电子地图数据的地址信息,与名称一同作为关键词。
优选的,所述装置还包括:预处理单元,用于对原始的电子地图数据进行预处理,并将预处理结果输出到关键词提取单元;其中,所述预处理包括去除无关符号、字符编码转换、调整统一格式。
优选的,所述装置还包括:检索单元,用于在电子地图检索中,根据用户输入的查询词返回相匹配的检索结果,将检索结果中排序靠前的电子地图数据优先显示。
优选的,所述装置还包括:图层显示单元,用于在图层显示时,选取显示范围内排序靠前的电子地图数据进行显示。
优选的,所述装置还包括:数据更新单元,用于对排序靠前的电子地图数据进行优先更新。
本发明还提供了一种搜索引擎***,所述***包括上述任一装置实施例所述的装置。
根据本发明提供的具体实施例,本发明具有以下技术效果:
首先,本发明利用互联网技术对POI数据进行排序,使用互联网的网络知名度来刻画POI数据的重要程度,而网络知名度是根据关键词(是从POI数据中提取出)在搜索引擎中返回的结果网页进行计算得到。由于这种刻画代表了广大网民乃至广大群众的认识,因此利用网络知名度来对POI数据进行排序,排序的效果比较好,具有很好的群众基础和合理性。而且,使用机器自动对POI数据进行打分和排序,极大地节省了人力,效率更高,成本非常低廉。
其次,在利用网络知名度刻画POI数据的重要程度时,本发明主要使用了网页的重要程度、网页与关键词的匹配程度这两个指标,而且每个指标也有不同的计算方法。
再次,本发明还充分考虑了POI数据的类别对POI重要程度的影响,利用POI数据的类别信息来对基本的网络知名度得分进行调整从而得到POI的最终得分,从而更加准确地刻画了POI数据的重要程度。
附图说明
图1是本发明实施例一所述一种电子地图数据的排序方法流程图;
图2是本发明实施例二所述一种POI数据的排序方法流程示意图;
图3是本发明实施例所述一种电子地图数据的排序装置结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例一:
针对传统的POI人工排序方法,本发明实施例提供了一种利用互联网技术进行的排序方法。参照图1,是本发明实施例一所述一种电子地图数据的排序方法流程图。本实施例中,所述电子地图数据以POI数据为例进行说明,但所述电子地图数据包括但不限于POI数据。
S101,提取出每个POI数据的关键词;
本实施例需要从每个POI数据中提取出一个关键词,用来在互联网的搜索引擎中进行查询。由于每个POI数据具有一些属性,包括名称、类别、坐标或其它属性信息,因此提取时可以从这些属性信息中提取出最能代表这个POI数据的词作为关键词。本实施例中,关键词的基本部分是POI的名称,因为名称是POI数据最重要的部分。
优选的,在提取POI数据的名称时,需要对名称进行一些处理,如去除名称中的分店、分公司等信息。因为如餐饮、公司这样的名称,里面经常存在分店、分公司的情况,而POI排序的目的是为了把总店、总公司排在靠前的位置,所以这时就可以把这种分店、分公司的字符去除。如“xx公司五道口分店”,就可以把“五道口分店”去除,只剩“xx公司”。
优选的,也可以加入其它一些信息作为名称的补充,如地址、区县等。因为有些名称太短,不具有实际意义,如公厕、停车场等词,这时候就可以把POI的地址加入进来,和名称一起作为关键词,这样处理的效果更好。
S102,利用所述关键词进行搜索,获取对应每个POI数据的搜索结果网页集合;
上述提取出的关键词,在搜索引擎中进行查询并取得返回的结果集合。
S103,根据每个POI数据的相应搜索结果网页集合,计算该POI数据的重要度;
本发明是利用互联网的网络知名度来刻画POI数据的重要程度,而POI的网络知名度是根据对应该POI的搜索结果网页集合计算。其中,所述网络知名度是指一个名称在网络中的知名程度。
针对每个POI数据,利用提取出的关键词进行查询能够得到多个搜索结果网页(即网页集合),而每一个网页具有两个指标:一个是网页的重要程度,另一个是网页与关键词的匹配程度。本实施例主要利用所述两个指标来衡量POI数据的网络知名度。
由于每种指标都有不同的计算方法,本实施例只采用其中一种比较常用的方法。对于网页的重要程度,采用计算网页级别(PageRank)的方法。网页的PageRank是度量网页重要程度的一种指标,是根据网页之间的超链接来进行计算,源自于Google创始人提出的PageRank算法。当然,也可以用网页的流量来表示网页的重要程度。对于网页与关键词的匹配程度(MatchRank),通常采用的计算方法是:如果关键词在网页中完整出现,则匹配程度较高,如果关键词被切分后出现,则匹配程度较低。本发明包含但不限于以上计算方法。
得到每个网页的PageRank和MatchRank后,将每个网页的PageRank和MatchRank相乘,然后再将对应同一个POI数据的所有网页的相乘结果相加,即得到一个POI数据的计算结果。本实施例中,采用对POI数据打分的方式,所以所述计算结果得到的是一个对该POI数据的网络知名度进行刻画的分值。
需要说明的是,上述根据网页的PageRank和MatchRank采用相乘再相加的计算来获得一个POI分值的方法,仅作为本实施例的一种实现方式,本发明包括但不限于所述方法。
S104,按照所述重要度对所述POI数据进行排序。
得到每个POI数据的得分后,利用所述得分即可以对所有的POI数据进行排序。
由上述处理流程可知,本发明使用互联网的网络知名度来刻画POI数据的重要程度,由于这种刻画代表了广大网民乃至广大群众的认识,因此利用网络知名度来对POI数据进行排序,排序的效果比较好,具有很好的群众基础和合理性。而且,使用机器自动对POI数据进行打分和排序,极大地节省了人力,效率更高,成本非常低廉。
实施例二:
本发明实施例二提供了一种具体应用实例。
参照图2,是本发明实施例二所述一种POI数据的排序方法流程示意图。
S201,对原始的POI数据进行预处理;
对原始POI数据进行清洗过滤,主要功能是使数据符合一定的输入标准。所述预处理主要包括去除无关符号、字符编码转换、调整统一格式三个部分。其中,
1)去除无关符号:由于数据的来源或者其他问题,数据中可能存在一些无关符号,这些符号没有实际意义,如!、#等符号,还有乱码等,需要将这些无关符号去除,起到一个清洗过滤作用;
2)字符编码转换:使字符的编码一致,可以有利于后面打分的公平。如半角转全角,繁体转简体等;
3)调整格式:数据的输入格式应该统一,这样利于编程。
S202,针对预处理后的POI数据,提取出每个POI数据的关键词;
提取过程中,可以根据地名库和别名库识别出名称中包含的分店、分公司等信息,然后去除这些信息。例如“xx公司五道口分店”,如果“五道口”是地名库中的一个词,“分店”是特有词库中的词,这样就可以把“五道口分店”去除,只剩“xx公司”。
S203,利用所述关键词进行搜索,获取对应每个POI数据的搜索结果网页集合;
S204,针对每个POI数据,根据相对应的搜索结果网页集合计算得到用于表示该POI数据重要程度的基本分值;
本实施例中,根据网页的PageRank和MatchRank计算得到的分值作为POI数据的基本分值,这个基本分值是对该POI数据的网络知名度的刻画。
S205,根据POI数据的类别信息调整所述基本分值;
由于POI数据具有很多类别,而不同类别的数据在网络上具有不同的性质。例如,餐饮类的POI数据要比政府机关类的POI数据在网络上更受到关注,但是政府机关类的POI数据要比餐饮类的POI数据更为重要,因为在实际生活中人们更关注政府机关类的POI数据。因此,为了平衡不同类别POI数据的得分,本实施例引入了类别权重,需要根据类别的权重来调整POI的基本得分,使得类别重要的POI得分提高,类别不重要的POI得分降低。类别的权重可以根据经验来设定,也可以使用一些训练数据来训练获得。调整过程是:用POI数据的基本得分乘以其所属类别的权重大小,这样就得到最终得分。
例如,有两个POI数据,一个是北京大学第三医院,一个是郭林家常菜。由于餐饮类的名称在网页中出现比较多,所以郭林家常菜的基本得分为5分,而北京大学第三医院的得分为4分。但是根据人们的经验和习惯来说,医院会比餐饮类重要,所以医院类的类别权重较大,设为1.5,而餐饮的权重较低,设为0.8。这样最终两个POI的得分分别为:北京大学第三医院4×1.5=6,郭林家常菜5×0.8=4。从而北京大学第三医院比郭林家常菜的得分高,排序靠前,这就符合了人们的一般认识。
S206,按照所述调整后的最终分值对所述POI数据进行排序。
对比实施例一和实施例二,实施例二增加了预处理过程和基本分值的调整过程。实施例二还充分考虑了POI数据的类别对POI重要程度的影响,利用POI数据的类别信息来对基本的网络知名度得分进行调整从而得到POI的最终得分,从而更加准确地刻画了POI数据的重要程度。
电子地图POI数据的排序具有很多实用价值,例如:
1)查询检索方面:用户在电子地图查询时输入一个查询词,会返回很多检索结果,这些检索结果都与该查询词匹配,但这些结果中往往还有重要程度之分。如果对POI进行排序后,就可以在匹配的同时,把重要的POI显示在前面,不重要的放在后面,这样更方便用户使用。例如,查询“全聚德”,会出现全聚德的很多分店和一些附属公司或培训机构,它们都与这个查询词匹配,但是不能把一些附属公司和培训机构显示在前面,因为一般这些不太重要,而应该把重要的总店或者分店排在前面。再如:查询北京大学,会出现北京大学和它的附属机构,北京大学应该排在第一位,但它的众多附属机构应该有一个排序的前后之分。
2)图层显示方面:电子地图一般由很多图层组成,当用户在查看某个图层时,应该将该图层的POI显示出来供用户查看。但是用户在某个图层中关注点的周围也许有很多的POI,如果把这些POI全部显示出来,则整个页面会非常杂乱且臃肿,这就不利于用户查看。因此,需要按照重要程度来选取一部分POI进行显示,这样不但用户可以查看到自己需要的信息,而且整个显示效果比较好。
3)数据更新方面:由于POI更新速度较快,而且更新量较大,如果在精力有限的情况下可以只针对比较重要的数据先更新。
针对上述方法实施例,本发明还提供了一种电子地图数据的排序装置实施例。参照图3,是本发明实施例所述一种电子地图数据的排序装置结构图。所述装置主要包括:
关键词提取单元U32,用于提取出每个电子地图数据的关键词;
查询单元U33,用于利用所述关键词进行搜索,获取对应每个电子地图数据的搜索结果网页集合;
计算单元U34,用于根据每个电子地图数据的相应搜索结果网页集合,计算该电子地图数据的重要度;
排序单元U36,用于按照所述重要度对所述电子地图数据进行排序。
其中,所述计算单元U34具体包括:
第一计算子单元,用于针对集合中每个搜索结果网页,分别计算用于表示网页重要程度的第一数值;网页的重要程度可以由网页级别(PageRank)来表示,所以所述第一数值即指计算所得的PageRank;当然,也可以用网页的流量来表示;
第二计算子单元,用于针对集合中每个搜索结果网页,分别计算用于表示网页与查询词匹配程度的第二数值;网页与查询词的匹配程度(MatchRank)可以由多种方法计算得到;
综合计算子单元,用于针对每个电子地图数据,根据相对应集合中的所有搜索结果网页的第一数值和第二数值,计算用于表示该电子地图数据重要程度的结果数据。一种计算方式是:所述综合计算子单元将集合中每个搜索结果网页的第一数值和第二数值相乘,然后再将集合中所有搜索结果网页的相乘结果求和,得到该电子地图数据的重要程度值。
其中,所述关键词提取单元U32将提取出的电子地图数据的名称作为关键词;或者,将提取出的电子地图数据的地址信息,与名称一同作为关键词。优选的,在提取名称时去掉包含分店、分公司的信息。
优选的,在本发明的另一装置实施例中,所述装置还包括调整单元U35,用于根据电子地图数据所属类别所具有的不同权重,将该电子地图数据的重要度乘以该电子地图数据所属类别的权重值,得到调整后的结果数据,并输出到排序单元U36用于排序。
优选的,在本发明的另一装置实施例中,所述装置还包括预处理单元U31,用于对原始的电子地图数据进行预处理,并将预处理结果输出到关键词提取单元U32;其中,所述预处理包括去除无关符号、进行字符编码转换、调整统一格式。
优选的,在本发明的另一装置实施例中,所述装置还包括检索单元U37,用于在电子地图检索中,根据用户输入的查询词返回相匹配的检索结果,将检索结果中排序靠前的电子地图数据优先显示。
优选的,在本发明的另一装置实施例中,所述装置还包括图层显示单元U38,用于在图层显示时,选取显示范围内排序靠前的电子地图数据进行显示。
优选的,在本发明的另一装置实施例中,所述装置还包括数据更新单元U39,用于对排序靠前的电子地图数据进行优先更新。
图3所示装置中未详述的部分可以参见图1、图2所示方法的相关部分,为了篇幅考虑,在此不再详述。
此外,本发明还提供了一种搜索引擎***,所述***包括上述任一装置实施例所述的装置。所述搜索引擎***在电子地图数据的搜索应用方面,能够提供更加优质的检索结果。
以上对本发明所提供的一种电子地图数据的排序方法及装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (23)

1、一种电子地图数据的排序方法,其特征在于,包括:
提取出每个电子地图数据的关键词;
利用所述关键词进行搜索,获取对应每个电子地图数据的搜索结果网页集合;
根据每个电子地图数据的相应搜索结果网页集合,计算该电子地图数据的重要度;
按照所述重要度对所述电子地图数据进行排序。
2、根据权利要求1所述的方法,其特征在于,所述根据每个电子地图数据的相应搜索结果网页集合,计算该电子地图数据的重要度,具体包括:
针对集合中每个搜索结果网页,分别计算用于表示网页重要程度的第一数值和用于表示网页与关键词匹配程度的第二数值;
根据相应集合中所有搜索结果网页的第一数值和第二数值,计算该电子地图数据的重要度。
3、根据权利要求2所述的方法,其特征在于,所述根据相应集合中所有搜索结果网页的第一数值和第二数值,计算该电子地图数据的重要度,具体包括:
将集合中每个搜索结果网页的第一数值和第二数值相乘,然后再将集合中所有搜索结果网页的相乘结果求和,得到该电子地图数据的重要度。
4、根据权利要求2或3所述的方法,其特征在于:所述第一数值通过计算网页级别得到。
5、根据权利要求2或3所述的方法,其特征在于,所述计算该电子地图数据的重要度之后,还包括:
根据电子地图数据所属类别所具有的不同权重,将该电子地图数据的重要度乘以该电子地图数据所属类别的权重值,得到调整后的结果数据,用于排序。
6、根据权利要求1所述的方法,其特征在于,所述提取出每个电子地图数据的关键词,具体包括:
提取出每个电子地图数据的名称作为关键词。
7、根据权利要求6所述的方法,其特征在于,还包括:
提取出每个电子地图数据的地址信息,与名称一同作为关键词。
8、根据权利要求1所述的方法,其特征在于,所述提取出每个电子地图数据的关键词之前,还包括:
对原始的电子地图数据进行预处理,所述预处理包括去除无关符号、字符编码转换、调整统一格式;
将预处理结果用于关键词的提取。
9、根据权利要求1所述的方法,其特征在于,按照所述重要度对所述电子地图数据进行排序之后,还包括:
在电子地图检索中,根据用户输入的查询词返回相匹配的检索结果,将检索结果中排序靠前的电子地图数据优先显示。
10、根据权利要求1所述的方法,其特征在于,按照所述重要度对所述电子地图数据进行排序之后,还包括:
在图层显示时,选取显示范围内排序靠前的电子地图数据进行显示。
11、根据权利要求1所述的方法,其特征在于,按照所述重要度对所述电子地图数据进行排序之后,还包括:
对排序靠前的电子地图数据进行优先更新。
12、一种电子地图数据的排序装置,其特征在于,包括:
关键词提取单元,用于提取出每个电子地图数据的关键词;
查询单元,用于利用所述关键词进行搜索,获取对应每个电子地图数据的搜索结果网页集合;
计算单元,用于根据每个电子地图数据的相应搜索结果网页集合,计算该电子地图数据的重要度;
排序单元,用于按照所述重要度对所述电子地图数据进行排序。
13、根据权利要求12所述的装置,其特征在于,所述计算单元具体包括:
第一计算子单元,用于针对集合中每个搜索结果网页,分别计算用于表示网页重要程度的第一数值;
第二计算子单元,用于针对集合中每个搜索结果网页,分别计算用于表示网页与关键词匹配程度的第二数值;
综合计算子单元,用于根据每个电子地图数据相应集合中的所有搜索结果网页的第一数值和第二数值,计算该电子地图数据的重要度。
14、根据权利要求13所述的装置,其特征在于:
所述综合计算子单元将集合中每个搜索结果网页的第一数值和第二数值相乘,然后再将集合中所有搜索结果网页的相乘结果求和,得到该电子地图数据的重要度。
15、根据权利要求13所述的装置,其特征在于:所述第一计算子单元通过计算网页级别得到第一数值。
16、根据权利要求12所述的装置,其特征在于,所述装置还包括:
调整单元,用于根据电子地图数据所属类别所具有的不同权重,将该电子地图数据的重要度乘以该电子地图数据所属类别的权重值,得到调整后的结果数据,并输出到排序单元用于排序。
17、根据权利要求12所述的装置,其特征在于:所述关键词提取单元将提取出的电子地图数据的名称作为关键词。
18、根据权利要求17所述的装置,其特征在于:所述关键词提取单元还将提取出的电子地图数据的地址信息,与名称一同作为关键词。
19、根据权利要求12所述的装置,其特征在于,所述装置还包括:
预处理单元,用于对原始的电子地图数据进行预处理,并将预处理结果输出到关键词提取单元;其中,所述预处理包括去除无关符号、字符编码转换、调整统一格式。
20、根据权利要求12所述的装置,其特征在于,所述装置还包括:
检索单元,用于在电子地图检索中,根据用户输入的查询词返回相匹配的检索结果,将检索结果中排序靠前的电子地图数据优先显示。
21、根据权利要求12所述的装置,其特征在于,所述装置还包括:
图层显示单元,用于在图层显示时,选取显示范围内排序靠前的电子地图数据进行显示。
22、根据权利要求12所述的装置,其特征在于,所述装置还包括:
数据更新单元,用于对排序靠前的电子地图数据进行优先更新。
23、一种搜索引擎***,其特征在于,所述***包括权利要求12至22任一权利要求所述的装置。
CN 200810222422 2008-09-16 2008-09-16 一种电子地图数据的排序方法及装置 Active CN101350154B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200810222422 CN101350154B (zh) 2008-09-16 2008-09-16 一种电子地图数据的排序方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200810222422 CN101350154B (zh) 2008-09-16 2008-09-16 一种电子地图数据的排序方法及装置

Publications (2)

Publication Number Publication Date
CN101350154A true CN101350154A (zh) 2009-01-21
CN101350154B CN101350154B (zh) 2013-01-30

Family

ID=40268929

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200810222422 Active CN101350154B (zh) 2008-09-16 2008-09-16 一种电子地图数据的排序方法及装置

Country Status (1)

Country Link
CN (1) CN101350154B (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011072411A1 (zh) * 2009-12-14 2011-06-23 北京友迈在地科技有限公司 一种在电子地图中以优先顺序显示特定符号的方法及***
CN102541936A (zh) * 2010-12-31 2012-07-04 高德软件有限公司 兴趣点流行度获取方法和装置
CN102890725A (zh) * 2012-11-02 2013-01-23 瑞庭网络技术(上海)有限公司 搜索引擎的结果排序方法
CN103185596A (zh) * 2011-12-30 2013-07-03 上海博泰悦臻电子设备制造有限公司 兴趣点搜索方法、兴趣点搜索装置
CN103258057A (zh) * 2013-06-03 2013-08-21 北京奇虎科技有限公司 在电子地图界面上展示兴趣点poi的方法和装置
CN103336807A (zh) * 2013-06-25 2013-10-02 百度在线网络技术(北京)有限公司 一种显示兴趣点的方法及***
CN103577442A (zh) * 2012-07-30 2014-02-12 腾讯科技(深圳)有限公司 一种地图数据重要度计算方法及装置
CN104123318A (zh) * 2013-04-28 2014-10-29 百度在线网络技术(北京)有限公司 一种地图显示兴趣点的方法及***
CN104281577A (zh) * 2013-07-02 2015-01-14 威盛电子股份有限公司 数据文件的排序方法
CN104281576A (zh) * 2013-07-02 2015-01-14 威盛电子股份有限公司 地标数据的显示方法
CN104317909A (zh) * 2014-10-27 2015-01-28 百度在线网络技术(北京)有限公司 兴趣点数据的校验方法和装置
CN104462143A (zh) * 2013-09-24 2015-03-25 高德软件有限公司 连锁品牌词词库、类别词词库建立方法和装置
CN104899200A (zh) * 2014-03-04 2015-09-09 高德软件有限公司 一种poi搜索反馈方法及装置
CN105069079A (zh) * 2015-07-31 2015-11-18 北京奇虎科技有限公司 筛选兴趣点poi数据的方法及装置
CN105222803A (zh) * 2015-10-20 2016-01-06 北京百度网讯科技有限公司 地图poi显示方法及终端
CN105550330A (zh) * 2015-12-21 2016-05-04 北京奇虎科技有限公司 兴趣点poi信息排序的方法和***
CN105608112A (zh) * 2015-12-10 2016-05-25 北京奇虎科技有限公司 衡量地图poi数据的质量的方法和装置
CN105786915A (zh) * 2014-12-25 2016-07-20 高德软件有限公司 一种poi重要度确定方法及装置
CN107315748A (zh) * 2016-04-26 2017-11-03 斑马网络技术有限公司 电子地图索引方法、装置、终端设备和用户界面***
CN107315750A (zh) * 2016-04-26 2017-11-03 斑马网络技术有限公司 电子地图图层显示方法、装置、终端设备和用户界面***
CN107798018A (zh) * 2016-09-06 2018-03-13 高德软件有限公司 一种兴趣点显示信息的设置方法及装置
CN107918512A (zh) * 2017-11-16 2018-04-17 携程旅游信息技术(上海)有限公司 酒店信息显示方法、装置、电子设备、存储介质
CN108984640A (zh) * 2018-06-22 2018-12-11 华北电力大学 一种基于web数据挖掘的地理信息获取方法
CN111026937A (zh) * 2019-11-13 2020-04-17 百度在线网络技术(北京)有限公司 提取poi名称的方法、装置、设备和计算机存储介质
CN111177125A (zh) * 2013-03-15 2020-05-19 美国结构数据有限公司 用于分析关注实体特性的设备、***以及方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1389811A (zh) * 2002-02-06 2003-01-08 北京造极人工智能技术有限公司 搜索引擎的智能化搜索方法
US7475074B2 (en) * 2005-02-22 2009-01-06 Taiwan Semiconductor Manufacturing Co., Ltd. Web search system and method thereof
CN101000608A (zh) * 2006-01-11 2007-07-18 吴风勇 基于搜索引擎技术的关键字动态匹配生成的方法

Cited By (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102667759A (zh) * 2009-12-14 2012-09-12 北京友迈在地科技有限公司 一种在电子地图中以优先顺序显示特定符号的方法及***
WO2011072411A1 (zh) * 2009-12-14 2011-06-23 北京友迈在地科技有限公司 一种在电子地图中以优先顺序显示特定符号的方法及***
CN102667759B (zh) * 2009-12-14 2014-07-30 北京友迈在地科技有限公司 一种在电子地图中以优先顺序显示特定符号的方法及***
CN102541936A (zh) * 2010-12-31 2012-07-04 高德软件有限公司 兴趣点流行度获取方法和装置
CN103185596A (zh) * 2011-12-30 2013-07-03 上海博泰悦臻电子设备制造有限公司 兴趣点搜索方法、兴趣点搜索装置
CN103577442B (zh) * 2012-07-30 2019-02-05 腾讯科技(深圳)有限公司 一种地图数据重要度计算方法及装置
CN103577442A (zh) * 2012-07-30 2014-02-12 腾讯科技(深圳)有限公司 一种地图数据重要度计算方法及装置
CN102890725B (zh) * 2012-11-02 2015-08-19 瑞庭网络技术(上海)有限公司 搜索引擎的结果排序方法
CN102890725A (zh) * 2012-11-02 2013-01-23 瑞庭网络技术(上海)有限公司 搜索引擎的结果排序方法
CN111177125B (zh) * 2013-03-15 2023-10-31 美国结构数据有限公司 用于分析关注实体特性的设备、***以及方法
US11762818B2 (en) 2013-03-15 2023-09-19 Foursquare Labs, Inc. Apparatus, systems, and methods for analyzing movements of target entities
CN111177125A (zh) * 2013-03-15 2020-05-19 美国结构数据有限公司 用于分析关注实体特性的设备、***以及方法
CN104123318B (zh) * 2013-04-28 2019-01-15 百度在线网络技术(北京)有限公司 一种地图显示兴趣点的方法及***
CN104123318A (zh) * 2013-04-28 2014-10-29 百度在线网络技术(北京)有限公司 一种地图显示兴趣点的方法及***
CN103258057A (zh) * 2013-06-03 2013-08-21 北京奇虎科技有限公司 在电子地图界面上展示兴趣点poi的方法和装置
CN103258057B (zh) * 2013-06-03 2017-06-23 北京奇虎科技有限公司 在电子地图界面上展示兴趣点poi的方法和装置
CN103336807B (zh) * 2013-06-25 2018-01-05 百度在线网络技术(北京)有限公司 一种显示兴趣点的方法及***
CN103336807A (zh) * 2013-06-25 2013-10-02 百度在线网络技术(北京)有限公司 一种显示兴趣点的方法及***
CN104281576A (zh) * 2013-07-02 2015-01-14 威盛电子股份有限公司 地标数据的显示方法
CN104281577A (zh) * 2013-07-02 2015-01-14 威盛电子股份有限公司 数据文件的排序方法
CN104281577B (zh) * 2013-07-02 2018-11-16 威盛电子股份有限公司 数据文件的排序方法
CN104281576B (zh) * 2013-07-02 2018-08-31 威盛电子股份有限公司 地标数据的显示方法
CN104462143A (zh) * 2013-09-24 2015-03-25 高德软件有限公司 连锁品牌词词库、类别词词库建立方法和装置
CN104462143B (zh) * 2013-09-24 2018-01-30 高德软件有限公司 连锁品牌词词库、类别词词库建立方法和装置
CN104899200A (zh) * 2014-03-04 2015-09-09 高德软件有限公司 一种poi搜索反馈方法及装置
CN104317909B (zh) * 2014-10-27 2018-09-28 百度在线网络技术(北京)有限公司 兴趣点数据的校验方法和装置
CN104317909A (zh) * 2014-10-27 2015-01-28 百度在线网络技术(北京)有限公司 兴趣点数据的校验方法和装置
CN105786915A (zh) * 2014-12-25 2016-07-20 高德软件有限公司 一种poi重要度确定方法及装置
CN105069079A (zh) * 2015-07-31 2015-11-18 北京奇虎科技有限公司 筛选兴趣点poi数据的方法及装置
CN105222803A (zh) * 2015-10-20 2016-01-06 北京百度网讯科技有限公司 地图poi显示方法及终端
WO2017067211A1 (zh) * 2015-10-20 2017-04-27 北京百度网讯科技有限公司 地图poi显示方法及终端
CN105608112A (zh) * 2015-12-10 2016-05-25 北京奇虎科技有限公司 衡量地图poi数据的质量的方法和装置
CN105550330A (zh) * 2015-12-21 2016-05-04 北京奇虎科技有限公司 兴趣点poi信息排序的方法和***
CN105550330B (zh) * 2015-12-21 2020-09-11 北京奇虎科技有限公司 兴趣点poi信息排序的方法和***
CN107315750A (zh) * 2016-04-26 2017-11-03 斑马网络技术有限公司 电子地图图层显示方法、装置、终端设备和用户界面***
CN107315748A (zh) * 2016-04-26 2017-11-03 斑马网络技术有限公司 电子地图索引方法、装置、终端设备和用户界面***
CN107798018B (zh) * 2016-09-06 2020-04-10 高德软件有限公司 一种兴趣点显示信息的设置方法及装置
CN107798018A (zh) * 2016-09-06 2018-03-13 高德软件有限公司 一种兴趣点显示信息的设置方法及装置
CN107918512A (zh) * 2017-11-16 2018-04-17 携程旅游信息技术(上海)有限公司 酒店信息显示方法、装置、电子设备、存储介质
CN108984640A (zh) * 2018-06-22 2018-12-11 华北电力大学 一种基于web数据挖掘的地理信息获取方法
CN111026937A (zh) * 2019-11-13 2020-04-17 百度在线网络技术(北京)有限公司 提取poi名称的方法、装置、设备和计算机存储介质
US11768892B2 (en) 2019-11-13 2023-09-26 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for extracting name of POI, device and computer storage medium

Also Published As

Publication number Publication date
CN101350154B (zh) 2013-01-30

Similar Documents

Publication Publication Date Title
CN101350154A (zh) 一种电子地图数据的排序方法及装置
CN100405371C (zh) 一种提取新词的方法和***
CN101299217B (zh) 一种地图信息处理的方法、装置和***
CN1936893B (zh) 基于互联网信息的输入法词频库的生成方法和***
US10445346B2 (en) Custom local search
CN104881488B (zh) 基于关系表的可配置信息抽取方法
CN1924858B (zh) 一种获取新词的方法、装置以及一种输入法***
CN103365924B (zh) 一种互联网信息搜索的方法、装置和终端
CN101630314B (zh) 一种基于领域知识的语义查询扩展方法
CN101350013A (zh) 一种地理信息的搜索方法和***
CN102591867B (zh) 一种基于移动设备位置的搜索服务方法
CN104463730A (zh) 基于旅游目标地域来挖掘旅游路线的方法和设备
CN106682169A (zh) 一种应用标签挖掘方法、装置和应用搜索方法、服务器
CN101794277B (zh) 一种网络文字信息中嵌入地理标签的方法及***
CN103106287A (zh) 一种用户检索语句的处理方法及***
CN102541936A (zh) 兴趣点流行度获取方法和装置
CN106682170A (zh) 一种应用搜索方法和装置
JP2022532451A (ja) 百科知識ベースと単語の埋め込みに基づく中国語地名語義の曖昧性解消方法
CN103902521A (zh) 一种中文语句识别方法和装置
CN112527933A (zh) 一种基于空间位置和文本训练的中文地址关联方法
CN103886020A (zh) 一种房地产信息快速搜索方法
CN103186556A (zh) 得到和搜索结构化语义知识的方法及对应装置
CN106649823A (zh) 基于综合主题词垂直搜索和聚焦爬虫的网页分类识别方法
CN116340541A (zh) 一种文博知识图谱***构建方法
CN102306182A (zh) 基于概念语义背景图挖掘用户兴趣的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: BEIJING SOHU NEW MEDIA INFORMATION TECHNOLOGY CO.,

Free format text: FORMER OWNER: SOGO SCIENCE-TECHNOLOGY DEVELOPMENT CO., LTD., BEIJING

Effective date: 20101020

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100084 ROOM 01, 9/F, SOHU.COM INTERNET PLAZA, BUILDING 9, YARD 1, ZHONGGUANCUN EAST ROAD, HAIDIAN DISTRICT, BEIJING TO: 100084 ROOM 802, 8/F, SOHU.COM INTERNET PLAZA, BUILDING 9, YARD 1, ZHONGGUANCUN EAST ROAD, HAIDIAN DISTRICT, BEIJING

TA01 Transfer of patent application right

Effective date of registration: 20101020

Address after: 100084 Beijing, Zhongguancun East Road, building 1, No. 9, Sohu cyber building, room 8, room, Room 802

Applicant after: Beijing Sohu New Media Information Technology Co., Ltd.

Address before: 100084 Beijing, Zhongguancun East Road, building 1, No. 9, Sohu cyber building, room 9, room, room 01

Applicant before: Sogo Science-Technology Development Co., Ltd., Beijing

C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: SOGO SCIENCE-TECHNOLOGY DEVELOPMENT CO., LTD., BEI

Free format text: FORMER OWNER: BEIJING SOHU NEW MEDIA INFORMATION TECHNOLOGY CO., LTD.

Effective date: 20130902

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20130902

Address after: 100084 Beijing, Zhongguancun East Road, building 1, No. 9, Sohu cyber building, room 9, room, room 01

Patentee after: Sogo Science-Technology Development Co., Ltd., Beijing

Address before: 100084 Beijing, Zhongguancun East Road, building 1, No. 9, Sohu cyber building, room 8, room, Room 802

Patentee before: Beijing Sohu New Media Information Technology Co., Ltd.