CN103049481B - 一种搜索方法和搜索设备 - Google Patents

一种搜索方法和搜索设备 Download PDF

Info

Publication number
CN103049481B
CN103049481B CN201210500477.7A CN201210500477A CN103049481B CN 103049481 B CN103049481 B CN 103049481B CN 201210500477 A CN201210500477 A CN 201210500477A CN 103049481 B CN103049481 B CN 103049481B
Authority
CN
China
Prior art keywords
region
user
sequence
search
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210500477.7A
Other languages
English (en)
Other versions
CN103049481A (zh
Inventor
田园
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201210500477.7A priority Critical patent/CN103049481B/zh
Publication of CN103049481A publication Critical patent/CN103049481A/zh
Application granted granted Critical
Publication of CN103049481B publication Critical patent/CN103049481B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种搜索方法,该方法包括:a)接收用户的查询序列;b)判断所述查询序列是否具有地域性;c)判断是否可以从所述查询序列中提取出地域词;d)对所述查询序列、以及所述一个或者多个查询扩展序列进行匹配搜索,获取相应的搜索结果;e)将所述搜索结果提供给所述用户。相应地,还提供了一种搜索设备。本发明的优点在于,可以针对于用户地域性提供搜索结果,同时该搜索结果还可以满足用户多维度的需求。

Description

一种搜索方法和搜索设备
技术领域
本发明涉及搜索引擎技术,尤其涉及一种搜索方法和搜索设备。
背景技术
在现有技术中,用户在搜索引擎中输入查询请求后,搜索引擎在互联网上对该查询请求进行匹配搜索,并将搜索到的结果展示给用户。由于互联网的资源非常丰富,所以搜索引擎技术的使用在一定程度上为用户带来了极大的便利性。但是,目前的搜索引擎技术仍然存在如下的不足之处:
(1)无论用户在哪里,只要用户使用同一个搜索引擎对相同的查询请求进行搜索,搜索引擎获取到的搜索结果都是一样的,但实际上,有些查询请求是具有地域性的,即,位于不同地域的用户尽管使用相同的查询请求,但其所期望的搜索结果是不同的。在这种情况下,目前的搜索引擎技术便无法满足不用地域用户的搜索需求了,用户需要输入更为详细的查询请求或者在搜索结果中通过多次点击寻找其所需的信息,从而给用户带来了一定的不便利性。例如,北京的用户和四川的用户均使用“到杭州的航班”进行搜索,其中,北京的用户希望获得从北京到杭州的航班信息,而四川的用户则希望获得从四川到杭州的航班信息,现有的搜索引擎通过对查询请求进行匹配搜索后,提供了可以查询“到杭州的航班”的相关网址,北京的用户和四川的用户在进入到目标网站内后,需要分别选择或者输入“北京”和“四川”才能获取到其需要的信息,如此一来,不但搜索效率低下,且用户的体验也不好。
(2)用户在进行搜索的过程中,其需求往往不是单一维度的,这体现在用户通常会使用具有关联性的一系列查询请求进行搜索,以获取全面的信息。现有的搜索引擎所提供的搜索结果,仅仅是针对于用户所输入的查询请求进行匹配搜索的,所以,当用户的需求是多维度的时候,用户需要逐一输入查询请求进行搜索,操作繁琐且效率低下。例如,用户想去杭州西湖旅游,希望通过网络可以获取到杭州西湖的旅游攻略、去杭州的列车时刻表、杭州西湖附近的旅馆信息、甚至是杭州近期的天气状况,在现有技术中,用户需要在搜索引擎中先输入“杭州西湖旅游攻略”,在获取了其需要的信息后,再继续逐一输入“杭州火车”、“杭州西湖旅馆”以及“杭州天气预报”进行搜索。由此可以看出,现有的搜索引擎技术无法智能地满足用户具有关联性的多维度需求。
基于上述两个问题,亟需提供一种搜索需求的方法和设备,希望通过该方法和设备所得到的搜索结果,不但可以针对于用户的地域性,同时还可以满足用户多维度的需求。
发明内容
本发明的目的是提供一种可以解决上述问题的搜索方法和搜索设备。
根据本发明的一个方面,提供了一种搜索方法,该方法包括以下步骤:
a)接收用户的查询序列;
b)判断所述查询序列是否具有地域性,如果具有,则获取所述用户的当前地理位置后至步骤c);如果不具有,则对所述查询序列进行匹配搜索后至步骤e);
c)判断是否可以从所述查询序列中提取出地域词,如果可以,则提取出所述地域词,并基于所述当前地理位置和地域词对所述查询序列进行扩展处理,以获取一个或者多个查询扩展序列;如果不可以,则基于所述当前地理位置对所述查询序列进行扩展处理,以获取一个或者多个查询扩展序列;
d)对所述查询序列、以及所述一个或者多个查询扩展序列进行匹配搜索,获取相应的搜索结果;
e)将所述搜索结果提供给所述用户。
根据本发明的另一个方面,还提供了一种搜索设备,该设备包括:
请求接收装置,用于接收用户的查询序列;
地域判断装置,用于判断所述查询序列是否具有地域性、以及用于判断是否可以从所述查询序列中提取出地域词;
地域获取装置,用于获取所述用户的当前地理位置、以及用于从所述查询序列中提取出地域词;
查询扩展装置,用于基于所述当前地理位置和/或地域词对所述查询序列进行扩展处理,以获取一个或者多个查询扩展序列;
匹配搜索装置,用于对所述查询序列、以及所述一个或者多个查询扩展序列进行匹配搜索,获取相应的搜索结果;
结果提供装置,用于将所述搜索结果提供给所述用户。
与现有技术相比,本发明具有以下优点:对于不同地域的用户,基于所述用户的当前地理位置对其查询序列智能地进行扩展,以获取可能反映所述用户多维度查询需求的查询扩展序列,然后通过对所述用户的查询序列以及查询扩展序列进行匹配搜索,获得相应的搜索结果并提供给所述用户。利用本发明所得到的搜索结果,可以满足不同地域用户的多维度查询需求,具有一定的针对性,且无需用户输入繁琐的查询序列、或者多次输入查询序列进行搜索,从而可以有效地减少用户的操作步骤,提高搜索效率,令用户具有良好的使用体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为根据本发明一个方面的搜索方法流程图;
图2为一个优选实施例的判断用户查询序列是否具有地域性的方法流程图;
图3(a)为一个优选实施例的特定展示搜索结果显示示意图;
图3(b)和图3(c)为另一个优选实施例的特定展示搜索结果显示示意图;以及
图4为根据本发明另一个方面的搜索设备示意图。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1为根据本发明一个方面的搜索方法流程图,如图所示,该方法包括以下步骤:
步骤S101,接收用户的查询序列。
具体地,获取用户在计算机的搜索引擎中或者移动终端的搜索引擎中所输入的查询序列,其中,该查询序列通常为文字序列、数字序列、符号序列中的一种或其任意组合,例如,“天气预报”、“360安全卫士下载”、“建党伟业什么时候上映?”等。
步骤S102,判断所述查询序列是否具有地域性。
具体地,请参考图2,图2为一个优选实施例的判断用户查询序列是否具有地域性的方法流程图。如图所示,首先执行步骤S1021,在接收用户的查询序列后,对所述查询序列进行拆词处理,去除副词、助词、语气词等不具有实际意义的词,以获得一个或者多个中心词。举例说明,如果用户的查询序列为“兵马俑一日游”,经过拆词处理后,可以得到“兵马俑”和“一日游”两个中心词,“协和医院如何预约挂号?”可以拆分为“协和医院”和“预约挂号”两个中心词,“团购网站”可以拆分为“团购”和“网站”两个中心词,而“蓝精灵影评”则可以拆分为“蓝精灵”和“影评”两个中心词。
然后执行步骤S1022,在所述地域词条库中对所述一个或者多个中心词进行匹配,如果该一个或者多个中心词不存在于所述地域词条库中,则判断所述查询序列不具有地域性,否则判断所述查询序列具有地域性。其中,所述地域词条库为预先建立的数据库,其包括了大量具有地域性的词条,即,这些词条和地域具有一定的关联性,例如,“北京”、“兵马俑”、“故宫”、“团购”、“租房”、“天气”等。所述地域性词条通常可以分为两类,其中一类是可以关联到特定地域的词条,即,所述地域词条只和某一个或者某些地域相关,而和其他地域无关,例如,“北京”本身就是地名,所以“北京”的关联即为其自身,而“兵马俑”可以关联到“西安”,“故宫”可以关联到“北京”或者“沈阳”;另外一类是具有普遍地域性的词条,这些词条和所有地域均有关联,但又依赖于地域的差异性,例如“团购”、“租房”以及“天气”。针对于地域性词条的上述特性,对所述地域词条库中的词条进行分析,如果所述词条具有特定的地域性,则将所述词条与相应的地域名称相关联,并将这种对应关系、以及关联后的地域名称记录至所述地域词条库中,用于后续步骤中提取查询序列的地域信息,例如,对“北京”、“兵马俑”、“故宫”、“团购”、“租房”、“天气”进行关联后,会生成“北京-北京”、“兵马俑-西安”、“故宫-北京/沈阳”、“团购”、“租房”以及“天气”。在判断用户的查询序列是否具有地域性的时候,只需要判断拆分后的查询序列是否包含所述地域词条库中的词条即可,仍以上述查询序列“兵马俑一日游”、“协和医院如何预约挂号?”、“团购网站”和“蓝精灵影评”为例,中心词“兵马俑”、“协和医院”和“团购”在所述地域词条库中可以匹配成功,所以可以判断出“兵马俑一日游”、“协和医院如何预约挂号?”和“团购网站”具有一定的地域性,而“蓝精灵影评”则和地域无关。
优选地,为了可以准确地判断用户的查询序列是否具有地域性,需要定期对所述地域词条库进行更新,以确保所述地域词条库中的词条的全面性以及时效性。
执行步骤S102后,如果判断所述查询序列不具有地域性,则执行步骤S103,对所述查询序列进行搜索匹配,即,无需对查询序列进行任何地域关联,直接使用该查询序列进行搜索,以获得相应的搜索结果。获得相应的搜索结果后,执行步骤S110,将所述搜索结果提供给所述用户。
执行步骤S102后,如果判断所述查询序列具有地域性,则执行步骤S104,获取所述用户的当前地理位置。
具体地,如果用户通过计算机的搜索引擎进行查询,则根据所述用户的IP地址获取该用户的当前地理位置;如果用户通过移动终端的搜索引擎进行查询,则根据该用户周边基站所提供的信息或者根据移动终端内的GPS模块所提供的信息,确认该用户的当前地理位置。其中,所述当前地理位置可以是国家、省份、城市中的一种或者其任意组合。
接着,执行步骤S105,判断是否可以从所述查询序列中提取出地域词。
具体地,对于在步骤S102中匹配成功的所述中心词,如果在所述地域词条库中存在与所述中心词相关联的地域名称,则判断可以从所述查询序列中提取出地域词,否则判断不可以从所述查询序列中提取出地域词。仍以上述查询序列“兵马俑一日游”、“协和医院如何预约挂号?”、“团购网站”和“蓝精灵影评”为例,拆分后的中心词“兵马俑”、“协和医院”以及“团购”存在于地域词条库中,即具有地域性,进一步发现,其中,所述中心词“兵马俑”和“协和医院”具有特定的关联地域,分别为“西安”和“北京”,所以可以判定从查询序列“兵马俑一日游”和“协和医院就医”中能够提取出和该查询序列相关联的地域信息,而“团购”没有特定的关联地域,所以无法提取出地域词。
执行步骤S105后,如果无法提取具体的地域词,则执行步骤S106,基于所述当前地理位置对所述查询序列进行扩展处理,以获取一个或者多个查询扩展序列;如果可以提取到具体的地域词,则执行步骤S107,提取出所述地域词,以及执行步骤S108,基于所述当前地理位置和地域词对所述查询序列进行扩展处理,以获取一个或者多个查询扩展序列。下面对于这两种情况分别进行说明。
具体地,通过对大量用户的历史查询路径进行统计分析建立用户查询模型,其中,所述历史查询路径包括用户在一次完整查询的过程中所输入的查询序列、搜索结果的点击结果、在网页内鼠标的轨迹、以及用户在网页内停留的时间等。用户在一次完整的查询过程中,通常是针对一个主题的多方需求进行搜索,这些需求以该主题为中心,其间相互关联,例如,用户对天气状况进行查询的过程中,除了具体的天气预报,还会了解今日/明日的各项生活指数,如穿衣指数、洗车指数、运动指数等,即,天气为用户的查询主题,而天气预报、生活指数为查询需求。当对同一个主题的大量用户的历史查询路径进行统计分析后,可以提取出用户针对于该主题最常体现出的查询需求。对于不同主题的查询需求建立子模型,将大量子模型集合在一起就构成了所述用户查询模型。每个子模型下面的查询需求,与一个或者多个关键词相对应,其中,该一个或者多个关键词是针对于所述查询需求用户使用频率最高的历史查询序列。当用户输入查询序列对某一主题进行查询的时候,基于用户查询模型中相关主题的子模型,对用户的查询序列进行扩展所获得的查询扩展序列(即子模型下的关键词),在一定程度上可以满足大部分用户的查询需求。
仍以上述天气为例,关于“天气”的子模型包括“天气”和“生活指数”两个查询需求,其中,查询需求“天气”下的关键词为“天气预报”,查询需求“生活指数”下的关键词为“生活指数”。
又例如,针对于旅行这个主题,经统计分析发现,用户查询需求主要包括“旅游景点”、“交通方式”、“住宿”以及“餐饮”,其中,查询需求“旅游景点”下的关键词为“旅游攻略”、“景点介绍”和“门票”,查询需求“交通方式”下的关键词为“火车”、“航班”和“自驾”,查询需求“住宿”下的关键词为“旅馆”,而查询序列“餐饮”下的关键词为“饭馆”。
优选地,对于较大的查询主题,可以针对于该主题下每个子主题分别建立子模型,以更好地反映用户的实际查询需求。仍以旅游为例,可以针对于不同景点建立子模型,例如,对于“海南三亚”和“马尔代夫”两个主题,其查询需求是一样的,分别为“旅游景点”、“交通方式”、“住宿”以及“餐饮”,但是,对于主题“海南三亚”来说,查询需求“交通方式”下的关键词包括“火车”、“航班”和“自驾”,而主题“马尔代夫”下的关键词只包括“航班”。
优选地,还可以分别针对于每个地域的大量用户的历史查询路径进行统计分析而建立用户查询模型,以更准确地满足用户的查询需求。
优选地,为了可以准确地反映出用户的查询需求,需要对所述用户查询模型定期进行更新。
对于不可以提取出地域词的所述查询序列,基于用户查询模型和所述当前地理位置,对所述查询序列进行扩展,以获取一个或者多个查询扩展序列。例如,用户的查询序列为“天气”,该用户的当前地理位置为北京。基于用户查询模型和当前地理位置“北京”,对所述查询序列“天气”进行扩展后,可以获得“北京天气预报”以及“北京生活指数”两个查询扩展序列。
对于可以提取出地域词的所述查询序列,在地域词条库中获取与所述查询序列中心词相关联的地域名称作为地域词,然后,基于用户查询模型、用户的当前地理位置、以及从所述查询序列中提取出的地域词,对所述查询序列进行扩展,以获取一个或者多个查询扩展序列。例如,用户的查询序列为“兵马俑一日游”,该用户的当前地理位置为北京,根据拆分后的中心词为“兵马俑”和“一日游”,可以从所述查询序列中提取出地域词“西安”。基于用户查询模型、当前地理位置“北京”以及地域词“西安”,对所述查询序列进行扩展后,得到如下查询扩展序列,即,“兵马俑旅游路线”、“兵马俑门票”、“北京到西安的火车”、“北京到西安的航班”、“西安景点”以及“西安旅馆”。
在执行步骤S106或者步骤S108后,即获取了一个或者多个查询扩展序列之后,继续执行步骤S109,对所述查询序列、以及一个或者多个查询扩展序列进行匹配搜索,获取相应的搜索结果。
具体地,在资源库中以及互联网的网页中,对所述查询序列、以及一个或者多个查询扩展序列进行匹配搜索,以获取相关的搜索结果。其中,所述资源库是预先建立的,包括了经过验证的准确且合法的资源,从而可以保证搜索结果的准确性以及安全性,而互联网的网页由于包含了极其丰富的资源,从而可以保证搜索结果的全面性。在其他实施例中,也可以仅仅在资源库中、或者仅仅在互联网的网页中进行搜索。
所述搜索结果可以是数据资源,也可以是应用资源。所述数据资源为文字、图片、URL、数字、符号中的一种或其任意组合,而所述应用资源为具有交互性的应用程序。例如,针对于查询序列“兵马俑一日游”进行搜索,得到的搜索结果中包括关于兵马俑的文字介绍、图片、相关网站的地址、以及兵马俑视频,其中,所述文字介绍、图片以及相关网站的地址为数据资源,而兵马俑视频为应用资源。
最后,执行步骤S110,将所述搜索结果提供给所述用户。
具体地,基于所述用户查询模型,对所述搜索结果进行排序,并将排序后的所述搜索结果进行显示。针对于用户查询序列所搜索到的结果通常放在最前面位置,以直接满足用户的查询需求,针对于查询扩展序列所搜索到的结果依次放在后面的位置,以满足用户其他相关联的查询需求。当存在多个查询扩展序列的时候,可以依据用户查询模型中大量用户对其查询需求的搜索顺序,对搜索结果进行相应地排序。
在显示方式上,可以采用传统URL结果和特定展示结果进行展示,将搜索结果提供给用户。其中,所述特定展示结果的形式是相对搜索引擎的传统搜索结果展示形式而言,通常搜索引擎的传统搜索结果展示形式为在搜索结果页中逐条展示URL结果,而所述特定展示结果是将搜索得到的优质资源放在同一条显示结果内,例如,从资源库中获取到的资源或者经统计用户点击率较高的资源,且特定展示结果通常在传统URL结果之前进行展示,其展现形式可以参考图3(a)、图3(b)和图3(c)中方框圈起的部分所示,当然,本领域的技术人员可以理解,特定展示结果的形式不限于此,其他可以将优质资源进行集中显示、且不同于传统URL结果的展示形式都可以作为特定展示结果。在其他实施例中,也可以仅采用特定展示结果或者仅采用传统URL结果进行显示。
针对于特定展示结果这种显示形式,当所述搜索结果较少的时候,所述搜索结果依序显示即可,用户很直观地就可以看到所有搜索结果,如图3(a)中方框圈起的部分所示,上部分为具体的天气情况,下部分为各项生活指数;当所述搜索结果较多的时候,可以在一条显示结果中以分页的形式进行显示,如图3(b)和图3(c)中方框圈起的部分所示,首先参考图3(b),搜索结果可以反映用户四个方面的查询需求,即,“景点介绍”、“交通方式”、“旅馆住宿”以及“特色餐饮”,对应于每个查询需求的搜索结果对应于一个标签,其中,标签“景点介绍”中的内容是根据查询序列“兵马俑一日游”搜索得到的,位于最前面显示给用户,而标签“交通方式”、“旅馆住宿”以及“特色餐饮”中的内容被隐藏,对应于用户其他的查询需求。当用户查看完景点介绍后,希望查看其他查询需求的对应内容时,只需点击标签即可查看到相应的搜索结果,例如,用户希望查看如何去西安,则点击标签“交通方式”即可查看到北京到西安的列车时刻表及票价查询、以及北京到西安的机票查询,如图3(c)方框中圈起的部分所示。如此一来,用户可以清晰且有层次地看到不同查询需求所对应的内容,而且,搜索结果在一屏之内即可显示完整,用户只需简单点击标签,而无需通过滑动鼠标或者操作键盘来滚动页面或者进行翻页,从而有效地简化了用户的操作,且用户体验好。在其他实施例中,对于特定展示结果这种显示形式,还可以存在其他布局方式,在此不再一一列举。
与现有技术相比,本发明对于不同地域的用户,基于该用户的当前地理位置对其查询序列智能地进行扩展,以获取可能反映所述用户多维度查询需求的查询扩展序列,然后通过对所述用户的查询序列以及查询扩展序列进行匹配搜索,获得相应的搜索结果并提供给所述用户。利用本发明所得到的搜索结果,可以满足不同地域用户的多维度查询需求,具有一定的针对性,且无需用户输入繁琐的查询序列、或者多次输入查询序列进行搜索,从而可以有效地减少用户的操作步骤,提高搜索效率,令用户具有良好的使用体验。
相应地,本发明还提供了一种搜索设备,请参考图4。如图所示,该设备包括请求接收装置401、地域判断装置402、地域获取装置403、查询扩展装置404、匹配搜索装置405以及结果提供装置406,下面,对上述装置的具体工作过程进行说明。
首先,所述请求接收装置401,用于接收用户在计算机的搜索引擎中或者移动终端的搜索引擎中所输入的查询序列,其中,该查询序列通常为文字序列、数字序列、符号序列中的一种或其任意组合。
接着,所述地域判断装置402,用于判断所述查询序列是否具有地域性。
具体地,在接收用户的查询序列后,所述地域判断装置402对所述查询序列进行拆词处理,去除副词、助词、语气词等不具有实际意义的词,以获得一个或者多个中心词。举例说明,如果用户的查询序列为“兵马俑一日游”,经过所述地域判断装置402拆词处理后,可以得到“兵马俑”和“一日游”两个中心词,“协和医院如何预约挂号?”可以拆分为“协和医院”和“预约挂号”两个中心词,“团购网站”可以拆分为“团购”和“网站”两个中心词,而“蓝精灵影评”则可以拆分为“蓝精灵”和“影评”两个中心词。然后,所述地域判断装置402在所述地域词条库50中对所述一个或者多个中心词进行匹配,如果该一个或者多个中心词不存在于所述地域词条库50中,则所述地域判断装置402判断所述查询序列不具有地域性,否则判断所述查询序列具有地域性。其中,所述地域词条库50为词条库建立装置407预先建立的数据库,其包括了大量具有地域性的词条,即,这些词条和地域具有一定的关联性,例如,“北京”、“兵马俑”、“故宫”、“团购”、“租房”、“天气”等。所述地域性词条通常可以分为两类,其中一类是可以关联到特定地域的词条,即,所述地域词条只和某一个或者某些地域相关,而和其他地域无关,例如,“北京”本身就是地名,所以“北京”的关联即为其自身,而“兵马俑”可以关联到“西安”,“故宫”可以关联到“北京”或者“沈阳”;另外一类是具有普遍地域性的词条,这些词条和所有地域均有关联,但又依赖于地域的差异性,例如“团购”、“租房”以及“天气”。针对于地域性词条的上述特性,所述词条库建立装置407对所述地域词条库50中的词条进行分析,如果所述词条具有特定的地域性,则所述词条库建立装置407将所述词条与相应的地域名称相关联,并将这种对应关系、以及关联后的地域名称记录至所述地域词条库50中,用于后续所述地域获取装置403提取查询序列的地域信息,例如,对“北京”、“兵马俑”、“故宫”、“团购”、“租房”、“天气”进行关联后,会生成“北京-北京”、“兵马俑-西安”、“故宫-北京/沈阳”、“团购”、“租房”以及“天气”。所述地域判断装置402在判断用户的查询序列是否具有地域性的时候,只需要判断拆分后的查询序列是否包含所述地域词条库50中的词条即可,仍以上述查询序列“兵马俑一日游”、“协和医院如何预约挂号?”、“团购网站”和“蓝精灵影评”为例,中心词“兵马俑”、“协和医院”和“团购”在所述地域词条库50中可以匹配成功,所以所述地域判断装置402可以判断出“兵马俑一日游”、“协和医院如何预约挂号?”和“团购网站”具有一定的地域性,而“蓝精灵影评”则和地域无关。
优选地,为了可以准确地判断用户的查询序列是否具有地域性,所述词条库建立装置407需要定期对所述地域词条库50进行更新,以确保所述地域词条库50中的词条的全面性以及时效性。
如果所述地域判断装置402判断所述查询序列不具有地域性,则所述匹配搜索装置405对所述查询序列进行搜索匹配,即,无需对查询序列进行任何地域关联,直接使用该查询序列进行搜索,以获得相应的搜索结果。所述匹配搜索装置405获得相应的搜索结果后,所述结果提供装置406将所述搜索结果提供给所述用户。
如果所述地域判断装置402判断所述查询序列具有地域性,则所述地域获取装置403获取所述用户的当前地理位置。具体地,如果用户通过计算机的搜索引擎进行查询,则所述地域获取装置403根据所述用户的IP地址获取该用户的当前地理位置;如果用户通过移动终端的搜索引擎进行查询,则所述地域获取装置403根据该用户周边基站所提供的信息或者根据移动终端内的GPS模块所提供的信息,确认该用户的当前地理位置。其中,所述当前地理位置可以是国家、省份、城市中的一种或者其任意组合。
然后,所述地域判断装置402,判断是否可以从所述查询序列中提取出地域词。具体地,对于匹配成功的所述中心词,如果在所述地域词条库50中存在与所述中心词相关联的地域名称,则所述地域判断装置402判断可以从所述查询序列中提取出地域词,否则判断不可以从所述查询序列中提取出地域词。仍以上述查询序列“兵马俑一日游”、“协和医院如何预约挂号?”、“团购网站”和“蓝精灵影评”为例,拆分后的中心词“兵马俑”、“协和医院”以及“团购”存在于地域词条库50中,即具有地域性。进一步发现,其中,所述中心词“兵马俑”和“协和医院”具有特定的关联地域,分别为“西安”和“北京”,所以所述地域判断装置402可以判定从查询序列“兵马俑一日游”和“协和医院就医”中能够提取出和该查询序列相关联的地域信息,而“团购”没有特定的关联地域,所以无法提取出地域词。
如果所述地域判断装置402判断无法提取具体的地域词,则所述查询扩展装置404仅基于所述当前地理位置对所述查询序列进行扩展处理,以获取一个或者多个查询扩展序列;如果所述地域判断装置402判断可以提取到具体的地域词,则所述地域获取装置403提取出所述地域词,以及所述查询扩展装置404基于所述当前地理位置和所述提取出的地域词对所述查询序列进行扩展处理,以获取一个或者多个查询扩展序列。下面对于这两种情况分别进行说明。
具体地,模型建立装置408通过对大量用户的历史查询路径进行统计分析建立用户查询模型,其中,所述历史查询路径包括用户在一次完整查询的过程中所输入的查询序列、搜索结果的点击结果、在网页内鼠标的轨迹、以及用户在网页内停留的时间等。用户在一次完整的查询过程中,通常是针对一个主题的多方需求进行搜索,这些需求以该主题为中心,其间相互关联,例如,用户对天气状况进行查询的过程中,除了具体的天气预报,还会了解今日/明日的各项生活指数,如穿衣指数、洗车指数、运动指数等,即,天气为用户的查询主题,而天气预报、生活指数为查询需求。当所述模型建立装置408对同一个主题的大量用户的历史查询路径进行统计分析后,可以提取出用户针对于该主题最常体现出的查询需求。对于不同主题的查询需求建立子模型后,所述模型建立装置408将大量子模型集合在一起就构成了所述用户查询模型。每个子模型下面的查询需求,与一个或者多个关键词相对应,其中,该一个或者多个关键词是针对于所述查询需求用户使用频率最高的历史查询序列。当用户输入查询序列对某一主题进行查询的时候,所述查询扩展装置404基于用户查询模型中相关主题的子模型,对用户的查询序列进行扩展所获得的查询扩展序列(即子模型下的关键词),在一定程度上可以满足大部分用户的查询需求。
仍以上述天气为例,关于“天气”的子模型包括“天气”和“生活指数”两个查询需求,其中,查询需求“天气”下的关键词为“天气预报”,查询需求“生活指数”下的关键词为“生活指数”。
又例如,针对于旅行这个主题,所述模型建立装置408经统计分析发现,用户查询需求主要包括“旅游景点”、“交通方式”、“住宿”以及“餐饮”,其中,查询需求“旅游景点”下的关键词为“旅游攻略”、“景点介绍”和“门票”,查询需求“交通方式”下的关键词为“火车”、“航班”和“自驾”,查询需求“住宿”下的关键词为“旅馆”,而查询序列“餐饮”下的关键词为“饭馆”。
优选地,对于较大的查询主题,所述模型建立装置408可以针对于该主题下每个子主题分别建立子模型,以更好地反映用户的实际查询需求。仍以旅游为例,所述模型建立装置408可以针对于不同景点建立子模型,例如,对于“海南三亚”和“马尔代夫”两个主题,其查询需求是一样的,分别为“旅游景点”、“交通方式”、“住宿”以及“餐饮”,但是,对于主题“海南三亚”来说,查询需求“交通方式”下的关键词包括“火车”、“航班”和“自驾”,而主题“马尔代夫”下的关键词只包括“航班”。
优选地,所述模型建立装置408还可以分别针对于每个地域的大量用户的历史查询路径进行统计分析而建立用户查询模型,以更准确地满足用户的查询需求。
优选地,为了可以准确地反映出用户的查询需求,所述模型建立装置408需要对所述用户查询模型定期进行更新。
对于不可以提取出地域词的所述查询序列,所述查询扩展装置404基于用户查询模型和所述当前地理位置,对所述查询序列进行扩展,以获取一个或者多个查询扩展序列。例如,用户的查询序列为“天气”,该用户的当前地理位置为北京。所述查询扩展装置404基于用户查询模型和当前地理位置“北京”,对所述查询序列“天气”进行扩展后,可以获得“北京天气预报”以及“北京生活指数”两个查询扩展序列。
对于可以提取出地域词的所述查询序列,所述地域获取装置403在地域词条库50中获取与所述查询序列中心词相关联的地域名称作为地域词,然后,所述查询扩展装置404基于用户查询模型、用户的当前地理位置、以及从所述查询序列中提取出的地域词,对所述查询序列进行扩展,以获取一个或者多个查询扩展序列。例如,用户的查询序列为“兵马俑一日游”,该用户的当前地理位置为北京,根据拆分后的中心词为“兵马俑”和“一日游”,所述地域获取装置403可以从所述查询序列中提取出地域词“西安”。所述查询扩展装置404基于用户查询模型、当前地理位置“北京”以及地域词“西安”,对所述查询序列进行扩展后,得到如下查询扩展序列,即,“兵马俑旅游路线”、“兵马俑门票”、“北京到西安的火车”、“北京到西安的航班”、“西安景点”以及“西安旅馆”。
在所述查询扩展装置404获取了一个或者多个查询扩展序列之后,所述匹配搜索装置405对所述查询序列、以及一个或者多个查询扩展序列进行匹配搜索,获取相应的搜索结果。
具体地,在资源库51中以及互联网的网页中,所述匹配搜索装置405对所述查询序列、以及一个或者多个查询扩展序列进行匹配搜索,以获取相关的搜索结果。其中,所述资源库51是由资源库建立装置(未示出)预先建立的,包括了经过验证的准确且合法的资源,从而可以保证搜索结果的准确性以及安全性,而互联网的网页由于包含了极其丰富的资源,从而可以保证搜索结果的全面性。在其他实施例中,所述匹配搜索装置405也可以仅仅在资源库51中、或者仅仅在互联网的网页中进行搜索。
最后,所述结果提供装置406将所述搜索结果提供给所述用户。
具体地,所述结果提供装置406基于所述用户查询模型,对所述搜索结果进行排序,并将排序后的所述搜索结果进行显示。针对于用户查询序列所搜索到的结果通常放在最前面位置,以直接满足用户的查询需求,针对于查询扩展序列所搜索到的结果依次放在后面的位置,以满足用户其他相关联的查询需求。当存在多个查询扩展序列的时候,所述结果提供装置406可以依据用户查询模型中大量用户对其查询需求的搜索顺序,对搜索结果进行相应地排序。
在显示方式上,所述结果提供装置406可以采用传统URL结果和特定展示结果进行展示,将搜索结果提供给用户。其中,所述特定展示结果的形式是相对搜索引擎的传统搜索结果展示形式而言,通常搜索引擎的传统搜索结果展示形式为在搜索结果页中逐条展示URL结果,而所述特定展示结果是将搜索得到的优质资源放在同一条显示结果内,例如,从资源库51中获取到的资源或者经统计用户点击率较高的资源,且特定展示结果通常在传统URL结果之前进行展示,其展现形式可以参考图3(a)、图3(b)和图3(c)中方框圈起的部分所示,当然,本领域的技术人员可以理解,特定展示结果的形式不限于此,其他可以将优质资源进行集中显示、且不同于传统URL结果的展示形式都可以作为特定展示结果。在其他实施例中,也可以仅采用特定展示结果或者仅采用传统URL结果进行显示。
针对于特定展示结果这种显示形式,当所述搜索结果较少的时候,所述结果提供装置406可将所述搜索结果依序显示,用户很直观地就可以看到所有搜索结果,如图3(a)中方框圈起的部分所示,上部分为具体的天气情况,下部分为各项生活指数;当所述搜索结果较多的时候,所述结果提供装置406可将所述搜索结果整合在一条显示结果中并以分页的形式进行显示,如图3(b)和图3(c)中方框圈起的部分所示,首先参考图3(b),搜索结果可以反映用户四个方面的查询需求,即,“景点介绍”、“交通方式”、“旅馆住宿”以及“特色餐饮”,对应于每个查询需求的搜索结果对应于一个标签,其中,标签“景点介绍”中的内容是根据查询序列“兵马俑一日游”搜索得到的,位于最前面显示给用户,而标签“交通方式”、“旅馆住宿”以及“特色餐饮”中的内容被隐藏,对应于用户其他的查询需求,当用户查看完景点介绍后,希望查看其他查询需求的对应内容时,只需点击标签即可查看到相应的搜索结果,例如,用户希望查看如何去西安,则点击标签“交通方式”即可查看到北京到西安的列车时刻表及票价查询、以及北京到西安的机票查询,如图3(c)方框中圈起的部分所示。如此一来,用户可以清晰且有层次地看到不同查询需求所对应的内容,而且,搜索结果在一屏之内即可显示完整,用户只需简单点击标签,而无需通过滑动鼠标或者操作键盘来滚动页面或者进行翻页,从而有效地简化了用户的操作,且用户体验好。在其他实施例中,对于特定展示结果这种显示形式,还可以存在其他布局方式,在此不再一一列举。
实施上述具体实施方式,有效地解决了现有技术中出现的问题,本发明对于不同地域的用户,基于该用户的当前地理位置对其查询序列智能地进行扩展,以获取可能反映所述用户多维度查询需求的查询扩展序列,然后对所述用户的查询序列以及查询扩展序列进行匹配搜索,获得相应的搜索结果并提供给所述用户。利用本发明所得到的搜索结果,可以满足不同地域用户的多维度查询需求,具有一定的针对性,且无需用户输入繁琐的查询序列、或者多次输入查询序列进行搜索,从而可以有效地减少用户的操作步骤,提高搜索效率,令用户具有良好的使用体验。
本发明提供的搜索方法可以使用可编程逻辑器件结合来实现,也可以实施为计算机程序软件,例如根据本发明的实施例可以是一种计算机程序产品,运行该程序产品使计算机执行用于所示范的方法。所述计算机程序产品包括计算机可读存储介质,该介质上包含计算机程序逻辑或代码部分,用于实现所述搜索方法。所述计算机可读存储介质可以是被安装在计算机中的内置介质或者可从计算机主体拆卸的可移动介质(例如热拔插技术存储设)。所述内置介质包括但不限于可重写的非易失性存储器,例如RAM、ROM、快闪存储器和硬盘。所述可移动介质包括但不限于:光存储媒体(例如CD-ROM和DVD)、磁光存储媒体(例如MO)、磁存储媒体(例如盒带或移动硬盘)、具有内置的可重写的非易失性存储器的媒体(例如存储卡)和具有内置ROM的媒体(例如ROM盒)。
以上所揭露的仅为本发明的一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (18)

1.一种搜索方法,该方法包括以下步骤:
a)接收用户的查询序列;
b)判断所述查询序列是否具有地域性,如果具有,则获取所述用户的当前地理位置后至步骤c);否则,对所述查询序列进行匹配搜索后至步骤e);
c)判断是否可以从所述查询序列中提取出地域词,如果可以,则提取出所述地域词,并基于所述当前地理位置和地域词对所述查询序列进行扩展处理,以获取一个或者多个查询扩展序列;否则,基于所述当前地理位置对所述查询序列进行扩展处理,以获取一个或者多个查询扩展序列;
d)对所述查询序列、以及所述一个或者多个查询扩展序列进行匹配搜索,获取相应的搜索结果;
e)将所述搜索结果提供给所述用户。
2.根据权利要求1所述的方法,其中,获取所述用户的当前地理位置的步骤包括:
通过所述用户的IP地址或者所述用户周边基站的信息获取该用户的当前地理位置。
3.根据权利要求1或2所述的方法,还包括:
建立或更新地域词条库,其中,至少一些地域词条与特定地域名称相关联。
4.根据权利要求3所述的方法,其中,判断所述查询序列是否具有地域性的步骤包括:
对所述查询序列进行拆词处理,以获得一个或者多个中心词;
在所述地域词条库中对所述一个或者多个中心词进行匹配,如果该一个或者多个中心词不存在于所述地域词条库中,则判断所述查询序列不具有地域性,否则判断所述查询序列具有地域性。
5.根据权利要求4所述的方法,其中,判断是否可以从所述查询序列中提取出地域词的步骤包括:
对于匹配成功的所述中心词,如果在所述地域词条库中存在与所述中心词相关联的地域名称,则判断可以从所述查询序列中提取出地域词,否则判断不可以从所述查询序列中提取出地域词。
6.根据权利要求5所述的方法,其中,步骤c)还包括,基于用户查询模型,对所述查询序列进行扩展,以获取一个或者多个查询扩展序列。
7.根据权利要求6所述的方法,其中:
对大量用户的历史查询路径进行统计分析,建立或更新用户查询模型。
8.根据权利要求7所述的方法,其中,所述步骤e)包括:
基于所述用户查询模型,对所述搜索结果进行排序,并将排序后的所述搜索结果进行显示。
9.根据权利要求8所述的方法,其中,将排序后的所述搜索结果放在一条显示结果中进行展示。
10.一种搜索设备,该设备包括:
请求接收装置,用于接收用户的查询序列;
地域判断装置,用于判断所述查询序列是否具有地域性、以及用于判断是否可以从所述查询序列中提取出地域词;
地域获取装置,用于获取所述用户的当前地理位置、以及用于从所述查询序列中提取出地域词;
查询扩展装置,用于基于所述当前地理位置和/或地域词对所述查询序列进行扩展处理,以获取一个或者多个查询扩展序列;
匹配搜索装置,用于对所述查询序列、以及所述一个或者多个查询扩展序列进行匹配搜索,获取相应的搜索结果;以及
结果提供装置,用于将所述搜索结果提供给所述用户。
11.根据权利要求10所述的设备,其中:
所述地域获取装置通过所述用户的IP地址或者所述用户周边基站的信息获取该用户的当前地理位置。
12.根据权利要求10或11所述的设备,还包括:
词条库建立装置,用于建立或更新地域词条库,并将至少一些地域词条与特定地域名称相关联。
13.根据权利要求12所述的设备,其中:
所述地域判断装置对所述查询序列进行拆词处理,以获得一个或者多个中心词,并在所述地域词条库中对该一个或者多个中心词进行匹配,如果该一个或者多个中心词不存在于所述地域词条库中,则判断所述查询序列不具有地域性,否则判断所述查询序列具有地域性。
14.根据权利要求13所述的设备,其中:
对于匹配成功的所述中心词,所述地域判断装置检测在所述地域词条库中是否存在与该中心词相关联的地域名称,如果存在,则判断可以从所述查询序列中提取出地域词,否则判断不可以从所述查询序列中提取出地域词。
15.根据权利要求14所述的设备,其中:
所述查询扩展装置基于用户查询模型、以及所述当前地理位置和地域词,对所述查询序列进行扩展,以获取一个或者多个查询扩展序列。
16.根据权利要求15所述的设备,还包括:
模型建立装置,用于对大量用户的历史查询路径进行统计分析,建立或更新用户查询模型。
17.根据权利要求16所述的设备,其中:
所述结果提供装置,基于所述用户查询模型对所述搜索结果进行排序,并将排序后的所述搜索结果进行显示。
18.根据权利要求17所述的设备,其中:
所述结果提供装置将排序后的所述搜索结果放在一条显示结果中进行展示。
CN201210500477.7A 2012-11-29 2012-11-29 一种搜索方法和搜索设备 Active CN103049481B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210500477.7A CN103049481B (zh) 2012-11-29 2012-11-29 一种搜索方法和搜索设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210500477.7A CN103049481B (zh) 2012-11-29 2012-11-29 一种搜索方法和搜索设备

Publications (2)

Publication Number Publication Date
CN103049481A CN103049481A (zh) 2013-04-17
CN103049481B true CN103049481B (zh) 2016-03-02

Family

ID=48062122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210500477.7A Active CN103049481B (zh) 2012-11-29 2012-11-29 一种搜索方法和搜索设备

Country Status (1)

Country Link
CN (1) CN103049481B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104537070B (zh) * 2014-12-29 2019-07-02 广州神马移动信息科技有限公司 挖掘旅游目的地景点的方法和设备
CN106227876B (zh) * 2016-08-02 2020-03-10 百度在线网络技术(北京)有限公司 一种活动安排辅助决策方法和装置
CN106294856A (zh) * 2016-08-23 2017-01-04 盛玉伟 房屋app中房屋匹配方法及***
CN106354852A (zh) * 2016-09-02 2017-01-25 北京百度网讯科技有限公司 基于人工智能的搜索方法及装置
CN111310008A (zh) * 2020-03-20 2020-06-19 北京三快在线科技有限公司 搜索意图识别方法、装置、电子设备和存储介质
CN113239293A (zh) * 2021-05-10 2021-08-10 北京百度网讯科技有限公司 确定搜索结果的方法、设备、介质及程序产品
CN113297456B (zh) * 2021-05-20 2023-04-07 北京三快在线科技有限公司 搜索方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101313300A (zh) * 2005-08-30 2008-11-26 谷歌公司 本地搜索
CN102262651A (zh) * 2010-05-27 2011-11-30 微软公司 基于位置知晓的查询的事件检索和警告

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101313300A (zh) * 2005-08-30 2008-11-26 谷歌公司 本地搜索
CN102262651A (zh) * 2010-05-27 2011-11-30 微软公司 基于位置知晓的查询的事件检索和警告

Also Published As

Publication number Publication date
CN103049481A (zh) 2013-04-17

Similar Documents

Publication Publication Date Title
CN103049481B (zh) 一种搜索方法和搜索设备
Marine-Roig et al. Tourism analytics with massive user-generated content: A case study of Barcelona
CN102253936B (zh) 记录用户访问商品信息的方法及搜索方法和服务器
CN102779140B (zh) 一种关键词获取方法及装置
US8682882B2 (en) System and method for automatically identifying classified websites
CN104102639B (zh) 基于文本分类的推广触发方法和装置
CN111522901B (zh) 文本中地址信息的处理方法及装置
CN105224554A (zh) 推荐搜索词进行搜索的方法、***、服务器和智能终端
CN107657048A (zh) 用户识别方法及装置
CN103294781A (zh) 一种用于处理页面数据的方法与设备
CN103544178A (zh) 一种用于提供与目标页面相对应的重构页面的方法和设备
CN104899220A (zh) 应用程序推荐方法和***
CN101529372A (zh) 使用地址完成的本地搜索
CN107861753B (zh) App生成索引、检索方法和***及可读存储介质
CN106293119A (zh) 一种在输入法中进行信息推荐的方法与装置
CN105547306A (zh) 一种路线推送方法及***
CN101420481A (zh) 一种终端分屏显示的方法和装置
CN110019645A (zh) 索引库构建方法、搜索方法及装置
CA2709116A1 (en) Method and system for enabling location entry
CN102646124A (zh) 一种自动识别地址信息的方法
CN102999511B (zh) 一种页面快速转换方法、装置和***
WO2011151179A1 (en) Method and apparatus for performing extended search
CN104503988A (zh) 搜索方法及装置
CN102194000A (zh) 一种信息处理方法、装置及终端
CN108228802B (zh) 一种输入联想的推荐方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant