CN103034663A - 一种信息搜索方法和设备 - Google Patents

一种信息搜索方法和设备 Download PDF

Info

Publication number
CN103034663A
CN103034663A CN201110305094XA CN201110305094A CN103034663A CN 103034663 A CN103034663 A CN 103034663A CN 201110305094X A CN201110305094X A CN 201110305094XA CN 201110305094 A CN201110305094 A CN 201110305094A CN 103034663 A CN103034663 A CN 103034663A
Authority
CN
China
Prior art keywords
search
keyword sets
seller
obtains
search server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201110305094XA
Other languages
English (en)
Other versions
CN103034663B (zh
Inventor
郑南
杨帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201110305094.XA priority Critical patent/CN103034663B/zh
Publication of CN103034663A publication Critical patent/CN103034663A/zh
Priority to HK13106139.4A priority patent/HK1179372A1/zh
Application granted granted Critical
Publication of CN103034663B publication Critical patent/CN103034663B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种信息搜索方法和设备,该方法包括:搜索服务器接收携带有至少两个关键词组的搜索请求,其中每个关键词组中包括一个或多个关键词;搜索服务器根据搜索请求中的关键词组进行搜索,并记录搜索得到的对象及其所属的集合;搜索服务器提取在各关键词组对应的集合中都出现的集合,并从搜索得到的对象中获取属于该提取出的集合的对象;搜索服务器返回搜索结果,其中携带有该提取出的集合的信息和属于该提取出的集合的对象的信息。通过本申请,提高了搜索效率,减少了用户的搜索时间,并减少了用户端与服务器端的交互次数,降低了服务器的负担,同时减少了网络带宽的占用。

Description

一种信息搜索方法和设备
技术领域
本申请涉及通信领域,尤其涉及一种信息搜索方法和设备。
背景技术
目前的商品搜索服务器通过对需要查询的文本建立倒排索引来支持快速的文本查询。商品的查询流程如图1所示,包括:
步骤101,搜索服务器接收用户输入的查询关键词,并且还可接收过滤、统计、排序等其他条件;
步骤102,搜索服务器将查询关键词进行分词,然后使用分词后的每个词查询倒排表,对这些词的倒排表进行集合运算和位置关系计算,得到该查询关键词的最终商品信息列表;
步骤103,搜索服务器返回满足条件的商品信息,并且返回时还可在进行其他条件运算后,再返回给用户。
随着搜索技术和信息数量的发展,大型搜索集群架构被开发应用。大型搜索集群架构通常采用多行多列的方式来提供大规模高并发的搜索服务。大型搜索集群文档数很大,建库后索引很大,通常需要将其分成多份,放在多台搜索机器(searcher)上,如图2所示,由n台机器构成完整的一份索引。同时,由于同时进行搜索的用户数量庞大,一台机器无法提供这样高并发的搜索服务,所以需要由具有相同索引的m个搜索机器来共同提供服务,其中,具有相同索引的机器为1列(Col),共n列;每一行(Row)构成一份完整的索引,共m行。
大型搜索查询的基本过程结合图2所示,包括:
1、聚合设备(merger)接收一个搜索请求(query)后,从每列searcher中随机选取1台searcher(1列中每台被选取的概率基本相同,以实现负载均衡),并将query发送给选择出的这些searcher;
2、每台被选择出的searcher收到查询请求query后,将查询关键词进行分词,然后分词后的每个token(标记)查询其倒排表,并对这些token的倒排表进行集合运算和位置关系计算,得到该查询关键词的最终doclist(查询结果列表);再与其它查询条件做集合运算,然后进行一些统计、rank(等级划分)和排序后,将结果返回给merger;
3、merger收到每台searcher的返回结果后,进行汇总,然后将结果返回用户。
在目前的搜索架构下,无论是一般搜索还是大型搜索,能够满足使用一个或多个关键词查询同一商品信息。如果用户需要查询多个商品信息,则需要分别对该多个商品信息进行查询。随着搜索技术的发展,存在这样的应用需求,即用户需要购买多件商品,并期望找到一家同时出售所有商品的卖家进行购买。若要实现该需求,采用现有的搜索技术需要用户多次提交搜索请求进行信息搜索,从而导致用户操作复杂、网络资源开销较大、搜索效率较低。可见,现有搜索技术难以满足这种需求。
发明内容
本申请提供了一种信息搜索方法和设备,以提高搜索效率,降低服务器负担以及网络带宽的占用。
为了达到以上目的,本申请实施例提供一种信息搜索方法,包括:
搜索服务器接收携带有至少2个关键词组的搜索请求,其中每个关键词组中包括一个或多个关键词;
搜索服务器根据搜索请求中的关键词组进行搜索,并记录搜索得到的对象及其所属的集合;
搜索服务器提取在各关键词组对应的集合中都出现的集合,并从搜索得到的对象中获取属于该提取出的集合的对象;
搜索服务器返回搜索结果,其中携带有该提取出的集合的信息和属于该提取出的集合的对象的信息。
本申请实施例提供一种搜索服务器,包括:
请求接收模块,用于接收携带有至少2个关键词组的搜索请求,其中每个关键词组中包括一个或多个关键词;
搜索处理模块,根据所述请求接收模块接收到的搜索请求中的关键词组进行搜索,并记录搜索得到的对象及其所属的集合;
结果处理模块,提取在各关键词组对应的集合中都出现的集合,并从搜索得到的对象中获取属于该提取出的集合的对象;返回搜索结果,其中携带有该提取出的集合的信息和属于该提取出的集合的对象的信息。
与现有技术相比,本申请实施例至少具有以下优点:
本申请实施例中,搜索服务器根据获取到的关键词组中的各关键词搜索对应的对象及其所属的集合,并统计对各关键词组各自对应搜索到的对象所属的集合,以查找在各关键词组对应的集合中都出现的集合,作为搜索结果返回,从而能够满足现有技术中用户在需要购买多件商品时,查找一家同时出售所有商品的卖家进行购买的需求,这提高了搜索效率,减少了用户的搜索时间,并减少了用户端与服务器端的交互次数,降低了服务器的负担,同时减少了网络带宽的占用。
附图说明
图1是现有技术中商品的查询流程示意图;
图2是现有技术中大型搜索查询的基本过程示意图;
图3是本申请实施例一提供的搜索方法的流程示意图;
图4是本申请实施例一提供的搜索方法的具体实现过程示意图;
图5是本申请实施例一提供的搜索方法在大型搜索集群架构中应用时的流程示意图;
图6A是本申请实施例提供的搜索方法的搜索界面的示意图;
图6B~6D是本申请实施例提供的搜索方法的搜索结果示意图;
图7是本申请实施例二提供的搜索方法的流程示意图;
图8是本申请实施例三提供的搜索服务器的结构示意图。
具体实施方式
下面将结合本申请的实施例中的附图,对本申请的实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的其他实施例,都属于本申请的实施例保护的范围。
当用户希望通过一次搜索得到具有多种期望商品(或称目标商品)的卖家时,现有搜索技术无法满足用户的需要。类似的,当用户在一些杂志文献数据库内搜索杂志时,有可能需要搜索同时包括多篇特定文章(或称目标文章)的杂志,而每一篇特定文章都需要通过一个或多个关键词进行搜索,现有的搜索技术也无法满足用户的这种需要。
为了描述方便,以下将用户希望搜索得到的卖家或杂志称为集合,将卖家需要包括的商品或杂志需要包括的文章称为对象。
本申请的实施例中,允许用户一次性输入与多个对象分别对应的关键词组,该关键词组中包含一个或多个关键词;搜索服务器识别每一对象对应的关键词组,并分别根据每一对象对应的关键词组进行搜索,对搜索结果进行汇总,从中得到包括所有对象的集合。例如,搜索服务器可以在显示界面中同时向用户显示多个搜索框,每个搜索框中的关键词组对应一个对象;搜索服务器也可以在显示界面向用户显示单个搜索框,但要求用户输入时以特殊符号连接同一个关键词组内的各关键词以及各关键词组,如同一个关键词组中各关键词可以使用“*”连接;不同关键词组间使用“+”连接。
下面通过具体实施例对本申请提供的搜索方法进行进一步介绍。
实施例一
本申请实施例一提供的信息搜索流程可如图3所示,包括:
步骤301,搜索服务器接收携带多个关键词组的搜索请求,获取其中携带的关键词组。
步骤302,搜索服务器根据获取到的关键词组进行搜索,得到与各关键词组各自对应搜索到的对象及各对象所属的集合,并统计对各关键词组各自对应搜索到的对象所属的集合,判断是否存在在各关键词组对应的集合中都出现的集合,当判断结果为是时,执行步骤303。
步骤303,搜索服务器返回搜索结果,其中携带在各关键词组对应的集合中都出现的集合的信息及其所包含的对象的信息。
本实施例中,为了描述清楚,以对象为商品信息(以下实施例中描述为商品)且集合为卖家ID(以下实施例中描述为卖家)为例,介绍步骤302-303的具体实现过程,如图4所示,包括:
步骤401,搜索服务器选择一种商品的关键词组。
需要说明,搜索服务器不会重复选择同种商品的关键词组。
步骤402,搜索服务器根据选择的商品的关键词组进行搜索,得到对应的商品以及卖家。
步骤403,如果当前是第一次搜索,则记录搜索得到的商品以及卖家;否则,搜索服务器比较搜索得到的卖家与当前记录的卖家,若当前记录的卖家未出现在该搜索得到的卖家中,则删除当前记录的该卖家,并在当前记录的卖家均被删除时,结束搜索流程;若当前记录的卖家出现在搜索得到的集合中,则在当前记录的该卖家中添加搜索得到的该卖家中包含的商品。其中,第一次搜索即根据第一次选择的商品的关键词组进行的搜索。
具体地,搜索服务器根据搜索得到的卖家及商品,处理当前记录的卖家及商品,该过程可以通过但不限于下述方式实现:
步骤A、搜索服务器根据接收到的搜索请求中关键词组进行第一次搜索,得到并记录对象及各对象所属的集合;
步骤B、搜索服务器判断是否存在未被搜索的关键词组;若判断为是,则转至步骤C;否则,转至步骤F;
步骤C、搜索服务器选择一个未被搜索的关键词组,根据该关键词组进行搜索;
步骤D、搜索服务器判断搜索得到的集合中是否包括与当前记录的集合相同的集合;若判断为是,则转至步骤E;否则,转至步骤F;
步骤E、搜索服务器将搜索得到的相同集合中的对象添加到对应的当前记录的集合中,并在当前记录的集合中删除未包括在当前搜索得到的集合,得到更新后的当前记录的集合,并转至步骤B;
步骤F、流程结束。
下面结合具体实例对该流程进行更加详细的描述。
假设搜索服务器第一次搜索得到了卖家A及其商品A1、A2,卖家B及其商品B1,卖家C及其商品C1、C2;搜索服务器记录搜索得到的卖家及其商品。当搜索服务器根据其他关键词组进行搜索时,如第二次搜索,得到了卖家B及其商品B2、B3,以及卖家C及其商品C2、C3,搜索服务器比较搜索得到的卖家(B和C)和当前记录的卖家(A、B和C),发现当前记录的卖家A未出现在该搜索得到的卖家中,因此,删除当前记录的卖家A(由于该搜索得到的卖家中没有卖家A,则卖家A不可能在各关键词组对应的集合中均出现);而由于当前记录的卖家B和C出现在该搜索得到的卖家中,因此,根据将该搜索得到的卖家B和C的商品添加到当前记录的卖家B和C的商品中,即在第二次搜索之后,当前记录更新为卖家B及其商品B1、B2、B3,卖家C及其商品C1、C2、C3。若搜索服务器第三次搜索得到卖家C及其商品C4以及卖家D及其商品D1,由于当前记录的卖家B未出现在该搜索得到的卖家中,因此,删除当前记录的卖家B及其包含的商品,而由于当前记录的卖家C出现在当前搜索得到的卖家中,因此,将该搜索得到的卖家C的商品添加到当前记录的卖家C的商品中,而由于卖家D在当前记录中并未记录,因此不记录当前搜索得到的卖家D;即在第三次搜索之后,当前记录更新为卖家C及其商品C1、C2、C3和C4。若此时,该搜索请求中的关键词组均进行了搜索,该搜索请求最终得到的搜索结果为卖家C及其商品C1、C2、C3和C4。而如果当前搜索未结束,且第四次搜索得到卖家E及其商品E1、E2,则由于当前记录的卖家未出现在该搜索得到的卖家中,删除当前记录中记录的该卖家(即卖家C),同时由于卖家E在当前记录中并未记录,因此不记录卖家E,即第四次搜索之后,当前记录的卖家为空,此次搜索流程结束,未能得到在各关键词组对应的卖家中均出现的卖家。
优选的,针对每一次搜索结果中的每一个卖家,搜索服务器可以只记录该卖家的一个商品。该一个商品可以通过下述方式得到:搜索服务器对搜索得到的该卖家的商品进行排序,记录排序后的第一个商品。其中,对卖家的商品进行排序的方式包括根据价格由低到高,或者根据出厂时间由远到近等。
步骤404,搜索服务器对所有关键词组的搜索结束后,根据记录的卖家及其商品,得到在各关键词组对应的卖家中均出现的卖家,并返回搜索结果。
需要说明,当采用步骤403中的优选方式时,每一次搜索只会记录一个卖家的一件商品,因此最终记录的卖家可包括两种:一种卖家的不同商品个数与用户输入的关键词组的数量相同,另一种卖家的不同商品个数小于用户输入的关键词组的数量。此时,搜索服务器可根据前一种卖家及其商品输出搜索结果。
本申请实施例中,当用户希望搜索包括多个对象的集合时,用户输入与每一对象对应的关键词组。搜索设备识别关键词组与对象的对应关系,根据每一对象的关键词组进行搜索,并对搜索结果进行汇总处理,得到同时包括所有对象的集合,从而能够满足现有技术中用户在需要购买多件商品时,查找一家同时出售所有商品的卖家进行购买的需求,以及用户在一些杂志文献数据库内搜索杂志时,搜索同时包括多篇特定文章的杂志的需求,提高了搜索效率,减少了用户的搜索时间,并减少了用户端与服务器端的交互次数,降低了服务器的负担,同时减少了网络带宽的占用。
为了更清楚地介绍本实施例提供的搜索方法,下面以商品搜索领域的大型搜索集群架构为例,对该方法进行进一步介绍。此时,优选地,对商品进行预处理,将同一个卖家的商品存储在同一服务器上。为了更好的支持总价最低排序,同一个卖家的商品按照价格高低进行排序。对商品进行存储的过程包括:商品分配设备接收到卖家新上传的商品信息,根据卖家ID进行计算,得到之前卖家商品存储的服务器,将新上传的商品信息存储到之前的服务器。其中,Searcher服务器对卖家和商品的记录方式以卖家ID和商品ID为例进行介绍。
如图5所示,该方法在大型搜索集群架构中的应用过程包括以下步骤:
步骤501,用户在搜索服务器的搜索框中输入多个关键词组。
该多个关键词以特定方式排列,例如不同商品的关键词之间用加号隔开,同一商品的关键词之间用空格隔开。输入方式可以是以某种语法在一个搜索输入框中输入,也可以是在多个输入框中输入。
步骤502,merger服务器接收到用户的搜索请求,并转发搜索请求到各个searcher服务器。
步骤503,Searcher服务器接收merger服务器发送的搜索请求,识别搜索请求中与每一商品对应的关键词组。
具体地,预先设定关键词组的排列方式,Searcher服务器根据关键词组的排列方式识别与每一商品对应的关键词组。
步骤504,Searcher服务器根据预设策略,选择一个未被搜索的关键词组进行搜索。
Searcher服务器将得到的各商品的关键词组进行排序,根据预设策略选择其中一种商品的关键词组,该预设策略可以为随机或顺序选择。
步骤505,Searcher服务器判断当前搜索是否为对应所接收到的搜索请求的第一次搜索。若判断为是,则转至步骤506;否则,转至步骤507。
步骤506,Searcher服务器记录搜索得到的卖家ID和符合条件的商品ID的对应关系。
优选地,Searcher服务器将搜索得到的满足条件的所有商品按照卖家进行合并,即一个卖家只保留一个商品,并在卖家表中记录搜索得到的卖家ID和该商品ID的对应关系。
步骤507,Searcher服务器判断之前是否已记录当前搜索得到的卖家ID。若判断为是,则转至步骤508;否则,转至步骤510。
其中,当判断结果为否时,说明这个卖家没有满足前面条件的商品,因此排除这个卖家。
步骤508,Searcher服务器判断之前是否已记录该卖家ID与当前搜索得到的商品ID的对应关系。若判断为是,则转至步骤510;否则,转至步骤509。
优选地,每一次搜索到的每一卖家ID对应一个商品ID,该商品ID通过下述方式得到:Searcher服务器对搜索得到的该卖家的商品进行排序,选择第一个商品的商品ID作为归属于该卖家ID的商品ID。其中,对卖家的商品进行排序的方式包括根据价格由低到高,或者根据出厂时间由远到近等。
步骤509,Searcher服务器记录当前搜索得到的卖家ID与商品ID的对应关系。
步骤510,Searcher服务器判断是否存在未被搜索的关键词组。若判断为是,则转至步骤504;否则,转至步骤511。
步骤511,Searcher服务器获取记录的每一卖家ID对应的商品ID的数量,与搜索请求中携带的关键词组的数量进行比较,根据数量相同的卖家ID输出搜索结果。
Searcher服务器检查卖家表,如果一个卖家符合条件的商品ID的个数小于搜索请求中携带的关键词组的个数,即待搜索商品的个数,则表明该卖家没有拥有满足所有条件的商品,删除该卖家的记录。对于符合条件的卖家,按照用户指定条件(如符合条件的卖家对应的商品的总价或卖家对应的信誉)进行排序,返回搜索结果给merger。同一个卖家的商品在一起返回。例如,如果指定总价排序,Searcher服务器将计算每个卖家符合条件的所有商品的总价,按照总价排序后返回merger。
步骤512,merger接收各Searcher服务器发送的搜索结果,将搜索结果进行排序,返回最终结果给用户端。
用户可以直接购买所有商品,或者进入某一店铺继续挑选,或者重新输入查询条件和/或排序条件等进行搜索。
需要注意的是,在该实施例中,在保证根据每个关键词组搜索得到的每个卖家中仅包含一个商品的前提下,Searcher服务器还可以直接记录根据各关键词组搜索得到的卖家ID和商品ID的对应关系,并在所有关键词组均被搜索后,将包含的商品ID数量与关键词组数量相同的卖家作为搜索结果返回。
本申请实施例中,Searcher服务器接收携带有多个关键词组的搜索请求,根据每一关键词组分别搜索,记录各商品与卖家的对应关系,输出同时包括各商品的卖家,从而能够满足现有技术中用户在需要购买多件商品时,查找一家同时出售所有商品的卖家进行购买的需求,这提高了搜索效率,减少了用户的搜索时间,并减少了用户端与服务器端的交互次数,降低了服务器的负担,同时减少了网络带宽的占用。
参见图6A、6B、6C以及6D。其中,图6A为本发明实施例提供的一种信息搜索方法的搜索界面示意图;图6B、6C以及6D则对应的搜索结果示意图,且图6B、6C以及6D分别示出了在不同卖家的搜索结果。在该实施例中,一次搜索请求的不同关键词组之间通过“+”连接。搜索服务器得到搜索结果后,可以根据搜索结果中的商品总价对对对应于不同卖家的搜索结果进行排序。
实施例二
本申请实施例二提供一种搜索方法,应用于搜索同时包括多个对象的集合的***,每一对象分别通过对应的关键词组进行搜索。该对象例如为商品或文章,相应的,集合为卖家或杂志。如图7所示,该方法包括:
步骤701,搜索服务器接收携带多个关键词组的搜索请求。
步骤702,搜索服务器识别关键词组与对象的对应关系,根据每一对象对应的关键词组分别进行搜索,对搜索结果进行汇总处理,得到同时包括所有对象的集合。
具体的,搜索服务器根据每一对象的关键词组进行搜索,优选的,搜索服务器通过多个进程分别根据各关键词组进行搜索,记录得到的对象及各对象所属的集合,并对搜索结果进行汇总,从中筛选得到同时包括所有对象的集合(即在各关键词组对应的集合中均出现的集合)。
实施例三
基于与上述方法实施例相同的技术构思,本发明实施例三提供一种搜索服务器,如图8所示,该搜索服务器包括:
请求接收模块81,用于接收携带有至少2个关键词组的搜索请求,其中每个关键词组中包括一个或多个关键词;
搜索处理模块82,根据请求接收模块81接收到的搜索请求中的关键词组进行搜索,并记录搜索得到的对象及其所属的集合;
结果处理模块83,提取在各关键词组对应的集合中都出现的集合,并从搜到的对象中获取属于该提取出的集合的对象;返回搜索结果,其中携带有该提取出的集合的信息和属于该提取出的集合的对象的信息。
其中,搜索处理模块82还用于,具体通过以下流程实现根据搜索请求的关键词组进行搜索,并记录搜索得到的对象及其所属的集合:
步骤A、根据接收到的搜索请求中关键词组进行第一次搜索,得到并记录对象及各对象所属的集合;
步骤B、判断是否存在未被搜索的关键词组;若判断为是,则转至步骤C;否则,转至步骤F;
步骤C、选择一个未被搜索的关键词组,根据该关键词组进行搜索;
步骤D、判断搜索得到的集合中是否包括当前记录的集合相同的集合;若判断为是,则转至步骤E;否则,转至步骤F;
步骤E、将搜索得到的相同集合中的对象添加到对应的当前记录的集合中,并在当前记录的集合中删除未包括在当前搜索得到的集合,得到更新后的当前记录的集合,并转至步骤B;
步骤F、流程结束。
其中,搜索处理模块82具体用于,通过多个进程分别根据各关键词组进行搜索,得到并记录对象及各对象所属的集合;其中,一个进程对应一个关键词组的搜索。
其中,一个关键词组对应的集合中,一个集合中仅记录一个对象;
结果处理模块83具体用于,根据搜索到的对象所属的集合进行汇总,并统计各集合中包含的不同对象的数量;提取所述集合中包含的不同对象的数量等于关键词组的数量的集合。
其中,所述对象为商品信息,所述集合为卖家ID;
结果处理模块83还用于,根据查找到的卖家ID对应的商品信息的总价和/或卖家ID对应的信誉,对查找到的卖家ID进行排序;并返回的搜索结果为排序后的卖家ID以及搜索到的所述卖家ID对应的商品信息。
本申请实施例中,搜索服务器根据获取到的关键词组中的各关键词搜索对应的对象及其所属的集合,并统计对各关键词组各自对应搜索到的对象所属的集合,以查找在各关键词组对应的集合中都出现的集合,作为搜索结果返回,从而能够满足现有技术中用户在需要购买多件商品时,查找一家同时出售所有商品的卖家进行购买的需求,这提高了搜索效率,减少了用户的搜索时间,并减少了用户端与服务器端的交互次数,降低了服务器的负担,同时减少了网络带宽的占用。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
本领域技术人员可以理解附图只是一个优选实施例的示意图,附图中的模块或流程并不一定是实施本申请所必须的。
本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
以上公开的仅为本申请的几个具体实施例,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (10)

1.一种信息搜索方法,其特征在于,包括:
搜索服务器接收携带有至少2个关键词组的搜索请求,其中每个关键词组中包括一个或多个关键词;
搜索服务器根据搜索请求中的关键词组进行搜索,并记录搜索得到的对象及其所属的集合;
搜索服务器提取在各关键词组对应的集合中都出现的集合,并从搜索得到的对象中获取属于该提取出的集合的对象;
搜索服务器返回搜索结果,其中携带有该提取出的集合的信息和属于该提取出的集合的对象的信息。
2.如权利要求1所述的方法,其特征在于,;
搜索服务器根据搜索请求的关键词组进行搜索,并记录搜索得到的对象及其所属的集合,具体通过以下流程实现:
步骤A、搜索服务器根据接收到的搜索请求中关键词组进行第一次搜索,得到并记录对象及各对象所属的集合;
步骤B、搜索服务器判断是否存在未被搜索的关键词组;若判断为是,则转至步骤C;否则,转至步骤F;
步骤C、搜索服务器选择一个未被搜索的关键词组,根据该关键词组进行搜索;
步骤D、搜索服务器判断搜索得到的集合中是否包括与当前记录的集合相同的集合;若判断为是,则转至步骤E;否则,转至步骤F;
步骤E、搜索服务器将搜索得到的相同集合中的对象添加到对应的当前记录的集合中,并在当前记录的集合中删除未包括在当前搜索得到的集合,得到更新后的当前记录的集合,并转至步骤B;
步骤F、流程结束。
3.如权利要求1所述的方法,其特征在于,所述搜索服务器根据搜索请求的关键词组进行搜索,并记录搜索得到的对象及其所属的集合,具体为:
搜索服务器通过多个进程分别根据各关键词组进行搜索,得到并记录对象及各对象所属的集合;其中,一个进程对应一个关键词组的搜索。
4.如权利要求1所述的方法,其特征在于,一个关键词组对应的集合中,一个集合中仅记录一个对象;
所述搜索服务器提取在各关键词组对应的集合中都出现的集合,具体为:
所述搜索服务器根据搜索得到的对象所属的集合进行汇总,并统计各集合中包含的不同对象的数量;
所述搜索服务器提取所述集合中包含的不同对象的数量等于关键词组的数量的集合。
5.如权利要求1-4任一项所述的方法,其特征在于,所述对象为商品信息,所述集合为卖家ID;
所述搜索服务器提取在各关键词组对应的集合中都出现的集合,并从搜到的所有对象中获取属于该提取出的集合的对象之后,还包括:搜索服务器根据查找到的卖家ID对应的商品信息的总价和/或卖家ID对应的信誉,对查找到的卖家ID进行排序;
所述搜索服务器返回的搜索结果为排序后的卖家ID以及搜索到的所述卖家ID对应的商品信息。
6.一种搜索服务器,其特征在于,包括:
请求接收模块,用于接收携带有至少2个关键词组的搜索请求,其中每个关键词组中包括一个或多个关键词;
搜索处理模块,根据所述请求接收模块接收到的搜索请求中的关键词组进行搜索,并记录搜索得到的对象及其所属的集合;
结果处理模块,提取在各关键词组对应的集合中都出现的集合,并从搜索得到的对象中获取属于该提取出的集合的对象;返回搜索结果,其中携带有该提取出的集合的信息和属于该提取出的集合的对象的信息。
7.如权利要求6所述的搜索服务器,其特征在于,所述搜索处理模块还用于,具体通过以下流程实现根据搜索请求的关键词组进行搜索,并记录搜索得到的对象及其所属的集合:
步骤A、根据接收到的搜索请求中关键词组进行第一次搜索,得到并记录对象及各对象所属的集合;
步骤B、判断是否存在未被搜索的关键词组;若判断为是,则转至步骤C;否则,转至步骤F;
步骤C、选择一个未被搜索的关键词组,根据该关键词组进行搜索;
步骤D、判断搜索得到的集合中是否包括与当前记录的集合相同的集合;若判断为是,则转至步骤E;否则,转至步骤F;
步骤E、将搜索得到的相同集合中的对象添加到对应的当前记录的集合中,并在当前记录的集合中删除未包括在当前搜索得到的集合,得到更新后的当前记录的集合,并转至步骤B;
步骤F、流程结束。
8.如权利要求6所述的搜索服务器,其特征在于,所述搜索处理模块具体用于,通过多个进程分别根据各关键词组进行搜索,得到并记录对象及各对象所属的集合;其中,一个进程对应一个关键词组的搜索。
9.如权利要求6所述的搜索服务器,其特征在于,一个关键词组对应的集合中,一个集合中仅记录一个对象;
所述结果处理模块具体用于,根据搜索得到的对象所属的集合进行汇总,并统计各集合中包含的不同对象的数量;提取所述集合中包含的不同对象的数量等于关键词组的数量的集合。
10.如权利要求6-9任一项所述的搜索服务器,其特征在于,所述对象为商品信息,所述集合为卖家ID;
所述结果处理模块还用于,
根据查找到的卖家ID对应的商品信息的总价和/或卖家ID对应的信誉,对查找到的卖家ID进行排序;返回的搜索结果为排序后的卖家ID以及搜索到的所述卖家ID对应的商品信息。
CN201110305094.XA 2011-09-29 2011-09-29 一种信息搜索方法和设备 Active CN103034663B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201110305094.XA CN103034663B (zh) 2011-09-29 2011-09-29 一种信息搜索方法和设备
HK13106139.4A HK1179372A1 (zh) 2011-09-29 2013-05-24 種信息搜索方法和設備

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110305094.XA CN103034663B (zh) 2011-09-29 2011-09-29 一种信息搜索方法和设备

Publications (2)

Publication Number Publication Date
CN103034663A true CN103034663A (zh) 2013-04-10
CN103034663B CN103034663B (zh) 2016-07-06

Family

ID=48021564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110305094.XA Active CN103034663B (zh) 2011-09-29 2011-09-29 一种信息搜索方法和设备

Country Status (2)

Country Link
CN (1) CN103034663B (zh)
HK (1) HK1179372A1 (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103246726A (zh) * 2013-05-09 2013-08-14 北京奇虎科技有限公司 一种网络信息的搜索方法、装置和***
CN104298684A (zh) * 2013-07-18 2015-01-21 深圳中兴网信科技有限公司 一种查询方法、装置及服务器
CN104978429A (zh) * 2015-07-10 2015-10-14 无锡天脉聚源传媒科技有限公司 一种搜索方法和装置
CN105808627A (zh) * 2014-12-31 2016-07-27 高德软件有限公司 Poi信息更新、检索、poi数据包生成方法及装置
CN106776601A (zh) * 2015-11-19 2017-05-31 北京国双科技有限公司 搜索条件的配置方法及装置
CN107832330A (zh) * 2017-09-27 2018-03-23 华为技术有限公司 一种搜索方法及终端设备
CN108536740A (zh) * 2018-03-07 2018-09-14 上海连尚网络科技有限公司 一种确定搜索结果的方法、介质以及设备
CN109344336A (zh) * 2018-12-25 2019-02-15 北京时光荏苒科技有限公司 搜索方法、搜索集生成方法、装置、介质、终端及服务器
CN109389465A (zh) * 2018-09-21 2019-02-26 中国联合网络通信集团有限公司 一种电商平台的优化方法和装置
CN110309375A (zh) * 2019-06-29 2019-10-08 大众问问(北京)信息科技有限公司 信息提示方法、装置及车载终端设备
CN110609848A (zh) * 2019-07-26 2019-12-24 上海百检网络技术有限公司 多条件检索的方法、服务器及用户端
CN111143692A (zh) * 2019-12-31 2020-05-12 亳州职业技术学院 基于用户需求的药膳推荐电子商务平台
CN111383077A (zh) * 2020-03-09 2020-07-07 浙江大华技术股份有限公司 一种数据管理及客户选型***、方法及装置
CN111597206A (zh) * 2020-05-27 2020-08-28 林思明 一种芯片选型方法、装置、电子设备及计算机可读存储介质
CN112131455A (zh) * 2020-09-28 2020-12-25 贝壳技术有限公司 列表页检索降级方法、装置、电子设备和存储介质
CN112784156A (zh) * 2021-01-13 2021-05-11 携程旅游信息技术(上海)有限公司 基于意图识别的搜索反馈方法、***、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102024041A (zh) * 2010-12-08 2011-04-20 王宝全 用于电子商务的搜索方法以及搜索***
CN102193954A (zh) * 2010-03-19 2011-09-21 姜振涛 一种同时搜索两种或两种以上信息的方法与***
CN102201007A (zh) * 2011-06-14 2011-09-28 悠易互通(北京)广告有限公司 一种大规模数据搜索***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102193954A (zh) * 2010-03-19 2011-09-21 姜振涛 一种同时搜索两种或两种以上信息的方法与***
CN102024041A (zh) * 2010-12-08 2011-04-20 王宝全 用于电子商务的搜索方法以及搜索***
CN102201007A (zh) * 2011-06-14 2011-09-28 悠易互通(北京)广告有限公司 一种大规模数据搜索***

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103246726B (zh) * 2013-05-09 2017-04-12 北京奇付通科技有限公司 一种网络信息的搜索方法、装置和***
CN103246726A (zh) * 2013-05-09 2013-08-14 北京奇虎科技有限公司 一种网络信息的搜索方法、装置和***
CN104298684A (zh) * 2013-07-18 2015-01-21 深圳中兴网信科技有限公司 一种查询方法、装置及服务器
CN104298684B (zh) * 2013-07-18 2018-04-06 深圳中兴网信科技有限公司 一种查询方法、装置及服务器
CN105808627A (zh) * 2014-12-31 2016-07-27 高德软件有限公司 Poi信息更新、检索、poi数据包生成方法及装置
CN104978429A (zh) * 2015-07-10 2015-10-14 无锡天脉聚源传媒科技有限公司 一种搜索方法和装置
CN106776601A (zh) * 2015-11-19 2017-05-31 北京国双科技有限公司 搜索条件的配置方法及装置
CN107832330A (zh) * 2017-09-27 2018-03-23 华为技术有限公司 一种搜索方法及终端设备
CN107832330B (zh) * 2017-09-27 2021-06-15 华为技术有限公司 一种搜索方法及终端设备
CN108536740B (zh) * 2018-03-07 2020-06-26 上海连尚网络科技有限公司 一种确定搜索结果的方法、介质以及设备
CN108536740A (zh) * 2018-03-07 2018-09-14 上海连尚网络科技有限公司 一种确定搜索结果的方法、介质以及设备
CN109389465A (zh) * 2018-09-21 2019-02-26 中国联合网络通信集团有限公司 一种电商平台的优化方法和装置
CN109344336A (zh) * 2018-12-25 2019-02-15 北京时光荏苒科技有限公司 搜索方法、搜索集生成方法、装置、介质、终端及服务器
CN110309375A (zh) * 2019-06-29 2019-10-08 大众问问(北京)信息科技有限公司 信息提示方法、装置及车载终端设备
CN110309375B (zh) * 2019-06-29 2021-07-20 大众问问(北京)信息科技有限公司 信息提示方法、装置及车载终端设备
CN110609848A (zh) * 2019-07-26 2019-12-24 上海百检网络技术有限公司 多条件检索的方法、服务器及用户端
CN111143692A (zh) * 2019-12-31 2020-05-12 亳州职业技术学院 基于用户需求的药膳推荐电子商务平台
CN111383077A (zh) * 2020-03-09 2020-07-07 浙江大华技术股份有限公司 一种数据管理及客户选型***、方法及装置
CN111597206A (zh) * 2020-05-27 2020-08-28 林思明 一种芯片选型方法、装置、电子设备及计算机可读存储介质
CN112131455A (zh) * 2020-09-28 2020-12-25 贝壳技术有限公司 列表页检索降级方法、装置、电子设备和存储介质
CN112131455B (zh) * 2020-09-28 2021-09-17 贝壳找房(北京)科技有限公司 列表页检索降级方法、装置、电子设备和存储介质
CN112784156A (zh) * 2021-01-13 2021-05-11 携程旅游信息技术(上海)有限公司 基于意图识别的搜索反馈方法、***、设备及存储介质

Also Published As

Publication number Publication date
HK1179372A1 (zh) 2013-09-27
CN103034663B (zh) 2016-07-06

Similar Documents

Publication Publication Date Title
CN103034663A (zh) 一种信息搜索方法和设备
JP5860456B2 (ja) 検索語重み付けの決定および利用
CN108647276B (zh) 一种搜索方法
CN102163228B (zh) 用于确定资源候选项的排序结果的方法、装置及设备
CN103870507B (zh) 一种基于类目的搜索方法和装置
CN103886090A (zh) 基于用户喜好的内容推荐方法及装置
CN101401062A (zh) 确定相关来源、查询及合并多个内容来源的结果的方法和***
CN103020240A (zh) 一种在线购物平台的商品检索方法
CN101847161A (zh) 搜索网页的方法和建立数据库的方法
CN103699700A (zh) 一种搜索引导的生成方法、***及相关服务器
CN102253936A (zh) 记录用户访问商品信息的方法及搜索方法和服务器
US9405803B2 (en) Ranking signals in mixed corpora environments
CN102760144A (zh) 信息搜索方法及***
US20180218043A1 (en) Information providing method and system
CN110990372A (zh) 一种维度数据的处理方法及装置、数据查询方法及装置
CN103514181A (zh) 一种搜索方法和装置
CN104239395A (zh) 搜索的方法和***
WO2012026140A1 (ja) データベース処理方法、データベース処理システム及びデータベースサーバ
CN101216837A (zh) 基于匹配用户个性化配置来显示搜索结果的方法和***
CN104021125A (zh) 一种搜索引擎排序的方法、***以及一种搜索引擎
CN102938121A (zh) 一种商品信息投放方法和设备
Saravanan Design of large-scale Content-based recommender system using hadoop MapReduce framework
CN108932248B (zh) 一种搜索实现方法及***
CN107292694A (zh) 采购单的生成方法及***
CN104506895B (zh) 视频归类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1179372

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1179372

Country of ref document: HK