CN107092621A - 信息搜索方法及装置 - Google Patents

信息搜索方法及装置 Download PDF

Info

Publication number
CN107092621A
CN107092621A CN201611045792.XA CN201611045792A CN107092621A CN 107092621 A CN107092621 A CN 107092621A CN 201611045792 A CN201611045792 A CN 201611045792A CN 107092621 A CN107092621 A CN 107092621A
Authority
CN
China
Prior art keywords
search
search result
label
hunting zone
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611045792.XA
Other languages
English (en)
Inventor
佟娜
闫奎名
张岱
肜博辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaodu Information Technology Co Ltd
Original Assignee
Beijing Xiaodu Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaodu Information Technology Co Ltd filed Critical Beijing Xiaodu Information Technology Co Ltd
Priority to CN201611045792.XA priority Critical patent/CN107092621A/zh
Publication of CN107092621A publication Critical patent/CN107092621A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种信息搜索方法及装置,涉及互联网技术领域。其中,所述方法包括:根据关键词,搜索出第一搜索结果;基于所述第一搜索结果,确定搜索需求;搜索满足所述搜索需求的第二搜索结果。基于搜索需求进行搜索,搜索到的结果更接近用户真实需求,搜索准确度高。

Description

信息搜索方法及装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种信息搜索方法及装置。
背景技术
随着互联网快速发展,大量O2O(Online To Offline,线上到线下)平台如雨后春笋般的出现。O2O将线下的商务机会与互联网结合,让互联网成为了线下交易的平台,大大改变了人们的生活方式。例如,外卖行业O2O平台的出现改变了人们的餐饮行为。
O2O平台会给用户提供一个客户端应用(APP),用户可通过APP搜索商户,然后进入相应的商户界面进行商品选择、下单等操作。有时,用户使用APP进行搜索时,会出现搜索不到期望商户的情况,用户的期望得不到满足。
发明内容
基于关键词进行文本匹配以获得搜索结果的过程为:首先,对关键词进行分词得到一批term(分词项),记为分词集tokens={term1,term2,...,termN}。然后,基于tokens,从商户名称和菜品名称的倒排索引中进行召回得到商户集合shoplist,召回的条件是tokens能够部分或者全部命中商户名称或者菜品名称。最后,将召回的商户集合shoplist反馈给用户。上述采用关键词分词进行文本匹配的搜索方式,搜索得到的结果中出现与用户真实需求相差甚远的概率较高,无法全面地满足用户需求;另外,采用单纯的文本匹配的方式极易出现在某一搜索范围内因无法匹配到部分或全部分词而出现搜索为空或搜索结果极少的情况,用户的期望得不到满足。例如,用户在位置A期望找到名称为B的商户,但是位置A及其附近不存在名称为B的商户,此时搜索结果就会为空,用户的期望得不到满足。
于是,在本发明的一个实施例中,提供了一种信息搜索方法。该方法包括:根据关键词,搜索出第一搜索结果;基于所述第一搜索结果,确定搜索需求;搜索满足所述搜索需求的第二搜索结果。
可选的,上述的方法中,所述第一搜索结果可以为一个或多个。当所述第一搜索结果为多个时,上述基于所述第一搜索结果,确定搜索需求,可采用如下方法实现:对多个所述第一搜索结果进行共性分析,得到共性特征;根据所述共性特征,确定所述搜索需求。
可选的,上述对多个所述第一搜索结果进行共性分析,得到共性特征,包括:获取多个所述第一搜索结果分别对应的标签字典,所述标签字典中包含有标签及标签对应的权重;将多个所述标签字典中标签的权重进行加权汇总;将汇总结果排在前N个的标签作为所述共性特征。其中,所述N为第一预设数值。
可选的,上述的方法还可包括:对多个所述第一搜索结果进行排序;相应的,对多个所述第一搜索结果进行共性分析,得到共性特征,可具体为:对排在前M个所述第一搜索结果进行共性分析,得到所述共性特征。其中,所述M为第二预设数值。选用排在前M个第一搜索结果进行共性分析,一是可以减少分析的数据量,提高分析效率;另一个是排序越靠前的搜索结果与关键词的匹配度越高,因此对匹配度高的搜索结果进行共性分析得到的共性特征就会更准确。
可选的,上述的搜索满足所述搜索需求的第二搜索结果,包括:获取搜索范围内的数据对应的标签字典;将所述数据对应的标签字典与所述搜索需求进行匹配;若匹配度满足匹配要求,则将所述数据作为所述第二搜索结果。
可选的,上述的方法还包括:若所述第二搜索结果为多个,则按照所述匹配度对多个所述第二搜索结果进行排序。在一种可实现的方式中,按照匹配度的高低从高到底的顺序对多个第二搜索结果进行排序。排序的目的是为了将与所述搜索需求匹配度高的第二搜索结果排在前面展现,给用户带来较好的搜索体验。
可选的,上述的方法还包括:获取多个所述第二搜索结果的特征信息;以及,所述按照匹配度对多个所述第二搜索结果进行排序,包括:结合所述匹配度和所述特征信息,对多个所述第二搜索结果进行排序。添加第二搜索结果的特征信息作为排序依据,使得排序依据更加全面,有助于提高用户的搜索体验。
可选的,上述的第一搜索结果和第二搜索结果可以是两个不同搜索范围内的数据,例如,所述第一搜索结果为第一搜索范围内的数据;所述第二搜索结果为第二搜索范围内的数据。相应的,上述的根据关键词,搜索出第一搜索结果可具体为:在第一搜索范围内,根据所述关键词搜索出所述第一搜索结果。上述的搜索满足所述搜索需求的第二搜索结果可具体为:在第二搜索范围内,搜索满足所述搜索需求的第二搜索结果。
可选的,上述的方法还包括:在所述第二搜索范围内,搜索出与所述关键词相匹配的第三搜索结果;若搜索出的所述第三搜索结果的数量小于阈值,则扩大所述第二搜索范围得到所述第一搜索范围。本发明实施例提供的方法可由上述事件触发,即在第二搜索范围内搜索到的与关键词匹配的第三搜索结果很少或为空时,扩大搜索范围并分析搜索需求,再回到第二搜索范围基于搜索需求进行搜索,丰富了搜索结果,进而可满足用户的多种需求。
可选的,上述的方法还可包括:为所述第二搜索结果设置后置显示属性;其中,所述后置显示属性指示了所述第二搜索结果的显示位置后置于所述第三搜索结果。接收到第二搜索结果和第三搜索结果的客户端可根据第二搜索结果的后置显示属性,优先在客户端的搜索界面上显示第三搜索结果,然后再在第三搜索结果的后面呈现所述第二搜索结果。
在本发明的另一个实施例中,提供了一种信息搜索装置。该装置包括:第一搜索模块、确定模块和第二搜索模块。其中,第一搜索模块用于根据关键词搜索出第一搜索结果;确定模块用于基于所述第一搜索结果,确定搜索需求;第二搜索模块用于搜索满足所述搜索需求的第二搜索结果。
本发明实施例提供的技术方案,根据搜索到的第一搜索结果确定搜索需求,再基于搜索需求进行搜索,搜索到的第二搜索结果接近用户的真实需求,易满足用户的搜索需求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的信息搜索方法的流程示意图;
图2为本发明另一实施例提供的信息搜索方法的流程示意图;
图3为本发明又一实施例提供的信息搜索方法的流程示意图;
图4为本发明一实施例提供的信息搜索装置的结构框图;
图5为本发明另一实施例提供的信息搜索装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明一实施例提供的信息搜索方法的流程示意图。如图1所示,该方法包括:
101、根据关键词,搜索出第一搜索结果。
102、基于所述第一搜索结果,确定搜索需求。
103、搜索满足所述搜索需求的第二搜索结果。
上述101中,可采用现有文本匹配的方式搜索与关键词相匹配的第一搜索结果。具体的搜索原理可参见现有技术,此处不再赘述。
在上述实施例和下述实施例中,上述搜索出的第一搜索结果可以是一个或多个。当所述第一搜索结果为一个时,可通过分析第一搜索结果中的内容信息来确定搜索需求。例如,在外卖类应用场景中,用户搜索的关键词为“肯德基”;搜索出一个肯德基店铺的信息。在一种可实现的方案中,获取该肯德基店铺对应的标签字典{西式快餐、炸鸡、汉堡、咖啡},直接将该标签字典中的各标签作为搜索需求,以基于搜索需求再次进行搜索,找出具有这些标签的第二搜索结果。
当所述第一搜索结果为多个时,可对多个第一搜索结果进行共性分析,以得到这些第一搜索结果的共性特征;然后根据共性特征确定出所述搜索需求。当然,在实际应用中也可直接将所述共性特征作为所述搜索需求。其中,共性分析可采用如下几种方式实现:
方式一:获取每个第一搜索结果对应的标签字典,然后对获取到的多个标签字典中的标签进行汇总,将出现次数多的标签作为搜索需求。例如,根据关键词搜索到的第一搜索结果有:肯德基店铺、必胜客店铺、赛百味店铺和麦当劳店铺。其中,肯德基店铺对应的标签字典为{西式快餐、炸鸡、汉堡、咖啡};必胜客店铺对应的标签字典为{西式快餐、披萨、糕点、下午茶};赛百味店铺对应的标签字典为{西式快餐、汉堡};麦当劳店铺对应的标签字典为{西式快餐、炸鸡、汉堡、咖啡};汇总上述标签字典中各标签的出现次数得到:西式快餐为4次、炸鸡为2次、汉堡为3次、咖啡为2次、披萨为1次、糕点为1次、下午茶为1次;将上述出现次数大于或等于2次的标签作为共性特征,得到共性特征为{西式快餐、炸鸡、汉堡、咖啡}。
方式二:获取每个第一搜索结果对应的标签字典,该标签字典中包含有标签以及标签对应的权重;然后将获取到的多个标签字典中标签的权重进行加权汇总;最后将加权汇总结果排在前面的N(N为第一预设数值,该值可人为设定)个标签作为共性特征。例如,根据关键词搜索到的第一搜索结果有:肯德基店铺、必胜客店铺、赛百味店铺和麦当劳店铺。其中,肯德基店铺对应的标签字典为{西式快餐:2、炸鸡:2、汉堡:2、咖啡:1};必胜客店铺对应的标签字典为{西式快餐:2、披萨:2、糕点:1、下午茶:1};赛百味店铺对应的标签字典为{西式快餐:2、汉堡:4};麦当劳店铺对应的标签字典为{西式快餐:2、炸鸡:2、汉堡:2、咖啡:1}。将所有标签字典中的各标签的权重进行加权汇总得到:西式快餐=2+2+2+2=8;炸鸡=2+2=4;汉堡=2+2+4=8;咖啡=1+1=2;披萨=2;糕点=1;下午茶=1;将上述各标签按照汇总结果进行排序:西式快餐、汉堡、炸鸡、咖啡、披萨、糕点、下午茶;将汇总结果排在前4的标签作为共性特征,得到共性特征为{西式快餐、汉堡、炸鸡、咖啡}。当然,在具体实施时为了提高汇总处理的效率,可先从多个标签字典中找出重复出现的标签,然后对重复出现的标签的权重进行加权汇总。
方式三,获取每个第一搜索结果的内容,从所有第一搜索结果的内容中提取共性信息,将共性信息作为所述共性特征。例如,在外卖类应用场景中,搜索结果为多个店铺信息,获取每个店铺中所有菜品信息,提取所有店铺中都有的菜品作为共性特征。
上述103中,搜索满足搜索需求的第二搜索结果时,可首先召回搜索范围内的所有数据,然后分别计算搜索范围内的数据与搜索需求的匹配度,将匹配度满足匹配要求的数据作为第二搜索结果。具体的,上述103可采用如下方法实现:获取搜索范围内的数据对应的标签字典;将所述数据对应的标签字典与所述搜索需求进行匹配;若匹配度满足匹配要求,则将所述数据作为所述第二搜索结果。
本实施例提供的技术方案,根据搜索到的第一搜索结果确定搜索需求,再基于搜索需求进行搜索,搜索到的第二搜索结果接近用户的真实需求,易满足用户的搜索需求。
进一步的,在上述实施例和下述实施例中,当搜索到的所述第一搜索结果为多个时,上述方法还可包括:对多个所述第一搜索结果进行排序。相应的,上述的基于第一搜索结果,确定搜索需求,可具体为:基于排在前M个所述第一搜索结果,确定搜索需求。其中,所述M为第二预设数值,该第二预设数值可人为设置。选用排在前M个第一搜索结果进行共性分析,一是可以减少分析的数据量,提高分析效率;另一个是排序越靠前的搜索结果与关键词的匹配度越高,因此对匹配度高的搜索结果进行共性分析得到的共性特征就会更准确。
在实际应用中会出现这样一种情况:采用关键词在现有搜索范围内进行搜索时,搜索不到第一搜索结果。例如,在外卖类应用场景中,搜索范围是根据用户所在的地理位置来确定的;假设用户当前所在的地理位置为西直门,该用户在使用应用进行搜索时,其对应的搜索范围就是西直门所处商圈内的所有数据(如商户)。此时,若用户欲搜索***商户,而在其所处的搜索范围内的没有***商户,则采用关键词进行搜索,搜索结果即为空。此时,就无法基于第一搜索结果确定搜索需求。针对这种情况,本发明提供了另一实施例。下述实施例中第一搜索结果和第二搜索结果是两个不同搜索范围内的数据。图2为本发明另一实施例提供的信息搜索方法的流程示意图。如图2所示,该方法包括:
201、在第一搜索范围内,根据关键词搜索出多个第一搜索结果。
202、对多个所述第一搜索结果进行排序。
203、对排在前M个所述第一搜索结果进行共性分析,得到所述共性特征。
204、根据所述共性特征,确定所述搜索需求。
205、获取所述第二搜索范围内的数据对应的标签字典。
206、将所述第二搜索范围内的数据对应的标签字典与所述搜索需求进行匹配。
207、若匹配度满足匹配要求,则将所述数据作为所述第二搜索结果。
208、若所述第二搜索结果为多个,则按照匹配度对多个所述第二搜索结果进行排序。
本实施例提供的技术方案,基于在第一搜索范围内搜索到的第一搜索结果确定搜索需求,以在第二搜索范围内搜索出满足搜索需求的第二搜索结果,避免了现有技术中在第二搜索范围内因无法匹配到关键词而出现搜索结果为空的情况出现;另外,基于搜索需求来进行搜索,搜索到的结果更接近用户真实需求,搜索准确度高。
上述步骤202在具体实施时,可根据设定的排序规则对多个所述第一搜索结果进行排序。其中,排序规则可以是:与关键词的匹配度越高的排在前面,或按照预设指标项的数量进行排序等等。其中,应用场景不同,预设指标项会有所不同。例如,在外卖类应用场景下,第一搜索结果为商户信息;相应的,预设指标项可以是商户的订单量、商户的历史被搜索次数等等。在上述实施例和下述实施例中,可按照商户的日订单量或月订单量等等,将订单量多的商户排在前面。上述N的数值可人为设定,例如,N取10、20等等。获取排序前10或20个第一搜索结果进行分析,一是可以减少分析的数据处理量,提高分析效率;另一个是提高共性分析的准确性。因为,在外卖类应用场景下,为用户推荐热度高的商户给用户,更能满足用户的需求,用户搜索体验度更高。
上述步骤203对排在前M个所述第一搜索结果进行共性分析,得到所述共性特征,可具体采用如下方法实现:
S1、获取多个所述第一搜索结果分别对应的标签字典,所述标签字典中包含有标签及标签对应的权重。
S2、将多个所述标签字典中标签的权重进行加权汇总。
S3、将汇总结果排在前N个的标签作为所述共性特征。
其中,所述N为第一预设数值。
例如,在外卖类应用场景中,搜索出的多个第一搜索结果均为商户信息。获取每个商户对应的标签字典tags={tag1:w1,tag2:w2,...,tagi:wi,…,tagN:wN},其中wi为第i个tag(标签)在当前商户tags中的权重,N为当前商户的tag数量;然后按照热度(如订单量的多少)对target_shops中商户的所有tag进行加权汇总,最终获取前10(N取值)个权重最大的tag,记作mean_tags={m_tag1:m_w1,m_tag2:m_w2,...,m_tagi:m_wi,…,m_tagN:m_wN},作为用户检索query的需求字典。
上述204的一种可实现方式是直接将所述共性特征作为所述搜索需求;例如,共性特征为{汉堡、薯条},直接将{汉堡、薯条}作为搜索需求。另一种可实现方式是通过对所述共性特征进行分析,将分析结果作为搜索需求。具体的,可采用预设的需求分析模型,将所述共性特征作为该模型的输入,分析出对应的搜索需求。其中,所述需求分析模型可人为设定。
上述206中,将所述第二搜索范围内的数据对应的标签字典与所述搜索需求进行匹配,其匹配过程可采用余弦相似度法实现。例如,所述第二搜索范围内的数据对应的标签字典D1=(wi1,wi2,…,win),搜索需求D2=(wj1,wj2,…,wjn),则第二搜索范围内的数据对应的标签字典与所述搜索需求的余弦相似度计算为:
余弦相似度最小值为0,最大值为1。余弦相似度其几何意义是:计算两向量在高维度空间中的夹角,夹角越小,余弦相似度越大(角度为0时,相似度为1);角度越大,余弦相似度越小(角度90度正交时,相似度为0)。
进一步的,在上述实施例和下述实施例中,上述方法还可包括:获取多个所述第二搜索结果的特征信息。相应的,上述的按照匹配度对多个所述第二搜索结果进行排序,包括:结合所述匹配度和所述特征信息,对多个所述第二搜索结果进行排序。其中,应用场景不同,上述的特征信息也会有所不同。例如,在外卖应用场景中,第二搜索结果为商户信息,商户信息对应的特征信息可包括:距离(商户位置距离用户当前位置的路程长度)、价格、优惠率等等。在具体实施时,可将匹配度、距离、价格和优惠率作为排序考虑的因子,对上述因子进行加权求和计算得分,然后根据得分的高低进行排序。
进一步的,上述实施例和下述实施例中,上述方法还可包括:
在所述第二搜索范围内,搜索出与所述关键词相匹配的第三搜索结果;
若搜索出的所述第三搜索结果的数量小于阈值,则扩大所述第二搜索范围得到所述第一搜索范围。
该步骤所描述的过程实质上可作为上述实施例的启动事件,即在第二搜索范围内搜索到的与关键词匹配的第三搜索结果很少时,扩大搜索范围并分析搜索需求,再回到第二搜索范围基于搜索需求进行搜索。当然,在实际应用中,上述实施例的执行也可不需要上述步骤所描述的事件触发,任何搜索都可先在第二搜索范围内搜索第三搜索结果,然后到第一搜索范围内搜索以获得搜索需求,再回到第二搜索范围内搜索满足搜索需求的第二搜索结果。这样可以丰富搜索结果,满足用户的多种需求。
进一步的,上述实施例和下述实施例中,搜索得到第二搜索结果和第三搜索结果后,可将所述第二搜索结果和第三搜索结果发送至客户端,以在客户端的相应搜索界面中进行展现。在展现时,可对第二搜索结果和第三搜索结果进行排序,例如,可将第二搜索结果排在第三搜索结果之后。相应的,上述的方法还可包括如下步骤:
为所述第二搜索结果设置后置显示属性。
其中,所述后置显示属性指示了所述第二搜索结果的显示位置后置于所述第三搜索结果。换句话说就是,将与关键词字面匹配的搜索结果展现在采用搜索需求进行搜索得到的搜索结果之前。客户端在接收到第三搜索结果和第二搜索结果后,可根据所述第二搜索结果的后置显示属性,将所述第二搜索结果显示在第三搜索结果之后进行显示。
本文中各实施例中所提及的第一搜索范围和第二搜索范围为两个不同的搜索范围。其中,所述第一搜索范围可包含第二搜索范围,例如,在外卖类应用场景下,搜索范围是根据用户所在的地理位置来确定的。假设用户当前所在的地理位置为西直门,第二搜索范围为西直门所处商圈内的所有商户。第一搜索范围可以是全城所有商圈内的所有商户。当然,所述第一搜索范围也可不包含第二搜索范围。例如,第二搜索范围为西直门所处商圈内的所有商户;第一搜索范围为在所述西直门所处商圈紧邻的商圈内的所有商户。
下面以外卖类应用场景为例,用户使用O2O平台提供的客户端APP搜索其想要查询的商户。图3为本发明又一实施例提供的信息搜索方法的流程示意图。如图3所示,该方法包括:
301、在用户当前所处的区域对应的第二搜索范围内,搜索与关键词相匹配的商户,将搜索到的商户记为第三搜索结果。
302、若所述第三搜索结果为空或所述第三搜索结果的数量小于阈值,则扩大所述第二搜索范围得到第一搜索范围。
这里需要说明的是:本实施例仅示出了通过扩大范围的方式来得到第一搜索范围的方式,实质上还可通过更换搜索范围的方式。
303、在第一搜索范围内搜索与关键词匹配的商户,将搜索到的商户记为第一搜索结果。
304、若第一搜索结果为多个,则按照商户热度对多个所述第一搜索结果进行排序。
其中,商户的热度可具体表现为订单量多的,或被搜索次数多的。例如,按照商户的总订单量进行排序,或者按照被搜索次数进行排序。
305、对热度最高的前N个第一搜索结果添加至目标商户集合中,并将该目标商户集合记作target_shops。
306、获取target_shops中每个商户对应的标签字典tags={tag1:w1,tag2:w2,...,tagi:wi,…,tagN:wN}。
其中,wi为第i个tag(标签)在当前商户所有tag中的权重,N为当前商户的tag数量。
307、对target_shops中所有商户对应的标签字典中的各tag进行加权汇总。
308、将汇总结果排在前M个的tag,记作需求标签mean_tags={m_tag1:m_w1,m_tag2:m_w2,...,m_tagi:m_wi,…,m_tagN:m_wN}。
其中,m_tagi为汇总结果排在前i个的标签。m_wi为第i个需求标签对应的汇总结果。
309、在用户当前所处的区域对应的第二搜索范围内,召回所有商户得到商户集合recall_shops。
310、获取recall_shops中每个商户的标签字典recall_tags={r_tag1:r_w1,r_tag2:r_w2,...,r_tagi:r_wi,…,r_tagN:r_wN}。
311、计算上述每个商户的recall_tags与需求标签mean_tags的匹配度match_ratio。
312、将match_ratio满足匹配要求的商户作为第二搜索结果。
313、若所述第二搜索结果为多个,则获取所述第二搜索结果的特征信息。
314、结合match_ratio和特征信息,对多个所述第二搜索结果进行排序。
315、为所述第二搜索结果设置后置显示属性。
其中,所述后置显示属性指示了所述第二搜索结果的显示位置后置于所述第三搜索结果。
316、若存在第三搜索结果,则将所述第三搜索结果和所述第二搜索结果发送至客户端。
客户端接收到所述第三搜索结果和第二搜索结果后,对其进行展示。展示的过程中,客户端会根据第二搜索结果的后置显示属性,将第二搜索结果的显示位置后置于第三搜索结果。以让用户最先看到与关键词匹配的第三搜索结果,后续再看到满足用户搜索需求的第二搜索结果。
关于上述301~316,可参见前述各实施例的描述,此处不再赘述。
需要说明的是:上述实施例所提供方法的各步骤的执行主体均可以是同一设备,或者,该方法也由不同设备作为执行主体。比如,步骤101至步骤103的执行主体可以为设备A;又比如,步骤101和102的执行主体可以为设备A,步骤103的执行主体可以为设备B;等等。
图4为本发明一实施例提供的信息搜索装置的结构示意图。如图4所示,本实施例提供的装置包括:第一搜索模块410、确定模块420和第二搜索模块430。其中,第一搜索模块410用于根据关键词,搜索出第一搜索结果。确定模块420用于基于所述第一搜索结果,确定搜索需求。第二搜索模块430用于搜索满足所述搜索需求的第二搜索结果。
本实施例提供的技术方案,根据搜索到的第一搜索结果确定搜索需求,再基于搜索需求进行搜索,搜索到的第二搜索结果接近用户的真实需求,易满足用户的搜索需求。
上述实施例中所述第一搜索结果可以为一个或多个。当第一搜索结果为一个时,上述的确定模块420还用于:对所述第一搜索节进行内容分析,以搜索需求。当第一搜索结果为多个时,上述的确定模块可采用图5所示的结构实现。具体的,所述确定模块420包括分析单元421和确定单元422。其中,分析单元421用于对多个所述第一搜索结果进行共性分析,得到共性特征。确定单元422用于根据所述共性特征,确定所述搜索需求。
进一步的,上述的分析单元421还用于:获取多个所述第一搜索结果分别对应的标签字典,所述标签字典中包含有标签及标签对应的权重;将多个所述标签字典中标签的权重进行加权汇总;将汇总结果排在前N个的标签作为所述共性特征;其中,所述N为第一预设数值。
如图5所示,上述实施例提供的信息搜索装置还可包括:第一排序模块440。所述第一排序模块440用于对多个所述第一搜索结果进行排序。相应的,上述分析单元还用:对排在前M个所述第一搜索结果进行共性分析,得到所述共性特征。其中,所述M为第二预设数值。
进一步的,上述的第二搜索模块430还用于:获取所述搜索范围内的数据对应的标签字典;将所述数据对应的标签字典与所述搜索需求进行匹配;若匹配度满足匹配要求,则将所述数据作为所述第二搜索结果。
进一步的,如图5所示,上述的信息搜索装置还可包括:第二排序模块450。第二排序模块450用于:若所述第二搜索结果为多个,则按照匹配度对多个所述第二搜索结果进行排序。
再进一步的,如图5所示,上述的信息搜索模块还可包括:获取模块460。该获取模块460用于获取多个所述第二搜索结果的特征信息。相应的,上述的第二排序模块450还用于:结合所述匹配度和所述特征信息,对多个所述第二搜索结果进行排序。
进一步的,所述第一搜索结果为第一搜索范围内的数据;所述第二搜索结果为第二搜索范围内的数据;以及所述第一搜索模块410还用于在第一搜索范围内,根据所述关键词搜索出所述第一搜索结果;所述第二搜索模块430还用于在第二搜索范围内,搜索满足所述搜索需求的第二搜索结果。基于在第一搜索范围内搜索到的第一搜索结果确定搜索需求,以在第二搜索范围内搜索出满足搜索需求的第二搜索结果,避免了现有技术中在第二搜索范围内因无法匹配到关键词而出现搜索结果为空的情况出现;另外,基于搜索需求来进行搜索,搜索到的结果更接近用户真实需求,搜索准确度高。
进一步的,如图5所示,上述的信息搜索模块还可包括:第三搜索模块470和处理模块480。其中,第三搜索模块470用于在所述第二搜索范围内,搜索出与所述关键词相匹配的第三搜索结果。处理模块480用于若搜索出的所述第三搜索结果的数量小于阈值,则扩大所述第二搜索范围得到所述第一搜索范围。
再进一步的,如图5所示,上述的信息搜索模块还可包括:设置模块490。该设置模块490用于为所述第二搜索结果设置后置显示属性。其中,所述后置显示属性指示了所述第二搜索结果的显示位置后置于所述第三搜索结果。
这里需要说明的是:上述实施例提供的信息搜索装置可实现上述各方法实施例提供的技术方案。信息搜索装置的实施例中各模块或单元的具体实现原理可参见上述方法实施例中对应的内容,此处不再赘述。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (20)

1.一种信息搜索方法,其特征在于,包括:
根据关键词,搜索出第一搜索结果;
基于所述第一搜索结果,确定搜索需求;
搜索满足所述搜索需求的第二搜索结果。
2.根据权利要求1所述的方法,其特征在于,所述第一搜索结果为多个;以及,
所述基于所述第一搜索结果,确定搜索需求,包括:
对多个所述第一搜索结果进行共性分析,得到共性特征;
根据所述共性特征,确定所述搜索需求。
3.根据权利要求2所述的方法,其特征在于,所述对多个所述第一搜索结果进行共性分析,得到共性特征,包括:
获取多个所述第一搜索结果分别对应的标签字典,所述标签字典中包含有标签及标签对应的权重;
将多个所述标签字典中标签的权重进行加权汇总;
将汇总结果排在前N个的标签作为所述共性特征;
其中,所述N为第一预设数值。
4.根据权利要求2或3所述的方法,其特征在于,还包括:
对多个所述第一搜索结果进行排序;以及,
所述对多个所述第一搜索结果进行共性分析,得到共性特征,包括:
对排在前M个所述第一搜索结果进行共性分析,得到所述共性特征。
其中,所述M为第二预设数值。
5.根据权利要求1至3中任一项所述的方法,其特征在于,所述搜索满足所述搜索需求的第二搜索结果,包括:
获取搜索范围内的数据对应的标签字典;
将所述数据对应的标签字典与所述搜索需求进行匹配;
若匹配度满足匹配要求,则将所述数据作为所述第二搜索结果。
6.根据权利要求5所述的方法,其特征在于,还包括:
若所述第二搜索结果为多个,则按照所述匹配度对多个所述第二搜索结果进行排序。
7.根据权利要求6所述的方法,其特征在于,还包括:
获取多个所述第二搜索结果的特征信息;
以及,所述按照匹配度对多个所述第二搜索结果进行排序,包括:
结合所述匹配度和所述特征信息,对多个所述第二搜索结果进行排序。
8.根据权利要求1至3中任一项所述的方法,其特征在于,所述第一搜索结果为第一搜索范围内的数据;所述第二搜索结果为第二搜索范围内的数据;以及
所述根据关键词,搜索出第一搜索结果,包括:
在第一搜索范围内,根据所述关键词搜索出所述第一搜索结果;
所述搜索满足所述搜索需求的第二搜索结果,包括:
在第二搜索范围内,搜索满足所述搜索需求的第二搜索结果。
9.根据权利要求8中任一项所述的方法,其特征在于,还包括:
在所述第二搜索范围内,搜索出与所述关键词相匹配的第三搜索结果;
若搜索出的所述第三搜索结果的数量小于阈值,则扩大所述第二搜索范围得到所述第一搜索范围。
10.根据权利要求9所述的方法,其特征在于,还包括:
为所述第二搜索结果设置后置显示属性;
其中,所述后置显示属性指示了所述第二搜索结果的显示位置后置于所述第三搜索结果。
11.一种信息搜索装置,其特征在于,包括:
第一搜索模块,用于根据关键词,搜索出第一搜索结果;
确定模块,用于基于所述第一搜索结果,确定搜索需求;
第二搜索模块,用于搜索满足所述搜索需求的第二搜索结果。
12.根据权利要求11所述的装置,其特征在于,所述第一搜索结果为多个;以及
所述确定模块,包括:
分析单元,用于对多个所述第一搜索结果进行共性分析,得到共性特征;
确定单元,用于根据所述共性特征,确定所述搜索需求。
13.根据权利要求12所述的装置,其特征在于,所述分析单元还用于:
获取多个所述第一搜索结果分别对应的标签字典,所述标签字典中包含有标签及标签对应的权重;
将多个所述标签字典中标签的权重进行加权汇总;
将汇总结果排在前N个的标签作为所述共性特征;
其中,所述N为第一预设数值。
14.根据权利要求12或13所述的装置,其特征在于,还包括:
第一排序模块,用于对多个所述第一搜索结果进行排序;以及
所述分析单元还用于:对排在前M个所述第一搜索结果进行共性分析,得到所述共性特征。
其中,所述M为第二预设数值。
15.根据权利要求11至13中任一项所述的装置,其特征在于,所述第二搜索模块还用于:
获取搜索范围内的数据对应的标签字典;
将所述数据对应的标签字典与所述搜索需求进行匹配;
若匹配度满足匹配要求,则将所述数据作为所述第二搜索结果。
16.根据权利要求15所述的装置,其特征在于,还包括:
第二排序模块,用于若所述第二搜索结果为多个,则按照所述匹配度对多个所述第二搜索结果进行排序。
17.根据权利要求16所述的装置,其特征在于,还包括:
获取模块,用于获取多个所述第二搜索结果的特征信息;
以及,所述第二排序模块还用于:
结合所述匹配度和所述特征信息,对多个所述第二搜索结果进行排序。
18.根据权利要求11至13中任一项所述的方法,其特征在于,所述第一搜索结果为第一搜索范围内的数据;所述第二搜索结果为第二搜索范围内的数据;以及
所述第一搜索模块,还用于在第一搜索范围内,根据所述关键词搜索出所述第一搜索结果;
所述第二搜索模块,还用于在第二搜索范围内,搜索满足所述搜索需求的第二搜索结果。
19.根据权利要求18所述的装置,其特征在于,还包括:
第三搜索模块,用于在所述第二搜索范围内,搜索出与所述关键词相匹配的第三搜索结果;
处理模块,用于若搜索出的所述第三搜索结果的数量小于阈值,则扩大所述第二搜索范围得到所述第一搜索范围。
20.根据权利要求19所述的装置,其特征在于,还包括:
设置模块,用于为所述第二搜索结果设置后置显示属性;
其中,所述后置显示属性指示了所述第二搜索结果的显示位置后置于所述第三搜索结果。
CN201611045792.XA 2016-11-24 2016-11-24 信息搜索方法及装置 Pending CN107092621A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611045792.XA CN107092621A (zh) 2016-11-24 2016-11-24 信息搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611045792.XA CN107092621A (zh) 2016-11-24 2016-11-24 信息搜索方法及装置

Publications (1)

Publication Number Publication Date
CN107092621A true CN107092621A (zh) 2017-08-25

Family

ID=59648673

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611045792.XA Pending CN107092621A (zh) 2016-11-24 2016-11-24 信息搜索方法及装置

Country Status (1)

Country Link
CN (1) CN107092621A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109636536A (zh) * 2018-12-19 2019-04-16 拉扎斯网络科技(上海)有限公司 服务产品提供方法、装置、电子设备及存储介质
CN110020082A (zh) * 2017-12-11 2019-07-16 北京搜狗科技发展有限公司 一种搜索方法及装置
CN111461833A (zh) * 2020-03-31 2020-07-28 拉扎斯网络科技(上海)有限公司 信息加载方法、***、服务器、终端及存储介质
CN111881352A (zh) * 2020-07-28 2020-11-03 腾讯科技(北京)有限公司 内容推送方法、装置、计算机设备和存储介质
CN112559903A (zh) * 2020-12-15 2021-03-26 广州市贺氏办公设备有限公司 一种社区成员搜索方法、***、装置及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110295688A1 (en) * 2010-05-28 2011-12-01 Microsoft Corporation Defining user intent
CN102999520A (zh) * 2011-09-15 2013-03-27 北京百度网讯科技有限公司 一种搜索需求识别的方法和装置
CN103020066A (zh) * 2011-09-21 2013-04-03 北京百度网讯科技有限公司 一种识别搜索需求的方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110295688A1 (en) * 2010-05-28 2011-12-01 Microsoft Corporation Defining user intent
CN102999520A (zh) * 2011-09-15 2013-03-27 北京百度网讯科技有限公司 一种搜索需求识别的方法和装置
CN103020066A (zh) * 2011-09-21 2013-04-03 北京百度网讯科技有限公司 一种识别搜索需求的方法和装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110020082A (zh) * 2017-12-11 2019-07-16 北京搜狗科技发展有限公司 一种搜索方法及装置
CN109636536A (zh) * 2018-12-19 2019-04-16 拉扎斯网络科技(上海)有限公司 服务产品提供方法、装置、电子设备及存储介质
CN111461833A (zh) * 2020-03-31 2020-07-28 拉扎斯网络科技(上海)有限公司 信息加载方法、***、服务器、终端及存储介质
CN111881352A (zh) * 2020-07-28 2020-11-03 腾讯科技(北京)有限公司 内容推送方法、装置、计算机设备和存储介质
CN112559903A (zh) * 2020-12-15 2021-03-26 广州市贺氏办公设备有限公司 一种社区成员搜索方法、***、装置及介质
CN112559903B (zh) * 2020-12-15 2024-04-05 广州市贺氏办公设备有限公司 一种社区成员搜索方法、***、装置及介质

Similar Documents

Publication Publication Date Title
CN107424043B (zh) 一种产品推荐方法及装置,电子设备
WO2019056661A1 (zh) 一种搜索词推送方法、装置及终端
CN107092621A (zh) 信息搜索方法及装置
US8078601B1 (en) Determining unambiguous geographic references
US9767144B2 (en) Search system with query refinement
CN110020128B (zh) 一种搜索结果排序方法及装置
JP2020523714A (ja) 推奨情報の取得方法及び装置、電子機器
CN104283842B (zh) 主题管理方法及***
CN103136228A (zh) 一种图片搜索方法以及图片搜索装置
CN110532351B (zh) 推荐词展示方法、装置、设备及计算机可读存储介质
CN110413875A (zh) 一种文本信息推送的方法以及相关装置
CN106886518A (zh) 一种微博账号分类的方法
CN106776860A (zh) 一种搜索摘要生成方法及装置
CN103577432A (zh) 一种商品信息搜索方法和***
CN108431829A (zh) 用于在目录中搜索产品的***和方法
WO2018176913A1 (zh) 搜索方法、装置及非临时性计算机可读存储介质
CN110287307A (zh) 一种搜索结果排序方法、装置及服务器
CN111400507A (zh) 实体匹配方法及其装置
CN113254810B (zh) 搜索结果输出方法、装置、计算机设备及可读存储介质
CN103902549B (zh) 搜索数据排序的方法和装置,数据搜索的方法和装置
CN110609958A (zh) 数据推送方法、装置、电子设备及存储介质
CN112488781A (zh) 搜索推荐方法、装置、电子设备及可读存储介质
CN102053960B (zh) 依群需特征构建物联互联双网快准搜索引擎的方法及***
CN112084307A (zh) 一种数据处理方法、装置、服务器及计算机可读存储介质
CN114820123A (zh) 团购商品推荐方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170825

RJ01 Rejection of invention patent application after publication