CN110020101B - 实时搜索场景的还原方法、装置和*** - Google Patents

实时搜索场景的还原方法、装置和*** Download PDF

Info

Publication number
CN110020101B
CN110020101B CN201710747385.1A CN201710747385A CN110020101B CN 110020101 B CN110020101 B CN 110020101B CN 201710747385 A CN201710747385 A CN 201710747385A CN 110020101 B CN110020101 B CN 110020101B
Authority
CN
China
Prior art keywords
search
personalized
scene
string
real
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710747385.1A
Other languages
English (en)
Other versions
CN110020101A (zh
Inventor
张勇乔
李剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taobao China Software Co Ltd
Original Assignee
Taobao China Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taobao China Software Co Ltd filed Critical Taobao China Software Co Ltd
Priority to CN201710747385.1A priority Critical patent/CN110020101B/zh
Publication of CN110020101A publication Critical patent/CN110020101A/zh
Application granted granted Critical
Publication of CN110020101B publication Critical patent/CN110020101B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种实时搜索场景的还原方法,包括一种实时搜索场景的还原方法,包括:确定需要重现的搜索场景,将对应所述搜索场景的原始搜索字串与个性化调整参数相合并,组成可重现搜索字串;根据所述可重现搜索字串执行搜索,返回重现的搜索场景。本申请同时提供一种实时搜索场景的还原装置。采用本申请提供的方法,在实时个性化搜索过程中,将影响搜索筛选和排序过程的变化因素记录下来,使准确的重现个性化搜索结果成为可能。由于在个性化搜索过程中就进行了相关记录,使用该方法可以在海量数据的情况下,通过相关技术手段,实现对全网用户海量搜索行为的实时复现。

Description

实时搜索场景的还原方法、装置和***
技术领域
本申请涉及实时搜索领域,具体涉及一种实时搜索场景的还原方法。本申请同时涉及一种实时搜索场景的还原装置、一种实时搜索场景的还原***和一种实时搜索场景还原的电子设备以及存储设备。
背景技术
现有的网络搜索技术已经实现了实时个性化。例如,目前常用的实时个性化搜索技术是基于搜索pora与igraph的实时个性化。在该技术下,以用户为key将一个用户针对一个对象(比如商品)的一次操作(比如点击、收藏...)抽象为一个事件,实时捕获全网用户的最新事件同步到igraph,同时结合***之前获取到的历史事件,驱动执行所有的用户维度算法模块,产出用户维度的实时个性化数据,实时更新在线存储(比如igraph)的用户维度个性化数据,从而影响该用户的个性化搜索结果。
在很多场合下,需要还原某次搜索的实际情况;但是由于实时个性化搜索技术的影响,当用户反馈自身搜索结果出现问题后,通过原先的用户请求URL来重现用户出问题的场景已经不再可行。
例如,当出现搜索结果排序不合理的情况需要解决时,仅仅使用用户请求URL就无法获得原先的搜索结果。如:卖家用户反馈的各种在搜索中无法找到自己店铺商品或排序靠后,买家反馈的各种在搜索中产生不符合期望(打标不对或价格不对,邮费不正确等)的商品;如果不考虑实时个性化搜索的影响,则不能正确了解用户所反映的问题。
同样的,在上述实时个性化搜索的影响下,不同用户需要在彼此之间传递搜索结果也将难以实现。例如,A买家在淘宝网站上进行了某个商品的搜索,并希望将搜索结果分享到B买家,于是将用户搜索请求URL提供给B;在A买家看来,他提供的分享应该使B客户能够看到他搜索到的商品。但由于搜索是实时个性化的搜索,所以搜索结果已经根据B的情况进行了调整,导致B使用A提供的用户请求URL却无法获得与A相同的结果;因此,实时个性化搜索妨碍了不同搜索用户之间分享搜索结果,对于电商而言,降低了买家的分享乐趣,减损了用户体验。
现有技术通过以下方式解决这类问题:
通过离线日志中的商品id在展现层重现用户的搜索的商品结果,还原搜索结果的商品快照;
通过离线日志中的请求URL二次查询的方式在数据层部分重现用户的搜索场景,还原商品分数与商品标;
通过对必要搜索日志进行存储和分析,在全链路重现用户的完整搜索场景,还原每条搜索结果。
上述现有技术,均不能准确、快速的还原个性化的搜索结果;在海量数据的情况下,难以满足对全网用户海量搜索行为的实时复现;不能方便的实现不同搜索用户之间的搜索结果分享。
发明内容
本申请提供是本申请提供的一种实时***中搜索场景的重现方法,以解决现有实时个性化搜索重现的问题。本申请另外提供一种实时***中搜索场景的重现装置和一种实时***中搜索场景的重现***。
本申请提供一种实时搜索场景的还原方法,包括:
确定需要重现的搜索场景,将对应所述搜索场景的原始搜索字串与个性化调整参数相合并,组成可重现搜索字串;
根据所述可重现搜索字串执行搜索,返回重现的搜索场景。
优选的,为实现该方法,在执行搜索过程中,进行如下准备工作:
在执行搜索,获得个性化搜索结果的过程中,记录原始搜索字串,和为搜索场景提供个性化搜索而提供的个性化调整参数。
优选的,所述记录原始搜索字串和为搜索场景提供个性化搜索而提供的个性化调整参数的步骤之前,执行下述步骤:
为每个搜索请求生成与该搜索请求唯一对应的搜索请求标识;所述搜索请求标识与所述搜索请求整个存续过程中的各个数据相关联。
优选的,所述在执行搜索,获得个性化搜索结果的过程中,记录原始搜索字串和为向搜索主体提供个性化搜索而提供的个性化调整参数,包括:
获取搜索请求,为每个搜索请求生成与该搜索请求唯一对应的搜索请求标识;
根据所述搜索请求提取所述原始搜索字串,记录所述原始搜索字串;
根据所述原始搜索字串得到初始搜索结果集合,记录所述初始搜索结果集合;
根据获得的个性化调整参数,对所述初始搜索结果集合进行个性化搜索调整,获得向搜索主体展示的个性化搜索结果;
在执行上述步骤的过程中,进行监听,记录所述查询过程的个性化状况。
优选的,所述在执行搜索,获得个性化搜索结果的过程中,记录原始搜索字串和为向搜索主体提供个性化搜索而提供的个性化调整参数,其中的记录基于日志***,包括:
所述根据所述搜索请求提取所述原始搜索字串,记录所述原始搜索字串的步骤中,前端服务将所述原始搜索字串写入第一日志;
所述根据所述原始搜索字串得到初始搜索结果集合,记录所述初始搜索结果集合的步骤中,所述前端服务将所返回的搜索结果标识列表写入第一日志中;
所述进行监听,记录所述查询过程的个性化状况的步骤中,搜索服务将个性化搜索参数写入第二日志中,以及将个性化搜索过程中的随机算法参数写入第二日志中。
优选的,所述在执行搜索,获得个性化搜索结果的过程中,同时记录所述搜索结果;所述搜索结果包括执行搜索时搜索引擎所返回的搜索结果标识列表。
优选的,所述原始搜索字串包括:搜索命令和搜索内容。
优选的,所述个性化调整参数包括:个性化搜索参数和随机算法参数。
优选的,所述个性化搜索参数包括:筛选搜索参数和/或排序搜索参数。
优选的,所述确定需要重现的搜索场景,将对应所述搜索场景的原始搜索字串与个性化调整参数相合并,组成可重现搜索字串的步骤,包括:
将所述个性化调整参数合并加入所述原始搜索字串,组成所述可重现搜索字串。
优选的,所述将所述个性化调整参数合并加入所述原始搜索字串,组成所述可重现搜索字串的步骤,包括:将搜索结果标识列表加入所述可重现搜索字串。
优选的,所述确定需要重现的搜索场景,将对应所述搜索场景的原始搜索字串与个性化调整参数相合并,组成可重现搜索字串的步骤,通过查找所述日志***数据组成所述可重现搜索字串,包括:
获取需要重现的搜索场景,通过所述搜索请求标识获取所述第一日志和所述第二日志中的对应数据;
将所述第一日志和所述第二日志中获取的数据按预设格式进行重组,得到重现搜索字串。
优选的,根据所述可重现搜索字串执行搜索,返回重现的搜索场景的步骤之前,包括:按预设格式解析所述可重现搜索字串。
优选的,所述按预设格式解析所述可重现搜索字串,解析结果包括:原始搜索字串、为向搜索主体提供个性化搜索而提供的个性化调整参数、搜索对象标识列表。
优选的,所述根据所述可重现搜索字串执行搜索,返回重现的搜索场景,包括:
将所述重现的搜索场景以快照的形式呈现。
优选的,用户通过如下方式分享搜索场景:
将对应所述搜索场景的可重新搜索字串发送给被分享人。
优选的,用户通过如下方式分享搜索场景:将需要分享的所述搜索场景的搜索请求标识发送给被分享人。
本申请同时提供一种实时搜索场景的还原装置,包括:
重组字串单元,用于确定需要重现的搜索场景,将对应所述搜索场景的原始搜索字串与个性化调参数相合并,组成可重现搜索字串;
返回场景单元,用于根据所述可重现搜索字串执行搜索,返回重现的搜索场景。
优选的,包括:
记录单元,用于在执行搜索,获得个性化搜索结果过程中,记录原始搜索字串,和为向搜索主题提供个性化搜索而提供的个性化调整参数。
优选的,包括生成搜索请求标识单元,用于为每个搜索请求生成与该搜索请求唯一对应的搜索请求标识;所述搜索请求标识与所述搜索请求整个存续过程中的各个数据相关联。
优选的,所述记录单元,包括:
生成搜索请求标识单元,用于获取搜索请求,为每个搜索请求生成与该搜索请求唯一对应的搜索请求标识;
提取原始搜索字串单元,用于根据所述搜索请求提取所述原始搜索字串,记录所述原始搜索字串;
获取结果单元,用于根据所述原始搜索字串得到初始搜索结果集合,记录所述初始搜索结果集合;
展示个性化搜索单元,用于根据获得的个性化调整因素,对所述初始搜索结果集合进行个性化搜索调整,获得向搜索主体展示的个性化搜索结果;
监听单元,用于在执行上述步骤的过程中,进行监听,记录所述查询过程的个性化状况。
本申请还提供一种实时搜索场景的还原***,包括通过网络实现相互通讯的服务器、客户端、数据库;
所述服务器在执行搜索,获得个性化搜索结果的过程中,记录原始搜索字串和为向搜索主体提供个性化搜索而提供的个性化调整参数到数据库;
当接收客户端指令,重现所述搜索场景时,服务器将所述数据库中对应所述搜索场景的所述原始搜索字串与所述个性化调整参数相合并,组成可重现搜索字串;
根据所述可重现搜索字串执行搜索,返回重现的搜索场景到客户端。
优选的,所述服务器在执行搜索,获得个性化搜索结果的过程中,记录原始搜索字串和为向搜索主体提供个性化搜索而提供的个性化调整参数到数据库,其中的记录基于日志***,包括:
客户端发起搜索请求,服务器获取搜索请求,为每个搜索请求生成与该搜索请求唯一对应的搜索请求标识;
根据所述搜索请求提取所述原始搜索字串,记录所述原始搜索字串,前端服务将所述原值搜索字串写入第一日志;
根据所述原始搜索字串得到初始搜索结果集合,记录所述初始搜索结果集合,所述前端服务将所返回的搜索对象标识列表写入第一日志中;
根据获得的个性化调整参数,对所述初始搜索结果集合进行个性化搜索调整,获得向搜索主体展示的个性化搜索结果;
在执行上述步骤的过程中,进行监听,记录所述查询过程的个性化状况,搜索服务将个性化搜索参数写入第二日志中,且将个性化搜索过程中的随机算法参数写入第二日志中。
优选的,所述服务器在执行搜索,获得个性化搜索结果的过程中,同时记录所述搜索结果;所述搜索结果包括执行搜索时搜索引擎所返回的搜索结果标识列表。
优选的,所述当接收客户端指令,重现所述搜索场景时,服务器将数据库中对应所述搜索场景的所述原始搜索字串与所述个性化调整参数相合并,组成可重现搜索字串,包括:
服务器获取重现信息,通过所述搜索请求标识获取所述第一日志和所述第二日志中的对应数据;
将所述第一日志和所述第二日志中的获取的数据按预设格式进行重组,得到所述可重现搜索字串。
优选的,服务器根据所述可重现搜索字串执行搜索,返回重现的搜索场景的步骤之前,包括:按预设格式解析所述可重现搜索字串。
优选的,所述根据所述可重现搜索字串执行搜索,返回重现的搜索场景到客户端,包括:
将所述重现的搜索场景以快照的形式呈现。
本申请提供一种实时搜索场景还原的电子设备,所述电子设备包括:
显示器;
处理器;
存储器,用于确定需要重现的搜索场景,将对应所述搜索场景的原始搜索字串与个性化调整参数相合并,组成可重现搜索字串,所述个性化调整参数是为向搜索主体提供个性化搜索而提供的参数;
根据所述可重现搜索字串执行搜索,返回重现的搜索场景。
本申请还提供一种用于实时搜索场景还原的存储设备,该存储设备存储有指令,所述指令能够被处理器加载并执行以下步骤:
确定需要重现的搜索场景,将对应所述搜索场景的原始搜索字串与个性化调整参数相合并,组成可重现搜索字串,所述个性化调整参数是为向搜索主体提供个性化搜索而提供的参数;
根据所述可重现搜索字串执行搜索,返回重现的搜索场景。
与现有技术相比,本申请提供的实时***中搜索场景的重新方法,在执行搜索,获得个性化搜索结果的过程中,记录原始搜索字串和为向搜索主体提供个性化搜索而提供的个性化调整因素;当重现所述搜索场景时,将对应所述搜索场景的所述原始搜索字串与所述个性化调整参数相合并,组成可重现搜索字串;根据所述可重现搜索字串执行搜索,可以重现搜索场景。
采用上述方法具有下述优点:
首先,在实时个性化搜索过程中,将影响搜索筛选和排序过程的变化因素记录下来,这样,就使准确的重现个性化搜索结果成为可能。
其次,由于在个性化搜索过程中就进行了相关记录,使用该方法可以在海量数据的情况下,通过相关技术手段,实现对全网用户海量搜索行为的实时复现。
再次,采用本技术方案后,可以通过传送可重现搜索字串的方式在不同用户之间分享搜索场景,有效提升用户的搜索体验。
附图说明
图1是本申请第一实施例提供的实时***中搜索场景的重现方法流程图;
图2是本申请提供的一种记录日志的方法流程图;
图3是本申请第二实施例提供的实时***中搜索场景的重现装置示意图;
图4是本申请第三实施例提供的实时***中搜索场景的重现***示意图;
图5是本申请第四实施例提供的实时***中搜索场景的重现电子设备示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
利用实时在线图存储和查询***(例如,iGraph服务)的大型网站,能够实时地调整用户个性化信息和搜索结果;但发生用户投诉或开发过程中遇到问题(例如,特定商品在网站中搜索不到、排序靠后、价格不正确、打标不准、结果不准确等问题)或线上故障时,因搜索实时个性化技术产生了重现和调查困难的问题。此外,很多情况下,不同用户期望通过用户搜索请求URL分享搜索结果,但由于搜索实时个性化技术,造成实际分享的结果并不一致,从而影响用户体验。
本申请提供了一种实时***中搜索场景的重现方法;请参考图1,是本申请第一实施例提供的实时***中搜索场景的重现方法流程图;下面结合图1对本方法进行详细描述,描述中用到的示例是辅助本申请的理解,不是具体应用环境限定。
步骤S101:确定需要重现的搜索场景,将对应所述搜索场景的原始搜索字串与个性化调整参数相合并,组成可重现搜索字串。
搜索场景是基于用户搜索请求进行个性化搜索处理,并返回搜索结果的整个过程的总称。在当前的网络搜索技术下,会对用户的搜索请求进行实时个性化处理,而产生对某个用户搜索请求的实时个性化搜索结果。所谓个性化搜索结果,可以包括针对同样的搜索字串,对不同用户的搜索结果的展示内容不同,以及展示内容的排序不同等。所谓实时个性化处理,是指搜索服务会根据不同搜索用户的个性化因素,以及随时搜集的用户反馈,实时对搜索结果进行上述个性化的搜索结果调整。
例如,针对同样的搜索字符串“连衣裙”,搜索服务器根据不同搜索用户的不同消费情况,在页面上展示不同系列的搜索结果;以及,对于同一个搜索用户,根据用户对第一页的搜索结果的点击浏览情况,在第二页就对搜索结果的展示内容和展示顺序进行个性化调整(即:实时个性化调整)。每个搜索用户获得的每个搜索结果页面都可以视为一个搜索场景。
当用户根据需求发起搜索请求,服务器会采用个性化服务计算搜索结果,最终获得所述个性化搜索结果;在采用个性化服务计算搜索结果的过程中,除了使用用户发起搜索请求提供的原始搜索字串外,还同时使用为搜索场景提供个性化结果的调整因素,所述调整因素即个性化调整参数;通过上述方式,即可获得针对搜索场景的个性化。相对应的,如果获得某次个性化搜索结果的原始搜索字串和个性化调整参数,即可重现此次搜索的结果,因此,可以以此重现个性化搜索的搜索场景。
从上面可以看出,为实现该重现搜索场景的方法,首先需要获得以下两个方面的信息,即:确定需要重现的是哪一个搜索场景;以及获得对应所述搜索场景的原始搜索字串与个性化调整参数。在获得以上信息后,才可能在需要重现搜索场景时,获得能够用于重现所述搜索场景的所有信息。
为了获得上述信息步骤,显然需要在执行搜索时就进行相应的准备;具体而言,就是在用户发出搜索请求,服务器提供个性化搜索结果的过程中,记录原始搜索字串,和为搜索场景提供实时个性化搜索而提供的个性化调整参数。
上述两个方面——执行搜索时进行的准备工作以及重现搜索场景时获得相关信息——相结合,最终就可以实现本步骤所述的:确定需要重现的搜索场景,将对应所述搜索场景的原始搜索字串与个性化调整参数相合并,组成可重现搜索字串,从而重新搜索场景。
以下就围绕上述几个方面分别进行说明
如前所述,为了实现本实施例提供的实时***中搜索场景的重现方法,首先需要在执行搜索时就需要进行相应准备,即在获得个性化搜索结果的过程中,记录原始搜索字串,和为向搜索主体提供个性化搜索而提供的个性化调整参数。上述步骤尽管属于准备步骤,却是实现重现搜索场景的前提,因此,以下首先对该步骤进行详细说明。
如上所述,在执行搜索过程中,需要具体记录某个个性化搜索结果的原始搜索字串以及相应的个性化调整参数,其前提必然要求该个性化搜索结果能够被准确标识,为此,首先需要为每个搜索请求生成与该搜索请求唯一对应的搜索请求标识,显然,该搜索请求标识需要在记录原始搜索字串和为搜索场景提供个性化搜索而提供的个性化调整参数的步骤之前就获得,此后,所述搜索请求标识与所述搜索请求整个存续过程中的各个数据相关联。具体地,通过生成唯一的搜索请求标识RN(Request Number),作为每一次搜索访问的唯一标识,并作为标识该搜索访问的唯一参数,并将所述搜索请求标识与所述搜索请求整个存续过程中的各个数据相关联。具备上述搜索请求标识后,既可以对应记录该个性化搜索的原始搜索字串和个性化调整参数。
为了进一步理解记录个性化搜索的原始搜索字串和个性化调整参数的过程,以下对个性化搜索的具体实现进行说明。
所谓实时个性化搜索结果是通过实时个性化搜索获得的,具体而言,就是将用户在每一页的点击行为转化为各个维度的用户特征并录入搜索***,并以此实时调整用户个性化信息和搜索结果;例如:根据用户在搜索结果第一页的点击浏览偏好,实时修正第二页展现给用户的搜索结果,增强第二页的个性化展示。当然,在用户第一次发出搜索请求时,已经根据由该用户的历史数据获得的搜索主体相关参数进行了个性化搜索处理。
现有技术提供了实现实时个性化搜索的工具,例如,用于记录用户特征的iGraph服务。iGraph是提供实时在线图存储与查询的***,它具有如下特点:高效的图索引和查询机制;支持超大图(十亿节点、百亿关系)在线索引;灵活的查询语言支撑;通过各种插件支持业务逻辑定制;提供毫秒级别查询响应,10W量级qps吞吐;支持在线实时图数据更新;用户自助的业务接入***。对于搜索服务而言,在搜索服务过程中,用户在每一页的点击行可以转化为各个维度的用户特征录入iGraph(这些用户特征在搜索时具体反映在实时个性化参数中)。用户进入下一页时,就可以通过实时调整个性化调整参数获得进一步个性化的搜索服务。在采用上述iGraph服务实现个性化搜索时,重现搜索场景所必须提取的实时个性化调整参数,可以采用获取iGraph服务的日志文件实现;后面会详细说明采用iGraph服务记录用户特征时获取个性化调整参数的具体方案。
如前所述,在执行搜索,获得个性化搜索结果的过程中,需要记录原始搜索字串和为向搜索主体提供实时个性化搜索而使用的个性化调整参数。以下分别介绍记录原始搜索字串和个性化调整参数的方法。
所述原始搜索字串包括:搜索命令和搜索内容。
所述搜索命令是点击搜索按钮完成的事务;所述搜索内容是对搜索关键字的定义,可以是某类特定关键字,也可以是带限定条件的关键字;例如:在搜索框中输入“连衣裙”;或“长袖连衣裙”;还可通过种类选项获取所述搜索内容,例如:在类型类别中选择“裙子”,再选择“连衣裙”。
所述个性化调整参数,是指为向搜索主体提供个性化搜索而提供的参数;包括:个性化搜索参数和随机算法参数;前者依据搜索主题的个性化因素而设置的调整参数,后者则是为了避免用户每次搜索看到同样的搜索结果而对排序分数比较近的搜索结果进行打散排序使用的参数。
所述个性化搜索参数包括:筛选搜索参数和/或排序搜索参数。
所述筛选搜索参数是对所选搜索内容的细节限定;例如:价格区间、品牌、材质、特色等;所述排序搜索参数是对所述搜索内容显示方式的限定;例如:价格高低、销售量高低、评价高低等。
在上述实现实时个性化搜索的过程中,需要记录个性化搜索过程的整个链路过程,用于重现个性化搜索场景。即所述在执行搜索,获得个性化搜索结果的过程中,一方面需要根据原始搜索字串和向搜索主体提供的个性化调整参数,完成与搜索场景相关的搜索;另一方面,为了实现对搜索场景的重现,还需要对原始搜索字串和该次搜索的实时个性化调整参数进行记录。从这个角度而言,可以将上述搜索过程概括如下:
获取搜索请求,为每个搜索请求生成与该搜索请求唯一对应的搜索请求标识RN;
根据所述搜索请求提取所述原始搜索字串,记录所述原始搜索字串;
根据所述原始搜索字串得到初始搜索结果集合,记录所述初始搜索结果集合;
根据获得的个性化调整参数,对所述初始搜索结果集合进行个性化搜索调整,获得向搜索主体展示的个性化搜索结果;
在执行上述步骤的过程中,进行监听,记录所述查询过程的个性化状况。
结合上述过程,本实施例提供一种基于日志***记录这个搜索过程的方案;请参考图2,是本申请提供的一种进行实时个性化搜索并采用日志***进行记录的方法的流程图。以下步骤中,结合每个步骤同时说明了监听、记录查询过程的个性化状况的办法。
步骤S201:获取搜索请求,为每个搜索请求生成与该搜索请求唯一对应的搜索请求标识RN。
本方法对实时个性化搜索的重现依赖日志***,将个性化搜索的影响因素存入日志***,查询日志***即可重现搜索过程,但需要注意的是,一次搜索中的相关数据可能根据不同的参数性质分别存储在不同的日志中;日志***利用分布式非关系型数据库(例如HBase数据库)存储搜索数据;所述唯一的搜索请求标识用于关联一次搜索的所有相关数据,根据日志体系的“外键”RN可以关联多份日志数据。
具体地,用户发起一次搜索请求,如搜索“连衣裙”;前端服务会给当前次的搜索产生一个与该搜索请求唯一对应的搜索请求标识RN;这个参数用来串联整个从发出搜索请求到最终搜索过程完成的唯一标识(对于电商来说,可以是一次商品搜索到最终成交),会在整个搜索环节中传递,并作为重现搜索场景的依据;在本例中,假设所述RN为具体为searchID。
步骤S202:根据所述搜索请求提取所述原始搜索字串,记录所述原始搜索字串;由于本实施例采用日志***进行记录,在该步骤中,所述前端服务将所述原始搜索字串写入第一日志。
搜索服务提供商接收到搜索命令后,根据原始字串包含的关键词内容和搜索主体相关数据进行计算获取搜索结果;同时,解析原始搜索字串并且按预设格式存入日志***。
例如,服务器接收到搜索访问请求s.m.taobao.com/search?key=连衣裙&id=xxx&searchId=%C1%AC%D2%C2%C8%B9;解析这段字符串,获得关键词key和搜索主体id;通过已经存储的搜索主体id对应的特征数据,计算获取搜索结果,同时将关键词key的值对应搜索主体id存入数据库,searchId的值按照id存入数据库;其中searchId就是唯一的搜索请求标识RN,由浏览器按照Session数据、Cookie数据和当前时间进行编码得到并反馈给服务器(这里只是列举一种实现可能);同一搜索主体id下各次搜索根据searchId的值区分,同一次搜索则根据searchId的值关联。
步骤S203:根据所述原始搜索字串得到初始搜索结果集合,记录所述初始搜索结果集合。在该步骤中,所述前端服务将所返回的搜索结果标识列表写入第一日志中。
搜索服务通过计算得到搜索结果;为了满足重现结果的正确性,将得到结果的搜索结果标识列表记录到日志***。
例如,服务器接收到搜索访问请求s.m.taobao.com/search?key=连衣裙&id=xxx&searchId=%C1%AC%D2%C2%C8%B9;计算得到的分数最高的前n个商品的resultId,例如,前面500个商品;将搜索结果标识resultId的值存入数据库,根据searchId与此次搜索的其他数据相关联;返回以所述搜索结果标识resuldId组成的搜索结果列表。
第一日志中存储包括搜索结果列表(由resultId组成),搜索引擎来源,排除非搜索引擎来源引起的问题(如广告商品的结果则不在搜索日志***中处理)。其中,所述搜索结果列表作为初始搜索结果集合。
步骤S204:根据获得的个性化调整参数,对所述初始搜索结果集合进行个性化搜索调整,获得向搜索主体展示的个性化搜索结果。
根据对搜索结果的操作(浏览、收藏等),通过浏览器cookie记录这些操作,并据此获得实时调整参数,并在触发查找或翻页时将实时调整参数反馈到服务器;服务器在提供搜索结果时,根据所述实时调整参数计算当前展示页面的个性化搜索结果,通常,这些个性化搜索结果在所述初始搜索结果集合中选择获得。
用户在每一页的点击行为都会写入实时***并据此产生实时调整参数。例如,假设当前页为第二页,只有在当次查询中写入日志***中存储的对应第二页的用户特征才是准确的特征信息。无法采用第一页的实时调整参数与第三页实时调整参数的原因如下:第一页的点击行为更新到igraph数据库后,这样,在提供第二页的搜索结果之前,会根据所述第一页的点击行为,产生新的实时调整参数,所述第二页的搜索结果是根据该新的实时调整参数获得的,因此,如果直接采用第一页的实时调整参数,会导致数据向前偏移;同样的,采用第三页的适时调整参数,则会因为第二页的点击行为更新到igraph,导致数据向后偏移。
步骤S205:在执行上述步骤的过程中,进行监听,记录所述查询过程的个性化状况。
具体而言,搜索服务将实时的个性化调整参数写入第二日志中,且将个性化搜索过程中的随机算法参数也同时写入第二日志中。
在整个个性化搜索过程中,根据个性化搜索反馈的信息,调整搜索结果,并实时记录个性化调整参数(包括个性化搜索参数和随机算法参数)。
例如,用户在搜索结果中选择其中一个查看(如点击图片链接),浏览器页面Cookie会记录这个商品id;翻页查看第二页商品(连衣裙)列表,服务器会重复步骤S201,但此时搜索字串会加入已经被查看的商品id;服务器通过对被查看商品对应的特性(价钱、款式、材质等)进行分析计算,对个性化搜索参数进行实时调整,与随机算法参数结合后,获得第二页的个性化搜索结果;记录该结果时,同时记录个性化搜索参数和随机算法参数。
上述记录日志方法的具体过程中,用户发起一次搜索请求,如搜索“连衣裙”,前端服务wsearch会给当前次的搜索产生一个唯一标识RN参数;这个参数用来串联整个从发出搜索请求到最终完成搜索(对于购物网站内的搜索而言,完成搜索可以是客户发出下单指令)的唯一标识,会在整个环节传递;用户的搜索请求会经过前端服务与搜索服务提供商,前端服务会记录用户的搜索请求URL,写入第一日志中;同时,前端服务会记录当前页返回的搜索结果列表,并写入第一日志中;搜索服务提供商会在执行整个查询操作的过程中查询在线数据,获取用户的实时个性化信息,同时将个性化搜索参数写入第二日志中;同时,搜索服务提供商会在执行算法插件的过程中记录算法的随机算法参数,并记录在第二日志中。
反复以上步骤实现一次完整搜索链路,并存入日志***。待需重现此次搜索结构时,就可以通过查找日志***中的本次搜索的所有相关数据实现。
通过此步骤的描述,日志***的设计需要高效、迅速的实现数据存储和数据查找;所以实际设计中商品数据可以存储在前端日志中;个性化数据存储在搜索服务提供商的日志***中。
由上可知,重现搜索场景是基于日志***。在现有技术下,日志结果集是每天凌晨离线生产的,对于用户的反馈而言,这样的响应时间太久。当前也可以去日志文件里面进行查询,这样的效率比较低(从2份日志文件中找到对应日志记录,然后进行手动拼接)。本实施例提供的技术方案中,通过TT对日志进行了订阅,只要有日志产生,就可以随时获取,并且,通过实时计算服务Galaxy对每一份日志进行重组,解析成可以用于重现查询的请求串。在实际实现过程中,整体延迟大概在1分钟左右,时间消耗主要是在等待日志的产生上。所述TT是指TT日志中心,是一个集日志的采集、传输、存储、监控于一体的日志管理***,通过日志中心,用户可以方便将日志数据实时存储到云端。
所述将对应所述搜索场景的所述原始搜索字串与所述个性化调整参数相合并,组成可重现搜索字串,所述个性化调整参数一般包括:调整名称字段和对应调整值列表。
所述当重现所述搜索场景时,将对应所述搜索场景的原始搜索字串与所述个性化调整参数相合并,组成可重现搜索字串的步骤,包括:
将所述个性化调整参数合并加入所述原始搜索字串,组成所述可重现搜索字串。
具体地,还原***订阅日志中心的消息,日志会通过TT推送给订阅方,获取所述第一日志与所述第二日志;***通过RN将2份日志进行join连接,重组出完整的可重现请求字串,还原请求串格式:s.m.taobao.com/search.json?q=连衣裙&mock=算法因子:xxx;nid:1,2,3,4,5,6,7;以及获取个性化信息:xxx&page=1。所述page=1表示该可重现搜索字串对应本次搜索的第一页。
所述将所述个性化调整参数合并加入所述原始搜索字串,组成所述可重现搜索字串的步骤,包括:将搜索对象标识列表(nid:1,2,3,4,5,6,7)加入所述可重现搜索字串。
步骤S102:根据所述可重现搜索字串执行搜索,返回重现的搜索场景。
最终根据搜索服务sp返回的搜索结果详情,就可以重现出用户当时的搜索场景,用于线上问题的诊断排查。
根据所述可重现搜索字串执行搜索,返回重现的搜索场景的步骤之前,包括:按预设格式解析所述可重现搜索字串。
例如,可重现搜索子串s.m.taobao.com/search.json?q=连衣裙&mock=算法因子:xxx;nid:1,2,3,4,5,6,7;个性化信息:xxx&page=1;通过Json字符串传递实时个性化搜索情况;搜索请求q是“连衣裙”。
通过mock这个参数作为标识,对其中的这些需要mock的字段做解析,当搜索服务提供商在获取到这个mock字段的时候,会解析其中的内容。
如解析到算法因子,那么搜索服务提供商就不会再访问算法因子的模型,而直接采用mock字段提供的这个值进行计算;个性化信息的原理与之相同。mock是对于某些不能直接使用的接口或者服务,创建虚拟的接口或服务来模拟其功能的一种方法。
根据所述可重现搜索字串执行搜索,返回重现的搜索场景的步骤之前,按预设格式解析所述可重现搜索字串,包括:
查询所述可重现搜索字串中的已翻页搜索结果标识列表,并在向搜索主体展示的当前页中去除对应所述已翻页搜索结果标识列表的所述搜索结果。所述已翻页搜索结果标识列表中记录着需要重现的该次搜索前面已翻页展示的结果,这些结果在需要重现的本搜索结果页面不能出现。当搜索服务提供商获取到已翻页搜索结果标识列表之后,会对当前页的搜索结果过滤,去除已经展示的搜索结果,保证所展示的搜索结果不重复。在需要重现的搜索场景中,这些搜索对象标识在所述重新搜索字串的已翻页搜索结果列表中列出,代表着需要去重的搜索结果。
所述根据所述可重现搜索字串执行搜索,返回重现的搜索场景,包括:
将所述重现的搜索场景以快照的形式保存。
通过以上对本申请一种实时***中搜索场景的重现方法的描述,解决了实时个性化搜索重现的问题;关于本方法,还有些实施细节问题需要注意。
实时服务的性能要点,重现服务提供全网用户的实时搜索行为重现,延迟需在秒级以下,为此,在具体实施时可以采取一些措施。例如,在存储上采用HBASE表存储,roekey采用散列分布;字段可以压缩存储,必须尽量压缩存储日志数据,字段之间用一个unicode字符分割,去除不必要的字符;通过RN关联的量隔日志愿的数据,存储在HBASE表的同一行的不同列上,避免存储在两个表中再做join操作,从而减少同时并发读和写对性能的影响等。
采用上述实时搜索场景的还原方法后,可以采用下述方式实现对某个具体的实施搜索场景的分享:
第一种方式,是将对应所述搜索场景的可重新搜索字串发送给被分享人;由于可重现搜索字串是通过原始搜索字串与个性化调整参数合并后获得的,通过该可重现搜索字串就可以获得所述搜索场景的全部信息,并实现对所述搜索场景的还原;
第二种方式,是将需要分享的所述搜索场景的搜索请求标识发送给被分享人;通过所述搜索请求标识,结合日志***的记录,同样可以重现与该搜索请求标识关联的搜索场景。
根据一种实时搜索场景的还原方法,本申请提供一种实时搜索场景的还原装置,请参考图3,是本申请第二实施例提供的实时搜索场景的还原装置示意图。关于装置的描述比较简单,详情请参考方法实施例。
一种实时搜索场景的还原装置,包括:
重组字串单元302,用于确定需要重现的搜索场景,将对应所述搜索场景的原始搜索字串与所述个性化调整参数相合并,组成可重现搜索字串。
返回场景单元303,用于根据所述可重现搜索字串执行搜索,返回重现的搜索场景。
可选的,包括记录单元301,用于在执行搜索,获得个性化搜索结果过程中,记录原始搜索字串,和为向搜索主体提供个性化搜索而提供的个性化调整参数。
可选的,包括生成搜索请求标识单元,用于为每个搜索请求生成与该搜索请求唯一对应的搜索请求标识;所述搜索请求标识与所述搜索请求整个存续过程中的各个数据相关联。
可选的,所述记录单元301,包括:
生成搜索请求标识单元,用于获取搜索请求,为每个搜索请求生成与该搜索请求唯一对应的搜索请求标识;所述生成搜索请求标识单元可以如前所述,作为一个独立单元,也可以作为记录单元301的一个子单元,这两种实施方式都是可行的;
提取原始搜索字串单元,用于根据所述搜索请求提取所述原始搜索字串,记录所述原始搜索字串;
获取结果单元,用于根据所述原始搜索字串得到初始搜索结果集合,记录所述初始搜索结果集合;
展示个性化搜索单元,用于根据获得的个性化调整因素,对所述初始搜索结果集合进行个性化搜索调整,获得向搜索主体展示的个性化搜索结果;
监听单元,用于在执行上述步骤的过程中,进行监听,记录所述查询过程的个性化状况。
可选的,所述记录单元301,用于在执行搜索,获得个性化搜索结果的过程中,记录原始搜索字串和为向搜索主体提供个性化搜索而提供的个性化调整参数;同时用于记录所述搜索结果;所述搜索结果包括执行搜索时搜索引擎所返回的搜索结果标识列表。
可选的,所述原始搜索字串包括:搜索命令和搜索内容。
可选的,所述个性化调整参数包括:个性化搜索参数和随机算法参数。
可选的,所述个性化搜索参数包括:筛选搜索参数和/或排序搜索参数。
可选的,所述重组字串单元302,用于将所述个性化调整参数合并加入所述原始搜索字串,组成所述可重现搜索字串。
可选的,所述重组字串单元302,将搜索结果标识列表加入所述可重现搜索字串。
可选的,所述重组字串单元302,当确定需要重现的搜索场景,将对应所述搜索场景的原始搜索字串与个性化调整参数相合并,组成可重现搜索字串的过程中,通过查找所述日志***数据组成所述可重现搜索字串,包括:
获取重现信息单元,用于获取需要重现的搜索场景,通过所述搜索请求标识获取第一日志和第二日志中的对应数据;
组成字串单元,用于将所述第一日志和所述第二日志中获取的数据按预设格式进行重组,得到重现搜索字串。
可选的,包括:解析字串单元,用于在根据所述可重现搜索字串执行搜索,返回重现的搜索场景的步骤之前,按预设格式解析所述可重现搜索字串。
可选的,所述按预设格式解析所述可重现搜索字串,解析结果包括:原始搜索字串、为向搜索主体提供个性化搜索而提供的个性化调整参数、搜索结果标识列表。
可选的,所述返回场景单元303返回重现的搜索场景时,所述重现的搜索场景以快照的形式呈现。
请参考图4,是本申请第三实施例提供的实时搜索场景的还原***示意图。***实施例相似于方法实施例,因此***实施例的描述较简单,具体请参考方法实施例。
一种实时***中搜索场景的重现***,包括通过网络实现相互通讯的服务器402、客户端、数据库:
所述服务器402在执行搜索,获得个性化搜索结果的过程中,记录原始搜索字串和为向搜索主体提供个性化搜索而提供的个性化调整参数到所述数据库403;
当接收所述客户端401指令,重现所述搜索场景时,所述服务器402将数据库403中对应所述搜索场景的所述原始搜索字串与所述调整因素相合并,组成可重现搜索字串;
根据所述可重现搜索字串执行搜索,返回重现的搜索场景到所述客户端401。
可选的,所述服务器402在执行搜索,获得个性化搜索结果的过程中,记录原始搜索字串和为向搜索主体提供个性化搜索而提供的个性化调整参数到所述数据库403,其中的记录基于日志***,包括:
客户端发起搜索请求,服务器402获取搜索请求,为每个搜索请求生成与该搜索请求唯一对应的搜索请求标识;
根据所述搜索请求提取所述原始搜索字串,记录所述原始搜索字串,前端服务将所述原值搜索字串写入第一日志;
根据所述原始搜索字串得到初始搜索结果集合,记录所述初始搜索结果集合,所述前端服务将所返回的搜索对象标识列表写入第一日志中;
根据获得的个性化调整参数,对所述初始搜索结果集合进行个性化搜索调整,获得向搜索主体展示的个性化搜索结果;
在执行上述步骤的过程中,进行监听,记录所述查询过程的个性化状况,搜索服务将个性化搜索参数写入第二日志中,且将个性化搜索过程中的随机算法参数写入第二日志中。
可选的,所述服务器402在执行搜索,获得个性化搜索结果的过程中,同时记录所述搜索结果;所述搜索结果包括执行搜索时搜索引擎所返回的搜索结果标识列表。
可选的,所述当接收客户端401指令,重现所述搜索场景时,所述服务器402将所述数据库403中对应所述搜索场景的所述原始搜索字串与所述调整因素相合并,组成可重现搜索字串,将所述调整参数合并加入所述原始搜索字串,组成所述可重现搜索字串。
可选的,所述当接收客户端401指令,重现所述搜索场景时,所述服务器402将数据库403中对应所述搜索场景的所述原始搜索字串与所述个性化调整参数相合并,组成可重现搜索字串,包括:
所述服务器402获取重现信息,通过所述搜索请求标识获取所述第一日志和所述第二日志中的对应数据;
将所述第一日志和所述第二日志中的获取的数据按预设格式进行重组,得到重现搜索字串。
可选的,所述服务器402根据所述可重现搜索字串执行搜索,返回重现的搜索场景的步骤之前,包括:按预设格式解析所述可重现搜索字串。
可选的,所述根据所述可重现搜索字串执行搜索,返回重现的搜索场景到客户端,包括:
将所述重现的搜索场景以快照的形式呈现。
请参考图5,是本申请第四实施例提供的实时搜索场景的还原电子设备示意图。电子设备实施例相似于方法实施例,因此电子设备实施例描述较简单,具体请参考方法实施例。
一种实时***中搜索场景重现的电子设备,所述电子设备包括:
显示器501;
处理器502;
存储器503,用于确定需要重现的搜索场景,将对应所述搜索场景的原始搜索字串与个性化调整参数相合并,组成可重现搜索字串,所述个性化调整参数是为向搜索主体提供个性化搜索而提供的参数;
根据所述可重现搜索字串执行搜索,返回重现的搜索场景。
本申请第五实施例提供一种用于实时搜索场景还原的存储设备,该存储设备存储有指令,所述指令能够被处理器加载并执行以下步骤:
确定需要重现的搜索场景,将对应所述搜索场景的原始搜索字串与个性化调整参数相合并,组成可重现搜索字串,所述个性化调整参数是为向搜索主体提供个性化搜索而提供的参数;
根据所述可重现搜索字串执行搜索,返回重现的搜索场景。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
2、本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (29)

1.一种实时搜索场景的还原方法,其特征在于,包括:
确定需要重现的搜索场景,将对应所述搜索场景的原始搜索字串与个性化调整参数相合并,组成可重现搜索字串;
根据所述可重现搜索字串执行搜索,返回重现的搜索场景;
其中,所述个性化调整参数,是指为向搜索主体提供个性化搜索而提供的参数。
2.根据权利要求1所述的实时搜索场景的还原方法,其特征在于,为实现该方法,在执行搜索过程中,进行如下准备工作:
在执行搜索,获得个性化搜索结果的过程中,记录原始搜索字串,和为搜索场景提供个性化搜索而提供的个性化调整参数。
3.根据权利要求2所述的实时搜索场景的还原方法,其特征在于,所述记录原始搜索字串和为搜索场景提供个性化搜索而提供的个性化调整参数的步骤之前,执行下述步骤:
为每个搜索请求生成与该搜索请求唯一对应的搜索请求标识;所述搜索请求标识与所述搜索请求整个存续过程中的各个数据相关联。
4.根据权利要求2所述的实时搜索场景的还原方法,其特征在于,所述在执行搜索,获得个性化搜索结果的过程中,记录原始搜索字串和为向搜索主体提供个性化搜索而提供的个性化调整参数,包括:
获取搜索请求,为每个搜索请求生成与该搜索请求唯一对应的搜索请求标识;
根据所述搜索请求提取所述原始搜索字串,记录所述原始搜索字串;
根据所述原始搜索字串得到初始搜索结果集合,记录所述初始搜索结果集合;
根据获得的个性化调整参数,对所述初始搜索结果集合进行个性化搜索调整,获得向搜索主体展示的个性化搜索结果;
在执行上述步骤的过程中,进行监听,记录所述搜索过程的个性化状况。
5.根据权利要求4所述的实时搜索场景的还原方法,其特征在于,所述在执行搜索,获得个性化搜索结果的过程中,记录原始搜索字串和为向搜索主体提供个性化搜索而提供的个性化调整参数,其中的记录基于日志***,包括:
所述根据所述搜索请求提取所述原始搜索字串,记录所述原始搜索字串的步骤中,前端服务将所述原始搜索字串写入第一日志;
所述根据所述原始搜索字串得到初始搜索结果集合,记录所述初始搜索结果集合的步骤中,所述前端服务将所返回的搜索结果标识列表写入第一日志中;
所述进行监听,记录所述搜索过程的个性化状况的步骤中,搜索服务将个性化搜索参数写入第二日志中,以及将个性化搜索过程中的随机算法参数写入第二日志中。
6.根据权利要求2所述的实时搜索场景的还原方法,其特征在于,所述在执行搜索,获得个性化搜索结果的过程中,同时记录所述搜索结果;所述搜索结果包括执行搜索时搜索引擎所返回的搜索结果标识列表。
7.根据权利要求4所述的实时搜索场景的还原方法,其特征在于,所述原始搜索字串包括:搜索命令和搜索内容。
8.根据权利要求1所述的实时搜索场景的还原方法,其特征在于,所述个性化调整参数包括:个性化搜索参数和随机算法参数。
9.根据权利要求8所述的实时搜索场景的还原方法,其特征在于,所述个性化搜索参数包括:筛选搜索参数和/或排序搜索参数。
10.根据权利要求1所述的实时搜索场景的还原方法,其特征在于,所述确定需要重现的搜索场景,将对应所述搜索场景的原始搜索字串与个性化调整参数相合并,组成可重现搜索字串的步骤,包括:
将所述个性化调整参数合并加入所述原始搜索字串,组成所述可重现搜索字串。
11.根据权利要求10所述的实时搜索场景的还原方法,其特征在于,所述将所述个性化调整参数合并加入所述原始搜索字串,组成所述可重现搜索字串的步骤,包括:将搜索结果标识列表加入所述可重现搜索字串。
12.根据权利要求5所述的实时搜索场景的还原方法,其特征在于,所述确定需要重现的搜索场景,将对应所述搜索场景的原始搜索字串与个性化调整参数相合并,组成可重现搜索字串的步骤,通过查找所述日志***数据组成所述可重现搜索字串,包括:
获取需要重现的搜索场景,通过所述搜索请求标识获取所述第一日志和所述第二日志中的对应数据;
将所述第一日志和所述第二日志中获取的数据按预设格式进行重组,得到重现搜索字串。
13.根据权利要求1所述的实时搜索场景的还原方法,其特征在于,根据所述可重现搜索字串执行搜索,返回重现的搜索场景的步骤之前,包括:按预设格式解析所述可重现搜索字串。
14.根据权利要求13所述的实时搜索场景的还原方法,其特征在于,所述按预设格式解析所述可重现搜索字串,解析结果包括:原始搜索字串、为向搜索主体提供个性化搜索而提供的个性化调整参数、搜索对象标识列表。
15.根据权利要求1所述的实时搜索场景的还原方法,其特征在于,所述根据所述可重现搜索字串执行搜索,返回重现的搜索场景,包括:
将所述重现的搜索场景以快照的形式呈现。
16.根据权利要求1所述的实时搜索场景的还原方法,其特征在于,用户通过如下方式分享搜索场景:
将对应所述搜索场景的可重新搜索字串发送给被分享人。
17.根据权利要求3所述的实时搜索场景的还原方法,其特征在于,用户通过如下方式分享搜索场景:将需要分享的所述搜索场景的搜索请求标识发送给被分享人。
18.一种实时搜索场景的还原装置,其特征在于,包括:
重组字串单元,用于确定需要重现的搜索场景,将对应所述搜索场景的原始搜索字串与个性化调整参数相合并,组成可重现搜索字串;
返回场景单元,用于根据所述可重现搜索字串执行搜索,返回重现的搜索场景;
其中,所述个性化调整参数,是指为向搜索主体提供个性化搜索而提供的参数。
19.根据权利要求18所述的实时搜索场景的还原装置,其特征在于,包括:
记录单元,用于在执行搜索,获得个性化搜索结果过程中,记录原始搜索字串,和为向搜索主题提供个性化搜索而提供的个性化调整参数。
20.根据权利要求18所述的实时搜索场景的还原装置,其特征在于,包括生成搜索请求标识单元,用于为每个搜索请求生成与该搜索请求唯一对应的搜索请求标识;所述搜索请求标识与所述搜索请求整个存续过程中的各个数据相关联。
21.根据权利要求19所述的实时搜索场景的还原装置,其特征在于,所述记录单元,包括:
生成搜索请求标识单元,用于获取搜索请求,为每个搜索请求生成与该搜索请求唯一对应的搜索请求标识;
提取原始搜索字串单元,用于根据所述搜索请求提取所述原始搜索字串,记录所述原始搜索字串;
获取结果单元,用于根据所述原始搜索字串得到初始搜索结果集合,记录所述初始搜索结果集合;
展示个性化搜索单元,用于根据获得的个性化调整因素,对所述初始搜索结果集合进行个性化搜索调整,获得向搜索主体展示的个性化搜索结果;
监听单元,用于在执行上述步骤的过程中,进行监听,记录所述搜索过程的个性化状况。
22.一种实时搜索场景的还原***,其特征在于,包括通过网络实现相互通讯的服务器、客户端、数据库;
所述服务器在执行搜索,获得个性化搜索结果的过程中,记录原始搜索字串和为向搜索主体提供个性化搜索而提供的个性化调整参数到数据库;
当接收客户端指令,重现所述搜索场景时,服务器将所述数据库中对应所述搜索场景的所述原始搜索字串与所述个性化调整参数相合并,组成可重现搜索字串;
根据所述可重现搜索字串执行搜索,返回重现的搜索场景到客户端;
其中,所述个性化调整参数,是指为向搜索主体提供个性化搜索而提供的参数。
23.根据权利要求22所述的实时搜索场景的还原***,其特征在于,所述服务器在执行搜索,获得个性化搜索结果的过程中,记录原始搜索字串和为向搜索主体提供个性化搜索而提供的个性化调整参数到数据库,其中的记录基于日志***,包括:
客户端发起搜索请求,服务器获取搜索请求,为每个搜索请求生成与该搜索请求唯一对应的搜索请求标识;
根据所述搜索请求提取所述原始搜索字串,记录所述原始搜索字串,前端服务将所述原始搜索字串写入第一日志;
根据所述原始搜索字串得到初始搜索结果集合,记录所述初始搜索结果集合,所述前端服务将所返回的搜索对象标识列表写入第一日志中;
根据获得的个性化调整参数,对所述初始搜索结果集合进行个性化搜索调整,获得向搜索主体展示的个性化搜索结果;
在执行上述步骤的过程中,进行监听,记录所述搜索过程的个性化状况,搜索服务将个性化搜索参数写入第二日志中,且将个性化搜索过程中的随机算法参数写入第二日志中。
24.根据权利要求22所述的实时搜索场景的还原***,其特征在于,所述服务器在执行搜索,获得个性化搜索结果的过程中,同时记录所述搜索结果;所述搜索结果包括执行搜索时搜索引擎所返回的搜索结果标识列表。
25.根据权利要求23所述的实时搜索场景的还原***,其特征在于,所述当接收客户端指令,重现所述搜索场景时,服务器将数据库中对应所述搜索场景的所述原始搜索字串与所述个性化调整参数相合并,组成可重现搜索字串,包括:
服务器获取重现信息,通过所述搜索请求标识获取所述第一日志和所述第二日志中的对应数据;
将所述第一日志和所述第二日志中的获取的数据按预设格式进行重组,得到所述可重现搜索字串。
26.根据权利要求22所述的实时搜索场景的还原***,其特征在于,服务器根据所述可重现搜索字串执行搜索,返回重现的搜索场景的步骤之前,包括:按预设格式解析所述可重现搜索字串。
27.根据权利要求22所述的实时搜索场景的还原***,其特征在于,所述根据所述可重现搜索字串执行搜索,返回重现的搜索场景到客户端,包括:
将所述重现的搜索场景以快照的形式呈现。
28.一种实时搜索场景还原的电子设备,其特征在于,所述电子设备包括:
显示器;
处理器;
存储器,用于确定需要重现的搜索场景,将对应所述搜索场景的原始搜索字串与个性化调整参数相合并,组成可重现搜索字串,所述个性化调整参数是为向搜索主体提供个性化搜索而提供的参数;
根据所述可重现搜索字串执行搜索,返回重现的搜索场景;
其中,所述个性化调整参数,是指为向搜索主体提供个性化搜索而提供的参数。
29.一种用于实时搜索场景还原的存储设备,其特征在于,存储有指令,所述指令能够被处理器加载并执行以下步骤:
确定需要重现的搜索场景,将对应所述搜索场景的原始搜索字串与个性化调整参数相合并,组成可重现搜索字串,所述个性化调整参数是为向搜索主体提供个性化搜索而提供的参数;
根据所述可重现搜索字串执行搜索,返回重现的搜索场景;
其中,所述个性化调整参数,是指为向搜索主体提供个性化搜索而提供的参数。
CN201710747385.1A 2017-08-25 2017-08-25 实时搜索场景的还原方法、装置和*** Active CN110020101B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710747385.1A CN110020101B (zh) 2017-08-25 2017-08-25 实时搜索场景的还原方法、装置和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710747385.1A CN110020101B (zh) 2017-08-25 2017-08-25 实时搜索场景的还原方法、装置和***

Publications (2)

Publication Number Publication Date
CN110020101A CN110020101A (zh) 2019-07-16
CN110020101B true CN110020101B (zh) 2023-09-12

Family

ID=67186150

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710747385.1A Active CN110020101B (zh) 2017-08-25 2017-08-25 实时搜索场景的还原方法、装置和***

Country Status (1)

Country Link
CN (1) CN110020101B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114445197A (zh) * 2022-02-10 2022-05-06 北京沃东天骏信息技术有限公司 商品列表页面的重现方法及装置、存储介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005267053A (ja) * 2004-03-17 2005-09-29 Nec Corp 音声検索装置、音声検索サーバ、音声検索方法及び音声検索プログラム
CN102521251A (zh) * 2011-11-16 2012-06-27 北京搜狗科技发展有限公司 个性化搜索直达的方法、实现该方法的装置和搜索服务器
CN104699725A (zh) * 2013-12-10 2015-06-10 阿里巴巴集团控股有限公司 数据搜索处理方法及***
CN105808605A (zh) * 2014-12-31 2016-07-27 北京奇虎科技有限公司 一种搜索日志合并方法和***
CN106446132A (zh) * 2016-09-19 2017-02-22 百度在线网络技术(北京)有限公司 搜索处理方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060218146A1 (en) * 2005-03-28 2006-09-28 Elan Bitan Interactive user-controlled relevance ranking of retrieved information in an information search system
JP5866728B2 (ja) * 2011-10-14 2016-02-17 サイバーアイ・エンタテインメント株式会社 画像認識システムを備えた知識情報処理サーバシステム
US9600542B2 (en) * 2014-06-27 2017-03-21 Sap Se Fuzzy substring search

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005267053A (ja) * 2004-03-17 2005-09-29 Nec Corp 音声検索装置、音声検索サーバ、音声検索方法及び音声検索プログラム
CN102521251A (zh) * 2011-11-16 2012-06-27 北京搜狗科技发展有限公司 个性化搜索直达的方法、实现该方法的装置和搜索服务器
CN104699725A (zh) * 2013-12-10 2015-06-10 阿里巴巴集团控股有限公司 数据搜索处理方法及***
CN105808605A (zh) * 2014-12-31 2016-07-27 北京奇虎科技有限公司 一种搜索日志合并方法和***
CN106446132A (zh) * 2016-09-19 2017-02-22 百度在线网络技术(北京)有限公司 搜索处理方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于用户兴趣模型构建与个性化搜索算法研究;张晓飞;余建桥;;电脑知识与技术(18);全文 *

Also Published As

Publication number Publication date
CN110020101A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
CN105446972B (zh) 基于及融合用户关系数据的搜索方法、装置和***
US11226964B1 (en) Automated generation of metrics from log data
US9262767B2 (en) Systems and methods for generating statistics from search engine query logs
CN105765573B (zh) 网站通信量优化方面的改进
JP5721818B2 (ja) 検索におけるモデル情報群の使用
US9177341B2 (en) Determining search relevance from user feedback
US7809752B1 (en) Representing user behavior information
US20090319365A1 (en) System and method for assessing marketing data
TWI752303B (zh) 營銷資訊投放平台建立方法及裝置
KR20110009198A (ko) 최다 클릭된 다음 객체들을 갖는 검색 결과
US20130185429A1 (en) Processing Store Visiting Data
US20190332972A1 (en) Dynamic query response with metadata
US9390446B2 (en) Consumer centric online product research
US20150310529A1 (en) Web-behavior-augmented recommendations
KR100987058B1 (ko) 인터넷 컨텐츠의 키워드를 이용한 광고 서비스 제공 방법,시스템 및 이를 위한 프로그램 기록매체
US20230123539A1 (en) Stitching event data using identity mappings
US10169802B2 (en) Data refining engine for high performance analysis system and method
CN107404508A (zh) 客户端页面的访问方法、客户端及电子设备
US8903817B1 (en) Determining search relevance from user feedback
JP5249415B2 (ja) データ統計を提供するための方法及び装置
CN109522473B (zh) 一种推荐关联信息的方法及其终端、服务器
CN110674404A (zh) 链接信息生成方法、装置、***、存储介质及电子设备
CN105450460B (zh) 网络操作记录方法及***
CN110020101B (zh) 实时搜索场景的还原方法、装置和***
US9734529B1 (en) Method, system, and computer readable medium for selection of catalog items for inclusion on a network page

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230630

Address after: Room 554, floor 5, building 3, No. 969, Wenyi West Road, Wuchang Street, Yuhang District, Hangzhou City, Zhejiang Province

Applicant after: TAOBAO (CHINA) SOFTWARE CO.,LTD.

Address before: Box 847, four, Grand Cayman capital, Cayman Islands, UK

Applicant before: ALIBABA GROUP HOLDING Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant