CN106708887A - 一种意图驱动的产品搜索***和方法 - Google Patents

一种意图驱动的产品搜索***和方法 Download PDF

Info

Publication number
CN106708887A
CN106708887A CN201510790109.4A CN201510790109A CN106708887A CN 106708887 A CN106708887 A CN 106708887A CN 201510790109 A CN201510790109 A CN 201510790109A CN 106708887 A CN106708887 A CN 106708887A
Authority
CN
China
Prior art keywords
search
user
qtext
qfilter
intention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510790109.4A
Other languages
English (en)
Inventor
符建辉
王卫明
曹阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KNOWOLOGY INTELLIGENT TECHNOLOGY Co Ltd
Original Assignee
KNOWOLOGY INTELLIGENT TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KNOWOLOGY INTELLIGENT TECHNOLOGY Co Ltd filed Critical KNOWOLOGY INTELLIGENT TECHNOLOGY Co Ltd
Priority to CN201510790109.4A priority Critical patent/CN106708887A/zh
Publication of CN106708887A publication Critical patent/CN106708887A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种意图驱动的产品搜索***及方法,包括接收从电子商务平台搜索模块传送的用户第(i-1)次的搜索请求、搜索模块返回的搜索结果、用户的浏览记录的模块A;由用户的第(i-1)次浏览记录VRi-1={R′i-1,1,R′i-1,2,…,R′i-1,si}计算出用户第(i-1)次搜索意图的模块B;根据用户第(i-1)次搜索意图以及第i次搜索请求和搜索结果,计算用户第i次搜索意图的模块C;使用用户第i次搜索的意图,对用户第i次搜索结果进行过滤的模块D;本发明具有很强的通用性,产品的平均搜索时间缩减了24.7%。

Description

一种意图驱动的产品搜索***和方法
技术领域
本发明涉及计算机搜索技术研究领域,特别是涉及一种意图驱动的产品搜索***及方法。
背景技术
搜索引擎是一种特殊的软件,它接收用户的查询串,返回给用户满足查询串的内容(如网页、商品、视频等)。Google、Yahoo和百度都有自己的搜索引擎,它们接收用户的查询串,返回存储的网页给用户。电子商务平台(如Amazon、淘宝、京东等)也有自己的搜索引擎,它们接收消费者的商品查询串,接收用户的筛选项(如价格档次),给用户返回满足查询串的产品信息。
搜索问题一直是计算机领域、互联网应用领域中的关键问题,虽然方法很多,但是实际效果都不够理想。
这一问题也普遍发生在各式各样的电子商务平台上。例如,大型电子商务平台(如淘宝、京东、维品会等)都有自己的搜索引擎,但是从用户体验角度看,搜索效果总是差强人意,用户通常不得不在平台上花费大量的时间进行搜索,进行产品比较,才能挑出满意的产品。为什么会出现这种情况呢?根本原因就是搜索***不了解用户的意图,不掌握用户的需求,搜索对象没有得到充分的语义分析,使得用户耗费时间多次搜索。
具体而言,造成电子商务平台产品搜索不准确的主要原因有:
(1)电子商务平台同类产品的商家太多,造成计算机库中的内容大量重复,或者同类产品的种类繁多,而搜索***采用的策略固定,不能适应用户的需求;
(2)有些搜索***按照众人的搜索行为进行适当的过滤(如著名的协同过滤技术),而这种粗放的、从众的过滤策略难以真正满足用户的个性化需要。
(3)尽管所有搜索电子商务平台的搜索引擎提供价格范围、品牌、国别、店主信用级别等元数据(metadata)过滤条件,但是由于它们的限制条件过于宽泛,还是不能很好地解决多次搜索的、多次浏览页面、多次产品比较的情形。
本发明针对的技术问题是:当用户在使用电子商务平台搜索模块搜索产品时,搜索模块并不真正地理解用户的意图;加之电子商务平台同类产品极多,用户不得不在大量产品中,通过逐项比对的方式搜索产品,不仅搜索时间长,而且也极易不能正确地搜索到自己满意的产品。
发明内容
本发明所要解决的技术问题:针对以上问题本发明提供了一种在电子商务平台上可快速而精准产品搜索的意图驱动的产品搜索***和方法。
技术方案:为了解决以上问题,本发明提供了一种意图驱动的产品搜索***,其特征在于:包括接收从电子商务平台搜索模块传送的用户第(i-1)次的搜索请求、搜索模块返回的搜索结果、用户的浏览记录的模块A;由用户的第(i-1)次浏览记录VRi-1={R′i-1,1,R′i-1,2,…,R′i-1,si}(其中每一项代表用户浏览的一项产品,共计有si项)计算出用户第(i-1)次搜索意图的模块B;根据用户第(i-1)次搜索意图以及第i次搜索请求和搜索结果,计算用户第i次搜索意图的模块C;使用用户第i次搜索的意图,对用户第i次搜索结果进行过滤的模块D;
上面所述模块中,模块A对用户第(i-1)次的搜索信息进行收集,包括搜索请求、搜索模块返回的搜索结果、用户的浏览记录,这些信息为模块B所使用;模块B用于获得用户在进行第(i-1)次搜索时的搜索意图,该意图将被模块C和模块D使用;模块C利用模块B提供的用户第(i-1)次搜索意图,以及用户第i次搜索请求和搜索结果,计算出用户在进行第i次搜索时的搜索意图,这一搜索意图将被模块D用于过滤用户的第i次搜索结果;模块D根据模块B和模块C计算的用户第(i-1)次搜索意图、用户第i次搜索意图,对用户的第i次搜索结果进行多个层次的过滤,保留准确的搜索结果供用户浏览。
为了解决以上问题本发明提供了一种意图驱动的产品搜索方法,其特征在于:包括以下步骤:
第一步:接收从电子商务平台搜索模块传送的用户第(i-1)次的搜索请求、搜索模块返回的搜索结果、用户的浏览记录;
第(i-1)次搜索使用的搜索请求为Queryi-1=(Qtexti-1,Qfilteri-1),其中查询串经过分词后得到Qtexti-1={Qtexti-1,1,Qtexti-1,2,…,Qtexti-1,ai},也即Qtexti-1分词形成ai个分词项。搜索引擎返回的搜索结果为Ri-1={Ri-1,1,Ri-1,2,…,Ri-1,mi},其中每一项代表搜索引擎返回的一项搜索结果,共计mi项,下标(i-1)代表第(i-1)次搜索的意思;用户在Ri-1中浏览记录为VRi-1={R′i-1,1,R′i-1,2,…,R′i-1,si},其中每一项代表用户浏览的一项产品,共计有si项,满足si≤mi,且即VRi-1是Ri-1的子集。
第二步:由用户的第(i-1)次浏览记录VRi-1={R′i-1,1,R′i-1,2,…,R′i-1,si}计算出用户第(i-1)次搜索的意图;
如第一步所述,在第(i-1)次搜索过程中,搜索结果为Ri-1,而用户浏览记录为VRi-1,那么这两个集合的差集Diff(Ri-1,VRi-1)表示用户不感兴趣的搜索结果;而Interset(Qtexti-1,VRi-1)表示用户表示用户感兴趣的搜索结果;将用户第(i-1)次搜索的意图设定为一个三元组[Qfilteri-1,Diff(Ri-1,VRi-1),Interset(Qtexti-1,VRi-1)];
第三步:根据第(i-1)次搜索意图以及第i次搜索请求和搜索结果,计算用户第i次搜索的意图:
第i次搜索使用的搜索请求Queryi=(Qtexti,Qfilteri),其中查询串经过分词后得到Qtexti={Qtexti,1,Qtexti,2,…,Qtexti,bi},也即Qtexti分词形成bi个分词项;搜索引擎返回的搜索结果为Ri={Ri,1,Ri,2,…,Ri,ni},共计ni项;
比对用户第i次的搜索和第(i-1)次搜索的区别:
步骤C1:当Qfilteri与Qfilteri-1不一致时,这说明用户改变了筛选项,或采用了新的Qtexti代替第(i-1)次的Qtexti-1;因此,用户在执行第i次搜索的意图体现在两个差集Diff(Qfilteri,Qfilteri-1)和Diff(Qtexti,Qtexti-1)中,我们采用二元对[Diff(Qfilteri,Qfilteri-1),Diff(Qtexti,Qtexti-1)]表示;
步骤C2:当Qfilteri与Qfilteri-1一致时,这说明用户并没有改变筛选项,而只是采用了新的Qtexti代替第(i-1)次的Qtexti-1;因此,用户在执行第i次搜索的意图体现在Diff(Qtexti,Qtexti-1)中;为了便于第四步的处理,我们此时也将用户在执行第i次搜索的意图记为二元对[φ,Diff(Qtexti,Qtexti-1)],其中φ表示空集;
第四步:使用用户第(i-1)次的搜索意图、第i次的搜索意图,对用户第i次搜索结果进行过滤;
上述步骤计算出了用户第(i-1)次的搜索意图[Qfilteri-1,Diff(Ri-1,VRi-1),Interset(Qtexti-1,VRi-1)],也计算出了第i次的搜索意图[Diff(Qfilteri,Qfilteri-1),Diff(Qtexti,Qtexti-1)];下面介绍对搜索引擎返回的第i次搜索结果Ri={Ri,1,Ri,2,…,Ri,ni}的过滤方法:
步骤D1:如果Qfilteri-1=Qfilteri,并且Interset(Qtexti-1,VRi-1)不空,则从Ri过滤掉含有Diff(Ri-1,VRi-1)中元素的元素;
步骤D2:如果Qfilteri=Qfilteri-1,并且Diff(Qtexti,Qtexti-1)不空,则从Ri过滤掉不含有Diff(Qtexti,Qtexti-1)中元素的元素;
步骤D3:如果Qfilteri≠Qfilteri-1,并且Diff(Qtexti,Qtexti-1)为空,则从Ri过滤掉不满足过滤项Qfilteri的元素;
步骤D3说明,用户没有改变查询项,只是关注了筛选项。
步骤D4:如果Qfilteri≠Qfilteri-1,并且Diff(Qtexti,Qtexti-1)不空,则从Ri过滤掉不满足过滤项Qfilteri的元素,同时从Ri过滤掉不含有Diff(Qtexti,Qtexti-1)中元素的元素。
有益效果:本发明首先分析用户使用电子商务平台搜索模块的搜索产品的意图,在用户执行当前搜索时,结合前一次的搜索意图,对当前搜索的结果进行动态筛选,确定出用户真正需要的产品,从而为用户在电子商务平台上实现快速而精准的产品搜索。本发明具有很强的通用性,产品的平均搜索时间缩减了24.7%,它可以集成到淘宝、京东、维品会、亚马逊等电子商务平台上,增强它们的搜索效果,也可以集成到其他众多的电子商务平台中。
附图说明
图1为用户执行的n次搜索示意图,它解释了本发明原理的多次搜索过程;
图2为本发明的一种意图驱动的产品搜索***和方法模块工作流程图。
具体实施方式
为了能够更清楚的说明本发明,以下定义并解释如下的术语:
(1)电子商务平台、电子商务平台搜索模块:电子商务平台是一个大型的装置,它保存了大量的多种多样的产品,用户可以通过它的搜索模块进行产品搜索,找到自己需要的产品,然后进行网上订单支付、网上跟踪等活动。通常,电子商务平台搜索模块包括两个基本功能:第一是文本搜索,用户通过输入文本串,执行搜索后,搜索模块返回含有输入文本串的产品信息;第二是产品筛选,用户可以设计需要的筛选项(如价格档次、品牌等),在执行搜索后,搜索模块给用户返回满足筛选限制的产品信息。
(2)用户搜索请求:根据上面对电子商务平台搜素模块的理解,本发明将用户搜索请求定义为一个二元组Query=(Qtext,Qfilter),其中Qtext是用户输入的搜索文本串(如“笔记本电脑”),Qfilter={Qfilter1,...,Qfilterk}为一个筛选项集合。例如,Qfilter={“价格=4000-6000”,“品牌=联想、苹果”},它含有价格和品牌这2个筛选项。用户搜索请求也简称搜索请求。
(3)电子商务平台搜索模块返回的搜索结果、用户浏览的记录:执行用户搜索请求后,搜索模块返回一些满足搜索请求的产品信息,供用户浏览,这些信息称为搜索结果。用户对上一次搜索结果进行浏览,浏览过的搜索结果的记录,称为用户的浏览记录,简称浏览记录。
(4)第1次搜索:用户为了某个意图,在某个平台上执行的第一次搜索。
(5)第2次搜索:用户为了某个意图,在某个平台上执行的第一次搜索后,由于对第一次搜索结果不满意,实行第二次搜索的过程。
(6)第i次搜索:这是一个表示模式。它表示用户为了某个意图,在某个平台上执行的第(i-1)次搜索后,由于对第(i-1)次搜索结果不满意,用户执行第i次搜索的过程。
(7)产品描述项:是关于产品某个属性的定性划分。常见的产品等级描述项包括:
●产品价格等级:针对产品而设置的一个描述项。本发明将产品价格等级记为{PB1,PB2,...,PBk},例如,产品价格等级={低价,中价,高价},其中k=3。
●产品品牌等级:针对现有产品而设置的一个描述项。本发明将产品品牌等级记为{PB1,PB2,...,PBk}。例如,产品品牌等级={低端,中段,高端},这里k=3。注意,为了便于描述,这里的k与产品价格等级中的k同名,但数值不一定相同,下文类似。
●新产品品牌等级:针对新产品而设置的一个描述项。本发明将新产品品牌等级记为{NB1,NB2,...,NBk}。例如,新产品品牌等级={低端,中端,高端,特高端},其中k=4。
●店主信用等级:为电子商务平台的店主设置的一个描述项。本发明将店主信用等级记为{SC1,SC2,...,SCk}。例如,店主信用等级={普通,银牌,金牌,钻石}。
(8)产品搜索时间:在电子商务平台上,用户搜索到自己需要的产品所花费的时间。
(9)集合的差集、交集、并集、基数:给定两个集合S1和S2,它们的差集记为Diff(S1,S2),是由那些出现在S1中而不出现在S2中的元素构成的集合。例如,S1={笔记本,电脑},S2={笔记本,电脑,4G},则Diff(S2,S1)={4G},Diff(S1,S2)={},即Diff(S1,S2)为空集合。即出现在S1又出现在S2中的元素为S1和S2的交集,记为Interset(S1,S2)。例如,S1={笔记本,电脑},S2={笔记本,电脑,4G},则Interset(S1,S2)={笔记本,电脑}。
下面结合附图和具体实施方式对本发明作进一步详细地说明。
本发明提出的一种意图驱动的产品搜索***分为四个大的模块:
模块A:接收从电子商务平台搜索模块传送的用户第(i-1)次的搜索请求、搜索模块返回的搜索结果、用户的浏览记录。
模块B:由用户的第(i-1)次浏览记录VRi-1={R′i-1,1,R′i-1,2,…,R′i-1,si},其中每一项代表用户浏览的一项产品,共计有si项。
计算出用户第(i-1)次搜索的意图。
模块C:根据第(i-1)次搜索意图以及第i次搜索请求和搜索结果,计算用户第i次搜索的意图。
模块D:使用用户第i次搜索的意图,对用户第i次搜索结果进行过滤。
模块A:接收从电子商务平台搜索模块传送的用户第(i-1)次的搜索请求、搜索模块返回的搜索结果、用户的浏览记录。
为了便于解释,我们下面假设第(i-1)次搜索使用的搜索请求Queryi-1=(Qtexti-1,Qfilteri-1),其中查询串经过分词后得到Qtexti-1={Qtexti-1,1,Qtexti-1,2,…,Qtexti-1,ai},也即Qtexti-1分词形成ai个分词项。搜索引擎返回的搜索结果为Ri-1={Ri-1,1,Ri-1,2,…,Ri-1,mi},其中每一项代表搜索引擎返回的一项搜索结果,共计mi项,下标(i-1)代表第(i-1)次搜索的意思。用户在Ri-1中浏览记录为VRi-1={R′i-1,1,R′i-1,2,…,R′i-1,si},其中每一项代表用户浏览的一项产品,共计有si项,满足si≤mi,且(即VRi-1是Ri-1的子集)。
模块B:由用户的第(i-1)次浏览记录VRi-1={R′i-1,1,R′i-1,2,…,R′i-1,si}计算出用户第(i-1)次搜索的意图。
如前所述,在第(i-1)次搜索过程中,搜索结果为Ri-1,而用户浏览记录为VRi-1,那么这两个集合的差集Diff(Ri-1,VRi-1)表示用户不感兴趣的搜索结果。而Interset(Qtexti-1,VRi-1)表示用户表示用户感兴趣的搜索结果。
根据上面说明,本发明将用户第(i-1)次搜索的意图设定为一个三元组[Qfilteri-1,Diff(Ri-1,VRi-1),Interset(Qtexti-1,VRi-1)]。
模块C:根据第(i-1)次搜索意图以及第i次搜索请求和搜索结果,计算用户第i次搜索的意图。
为了便于解释,我们下面假设第i次搜索使用的搜索请求Queryi=(Qtexti,Qfilteri),其中查询串经过分词后得到Qtexti={Qtexti,1,Qtexti,2,…,Qtexti,bi},也即Qtexti分词形成bi个分词项。搜索引擎返回的搜索结果为Ri={Ri,1,Ri,2,…,Ri,ni},共计ni项。
用户在进行了第(i-1)次搜索后,是什么因素决定了用户进行第i次搜索?这个问题是一个关键。由于不能事先知道用户的决定,但是从用户的第i次的搜索请求Queryi=(Qtexti,Qfilteri)中,可以得到重要的线索。我们分两种情形加以处理步骤:
步骤C1:当Qfilteri与Qfilteri-1不一致时,这说明用户改变了筛选项,也可能采用了新的Qtexti代替第(i-1)次的Qtexti-1。因此,用户在执行第i次搜索的意图体现在两个差集Diff(Qfilteri,Qfilteri-1)和Diff(Qtexti,Qtexti-1)中,我们采用二元对[Diff(Qfilteri,Qfilteri-1),Diff(Qtexti,Qtexti-1)]表示。
步骤C2:当Qfilteri与Qfilteri-1一致时,这说明用户并没有改变筛选项,而只是采用了新的Qtexti代替第(i-1)次的Qtexti-1。因此,用户在执行第i次搜索的意图体现在Diff(Qtexti,Qtexti-1)中。为了便于模块D的处理,我们此时也将用户在执行第i次搜索的意图记为二元对[φ,Diff(Qtexti,Qtexti-1)],其中φ表示空集。
模块D:使用用户第(i-1)次的搜索意图、第i次的搜索意图,对用户第i次搜索结果进行过滤。
上述步骤计算出了用户第(i-1)次的搜索意图[Qfilteri-1,Diff(Ri-1,VRi-1),Interset(Qtexti-1,VRi-1)],也计算出了第i次的搜索意图[Diff(Qfilteri,Qfilteri-1),Diff(Qtexti,Qtexti-1)]。下面介绍对搜索引擎返回的第i次搜索结果Ri={Ri,1,Ri,2,…,Ri,ni}的过滤方法:
步骤D1:如果Qfilteri-1=Qfilteri,并且Interset(Qtexti-1,VRi-1)不空,则从Ri过滤掉含有Diff(Ri-1,VRi-1)中元素的元素;
步骤D2:如果Qfilteri=Qfilteri-1,并且Diff(Qtexti,Qtexti-1)不空,则从Ri过滤掉不含有Diff(Qtexti,Qtexti-1)中元素的元素;
步骤D3:如果Qfilteri≠Qfilteri-1,并且Diff(Qtexti,Qtexti-1)为空,则从Ri过滤掉不满足过滤项Qfilteri的元素;
步骤D3说明,用户没有改变查询项,只是关注了筛选项。
步骤D4:如果Qfilteri≠Qfilteri-1,并且Diff(Qtexti,Qtexti-1)不空,则从Ri过滤掉不满足过滤项Qfilteri的元素,同时从Ri过滤掉不含有Diff(Qtexti,Qtexti-1)中元素的元素。
实验效果
为验证本发明的实际效果,本发明设计了常见的10大类100子类产品。大类包括家用笔记本电脑、冰箱、洗衣机、电视机、化妆品、运动服装、运动鞋、食品、葡萄酒、智能手环;每个子类包括20种不同的具体产品,这样共计有2000个具体的产品参与测试。在经过两组各10人次的模拟测试过程中,产品的平均搜索时间缩减了24.7%。

Claims (2)

1.一种意图驱动的产品搜索***,其特征在于:包括接收从电子商务平台搜索模块传送的用户第(i-1)次的搜索请求、搜索模块返回的搜索结果、用户的浏览记录的模块A;由用户的第(i-1)次浏览记录VRi-1={R′i-1,1,R′i-1,2,…,R′i-1,si},其中每一项代表用户浏览的一项产品,共计有si项,计算出用户第(i-1)次搜索意图的模块B;根据用户第(i-1)次搜索意图以及第i次搜索请求和搜索结果,计算用户第i次搜索意图的模块C;使用用户第i次搜索的意图,对用户第i次搜索结果进行过滤的模块D;
上面所述模块中,模块A对用户第(i-1)次的搜索信息进行收集,包括搜索请求、搜索模块返回的搜索结果、用户的浏览记录,这些信息为模块B所使用;模块B用于获得用户在进行第(i-1)次搜索时的搜索意图,该意图将被模块C和模块D使用;模块C利用模块B提供的用户第(i-1)次搜索意图,以及用户第i次搜索请求和搜索结果,计算出用户在进行第i次搜索时的搜索意图,这一搜索意图将被模块D用于过滤用户的第i次搜索结果;模块D根据模块B和模块C计算的用户第(i-1)次搜索意图、用户第i次搜索意图,对用户的第i次搜索结果进行多个层次的过滤,保留准确的搜索结果供用户浏览。
2.一种意图驱动的产品搜索方法,其特征在于:包括以下步骤:
第一步:接收从电子商务平台搜索模块传送的用户第(i-1)次的搜索请求、搜索模块返回的搜索结果、用户的浏览记录;
第(i-1)次搜索使用的搜索请求为Queryi-1=(Qtexti-1,Qfilteri-1),其中查询串经过分词后得到Qtexti-1={Qtexti-1,1,Qtexti-1,2,…,Qtexti-1,ai},也即Qtexti-1分词形成ai个分词项。搜索引擎返回的搜索结果为Ri-1={Ri-1,1,Ri-1,2,…,Ri-1,mi},其中每一项代表搜索引擎返回的一项搜索结果,共计mi项,下标(i-1)代表第(i-1)次搜索的意思;用户在Ri-1中浏览记录为VRi-1={R′i-1,1,R′i-1,2,…,R′i-1,si},其中每一项代表用户浏览的一项产品,共计有si项,满足si≤mi,且即VRi-1是Ri-1的子集;
第二步:由用户的第(i-1)次浏览记录VRi-1={R′i-1,1,R′i-1,2,…,R′i-1,si}计算出用户第(i-1)次搜索的意图;
如第一步所述,在第(i-1)次搜索过程中,搜索结果为Ri-1,而用户浏览记录为VRi-1,那么这两个集合的差集Diff(Ri-1,VRi-1)表示用户不感兴趣的搜索结果;而Interset(Qtexti-1,VRi-1)表示用户表示用户感兴趣的搜索结果;将用户第(i-1)次搜索的意图设定为一个三元组[Qfilteri-1,Diff(Ri-1,VRi-1),Interset(Qtexti-1,VRi-1)];
第三步:根据第(i-1)次搜索意图以及第i次搜索请求和搜索结果,计算用户第i次搜索的意图:
第i次搜索使用的搜索请求Queryi=(Qtexti,Qfilteri),其中查询串经过分词后得到Qtexti={Qtexti,1,Qtexti,2,…,Qtexti,bi},也即Qtexti分词形成bi个分词项;搜索引擎返回的搜索结果为Ri={Ri,1,Ri,2,…,Ri,ni},共计ni项;
比对用户第i次的搜索和第(i-1)次搜索的区别:
步骤C1:当Qfilteri与Qfilteri-1不一致时,这说明用户改变了筛选项,或采用了新的Qtexti代替第(i-1)次的Qtexti-1;因此,用户在执行第i次搜索的意图体现在两个差集Diff(Qfilteri,Qfilteri-1)和Diff(Qtexti,Qtexti-1)中,我们采用二元对[Diff(Qfilteri,Qfilteri-1),Diff(Qtexti,Qtexti-1)]表示;
步骤C2:当Qfilteri与Qfilteri-1一致时,这说明用户并没有改变筛选项,而只是采用了新的Qtexti代替第(i-1)次的Qtexti-1;因此,用户在执行第i次搜索的意图体现在Diff(Qtexti,Qtexti-1)中;为了便于第四步的处理,我们此时也将用户在执行第i次搜索的意图记为二元对[φ,Diff(Qtexti,Qtexti-1)],其中φ表示空集;
第四步:使用用户第(i-1)次的搜索意图、第i次的搜索意图,对用户第i次搜索结果进行过滤;
上述步骤计算出了用户第(i-1)次的搜索意图[Qfilteri-1,Diff(Ri-1,VRi-1),Interset(Qtexti-1,VRi-1)],也计算出了第i次的搜索意图[Diff(Qfilteri,Qfilteri-1),Diff(Qtexti,Qtexti-1)];下面介绍对搜索引擎返回的第i次搜索结果Ri={Ri,1,Ri,2,…,Ri,ni}的过滤方法:
步骤D1:如果Qfilteri-1=Qfilteri,并且Interset(Qtexti-1,VRi-1)不空,则从Ri过滤掉含有Diff(Ri-1,VRi-1)中元素的元素;
步骤D2:如果Qfilteri=Qfilteri-1,并且Diff(Qtexti,Qtexti-1)不空,则从Ri过滤掉不含有Diff(Qtexti,Qtexti-1)中元素的元素;
步骤D3:如果Qfilteri≠Qfilteri-1,并且Diff(Qtexti,Qtexti-1)为空,则从Ri过滤掉不满足过滤项Qfilteri的元素;
步骤D3说明,用户没有改变查询项,只是关注了筛选项;
步骤D4:如果Qfilteri≠Qfilteri-1,并且Diff(Qtexti,Qtexti-1)不空,则从Ri过滤掉不满足过滤项Qfilteri的元素,同时从Ri过滤掉不含有Diff(Qtexti,Qtexti-1)中元素的元素。
CN201510790109.4A 2015-11-17 2015-11-17 一种意图驱动的产品搜索***和方法 Pending CN106708887A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510790109.4A CN106708887A (zh) 2015-11-17 2015-11-17 一种意图驱动的产品搜索***和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510790109.4A CN106708887A (zh) 2015-11-17 2015-11-17 一种意图驱动的产品搜索***和方法

Publications (1)

Publication Number Publication Date
CN106708887A true CN106708887A (zh) 2017-05-24

Family

ID=58933332

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510790109.4A Pending CN106708887A (zh) 2015-11-17 2015-11-17 一种意图驱动的产品搜索***和方法

Country Status (1)

Country Link
CN (1) CN106708887A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330023A (zh) * 2017-06-21 2017-11-07 北京百度网讯科技有限公司 基于关注点的文本内容推荐方法和装置
CN109543016A (zh) * 2018-11-15 2019-03-29 北京搜狗科技发展有限公司 一种数据处理方法、装置和用于数据处理的装置
CN110647537A (zh) * 2019-09-24 2020-01-03 中国联合网络通信集团有限公司 数据搜索方法、装置及存储介质
CN110717318A (zh) * 2019-10-10 2020-01-21 海南大学 意图驱动的适应竞争及合作意向的内容填充***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101477554A (zh) * 2009-01-16 2009-07-08 西安电子科技大学 基于用户兴趣的个性化元搜索引擎及搜索结果处理方法
CN102591948A (zh) * 2011-12-27 2012-07-18 厦门市美亚柏科信息股份有限公司 一种基于用户行为分析的搜索结果改进的方法及其***
CN104239459A (zh) * 2014-09-02 2014-12-24 百度在线网络技术(北京)有限公司 语音搜索方法、装置和***
CN104462510A (zh) * 2014-12-22 2015-03-25 北京奇虎科技有限公司 基于用户搜索意图的搜索方法及装置
CN104838375A (zh) * 2012-11-13 2015-08-12 微软技术许可有限责任公司 搜索结果基于意图的呈现

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101477554A (zh) * 2009-01-16 2009-07-08 西安电子科技大学 基于用户兴趣的个性化元搜索引擎及搜索结果处理方法
CN102591948A (zh) * 2011-12-27 2012-07-18 厦门市美亚柏科信息股份有限公司 一种基于用户行为分析的搜索结果改进的方法及其***
CN104838375A (zh) * 2012-11-13 2015-08-12 微软技术许可有限责任公司 搜索结果基于意图的呈现
CN104239459A (zh) * 2014-09-02 2014-12-24 百度在线网络技术(北京)有限公司 语音搜索方法、装置和***
CN104462510A (zh) * 2014-12-22 2015-03-25 北京奇虎科技有限公司 基于用户搜索意图的搜索方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330023A (zh) * 2017-06-21 2017-11-07 北京百度网讯科技有限公司 基于关注点的文本内容推荐方法和装置
CN107330023B (zh) * 2017-06-21 2021-02-12 北京百度网讯科技有限公司 基于关注点的文本内容推荐方法和装置
CN109543016A (zh) * 2018-11-15 2019-03-29 北京搜狗科技发展有限公司 一种数据处理方法、装置和用于数据处理的装置
CN110647537A (zh) * 2019-09-24 2020-01-03 中国联合网络通信集团有限公司 数据搜索方法、装置及存储介质
CN110717318A (zh) * 2019-10-10 2020-01-21 海南大学 意图驱动的适应竞争及合作意向的内容填充***

Similar Documents

Publication Publication Date Title
Ben-Yitzhak et al. Beyond basic faceted search
Raorane et al. Association rule–extracting knowledge using market basket analysis
CN104063523B (zh) 一种电子商务搜索评分与排名的方法及***
US10354308B2 (en) Distinguishing accessories from products for ranking search results
US10198520B2 (en) Search with more like this refinements
CN101408885B (zh) 利用统计分布对主题进行建模
US7640234B2 (en) Methods and systems to communicate information
CN106339502A (zh) 一种基于用户行为数据分片聚类的建模推荐方法
US7720721B1 (en) Method and system for analyzing user interaction to identify documents associated with dissimilar items that may contain synonyms
US20110082734A1 (en) Locating bundled items
CN101692223A (zh) 响应于用户输入精炼搜索空间
Hasan et al. Query suggestion for e-commerce sites
CN106708887A (zh) 一种意图驱动的产品搜索***和方法
CN103577489A (zh) 一种网页浏览历史查询方法及装置
US20070200850A1 (en) Methods and systems to communicate information
CN108198045A (zh) 基于电子商务网站数据挖掘的混合推荐***的设计方法
CN105138690A (zh) 确定关键词的方法和装置
Shrivastava et al. Product recommendations using textual similarity based learning models
US9552425B2 (en) System and method for determining query aspects at appropriate category levels
CN104731926A (zh) 推荐词的展现方法和装置
Sneha et al. An online recommendation system based on web usage mining and semantic web using LCS algorithm
Meghabghab et al. Search engines, link analysis, and user's web behavior: a unifying web mining approach
CN106202517A (zh) 一种基于大数据的网上商品在网页上的排序方法
Krutil et al. Web page classification based on schema. org collection
CN108932247A (zh) 一种优化文本搜索的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 212009 Zhenjiang high tech Industrial Development Zone, Jiangsu, No. 668, No. twelve road.

Applicant after: Zhongke national power (Zhenjiang) Intelligent Technology Co., Ltd.

Address before: 212009 18 building, North Tower, Twin Tower Rd 468, twelve road 468, Ding Mo Jing, Jiangsu.

Applicant before: Knowology Intelligent Technology Co., Ltd.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20170524

RJ01 Rejection of invention patent application after publication