CN100568231C - 会话式推荐***及其检索方法 - Google Patents

会话式推荐***及其检索方法 Download PDF

Info

Publication number
CN100568231C
CN100568231C CNB2004800242325A CN200480024232A CN100568231C CN 100568231 C CN100568231 C CN 100568231C CN B2004800242325 A CNB2004800242325 A CN B2004800242325A CN 200480024232 A CN200480024232 A CN 200480024232A CN 100568231 C CN100568231 C CN 100568231C
Authority
CN
China
Prior art keywords
user
comment
incident
retrieval
circulation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004800242325A
Other languages
English (en)
Other versions
CN1839387A (zh
Inventor
巴里·史密斯
洛兰·麦金蒂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University College Dublin
Original Assignee
University College Dublin
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University College Dublin filed Critical University College Dublin
Publication of CN1839387A publication Critical patent/CN1839387A/zh
Application granted granted Critical
Publication of CN100568231C publication Critical patent/CN100568231C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9554Retrieval from the web using information identifiers, e.g. uniform resource locators [URL] by using bar codes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

会话型推荐***检索k个事件并且产生用于用户反馈的结构。该结构包括一列评论单元,对于每个评论单元,用户指定值范围。它也产生组合评论,每个是一起呈现的特征和值范围的组合。响应于用户请求,可以产生组合评论的解释。从一个会话循环到另一个,***确定是否得到了偏爱。如果是,则在下一个循环中,实现差异性的重新聚焦功能被用于检索。如果否,在会话的下一个循环中,实现基于相似性检索的细化功能被使用。

Description

会话式推荐***及其检索方法
技术领域
本发明涉及通过搜索***的自动事件检索。
背景技术
正在发展的电子商务***和其它搜索***的一个关键要求是尽快地执行检索以找出对于用户的目标事件。
近年来,已经开发了会话式推荐***,用于响应于用户反馈来重复地检索事件。该反馈常常是基于偏好的,其中用户指出在特定循环所检索的k个事件中优选的一个。用户也可以使用除简单偏爱之外的其它反馈形式。例如,用户可以对检索的事件进行排序或者分类,或者用户可以指出特定事件特征的优选值(例如,价格=$1000),或者评论/调节(critique/tweak)一个特征(例如,价格<$1000)。
以前,检索操作的主要基础是搜索类似于用户请求的事件。但是,最近,已经看出,这种处理常常不是令人满意的,并且在大量的事件彼此非常相似的情况下,可能使用户感到失望。实际的例子是用户根据特定标准来搜索休假选项的情况,并且推荐***在同一区域的三个公寓住宅中搜索休假选项。该问题引起了差异性检索操作的发展,在差异性检索操作中,推荐***确保具有对于用户请求的相似性以及检索事件之间的差异性。
这种方法通常减少了到达目标事件的循环数,但是,仍然存在改进的余地,特别是在有许多产品选项和/或大的产品空间被搜索的情况下。
发明内容
根据本发明,提供一种检索方法,该方法通过会话式推荐***来执行,该会话式推荐***在检索循环中利用用户反馈来操作,以从数据库中检索事件,其中,在检索会话的至少一个检索循环中,该***动态地选择一个选择机制,其中,根据在相关循环中的用户反馈进行所述动态选择;且其中在基于相似性检索而不是差异性的精细选择机制和基于增强差异性的相似性检索的重新聚焦选择机制之间进行所述动态选择,其中根据在何处从前一个循环中得到了偏爱事件,是否用户在当前循环中再次优先选择同一事件来进行所述动态选择,且如果指出了不同的偏爱,则该***选择精细选择机制;如果指出了相同的偏爱,则该***选择用于实现差异性的重新聚焦选择机制,其中,该***要求用户通过指定期望的搜索特征值来提供反馈,其中,该***要求用户通过其中对于搜索特征指出值范围的评论来间接地指出一个优选事件,其中,该***动态地在每个会话循环产生用于用户反馈的新的反馈结构。
在另一个实施例中,该***根据基于事件的推理来执行检索。
在另一个实施例中,该***检查保留在会话检索空间中的事件,并且识别多组特征以及值范围,以及自动地将选项呈现给用户,以指出这些特征和值范围对于组合评论反馈的适合性。
在另一个实施例中,该***通过表征递归特征和值范围作为关联规则A→B来动态地选择所述特征和值范围,其中根据特征和值范围A的存在,它可以推出其它特征和值范围B的存在。
在另一个实施例中,通过根据规则的支持度和置信度测量该规则重要性的处理来执行转换。
在另一个实施例中,该***产生多个候选组合评论,对它们进行分级,以及仅仅将具有较高等级的组合评论呈现给用户。
在另一个实施例中,根据对于用户的适用性标准以及减少搜索空间的能力标准来对所述候选组合评论进行分级。
在另一个实施例中,该***产生对于呈现给用户的每个组合评论的解释。
在另一个实施例中,将用于选择组合评论或者请求解释的选项呈现给用户。
本发明也提供一种会话式推荐***,用于在检索循环中利用用户反馈来操作,以从数据库中检索事件,其中,对于检索会话的至少一个检索循环,该***动态地选择一个选择机制,其中,根据在相关循环中的用户反馈进行所述动态选择;且其中在基于相似性检索而不是差异性的精细选择机制和基于增强差异性的相似性检索的重新聚焦选择机制之间进行所述动态选择,所述推荐***包括:用于根据在何处从前一个循环中得到了偏爱事件,是否用户在当前循环中再次优先选择同一事件来进行所述动态选择的装置;用于如果指出了不同的偏爱,则使该***选择精细选择机制的装置;用于如果指出了相同的偏爱,则使该***选择用于实现差异性的重新聚焦选择机制的装置;用于要求用户通过指定期望的搜索特征值来提供反馈的装置;用于要求用户通过其中对于搜索特征指出值范围的评论来间接地指出一个优选事件的装置;及用于动态地在每个会话循环产生用于用户反馈的新的反馈结构的装置。
附图说明
通过以下借助于仅仅参考附图的实例给出的本发明的一些实施例的描述,本发明将变得更加易于理解,其中,
图1是本发明的检索方法的流程图;
图2和3是样品屏幕截图(screenshot);
图4到图7是表示本发明的检索方法的效率的若干组曲线。
具体实施方式
参考图1,本发明的推荐***实现检索方法1,用于从事件库中检索事件。在步骤2中,用户输入具有搜索标准的请求。***根据相似性方法在步骤3推荐k个事件。在步骤4,用户检查这些事件,并且通过指出多个返回事件中的哪个是优选的或者通过指出已经找出了目标事件来提供反馈。
正如确定步骤5指出的,如果反馈指出找出了目标事件,则方法在步骤6停止。但是,否则,在确定步骤7,***检查是否用户优选的事件是与在前一循环中指出的相同的一个事件(很明显,对于第一循环不存在这种情况),例如,得到以及重新选择了偏爱了吗?***通过对在步骤4提供的特征值与事件库进行比较来确定是否得到了偏爱。如果得到了偏爱,则***在步骤8利用增强差异性的相似性方法(差异性)重新聚焦来执行下一个检索。如果没有得到偏爱,则***对于下一个检索仅仅利用相似性方法进行精细化。这种选择机制的动态选择被称为“自适应选择”或者“AS”。然后,***执行在步骤3的检索,以开始下一循环。
这样,在第一次之后的每一个循环,存在根据用户偏爱的最佳检索技术的自适应选择。正如以下详细说明的,这实现了效率上很大的改进。本发明主要的优点在于:按照非常简单的方式实现了该动态改进。检索工具和机制是现有检索***中已经可利用的,并且不要求另外的用户输入。本发明可以利用例如基于事件推理(CBR)的任何合适检索技术或者任何其它技术来执行,其中,相似性和增强差异性的相似性技术可以应用到上述检索技术中。
自适应选择实现了更高级的推荐策略,它能够在每个会话推荐循环中调整相似性和差异性的平衡。它通过确定是否最近的推荐代表了对上一循环所作的推荐的改进,来确定是否正确地聚焦了会话。这通过对现有的基于比较的自动推荐技术进行两方面的修改来实现,其中在现有的基于比较的自动推荐技术中,在每个推荐循环,固定数量(例如,k个)事件被呈现给用户,以及请求用户提供这些建议如何与它们的要求相关的反馈。第一,代替在每个新的循环作k个新的推荐,当前偏爱的事件被添加到k-1个新的推荐。我们将这个称为得到偏爱(“CP”)。这种修改本身引入了冗余,因为在一个或者多个未来的循环中,重复以前看到的事件。但是,包括以前的偏爱可以使得避免当没有最新的推荐事件与用户相关时通常发生的问题。确定是否已经得到了偏爱事件的步骤不涉及附加的用户输入。用户正如以前一样通过指定对于目标事件特征值的特定偏爱,指出值的优选范围(评论反馈),以及通过指出优选地事件(基于偏爱的反馈),或者对结果进行分类,来提供反馈。
同样,得到偏爱允许***自动地判断推荐的聚焦。如果用户情愿与得到的偏爱不同的事件,则它肯定是,因为它距目标更近,以及进行肯定的进程。在这种情况中,在下一个推荐循环,没有保证差异性,并且重点应该在相似性上。但是,如果用户情愿得到的偏爱事件,则它表示其它k-1个事件比得到的事件较少相关,并且这样,推荐***没有对目标进行肯定的进程。在这种情况下,发生两件事,第一,差异性被引入下一个推荐循环。以及第二,在下一个推荐循环的新事件选择期间,考虑这些候选事件与拒绝事件的相异性。***优先选择不仅与查询相似的并且与拒绝事件不相似的事件。这通过使用以下等式1给出的公式来实现,其中c是候选事件,Cp是当前优选事件,以及C’是一组k-1个拒绝事件。
SimDissim ( c , c P , C ′ ) = Sim ( c , c P ) + Σ ∀ ci ∈ C ( 1 - Sim ( c , c i ) ) K - - - ( 1 )
下面阐述用于实现方法1的步骤3、7、8和9的算法。
1、定义ItemRecommend(q,CB,k,ip,ip-1)
2、开始
3、如果(ip!=null)&&(ip==ip-1)
4、R’←ReFocus(q,CB,k-1)
5、否则
6、R’←ReFine(q,CB,k-1)
7、R←R’+ip
8、返回R
9、结束
10、定义ReFine(q,CB,k)
11、开始
12、CB’←sort CB in decreasing order of their sim to q
13、R←top k items in CB’
14、返回R
15、结束
16、定义ReFocus(q,CB,k,ip,ip-1)
17、开始
18、α=0.5CB’←sort CB in decreasing order acc to Equation 2
20、返回BounderGreedySelection(q,CB,k,b,α)
21、结束
该算法中的分量利用基于偏爱的反馈在基于比较的推荐中实现自适应选择。ItemRecommend函数首先必须检查是否用户已经选择得到的偏爱事件(ip-1)作为它们的偏爱(例如,ip-1=ip),如果是,则Refocus函数被调用来在下一个循环中选择一组k-1个不同的事件(步骤8);它们在下一个循环中被添加到偏爱事件,以构成k个事件。另一方面,如果没有选择得到的偏爱(例如,ip-1≠ip),则Refine函数被调用(步骤9),以帮助推荐***位于最近偏爱的区域,来希望该区域被理想的目标事件所占有。
限定贪婪(bounded greedy)技术涉及两个基本的阶段。第一,选择对于查询的bk个最相似的项(其中b通常为2到5之间的整数)。在第二阶段,递增地构建一组(R)选择项。在该构建的每个步骤,根据它们的品质,对bk项的剩余项进行排序,以及最高品质项被添加到R。项i的品质与i和当前查询q之间的相似性成正比,以及与相对于迄今所选择那些项的I的差异性成正比,
R=[r1,...,rm];见等式2&3。
Quality(q,i,R)=α*SIM(q,i)+(1-α)*Div(i,R)    (2)
Div ( i , R ) = lifR = { } ;
Σ i = 1 . . m ( 1 - Sim ( i , r i ) ) m otherwise - - - ( 3 )
根据在步骤4中用户提供反馈,上面的描述简要地提及了“评论”。这是这样一种反馈形式,它表示可能被称为特定项特征上的方向反馈。每个评论或者调节是对特定特征的值空间的限定。例如,用户可能指出他们正在寻找便宜的餐馆或者更正式的环境。存在两个单独的调节:前者是在价格特征上以及后者是在环境特征上。评论的优点是用户不需要提供对于特征的特定值信息,同时帮助推荐***极大地缩小它的搜索聚焦。
动态组合评论
每个推荐会话由如步骤2的初始用户查询启动,并且这将导致在第一推荐循环中可利用的最相似事件的检索。用户将有机会接受该事件,由此在步骤6结束该推荐会话,或者评论该事件。当他们评论该事件时,讨论中的评论用作对剩余事件的过滤器,并且在下一个循环所选择的偏爱事件是与该评论相匹配并且与前一个推荐事件最大相似的事件。
为了评论事件,用户将被呈现具有一反馈结构,包括单个特征(单元)评论范围加上因为它们能够精细选择剩余事件而选择的一组组合评论。我们将我们的方法称作动态评论。单元评论允许用户指定单个特征的范围(例如摄像机的分辨率范围)。组合评论是在一个单元中两个或者多个特征的组合,并且提供用户选择组合评论的机会。一个例子是“更小的内存和更低的分辨率和更便宜:是/否”。
这允许会话式推荐***按照动态方式产生用于用户反馈的新的机会。基本上,在每个循环期间,***察看保持和识别有特征组的事件,它们被分组在一起,并且被呈现给用户,作为最佳反馈形式。它通过执行数据挖掘处理发现这些特征组。
评论模式
让我们假设推荐***当前正用于与用户的推荐会话,以及新的事件已经被返回作为当前循环的一部分。可以将保存在事件库中每个事件与该新的事件进行比较,以产生评论模式。该模式基本上根据单元评论改变(recast)事件库中的每个事件,其中当与当前事件进行比较时,所述单元评论应用于它的特征的每一个。
下面的表1借助于实例描述了这个。它显示了已经被选择用于推荐给用户作为当前循环的一部分的当前事件,并且该当前事件也是来自事件库的事件。当前事件描述了一个1.4GHz的台式PC,具有512Mb的RAM,12”显示器以及30Gb硬盘,价格为3000欧。产生的评论模式根据各个特征评论反映了这两个事件之间的差别。例如,所示的评论模式包括用于处理器速度的“<”评论-我们称这为[速度<]-因为比较事件具有比当前推荐的时间更低的处理器。类似地,该模式包括评论[价格>],因为比较事件比当前事件更贵。这样,在搜寻处理之前,以及在当前循环选择事件之后,必须相对于当前事件对于事件库中的每个事件产生评论模式。这种模式用作组合评论的源。
表1
  当前事件   来自CB的事件   评论模式
  制造商   康柏   索尼 !=
  显示器(英寸)   14’   12’   <
  内存(MB)   512   512   =
  硬盘(GB)   40   30   <
  处理器   奔腾3   奔腾3   =
  速度(Mhz)   1400   900   <
  类型   台式   台式   =
  价格   1500   3000   >
搜寻组合评论
***通过识别在评论模式的潜在大集合(模式库)中的有用的重复评论子组来利用组合评论。特定子组趋向于在整个模式库上重复。例如,50%的剩余事件可以具有比当前事件较小的屏幕尺寸,但是较大的硬盘尺寸,即50%评论模式包含子模式[显示器<]和[硬盘>]。如果该评论应用于用户-如果它们实际上正在寻找较小的屏幕和较大的硬盘,则它的应用将马上过滤掉剩余事件的一半,这样,在下一循环期间,更好地聚焦用于合适事件的搜索。大概,构成该组合评论的单个评论都没有对它们自己运用相同的识别能力。
***找到频繁地一起发生的一组评论。这是一个挑战性的任务,主要是因为涉及的组合:典型的超级市场将具有几千个不同的产品,这在多个可能的重现项组中可以导致组合***。在上述评论情景下这个问题不是如此尖锐,因为仅仅存在有限数量的可能的评论。例如,每个数量特征可以具有<或者>的评论,以及每个名词特征可以具有=或者!=的评论特征,这样在由n个单个特征构成的事件库中仅仅具有2n个可能的评论。为了处理更复杂的情况,***对于待检查的可能的组合评论执行有效算法。一个如此算法是Apriori算法,其表征这些重复项子组作为形式A→B的关联规则-从特定评论子组的存在,它能够推出某些其它评论的存在。例如,一个人可能知道,从评论[显示器<],我们能够以高的几率推出[硬盘>]的存在;换句话说,模式[显示器<],[硬盘>]是平常的。
Apriori根据规则的支持度和置信度来测量规则的重要性。规则A→B的支持度是规则正确的模式的百分比,即,包含A和B的模式数量除以模式总数。另一方面,置信度是规则是正确的模式数量相对于规则是可适用的模式数量的度量,即包含A和B的模式的数量除以包含A的模式的数量。例如,我们将发现:如果存在总共100个评论模式但是仅仅它们中的10个包含模式[显示器<]和[硬盘>],则规则[显示器<]→[硬盘>]具有0.1的支持度。类似地,如果评论模式中的25个包含仅仅[显示器<],则该规则的置信度将为0.4。Apriori是一个多过程算法,其中,在第k个过程中,计算基数k的所有大的项组。开始,确定频繁的项组。这些是具有较少预定最小支持度的项组。然后,在每个新的过程中,扩展超出最小支持度阈值的那些项组。
在步骤3的每个推荐循环期间,***使用Apriori来产生组合评论集(在模式库上的频繁的项组),用于步骤4的用户反馈。然后,它选择这些组合评论的一个子组,使得它们可以呈现给用户作为评论选项。
对组合评论进行分级
在任何特定的循环,可以搜寻各种尺寸的大量组合评论。但是,将它们中的所有都呈现给用户是不可行的,于是***选择一个选择的子组。它所选择那个子组可能在组合评论可以证明在较少会话长度上是成功的程度上具有大的意义。在这方面,存在两个主要的标准。
它呈现可能适用于用户的组合评论,使得它们可能在它们的目标事件方向上限制剩余事件。按照这种方式,存在这些组合评论将被在任何单元评论上选择的好机会。
它呈现将过滤掉大量事件(减少搜索空间)的组合评论,使得存在目标事件在下一循环被检索的更大机会。
关于这些标准的第一个,可能的是,目标事件的某些特征可以从前一个循环提供的反馈中推断出来。例如,如果用户可靠地查询较便宜的PC,则包括[价格<]可能是好的选择。第二标准对于地址是较直率的。组合的评论的支持度是用于过滤几个或者许多事件的能力的直接度量。具有较低支持度值的组合评论意味着它按照小比例的评论模式存在,这样,它仅仅适用于几个剩余事件。如果使用,则因此评论可以将许多事件从考虑中删除。
存在支持度作为用于组合评论的分级度量的使用与它影响上述标准的方式之间的冲突(tension)。虽然低支持度的评论将消除许多事件,但是这些评论大概很少可能导致目标事件,所有的事情都是平等的。优选高支持度的评论将增加该评论导致目标事件的机会,但是这些评论不会将许多事件从考虑中去除。
参考图2和图3,利用用于从在线数字摄像机商店购买数字摄像机的两个屏幕截图系列来描述动态评论。屏幕截图表示了一序列推荐循环,以及,在每一个中,我们看到当前偏爱的事件,一组八个评论加上一组三个组合评论以及它们相关联的解释。每个组合评论被翻译成英语解释,并且直接被选择(经由“挑选(pick)”选项)或者被进一步解释(经由“解释(explain)”选项)。
在用户提供了一些初始信息之后,他们被呈现具有995欧的高清摄像机,具有512Mb的内存以及x7光学变焦。用户可以通过选择在被显示用于当前摄像机的特征值字段任意一侧上的合适评论图标来评论任何单个特征,例如制造商、光学变焦、或者内存。向上箭头表示一个较大的评论,向下箭头表示较小的评论,以及叉号表示不等于评论。另外,仅仅在这些特征下面,显示三个组合评论,并且用户可以选择直接应用的三个中的一个(“pick”选项)或者它们可以经由“explain”选项来请求更详细的解释。在特征值右侧的板上呈现该解释,并且缺省是第一组合评论的解释。
例如,在图3中,用户要求对第三组合评论的进一步解释(“不同的制造商、较低的分辨率和较便宜”)。产生解释告诉用户存在满足该评论的87个剩余摄像机,即与当前推荐的摄像据相比,有87个摄像机更便宜,具有较低的分辨率以及由不同的制造商制造。另外,该解释提供关于这些评论特征的值范围的信息。例如,用户被告诉这87个摄像机由指定的制造商制造,它们具有从1.4到4.8百万像素的分辨率,以及它们的价格范围为125到399欧。组合评论对于进行解释扮演了很有价值的角色。组合评论通过帮助用户理解特征之间的共同相互作用来帮助用户更好的理解超出当前循环的推荐机会。我们相信,在许多推荐域中,其中用于可能具有关于特征空间的更精细细节的不完全知识,组合评论将帮助有效地映射这个空间,为此,我们相信,用户将真正地发现:与单位评论相比,利用组合评论及其相关联的解释很容易工作,以及例如,这可以帮助用于犯较少的评论错误。例如,利用在数字摄像机域中的标准评论,用户可能天真地以错误的信念来选择[价格<]的单位评论。但是,按照这种方式减少价格可能导致用户发现不可能的分辨率减少,以及因此,他们将不得不返回。如果提供组合评论{[价格<],[分辨率<]\},则该问题很少可能发生,因为用户将理解在选择任何评论之前价格下降的含义。
实验
设置
算法。我们希望测试三个基本的会话型推荐策略:(1)SIM-用作基准的纯粹的基于相似性的推荐***;(2)DIV-采用上述相同增强差异性技术的推荐***;以及(3)AS-采用图1的自适应选择技术的等效推荐***。另外,我们希望使用两种不同类型的用户反馈测试这些推荐***:基于偏爱的反馈和评论。这给出了六种不同的待测试推荐***-利用基于偏爱的反馈的SIM、DIV和AS以及利用评论的SIM、DIV和AS,每个使用基于比较的推荐构架来实现。
数据组
旅行事件库包括了1024个事件,每个描述了根据例如位置、时间段、住宿、价格等特征的特定休假。一个威士忌事件库包括一组552个事件,每个描述了根据例如酿酒厂、年龄、防伪、甜度、香味、完成等特征的苏格兰威士忌。
方法
使用留一(leave-one-out)法,按照两种方式暂时移走和使用事件库中的每个事件。首先,它用作通过随机提取项特征子组构造的一组查询的基础。这里,对于不同的查询,提取不同数量的特征,以及通常,具有较多特征的查询比具有较少特征的查询更容易得到结果。第二,我们选择与原始库最相似的事件。这些事件用作实验的推荐目标。这样,库代表了用户的理想查询,所产生的查询是用户提供给推荐***的初始查询,并且目标是基于用户理想的对于用户最可利用的事件,以及在每个推荐循环,用户的偏爱被假设为与已知目标事件最相似的事件。根据适当情况,基于偏爱或者评论被在每个循环用于优选的事件。最后,在我们的评估中,我们设置推荐窗户尺寸k为3,是期望购物者在之间决定的最合适的项数。
测试查询
对于每个数据组,产生三个不同的查询组,具有不同的难度(容易、中等、困难)。困难是基于SIM利用基于偏爱的反馈所要求的循环数。
推荐效率
也许,会话型推荐***最基本的测试涉及它的推荐效率;即,用于常用查询的推荐对象的长度。根据会话期间循环的数量或者所提供的唯一事件的数量来度量会话长度。这样,为了测试推荐效率,从对于三个推荐***的数据组和循环的平均数量,上述留一法被用于每个查询,以及测量呈现给用户的唯一项。
结果。对于旅行和威士忌的结果分别被概括在图4和5中。在每个事件中,图(a)和(b)与基于偏爱的反馈有关,而(c)和(d)与评论有关。图(b)和(d)根据唯一事件测量效率-因为空间原因省略循环数据-但是图(a)和(c)包括根据DIV和AS方法相对于SIM基准所享用的百分比利益的唯一事件和循环信息。
分析
通过这些结构来澄清多个问题。首先,与SIM比较,对于两种反馈类型,在所有查询类型上,在两个数据组中,DIV和AS具有很大的效率好处。例如,在旅行中使用基于偏爱的反馈,对于适中查询,SIM方法在找到目标之前将平均大约100个唯一事件呈现给用户。相比较,DIV方法要求大约53个事件以及AS方法要求仅仅24个事件。使用在旅行中的评论,对于SIM、DIV和AS等效的结果分别是40、35和19。图4显示了对于利用DIV的旅行的相应的相对好处,相对于SIM,体验了利用基于偏爱的反馈的47%的唯一事件减少,而对于评论减少了13%。但是,相对于SIM,AS体验了相应的76%和53%的减少;根据循环减少,提供类似的好处。对于威士忌数据组,比较结果也被呈现在图4(a-c)中。
这些结果描述引入差异性到会话型推荐***中的好处,但是它们也显示了与AS相比较,直接的DIV方法是次优选的。的确,在两个数据组中,当使用DIV方法时,采用评论的推荐***仅仅享受到有限的效率改进(<26%)。相比较,本发明的AS方法显示了更大的效率优势,实现了对于基于偏爱反馈在两个数据组中超过75%(根据唯一事件)的最大效率改进,以及对于评论在两个数据中达到60%。应当注意,在两个数据组中以及使用两类反馈,相对于SIM,由DIV和AS所具有的效率好处通常如何随着查询难度增加。
偏爱容差
上述评估假设当用户选择了预先确定的事件时推荐会话结束。这与用户找到一个非常特定的事件类似。在实际中,用户在他们的接受标准上可能较灵活,常常容忍靠近但不是与他们的理想目标精确匹配的事件。为了测试这个,我们重复上述实验,但是当找到理想目标时没有终止推荐会话,但是一旦发现一个事件在目标的特定类似性阈值内,结束它。我们测量相似性阈值在从60%到100%。100%对应于会话利用最佳目标事件而结束的上一个设置。
结果
对于旅行和威士忌的结果分别被概括在图6和7中,在每个图中,曲线(a)和(b)与基于偏爱的反馈有关,而(c)和(d)与评论相关。同样,曲线仅仅提供了用于中等难度查询的结果,用于简单和高级查询的结果十分类似而被省略,同样是为了节省空间的原因。
分析
结果是清楚的。在较少严格的成功条件下,再次找到了DIV和AS相对于SIM所享有的性能优势。例如,在利用基于偏爱的反馈的旅行中,对于中等查询,我们发现:平均上,SIM期望用户在60%相似阈值处找到大约61个唯一事件(相比较在100%阈值处大约100个事件)。相比较,在同样条件下,DIV和AS分别要求用户检查仅仅31和18个事件(见图6(a),代表了相对于SIM,对于DIV大约49%的减少和对于AS大约71%的减少。随着相似性阈值的增加,用户在找到满意的一个之前必须检查的唯一事件数目也增加,有趣的是,虽然由DIV享有的相对好处对于变化的相似阈值保持相对恒定,但我们发现,AS好处随着相似性阈值而增加。换句话说,用于改进SIM(或者甚至DIV)效率的AS能力随着成功标准变得更严格而增加。通过对于利用评论的旅行的等效结果,反映了利用基于偏爱的反馈的旅行这些结果(图6(a-d)类似地,威士忌结果显示了相似的模式(图7(a-d)。
可以理解,本发明通过自动确定增加选择差异性的最好时间以及聚焦查询相似性的最好时间来更有效地利用相似性和差异性。并且,我们已经显示了这种方法与现有的基于相似性的推荐***以及同样现有的增强差异性技术相比享有极大的性能改进。例如,自适应选择可以将减少用户必须检查的唯一事件的数目,在基于偏爱的反馈的情况下达80%以及在评论的情况下达60%。
本发明并不局限于所描述的实施例,而是可以在结构和细节上作出改变。

Claims (10)

1、一种检索方法,该方法通过会话式推荐***来执行,该会话式推荐***在检索循环(3-9)中利用用户反馈(4)来操作,以从数据库中检索事件,其中,对于检索会话的至少一个检索循环,该***动态地选择(7)一个选择机制(8,9),其中,根据在相关循环中的用户反馈(4)进行所述动态选择(7);且其中在基于相似性检索而不是差异性的精细选择机制(9)和基于增强差异性的相似性检索的重新聚焦选择机制(8)之间进行所述动态选择,
其中,根据在何处从前一个循环中得到了偏爱事件,是否用户在当前循环中再次优先选择同一事件来进行所述动态选择(7),且
其中,
如果指出了不同的偏爱,则该***选择精细选择机制(9);
如果指出了相同的偏爱,则该***选择用于实现差异性的重新聚焦选择机制(8),
其中,该***要求用户通过指定期望的搜索特征值来提供反馈,
其中,该***要求用户通过其中对于搜索特征指出值范围的评论来间接地指出一个优选事件,
其中,该***动态地在每个会话循环产生用于用户反馈的新的反馈结构。
2、根据权利要求1的方法,其中,该***根据基于事件的推理来执行检索(3)。
3、根据权利要求1或2的方法,该***检查保留在会话检索空间中的事件,并且识别多组特征以及值范围,以及自动地将选项呈现给用户,以指出这些特征和值范围对于组合评论反馈的适合性。
4、根据权利要求3的方法,其中,该***通过表征递归特征和值范围作为关联规则A→B来动态地选择所述特征和值范围,其中根据特征和值范围A的存在,它可以推出其它特征和值范围B的存在。
5、根据权利要求4的方法,其中,通过根据规则的支持度和置信度测量该规则重要性的处理来执行转换。
6、根据权利要求4的方法,其中,该***产生多个候选组合评论,对它们进行分级,以及仅仅将具有较高等级的组合评论呈现给用户。
7、根据权利要求6的方法,其中,根据对于用户的适用性标准以及减少搜索空间的能力标准来对所述候选组合评论进行分级。
8、根据权利要求3的方法,其中,该***产生对于呈现给用户的每个组合评论的解释。
9、根据权利要求8的方法,其中,将用于选择组合评论或者请求解释的选项呈现给用户。
10、一种会话式推荐***,用于在检索循环(3-9)中利用用户反馈(4)来操作,以从数据库中检索事件,其中,对于检索会话的至少一个检索循环,该***动态地选择(7)一个选择机制(8,9),其中,根据在相关循环中的用户反馈(4)进行所述动态选择(7);且其中在基于相似性检索而不是差异性的精细选择机制(9)和基于增强差异性的相似性检索的重新聚焦选择机制(8)之间进行所述动态选择,所述推荐***包括:
用于根据在何处从前一个循环中得到了偏爱事件,是否用户在当前循环中再次优先选择同一事件来进行所述动态选择(7)的装置;
用于如果指出了不同的偏爱,则使该***选择精细选择机制(9)的装置;
用于如果指出了相同的偏爱,则使该***选择用于实现差异性的重新聚焦选择机制(8)的装置;
用于要求用户通过指定期望的搜索特征值来提供反馈的装置;
用于要求用户通过其中对于搜索特征指出值范围的评论来间接地指出一个优选事件的装置;及
用于动态地在每个会话循环产生用于用户反馈的新的反馈结构的装置。
CNB2004800242325A 2003-06-23 2004-06-23 会话式推荐***及其检索方法 Expired - Fee Related CN100568231C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
IE2003/0464 2003-06-23
IE20030464 2003-06-23

Publications (2)

Publication Number Publication Date
CN1839387A CN1839387A (zh) 2006-09-27
CN100568231C true CN100568231C (zh) 2009-12-09

Family

ID=33524001

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004800242325A Expired - Fee Related CN100568231C (zh) 2003-06-23 2004-06-23 会话式推荐***及其检索方法

Country Status (4)

Country Link
US (1) US7761454B2 (zh)
EP (1) EP1636719A1 (zh)
CN (1) CN100568231C (zh)
WO (1) WO2004114154A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005086854A2 (en) * 2004-03-09 2005-09-22 Freedom Scientific, Inc. Low vision enhancement for graphic user interface
EP2343660A1 (en) * 2007-03-31 2011-07-13 Sony Deutschland GmbH Method for content recommendation
US8285715B2 (en) * 2008-08-15 2012-10-09 Ugmode, Inc. System and method for the structured display of items
US8442977B2 (en) * 2010-02-16 2013-05-14 Honeywell International Inc. Distance-space embedding for multi-descriptor matching and retrieval
US9158775B1 (en) 2010-12-18 2015-10-13 Google Inc. Scoring stream items in real time
US8983996B2 (en) * 2011-10-31 2015-03-17 Yahoo! Inc. Assisted searching
US9858313B2 (en) 2011-12-22 2018-01-02 Excalibur Ip, Llc Method and system for generating query-related suggestions
US10491694B2 (en) * 2013-03-15 2019-11-26 Oath Inc. Method and system for measuring user engagement using click/skip in content stream using a probability model
US9672288B2 (en) 2013-12-30 2017-06-06 Yahoo! Inc. Query suggestions
US9916298B2 (en) * 2014-09-03 2018-03-13 International Business Machines Corporation Management of content tailoring by services
US10185983B2 (en) * 2015-12-31 2019-01-22 TCL Research America Inc. Least-ask: conversational recommender system with minimized user interaction
JP6178941B1 (ja) 2017-03-21 2017-08-09 株式会社ドワンゴ リアクション選択装置、リアクション選択方法、リアクション選択プログラム
CN111666498B (zh) * 2020-06-30 2023-06-16 腾讯科技(深圳)有限公司 一种基于互动信息的好友推荐方法、相关装置及存储介质
CN112925892B (zh) * 2021-03-23 2023-08-15 苏州大学 一种对话推荐方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003012684A2 (en) * 2001-07-30 2003-02-13 University College Dublin A retrieval system and method based on a similarity and relative diversity

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5426781A (en) * 1992-04-30 1995-06-20 International Business Machines Corporation Computerized report-based interactive database query interface
US7181438B1 (en) * 1999-07-21 2007-02-20 Alberti Anemometer, Llc Database access system
US6859802B1 (en) * 1999-09-13 2005-02-22 Microsoft Corporation Image retrieval based on relevance feedback
US7099860B1 (en) * 2000-10-30 2006-08-29 Microsoft Corporation Image retrieval systems and methods with semantic and feature based relevance feedback
KR100516289B1 (ko) * 2000-11-02 2005-09-21 주식회사 케이티 퍼지 적분을 이용하여 사용자 의견을 반영한 내용기반영상 검색 장치 및 그 방법
JP4003468B2 (ja) * 2002-02-05 2007-11-07 株式会社日立製作所 適合性フィードバックによる類似データ検索方法および装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003012684A2 (en) * 2001-07-30 2003-02-13 University College Dublin A retrieval system and method based on a similarity and relative diversity

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Comparison-Based Recommendation. Lorraine Mc Ginty,Barry Smyth.Advanced in Case-Based Reasoning: 6th European Conference,ECCBR 2002,Vol.2416. 2002 *
Deep dialogue vs casual conversation inrecommendersystems. LM Ginty,B.Smyth.Recommendation and Personalization in eCommerce,Proceedings of the AH’2002 Workshop. 2002 *

Also Published As

Publication number Publication date
US7761454B2 (en) 2010-07-20
WO2004114154A1 (en) 2004-12-29
US20060112087A1 (en) 2006-05-25
EP1636719A1 (en) 2006-03-22
CN1839387A (zh) 2006-09-27

Similar Documents

Publication Publication Date Title
CN100568231C (zh) 会话式推荐***及其检索方法
Van Leuken et al. Visual diversification of image search results
CN1094219C (zh) 多媒体数据库检索***
Chee et al. Rectree: An efficient collaborative filtering method
US8346701B2 (en) Answer ranking in community question-answering sites
US8942487B1 (en) Similar image selection
US8782061B2 (en) Scalable lookup-driven entity extraction from indexed document collections
US8037003B2 (en) Solution recommendation based on incomplete data sets
KR100797041B1 (ko) 분류된 웹 사이트 검색 시스템 및 방법
CN101124575A (zh) 用于生成推荐的方法和***
KR102063384B1 (ko) 이미지를 이용한 상품 정보 자동 등록 방법
CN1489089A (zh) 文件检索***和问题回答***
Berkovsky et al. Cross-representation mediation of user models
US8713001B2 (en) Systems and related methods of user-guided searching
US20070179924A1 (en) Solution recommendation based on incomplete data sets
CN111428007B (zh) 基于跨平台的同步推送反馈方法
Wasilewski et al. Intent-aware diversification using a constrained PLSA
McSherry Retrieval failure and recovery in recommender systems
Demartini et al. Overview of the INEX 2008 entity ranking track
CN105681910A (zh) 一种基于多用户的视频推荐方法及装置
KR20040021789A (ko) 상품 정보 등록 방법 및 시스템
CN104854588A (zh) 用于搜索标记的主要为非文本的项目的***和方法
WO2019184480A1 (zh) 物品推荐
CN111915414B (zh) 向目标用户展示目标对象序列的方法和装置
CN112860850B (zh) 人机交互方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20091209

Termination date: 20120623