CN103793388B - 搜索结果的排序方法和装置 - Google Patents

搜索结果的排序方法和装置 Download PDF

Info

Publication number
CN103793388B
CN103793388B CN201210420861.6A CN201210420861A CN103793388B CN 103793388 B CN103793388 B CN 103793388B CN 201210420861 A CN201210420861 A CN 201210420861A CN 103793388 B CN103793388 B CN 103793388B
Authority
CN
China
Prior art keywords
attributive character
user
reference index
search result
sorted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210420861.6A
Other languages
English (en)
Other versions
CN103793388A (zh
Inventor
李嘉森
苏绥绥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210420861.6A priority Critical patent/CN103793388B/zh
Priority to TW102109488A priority patent/TWI567673B/zh
Priority to US14/062,773 priority patent/US9633082B2/en
Priority to PCT/US2013/066968 priority patent/WO2014070624A1/en
Publication of CN103793388A publication Critical patent/CN103793388A/zh
Priority to US15/457,826 priority patent/US20170255630A1/en
Application granted granted Critical
Publication of CN103793388B publication Critical patent/CN103793388B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • G06F16/3326Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种搜索结果的排序方法和装置,所述方法包括:记录用户对根据查询词获得的搜索结果中的已展示对象的行为信息;当接收到翻页或翻屏请求时,根据用户对已展示对象的行为信息确定一项或多项属性特征在用户发生行为的对象的集合中的共同度;根据所述共同度选取符合预定要求的属性特征作为待展示或待排序对象排序的参考指标;对属性特征符合该参考指标的待展示或待排序的对象的排序进行调整。本发明根据用户行为动态更新搜索结果的排序,使搜索结果更准确,方便用户快速找到所需要的内容,转换率高。

Description

搜索结果的排序方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种搜索结果的排序方法和装置。
背景技术
随着计算机网络技术的不断发展,各个电子商务网站陆续设有自己的搜索引擎用以提供商品搜索服务,从而方便用户进行商品查询,快速找到用户感兴趣的商品。商品搜索与普通搜索引擎(如百度、***、bing等)的检索方法相类似,但有其自身的特点。与普通搜索相比,商品搜索在搜索结果的排序上,除了考虑与查询词的相关性之外,还会加入买家对商品的历史评价、发布商品信息的卖家的信誉度、作弊难易度、类目相关性及商品价格等多个维度并结合用户的个人偏好数据对各个商品对象进行综合排序,得到搜索结果。
现有的搜索结果通常按照分页或瀑布流的形式展现,一页或一屏显示一定数量的商品,例如每页40个商品,用户可以选择向后翻页或翻屏进行浏览。如果是分页展现的方式,当用户需要翻页时,通过点击对应的页码或者向后翻页的标签向搜索引擎再一次发送请求,可以浏览其他页面的商品。如果是瀑布流的展现方式,会在拖拽下拉鼠标或滑块的时候,向搜索引擎再一次发送请求,展现更多的网页内容代替原先所展现的内容。
由于现有的搜索结果都是一次性输出的自然搜索结果,在切换不同页的搜索结果时,并不重做新的排序。搜索结果的显示顺序与用户的点击或浏览行为没有一点关系。例如,在商品搜索时输入查询词为nike,用户在第一页点击了10个商品,当翻页查看到第二页时,第二页显示结果和第一页有没有点击无关,并不会根据用户行为进行动态排序。
在现有普通的搜索引擎中,会利用查询词的自然搜索结果的第一个点击行为作为目标网页,再根据目标网页基于全量的网页与网页之间的相似性的距离,从小到大的排序,对自然搜索结果进行调整,用以解决查询词的一意多词和一词多意的问题,明确用户的查询意图。
普通搜索的网页的相似性的距离计算,不适合商品搜索,因为商品搜索自然结果的列表页展现的信息,如标题、价格及图片信息会被目标页面的商品描述、评价信息、店铺信息、成交记录、促销信息、属性信息等各种信息复合作用在一起,目标页面的信息已不能代表用户点击自然搜索结果的信息了,所以目标页面与对象之间的网页相似性并不能确切地表征商品搜索的结果的相似性。另外,普通搜索的动态排序主要是优化查询词的自然结果,用初始搜索结果来探测查询词的意图,与用户实际意图偏差较大,准确率和转换率较低。
发明内容
本发明的目的是提供一种搜索结果的排序方法和装置,根据用户行为来识别用户意图,动态更新搜索结果的排序,以显示符合用户需求的搜索结果,使搜索结果更准确,方便用户快速找到所需要的内容,转换率高。
为实现上述目的,本发明提供了一种搜索结果的排序方法,所述方法包括:
记录用户对根据查询词获得的搜索结果中的已展示对象的行为信息;
当接收到翻页或翻屏请求时,根据用户对已展示对象的行为信息确定一项或多项属性特征在用户发生行为的对象的集合中的共同度;
根据所述共同度选取符合预定要求的属性特征作为待展示或待排序对象排序的参考指标;
对属性特征符合该参考指标的待展示或待排序的对象的排序进行调整。
另一方面,本发明还提供了一种搜索结果的排序装置,所述装置包括:
记录单元,用于记录用户对根据查询词获得的搜索结果中的已展示对象的行为信息;
计算单元,用于当接收到翻页或翻屏请求时,根据用户对已展示对象的行为信息确定一项或多项属性特征在用户发生行为的对象的集合中的共同度;
选取单元,用于根据所述共同度选取符合预定要求的属性特征作为待展示或待排序对象排序的参考指标;
调整单元,用于对属性特征符合所述选取单元选取的参考指标的待展示或待排序的对象的排序进行调整。
本发明提供的搜索结果的排序方法和装置,根据用户最近的浏览或点击行为来进行用户意图的识别,动态更新搜索结果的排序,以显示符合用户需求的搜索结果,使搜索结果更准确,从而使得用户能快速地找到所需要的内容,转换率高。
附图说明
图1为本发明实施例一提供的搜索结果的排序方法流程图;
图2为本发明实施例一提供的一种根据用户对已展示对象的行为信息确定属性特征共同度的方法流程图;
图3为本发明实施例一提供的一种计算待展示或待排序的对象的排序分值的方法流程图;
图4为本发明实施例二提供的搜索结果的排序装置示意图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
本发明提供的搜索结果的排序方法和装置,可用于各类的搜索引擎中,尤其是针对所得到搜索结果的属性信息类别较多的情况,例如电子商务网站的商品搜索等场景,在本发明的实施例中以商品搜索为例,对商品搜索的搜索结果进行动态排序的处理过程进行说明。
实施例一
图1是本实施例提供的搜索结果的排序方法流程图,如图1所示,本发明的搜索结果的排序方法包括:
步骤S101、记录用户对根据查询词获得的搜索结果中的已展示对象的行为信息。
用户通过浏览器输入查询词并确认后,即向搜索引擎发起搜索请求。搜索引擎接收用户的搜索请求,对查询词进行分词等处理操作,检索得到对应的搜索结果,并根据相关度的大小将所述搜索结果以分页或分屏的形式加以显示。在本步骤中,可以采用现有的搜索引擎得到查询词的搜索结果,并采用默认的排序方法加以显示。
所述的对象可以是商品或商品信息。在商品搜索中,利用查询词从数据库中检索出与该查询词相关的商品,并按照相关度大小进行排列显示,商品的排列方式也可以采用其他方式,本发明对具体显示形式不作限定。
用户对搜索结果中的对象的行为包括浏览和点击。根据用户的浏览或点击等行为,记录所述搜索结果中各对象的行为信息。行为信息可以包括但不限于:用户行为的对象、用户行为的对象在搜索结果页中的位置信息和/或用户对行为对象的发生浏览或点击的顺序。本实施例中以商品搜索为例进行说明,搜索结果中的一个对象具体为一个商品。搜索结果中没有被展示过的对象即为待重新排序和待展示的对象。
根据用户的浏览行为,记录用户浏览过的页面的信息,无论该页面有没有产生点击信息,只要被用户浏览过,就进行记录。所记录的信息,即所述的用户行为信息还包括页面的会话(session)信息、该页面对应的查询词、该页面在搜索结果中所处的页码或屏、该页面对应的商品识别码(id)及用户当前行为的对象在用户发生行为的各对象中的行为顺序。
其中,会话Session是指终端用户与交互***进行通信的过程,通常指从用户注册进入***到注销退出***之间的过程。
具体地,一个会话session指的就是用户在浏览某个网站时,从进入网站到浏览器关闭所经过的这段时间,用户使用浏览器在这段时间内的所有操作为同一会话中操作。
在同一session中,用户可以输入一个或多个查询词进行检索查询,本实施例对同一个session中的同一个查询词或查询词组合下的搜索结果进行动态排序,第n+1页的搜索结果根据前n个页面的浏览或点击反馈进行排序。当然,在实际使用需求下,也可以对一段时间内不同session的同一个查询词的搜索结果进行动态排序,例如,对同一个用户或者同一IP地址。
同理,根据用户的点击行为,记录用户点击过的商品,一并记录商品被点击的顺序,即用户对该对象的行为顺序。对于被用户点击的对象,记录的行为信息包括该对象对应的页面的会话(session)信息、该对象对应的查询词、该对象在搜索结果中所处的页面的页码或屏、该对象的商品识别码(id)及该对象在用户行为的各对象中发生点击的顺序。记录的格式可以如(session,查询词,页码,商品id串,行为顺序),表示在一个session的某个查询词下某一页码中的商品id被点击的信息。统计发现,用户在query搜索时的最后一次点击,才是最接近用户本意的,而非第一次点击。一般而言,对于点击顺序越靠后的点击,其价值越大,越符合用户的查询意图。
对于存储格式,可以将点击的商品依次写入商品id串中,以固定的符号进行压缩,可以但不限于使用“栈”的数据结构。
举个例子,假如搜索“nike”,在第一页,依次点击了4个商品,一般一页的商品数是40个,则记录结果为:
(20120324081,nike,1,auction_1:auction_3:auction_5:auction_15)
其中第一个字段表示会话session,如20120324081是会话session的id,第二个字段表示查询词,第三个字段表示页面。auction_1、auction_3、auction_5、auction_15分别表示不同的商品id。根据上述例子的记录,可看出第一页展示的搜素结果中,商品id为auction_15的商品是第四个被点击的。
步骤S102、当接收到翻页或翻屏请求时,根据用户对已展示对象的行为信息确定一项或多项属性特征在用户发生行为的对象的集合中的共同度。
当用户在同一个会话session中针对同一个查询词的搜索结果列表发起的一个翻页或翻屏请求时,搜索引擎则获取当前session使用的查询词对应的搜索结果下用户对已展示对象的行为信息,根据用户的行为信息确定用户行为对象的特征信息。如图2所示,根据用户对已展示对象的行为信息确定预设的一项或多项属性特征在用户发生行为的对象的集合中的共同度的方法具体包括如下子步骤S102_1-S102_4。
步骤S102_1、获取已展示的对象的属性特征。
按照历史选择信息中的相关次序,依次解析出用户行为对象对应的商品id,并获取该商品id对应的各项属性特征。所述的属性特征包括:商品信息的标题、商品的价格、商品的图片或图片地址、最近成交笔数、运费、商品所在地域、卖家名称及自定义标签(例如,商品发布方提供的服务标签,包括:假一赔三,如实描述,7天无理由退换货,闪电发货,细节图,货到付款,消费者保障等商品或卖家的标签)中的一种或多种信息。。由于这些商品的属性特征通常可以展现在搜索结果的列表页面,可以直观地影响买家对搜索结果的行为倾向,因而可以利用这些商品属性特征识别用户的意图。所述属性特征包括属性及商品在该属性上的属性值或属性值区间。
步骤S102_2、将用户点击过的对象归类于已选集合,将已展示的对象中未被点击的对象归类于未选集合。
用户点击包括在搜索结果页中用户选择某一对象点击而进入该对象的详情页面的操作行为。用户点击也可以是包括在搜索结果页中用户选择某一对象使其展开详细描述信息的操作行为。
当用户选择搜索结果的某一列表页时,在该列表页展示的对象通常是用户可以获取或浏览的对象。用户选择获得该列表页后,该列表页展示的对象视为用户已经浏览的对象。
将所有被浏览过的商品(也即已展示的对象)分为两个集合:已选集合和未选集合,已选集合中的商品是被浏览过且被点击过的商品,未选集合中的则是被浏览过但未被点击过的商品。
需要说明的是,步骤S102_1和步骤S102_2的先后顺序可以调换。
步骤S102_3、根据所述已选集合中的对象所具有的各项属性特征计算每一属性特征在已选集合中的共同度。
步骤S102_4、根据所述未选集合中的对象所具有的各项属性特征计算所述属性特征在未选集合中的共同度。
某一项属性特征在所述已选集合或未选集合中的共同度具体为:在所述已选集合或未选集合中,具有相同或相似的所述属性特征的对象的个数与所述已选集合或未选集合中对象的总数的比值,也即所述属性特征对应的属性上具有相同或相似的属性值的对象的个数与所述已选集合或未选集合中对象的总数的比值。
所述属性的属性值相似的情形包括:多个对象在该属性上的属性值在相同的预设区间内。
由于图片是影响点击的主要因素之一,但每个商品的图片很难有共同度,因而将属性特征分为图片属性特征和非图片属性特征。图片属性的属性值可以使用商品的图片的特征值表示。
对于非图片属性特征的共同度的计算,将商品的非图片属性特征的属性值数值化或分组离散化。例如,可以利用统计的方法,将价格、成交笔数、信用等属性,按照一定规则进行分组,如对价格属性可以分为(0,50]、(50,100]及(100-150]三个属性值区间等等,将每个商品在价格属性上的属性值划分到相应区间。通过对商品各项属性的数值化和分组可以将所有的属性特征分组离散化。如果被点击的商品大多符合某一属性的同一个属性值区间,则该该属性及属性值对形成的属性特征在被点击商品中的共同度较大。
继续参见图1,步骤S103、根据所述共同度选取符合预定要求的属性特征作为待展示或排序对象排序的参考指标。
选取符合预定要求的属性特征作为待展示或排序对象(即未展示对象)排序的参考指标的方法可以包括如下方式中的一种或多种:
对各项属性特征按共同度从大到小依次排序,选取预定数量的排序在前的属性特征作为参考指标。
或者,将共同度大于设定阈值的属性特征作为参考指标。
或者,先计算各项属性特征在所述已选集合和所述未选集合中的共同度之差,将所述共同度之差大于设定阈值时对应的属性特征作为参考指标。
或者,先计算各项属性特征在所述已选集合和所述未选集合中的共同度之差,按所述共同度之差对所述属性特征从大到小依次排序,选取预定数量的排序在前的属性特征作为参考指标。
如果一个属性特征在已选集合中有较高共同度,也即在用户点击过的商品集合中属性特征具有较高共同度,表示属性特征很可能时用户选择商品的参考因素;同时,如果该属性特征在未选集合中的共同度越低,该属性特征在已选集合和未选集合中的共同度的差值就较越大,表示该属性特征对用户的选择商品产生影响的可能性就越大,则可以将该属性特征作为未展示页面中的商品的动态排序的参考指标。可以理解的,参考指标可以用于区分用户意图。
本实施例的动态排序可以综合考虑属性特征在已选集合和未选集合的共同度之差,选出在已选集合中共同度高且在未选集合中不存在该属性特征或者共同度低的属性作为参考指标。
需要说明的是,步骤S102_2并不是必须的步骤,在用户点击的数量较少时,例如只点击1-2个商品,则可以不考虑未选集合。相应地,步骤S102_1可以仅根据所述对象的点击顺序,依次获取所点击的对象的各个属性及其属性值。
步骤S104、根据所述参考指标计算待展示或待排序的对象各自的排序分值。
根据共同度确定出参考指标。例如,根据各项属性特征在已选集合中的共同度确定出的参考指标的集合表示为(A1,A2,A3)。根据各项属性特征在未选集合中的共同度确定的参考指标的集合表示为(B1,B2,B3)。
对于待排序的对象,利用参考指标进行排序分值调整,将符合参考指标A1、A2和/或A3的对象进行加分,对符合参考指标B1、B2和/或B3的对象进行降分;即,对符合从已选集合中确定出的参考指标的未展示或待排序对象进行排序分值的加分或给予正的排序分值,对符合从未选集合中确定出的参考指标的未展示或待排序对象进行排序分值的减分或给予负的排序分值。
计算待展示或待排序的对象各自的排序分值可以同时考虑依照自然排序规则得到的每一对象的排序分值,即根据所述参考指标在依照自然排序规则得到的排序分值上做加分或减分。所述的自然排序规则可以为展示搜索结果列表的首页或首屏时采用的排序规则。
可以理解地,为保证符合从已选集合中确定出的参考指标的对象能优先展示,计算待展示或待排序的对象各自的排序分值时,符合从已选集合中确定出的参考指标的未展示或待排序对象的排序分值也可以是在依照自然排序规则得到的未展示或待排序对象的最大排序分值的基础上做加分后的分值。
此外,考虑到用户在已展示对象上的选择顺序对于用户意图的影响,在本申请的具体实施例中步骤S104包括步骤S104_1-S104_4,如图3所示。用户在已展示对象上的选择顺序即用户在已展示的搜索结果列表中发生于对象上的点击顺序。
步骤S104_1、根据所述点击顺序为用户在已展示对象中所点击的对象赋予第一权重。
由于点击顺序越靠后,其价值越大,就越符合用户的查询意图,因而根据点击顺序为被点击的商品赋予不同的第一权重,例如可以直接将顺序的名次作为第一权重,如果商品是第一个被点击,则该商品的第一权重为V1,第二个被点击的商品的第一权重为V2,依次类推,第n个被点击的商品的第一权重为Vn。依照商品被点击的顺序,各被点击商品的第一权重依次增大,即V1<V2…<Vn
步骤S104_2、根据用户所选择的对象中符合参考指标的对象的权重计算每一参考指标的权重。
用户选择的对象(即点击的对象)的数量为n,n为自然数。这些用户选择的对象对用户查询意图的影响的权重依次为V1、V2、…Vn。对于某一项参考指标,计算符合该参考指标的被选择的对象的权重的和,记作Vm。将符合该参考指标的被选择的对象的权重的和与用户选择的对象的权重的总和的比值作为该参考指标的权重,即参考指标对用户查询意图的影响的权重,记作Q。即,Q=Vm/(V1+V2+…Vn)。
例如,用户针对查询词为nike的第一页搜索结果,依次点击了第1、3、5和15个商品,记录为(20120324081,nike,1,auction_1:auction_3:auction_5:auction_15),第1、3、5和15个商品对应的第一权重分别为1、2、3和4。根据该用户行为确定的某一参考指标包括商品相关标签这一属性及对应的属性值“假一赔三”。在搜索结果列表中的第1、5和15个商品具有商品相关标签这一属性,且该商品相关标签具有“假一赔三”这一属性值,即符合该参考指标。则该参考指标的权重为(1+3+4)/(1+2+3+4)=0.8。
对于图片特征的计算,可以选择在离线情况下,将商品的图片转换为图片的特征值,以数值型的形式表示图片,数值越接近,则表明图片越相似。
步骤S104_3、计算待展示或待排序的对象符合的参考指标对该对象排序的影响程度的综合分。
待排序对象可能符合多个参考指标,可以为每一个参考指标分别预先配置指标分。根据已选集合确定的参考指标的指标分为正值,比如分值“1”;根据未选集合确定的参考指标的指标分为负值,比如分值“-1”。待排序的对象符合的参考指标对排序的影响程度的综合分值每一参考指标的指标分与权重的乘积的和。
待排序的对象符合的参考指标对待排序的对象的影响程度的综合分的计算公式如下:
f(auction_id)=T1*Q1+T2*Q2…+Tn*Qn
其中,f(auction_id)表示待排序的对象符合的参考指标对待排序对象的排序的影响程度的综合分。Tn为第n个参考指标的指标分,Qn为第n个参考指标的权重。对于根据已选集合确定的参考指标,其指标分为固定的正值,也可以分别为不同的预设值。对于根据未选集合确定的参考指标,其指标分可以为固定的负值,也可以分别为预设的不同的负值。
对于每一个点击图片,根据图片的特征值计算待排序商品的图片与该点击图片的相似度,并设置一个图片相似度阈值,判断计算得到的相似度是否大于预设图片相似度阈值,并选取前N3个,N3为任意正整数。对于每一个页面显示40个商品,N3也可以设置为40,选取待排序商品的图片与该点击图片相似度排在前40个的商品,存为(auction_id,auc_list)。其中auc_list是商品的列表,按照相似度的大小顺序排列,出现在auc_list的第一个商品,则在图片特征上该商品与被点击商品最相似。
如果用户的点击行为中包括多个被点击的商品,则针对每一个被点击的商品,确定一个待排序商品的商品列表。如果一个待排序商品存在于某一商品列表中,则将该待排序商品与该被点击商品的相似度加权到f(auction_id)中。如果不存在,则不加权。
步骤S104_4、根据待展示或待排序的对象符合的参考指标对该对象排序的影响程度的综合分调整待展示或待排序的对象的排序分值。
f(auction_id)为正值时,参考指标待展示或待排序的对象的排序分值的调整为正向调整,即提升该对象排序。
f(auction_id)为负值时,参考指标待展示或待排序的对象的排序分值的调整为负向调整,即降低该对象排序。
步骤S105、根据调整后待展示或待排序的对象的排序分值对待展示或待排序的对象进行重新排序。
若f(auction_id)<0,则表示商品要被降序,则在该商品原有的排序分值的基础上加上f(auction_id)即为调整后的排序分值;如果f(auction_id)>0,则表示商品要被提序,在该商品原有的排序分值的基础上加上f(auction_id)得到调整后的排序分值。
这样,根据用户的行为特征可以对待排序商品进行动态调整,第n+1页的搜索结果会根据前n个页面的点击反馈进行排序。
可选地,本发明在进行排序分值调整时,还可以加入用户在一段时间内的浏览行为或点击反馈行为,如浏览了哪些商品,哪些店铺,哪些类目,收藏哪些商品,基于历史偏好的统计,提取出共有的属性特征,来动态影响排序分值。
以上是对本发明所提供的搜索结果的排序方法进行的详细描述,下面对本发明提供的搜索结果的排序装置进行详细描述。
实施例二
图4是本实施例提供的搜索结果的排序装置示意图,如图4所示,本发明的排序装置包括:记录单元10、计算单元20、选取单元30、调整单元40、分类单元50和排序单元60。
记录单元10用于记录用户对根据查询词获得的搜索结果中的已展示对象的行为信息。
用户通过浏览器输入查询词并确认后,即向搜索引擎发起搜索请求。搜索引擎接收用户的搜索请求,对查询词进行分词等处理操作,检索得到对应的搜索结果,并根据相关度的大小将所述搜索结果以分页或分屏的形式加以显示。可以利用现有的搜索引擎得到查询词的搜索结果,并采用默认的排序方法加以显示,本发明是在利用已有的搜索引擎产生的搜索结果的基础上进行动态排序的。
所述的对象可以是商品或商品信息。在商品搜索中,检索单元10利用查询词从数据库中检索出与该查询词相关的商品,并按照相关度大小进行排列显示,商品的排列方式可以,本发明对具体显示形式不作限定。
用户对搜索结果中的对象的行为包括浏览和点击。记录单元10根据用户的浏览或点击等行为,记录所述搜索结果中各对象的行为信息,当接收到同一查询词的翻页或翻屏请求时,触发计算单元20。行为信息可以包括但不限于:用户行为的对象,以及用户行为的对象在搜索结果页中的位置信息和/或用户对行为对象的发生浏览或点击的顺序。本实施例中以商品搜索为例进行说明,搜索结果中的一个对象具体为一个商品。搜索结果中没有被展示过的对象即为待重新排序和待展示的对象。
记录单元10根据用户的浏览行为,记录用户浏览过的页面的信息,无论该页面有没有产生点击信息,只要被用户浏览过,就进行记录。所记录的信息,即所述的用户行为信息还包括页面的会话(session)信息、该页面对应的查询词、该页面在搜索结果中所处的页码或屏、该页面对应的商品识别码(id)及用户当前行为的对象在用户发生行为的各对象中的行为顺序。
其中,会话Session是指终端用户与交互***进行通信的过程,通常指从用户注册进入***到注销退出***之间的过程。
具体地,一个会话session指的就是用户在浏览某个网站时,从进入网站到浏览器关闭所经过的这段时间,用户使用浏览器在这段时间内的所有操作为同一会话中操作。
在同一session中,用户可以输入一个或多个查询词进行检索查询,本实施例对同一个session中的同一个查询词或查询词组合下的搜索结果进行动态排序,第n+1页的搜索结果根据前n个页面的浏览或点击反馈进行排序。当然,在实际使用需求下,也可以对一段时间内不同session的同一个查询词的搜索结果进行动态排序,例如,对同一个用户或者同一IP地址。
同理,记录单元10根据用户的点击行为,记录用户点击过的商品,一并记录商品被点击的顺序,即用户对该对象的行为顺序。对于被用户点击的对象,记录的行为信息包括该对象对应的页面的会话(session)信息、该对象对应的查询词、该对象在搜索结果中所处的页面的页码或屏、该对象的商品识别码(id)及该对象在用户行为的各对象中发生点击的顺序。记录的格式可以如(session,查询词,页码,商品id串,行为顺序),表示在一个session的某个查询词下某一页码中的商品id被点击的信息。统计发现,用户在query搜索时的最后一次点击,才是最接近用户本意的,而非第一次点击。一般而言,对于点击顺序越靠后的点击,其价值越大,越符合用户的查询意图。
对于存储格式,记录单元10可以将点击的商品依次写入商品id串中,以固定的符号进行压缩,可以但不限于使用“栈”的数据结构。
举个例子,假如搜索“nike”,在第一页,依次点击了4个商品,一般一页的商品数是40个,则记录结果为:
(20120324081,nike,1,auction_1:auction_3:auction_5:auction_15)
其中第一个字段表示会话session,如20120324081是会话session的id,第二个字段表示查询词,第三个字段表示页面。auction_1、auction_3、auction_5、auction_15分别表示不同的商品id。根据上述例子的记录,可看出第一页展示的搜素结果中,商品id为auction_15的商品是第四个被点击的。
当记录单元10接收到用户在同一个会话session中针对同一个查询词发起的一个翻页或翻屏请求时,触发计算单元20。
计算单元20用于根据用户对已展示对象的行为信息确定一项或多项属性特征在用户发生行为的对象的集合中的共同度。
当受到记录单元10的触发时,计算单元20获取当前session使用的查询词对应的搜索结果下用户对已展示对象的行为信息,根据用户的行为信息确定用户行为的特征信息。
分类单元50与计算单元20相连接,用于将用户点击过的对象归类于已选集合,将已展示的对象中未被点击的对象归类于未选集合。
用户点击包括在搜索结果页中用户选择某一对象点击而进入该对象的详情页面的操作行为。用户点击也可以是包括在搜索结果页中用户选择某一对象使其展开详细描述信息的操作行为。
当用户选择搜索结果的某一列表页时,在该列表页展示的对象通常是用户可以获取或浏览的对象。用户选择获得该列表页后,该列表页展示的对象视为用户已经浏览的对象。
将所有被浏览过的商品(也即已展示的对象)分为两个集合:已选集合和未选集合,已选集合中的商品是被浏览过且被点击过的商品,未选集合中的则是被浏览过但未被点击过的商品。
当然,分类单元50也可以仅用于将在搜索结果中被点击的对象归类于已选集合,或者,也可以仅用于将将在搜索结果中已展示且未被点击的对象归类于未选集合。
计算单元20包括获取子单元201、第一计算子单元202、和第二计算子单元203。
获取子单元201用于获取已展示的对象的属性特征。
按照历史选择信息中的相关次序,依次解析出用户行为对象对应的商品id,并获取该商品id对应的各项属性特征。所述的属性特征包括:商品信息的标题、商品的价格、商品的图片或图片地址、最近成交笔数、运费、商品所在地域、卖家名称及自定义标签(例如,商品发布方提供的服务标签,包括:假一赔三,如实描述,7天无理由退换货,闪电发货,细节图,货到付款,消费者保障等商品或卖家的标签)中的一种或多种信息。。由于这些商品的属性特征通常可以展现在搜索结果的列表页面,可以直观地影响买家对搜索结果的行为倾向,因而可以利用这些商品属性特征识别用户的意图。所述属性特征包括属性及商品在该属性上的属性值或属性值区间。
第一计算子单元202用于根据所记录的用户对已展示对象的行为信息计算每一属性特征在已选集合中的共同度。
第二计算子单元203用于根据所述未选集合中的对象所具有的各项属性特征计算所述属性特征在未选集合中的共同度。
某一项属性特征在所述已选集合或未选集合中的共同度具体为:在所述已选集合或未选集合中,具有相同或相似的所述属性特征的对象的个数与所述已选集合或未选集合中对象的总数的比值,也即所述属性特征对应的属性上具有相同或相似的属性值的对象的个数与所述已选集合或未选集合中对象的总数的比值。
所述属性的属性值相似的情形包括:多个对象在该属性上的属性值在相同的预设区间内。
由于图片是影响点击的主要因素之一,但每个商品的图片很难有共同度,因而将属性特征分为图片属性特征和非图片属性特征。图片属性的属性值可以使用商品的图片的特征值表示。
对于非图片属性特征的共同度的计算,将商品的非图片属性特征的属性值数值化或分组离散化。例如,可以利用统计的方法,将价格、成交笔数、信用等属性,按照一定规则进行分组,如对价格属性可以分为(0,50]、(50,100]及(100-150]三个属性值区间等等,将每个商品在价格属性上的属性值划分到相应区间。通过对商品各项属性的数值化和分组可以将所有的属性特征分组离散化。如果被点击的商品大多符合某一属性的同一个属性值区间,则该该属性及属性值对形成的属性特征在被点击商品中的共同度较大。
选取单元30用于根据所述共同度选取符合预定要求的属性特征作为待展示或排序对象排序的参考指标。
选取单元30选取符合预定要求的属性特征作为待展示或排序对象(即未展示对象)排序的参考指标的方法可以包括如下方式中的一种或多种:
对各项属性特征按共同度从大到小依次排序,选取预定数量的排序在前的属性特征作为参考指标。
或者,将共同度大于设定阈值的属性特征作为参考指标。
或者,先计算各项属性特征在所述已选集合和所述未选集合中的共同度之差,将所述共同度之差大于设定阈值时对应的属性特征作为参考指标。
或者,先计算各项属性特征在所述已选集合和所述未选集合中的共同度之差,按所述共同度之差对所述属性特征从大到小依次排序,选取预定数量的排序在前的属性特征作为参考指标。
如果一个属性特征在已选集合中有较高共同度,也即在用户点击过的商品集合中属性特征具有较高共同度,表示属性特征很可能时用户选择商品的参考因素;同时,如果该属性特征在未选集合中的共同度越低,该属性特征在已选集合和未选集合中的共同度的差值就较越大,表示该属性特征对用户的选择商品产生影响的可能性就越大,则可以将该属性特征作为未展示页面中的商品的动态排序的参考指标。可以理解的,参考指标可以用于区分用户意图。
本实施例的动态排序可以综合考虑属性特征在已选集合和未选集合的共同度之差,选出在已选集合中共同度高且在未选集合中不存在该属性特征或者共同度低的属性作为参考指标。
需要说明的是,计算单元20也可以不设置分类单元50,在用户点击的数量较少时,例如只点击1-2个商品,则可以不考虑未选集合。相应地,采用第一计算子单元202来进行计算,根据所有的所述选择的对象具有的属性特征或对应的所述属性特征值计算所述属性特征各自的共同度。选取单元30将所述共同度满足要求的属性特征作为所述关键特征。
排序单元40用于根据所述参考指标计算待展示或待排序的对象各自的排序分值。
选取单元30根据共同度确定出参考指标。例如,根据各项属性特征在已选集合中的共同度确定出的参考指标的集合表示为(A1,A2,A3)。根据各项属性特征在未选集合中的共同度确定的参考指标的集合表示为(B1,B2,B3)。
排序单元40对于待排序的对象,利用参考指标进行排序分值调整,将符合参考指标A1、A2和/或A3的对象进行加分,对符合参考指标B1、B2和/或B3的对象进行降分;即,对符合从已选集合中确定出的参考指标的未展示或待排序对象进行排序分值的加分或给予正的排序分值,对符合从未选集合中确定出的参考指标的未展示或待排序对象进行排序分值的减分或给予负的排序分值。
排序单元40计算待展示或待排序的对象各自的排序分值可以同时考虑依照自然排序规则得到的每一对象的排序分值,即根据所述参考指标在依照自然排序规则得到的排序分值上做加分或减分。所述的自然排序规则可以为展示搜索结果列表的首页或首屏时采用的排序规则。
可以理解地,为保证符合从已选集合中确定出的参考指标的对象能优先展示,排序单元40计算待展示或待排序的对象各自的排序分值时,符合从已选集合中确定出的参考指标的未展示或待排序对象的排序分值也可以是在依照自然排序规则得到的未展示或待排序对象的最大排序分值的基础上做加分后的分值。
此外,考虑到用户在已展示对象上的选择顺序对于用户意图的影响,在本申请的具体实施例中排序单元40还包括:赋值子单元401、第三计算子单元402、第四计算子单元403和第五计算子单元404。用户在已展示对象上的选择顺序即用户在已展示的搜索结果列表中发生于对象上的点击顺序。
赋值子单元401用于根据点击顺序为用户在已展示对象中所点击的对象赋予第一权重。
由于点击顺序越靠后,其价值越大,就越符合用户的查询意图,因而根据点击顺序为被点击的商品赋予不同的第一权重,例如可以直接将顺序的名次作为第一权重,如果商品是第一个被点击,则该商品的第一权重为V1,第二个被点击的商品的第一权重为V2,依次类推,第n个被点击的商品的第一权重为Vn。依照商品被点击的顺序,各被点击商品的第一权重依次增大,即V1<V2…<Vn
第三计算子单元402用于根据用户所选择的对象中符合参考指标的对象的第一权重计算每一参考指标的权重。
用户选择的对象(即点击的对象)的数量为n,n为自然数。这些用户选择的对象对用户查询意图的影响的权重依次为V1、V2、…Vn。对于某一项参考指标,计算符合该参考指标的被选择的对象的权重的和,记作Vm。将符合该参考指标的被选择的对象的权重的和与用户选择的对象的权重的总和的比值作为该参考指标的权重,即参考指标对用户查询意图的影响的权重,记作Q。即,Q=Vm/(V1+V2+…Vn)。
例如,用户针对查询词为nike的第一页搜索结果,依次点击了第1、3、5和15个商品,记录为(20120324081,nike,1,auction_1:auction_3:auction_5:auction_15),第1、3、5和15个商品对应的第一权重分别为1、2、3和4。第三计算子单元402根据该用户行为确定的某一参考指标包括商品相关标签这一属性及对应的属性值“假一赔三”。在搜索结果列表中的第1、5和15个商品具有商品相关标签这一属性,且该商品相关标签具有“假一赔三”这一属性值,即符合该参考指标。则该参考指标的权重为(1+3+4)/(1+2+3+4)=0.8。
对于图片特征的计算,第三计算子单元402选择在离线情况下,将商品的图片转换为图片的特征值,以数值型的形式表示图片,数值越接近,则表明图片越相似。
第四计算子单元403用于根据待展示或待排序的对象的属性特征所符合的参考指标的权重,计算该参考指标对该对象排序的影响程度的综合分。
待排序对象可能符合多个参考指标,可以为每一个参考指标分别预先配置指标分。根据已选集合确定的参考指标的指标分为正值,比如分值“1”;根据未选集合确定的参考指标的指标分为负值,比如分值“-1”。待排序的对象符合的参考指标对排序的影响程度的综合分值每一参考指标的指标分与权重的乘积的和。
第四计算子单元403采用待排序的对象符合的参考指标对待排序的对象的影响程度的综合分的计算公式如下:
f(auction_id)=T1*Q1+T2*Q2…+Tn*Qn
其中,f(auction_id)表示待排序的对象符合的参考指标对待排序对象的排序的影响程度的综合分。Tn为第n个参考指标的指标分,Qn为第n个参考指标的权重。对于根据已选集合确定的参考指标,其指标分为固定的正值,也可以分别为不同的预设值。对于根据未选集合确定的参考指标,其指标分可以为固定的负值,也可以分别为预设的不同的负值。
对于每一个点击图片,第四计算子单元403根据图片的特征值计算待排序商品的图片与该点击图片的相似度,并设置一个图片相似度阈值,判断计算得到的相似度是否大于预设图片相似度阈值,并选取前N3个,N3为任意正整数。对于每一个页面显示40个商品,N3也可以设置为40,选取待排序商品的图片与该点击图片相似度排在前40个的商品,存为(auction_id,auc_list)。其中auc_list是商品的列表,按照相似度的大小顺序排列,出现在auc_list的第一个商品,则在图片特征上该商品与被点击商品最相似。
如果用户的点击行为中包括多个被点击的商品,第四计算子单元403则针对每一个被点击的商品,确定一个待排序商品的商品列表。如果一个待排序商品存在于某一商品列表中,则将该待排序商品与该被点击商品的相似度加权到f(auction_id)中。如果不存在,则不加权。
第五计算子单元404用于根据该综合分调整该对象的排序分值。
第五计算子单元404根据待展示或待排序的对象符合的参考指标对该对象排序的影响程度的综合分调整待展示或待排序的对象的排序分值。
f(auction_id)为正值时,参考指标待展示或待排序的对象的排序分值的调整为正向调整,即提升该对象排序。
f(auction_id)为负值时,参考指标待展示或待排序的对象的排序分值的调整为负向调整,即降低该对象排序。
排序单元60用于根据调整后待展示或待排序的对象的排序分值对待展示或待排序的对象进行重新排序。
若f(auction_id)<0,则表示商品要被降序,则在该商品原有的排序分值的基础上加上f(auction_id)即为调整后的排序分值;如果f(auction_id)>0,则表示商品要被提序,在该商品原有的排序分值的基础上加上f(auction_id)得到调整后的排序分值。
这样,根据用户的行为特征可以对待排序商品进行动态调整,第n+1页的搜索结果会根据前n个页面的点击反馈进行排序。
可选地,本发明在进行排序分值调整时,还可以加入用户在一段时间内的浏览行为或点击反馈行为,如浏览了哪些商品,哪些店铺,哪些类目,收藏哪些商品,基于历史偏好的统计,提取出共有的属性特征,来动态影响排序分值。
本发明提供的排序方法和装置,根据综合排序的前面的点击反馈行为,来动态更新后续页面的搜索排序,用以优化查询词搜索结果的排序,可以迎合用户的需要,使用户能快速地找到所需要的内容,从而提高用户从浏览到成交的转换率。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (26)

1.一种搜索结果的排序方法,其特征在于,所述方法包括:
记录用户对根据查询词获得的搜索结果中的已展示对象的行为信息;
当接收到翻页或翻屏请求时,根据用户对已展示对象的行为信息确定一项或多项属性特征在用户发生行为的对象的集合中的共同度;
根据所述共同度选取符合预定要求的属性特征作为待展示或待排序对象排序的参考指标;
对属性特征符合该参考指标的待展示或待排序的对象的排序进行调整;
其中,所述共同度为在所述用户发生行为的对象的集合中,具有相同或相似的所述属性特征的对象的个数与所述用户发生行为的对象的集合中对象的总数的比值。
2.根据权利要求1所述的搜索结果的排序方法,其特征在于,所述行为信息包括:用户行为的对象、用户行为的对象在搜索结果页中的位置信息和/或用户对行为对象的发生浏览或点击的顺序。
3.根据权利要求1所述的搜索结果的排序方法,其特征在于,所述对象为商品或商品信息。
4.根据权利要求1所述的搜索结果的排序方法,其特征在于,根据用户对已展示对象的行为信息确定一项或多项属性特征在用户发生行为的对象的集合中的共同度的方法包括:
获取已展示的对象的属性特征;
将用户点击过的对象归类于已选集合,将已展示的对象中未被点击的对象归类于未选集合;
根据所记录的用户对已展示对象的行为信息计算每一属性特征在已选集合中的共同度;及
根据所述未选集合中的对象所具有的各项属性特征计算所述属性特征在未选集合中的共同度。
5.根据权利要求4所述的搜索结果的排序方法,其特征在于,属性特征在所述已选集合或未选集合中的共同度为:在所述已选集合或未选集合中,具有相同或相似的所述属性特征的对象的个数与所述已选集合或未选集合中对象的总数的比值。
6.根据权利要求4所述的搜索结果的排序方法,其特征在于,根据所述共同度选取符合预定要求的属性特征作为待展示或待排序对象排序的参考指标,具体包括:
对各项属性特征按共同度从大到小依次排序,选取预定数量的排序在前的属性特征作为参考指标或将共同度大于设定阈值的属性特征作为参考指标。
7.根据权利要求4所述的搜索结果的排序方法,其特征在于,根据所述共同度选取符合预定要求的属性特征作为待展示或待排序对象排序的参考指标,具体包括:
计算各项属性特征在所述已选集合和所述未选集合中的共同度之差,对各项属性特征按所述共同度之差从大到小依次排序,选取预定数量的排序在前的属性特征作为参考指标或将所述共同度之差大于设定阈值时对应的属性特征作为参考指标。
8.根据权利要求1所述的搜索结果的排序方法,其特征在于,所述用户发生行为的对象为在搜索结果中被点击的对象。
9.根据权利要求8所述的搜索结果的排序方法,其特征在于,所述方法还包括:
将在搜索结果中被点击的对象归类于已选集合;
所述对属性特征符合该参考指标的待展示或待排序的对象的排序进行调整的方法包括:
根据用户对已选集合中的对象的行为信息计算每一属性特征在已选集合中的共同度;
选择所述共同度大于预设阈值的属性特征作为参考指标;
对属性特征符合该参考指标的待展示或待排序的对象的排序进行提升。
10.根据权利要求8所述的搜索结果的排序方法,其特征在于,所述方法还包括:
将在搜索结果中被点击的对象归类于已选集合;
所述对属性特征符合该参考指标的待展示或待排序的对象的排序进行调整的方法包括:
根据用户对已选集合中的对象的行为信息计算每一属性特征在已选集合中的共同度;
对各项属性特征按共同度从大到小依次排序,选取预定数量的排序在前的属性特征作为参考指标;
对属性特征符合该参考指标的待展示或待排序的对象的排序进行提升。
11.根据权利要求1所述的搜索结果的排序方法,其特征在于,所述方法还包括:
将在搜索结果中已展示且未被点击的对象归类于未选集合;
所述对属性特征符合该参考指标的待展示或待排序的对象的排序进行调整的方法包括:
根据用户对未选集合中的对象的行为信息计算每一属性特征在未选集合中的共同度;
选择所述共同度大于预设阈值的属性特征作为参考指标;
对属性特征符合该参考指标的待展示或待排序的对象的排序进行降序。
12.根据权利要求1所述的搜索结果的排序方法,其特征在于,所述方法还包括:
将在搜索结果中已展示且未被点击的对象归类于未选集合;
所述对属性特征符合该参考指标的待展示或待排序的对象的排序进行调整的方法包括:
根据用户对未选集合中的对象的行为信息计算每一属性特征在未选集合中的共同度;
对各项属性特征按共同度从大到小依次排序,选取预定数量的排序在前的属性特征作为参考指标;
对属性特征符合该参考指标的待展示或待排序的对象的排序进行降序。
13.根据权利要求1所述的搜索结果的排序方法,其特征在于,所述方法还包括:
根据所述参考指标计算待展示或待排序的对象各自的排序分值;
所述对属性特征符合该参考指标的待展示或待排序的对象的排序进行调整具体为:根据所述排序分值对待展示或待排序的对象的重新进行排序;
其中,根据所述参考指标计算待展示或待排序的对象各自的排序分值,具体包括:
根据点击顺序为用户在已展示对象中所点击的对象赋予第一权重;
根据用户所选择的对象中符合参考指标的对象的第一权重计算每一参考指标的权重;
根据待展示或待排序的对象的属性特征所符合的参考指标的权重,计算该参考指标对该对象排序的影响程度的综合分;及
根据该综合分调整该对象的排序分值。
14.一种搜索结果的排序装置,其特征在于,所述装置包括:
记录单元,用于记录用户对根据查询词获得的搜索结果中的已展示对象的行为信息;
计算单元,用于当接收到翻页或翻屏请求时,根据用户对已展示对象的行为信息确定一项或多项属性特征在用户发生行为的对象的集合中的共同度;
选取单元,用于根据所述共同度选取符合预定要求的属性特征作为待展示或待排序对象排序的参考指标;
调整单元,用于对属性特征符合所述选取单元选取的参考指标的待展示或待排序的对象的排序进行调整;
其中,所述共同度为在所述用户发生行为的对象的集合中,具有相同或相似的所述属性特征的对象的个数与所述用户发生行为的对象的集合中对象的总数的比值。
15.根据权利要求14所述的搜索结果的排序装置,其特征在于,所述行为信息包括:用户行为的对象、用户行为的对象在搜索结果页中的位置信息和/或用户对行为对象的发生浏览或点击的顺序。
16.根据权利要求14所述的搜索结果的排序装置,其特征在于,所述对象为商品或商品信息。
17.根据权利要求14所述的搜索结果的排序装置,其特征在于,所述装置还包括:
分类单元,用于将用户点击过的对象归类于已选集合,将已展示的对象中未被点击的对象归类于未选集合;
计算单元具体包括:
获取子单元,用于获取已展示的对象的属性特征;
第一计算子单元,用于根据所记录的用户对已展示对象的行为信息计算每一属性特征在已选集合中的共同度;及
第二计算子单元,用于根据所述未选集合中的对象所具有的各项属性特征计算所述属性特征在未选集合中的共同度。
18.根据权利要求17所述的搜索结果的排序装置,其特征在于,所述属性特征在所述已选集合或未选集合中的共同度为:在所述已选集合或未选集合中,具有相同或相似的所述属性特征的对象的个数与所述已选集合或未选集合中对象的总数的比值。
19.根据权利要求17所述的搜索结果的排序装置,其特征在于,所述选取单元具体用于:
对各项属性特征按共同度从大到小依次排序,选取预定数量的排序在前的属性特征作为参考指标或将共同度大于设定阈值的属性特征作为参考指标。
20.根据权利要求17所述的搜索结果的排序装置,其特征在于,所述选取单元具体用于:
计算各项属性特征在所述已选集合和所述未选集合中的共同度之差,对各项属性特征按所述共同度之差从大到小依次排序,选取预定数量的排序在前的属性特征作为参考指标或将所述共同度之差大于设定阈值时对应的属性特征作为参考指标。
21.根据权利要求14所述的搜索结果的排序装置,其特征在于,所述用户发生行为的对象为在搜索结果中被点击的对象。
22.根据权利要求21所述的搜索结果的排序装置,其特征在于,所述装置还包括:
分类单元,用于将在搜索结果中被点击的对象归类于已选集合;
所述计算单元具体用于根据用户对已选集合中的对象的行为信息计算每一属性特征在已选集合中的共同度;
所述选取单元具体用于选择所述共同度大于预设阈值的属性特征作为参考指标;
所述调整单元具体用于对属性特征符合该参考指标的待展示或待排序的对象的排序进行提升。
23.根据权利要求21所述的搜索结果的排序装置,其特征在于,所述装置还包括:
分类单元,用于将在搜索结果中被点击的对象归类于已选集合;
所述计算单元具体用于根据用户对已选集合中的对象的行为信息计算每一属性特征在已选集合中的共同度;
所述选取单元具体用于对各项属性特征按共同度从大到小依次排序,选取预定数量的排序在前的属性特征作为参考指标;
所述调整单元具体用于对属性特征符合该参考指标的待展示或待排序的对象的排序进行提升。
24.根据权利要求14所述的搜索结果的排序装置,其特征在于,所述装置还包括:
分类单元,用于将在搜索结果中已展示且未被点击的对象归类于未选集合;
所述计算单元具体用于根据用户对未选集合中的对象的行为信息计算每一属性特征在未选集合中的共同度;
所述选取单元具体用于选择所述共同度大于预设阈值的属性特征作为参考指标;
所述调整单元具体用于对属性特征符合该参考指标的待展示或待排序的对象的排序进行降序。
25.根据权利要求14所述的搜索结果的排序装置,其特征在于,所述装置还包括:
分类单元,用于将在搜索结果中已展示且未被点击的对象归类于未选集合;
所述计算单元具体用于根据用户对未选集合中的对象的行为信息计算每一属性特征在未选集合中的共同度;
述选取单元具体用于对各项属性特征按共同度从大到小依次排序,选取预定数量的排序在前的属性特征作为参考指标;
所述调整单元具体用于对属性特征符合该参考指标的待展示或待排序的对象的排序进行降序。
26.根据权利要求14所述的搜索结果的排序装置,其特征在于,所述装置还包括:
排序单元,用于根据所述选取单元选取的参考指标计算待展示或待排序的对象各自的排序分值;
所述调整单元根据所述排序单元计算得到的排序分值对待展示或待排序的对象的重新进行排序;
所述排序单元具体包括:
赋值子单元,用于根据点击顺序为用户在已展示对象中所点击的对象赋予第一权重;
第三计算子单元,用于根据用户所选择的对象中符合参考指标的对象的第一权重计算每一参考指标的权重;
第四计算子单元,用于根据待展示或待排序的对象的属性特征所符合的参考指标的权重,计算该参考指标对该对象排序的影响程度的综合分;及
第五计算子单元,用于根据该综合分调整该对象的排序分值。
CN201210420861.6A 2012-10-29 2012-10-29 搜索结果的排序方法和装置 Active CN103793388B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201210420861.6A CN103793388B (zh) 2012-10-29 2012-10-29 搜索结果的排序方法和装置
TW102109488A TWI567673B (zh) 2012-10-29 2013-03-18 Sorting methods and devices for search results
US14/062,773 US9633082B2 (en) 2012-10-29 2013-10-24 Search result ranking method and system
PCT/US2013/066968 WO2014070624A1 (en) 2012-10-29 2013-10-25 Search result ranking method and system
US15/457,826 US20170255630A1 (en) 2012-10-29 2017-03-13 Search result ranking method and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210420861.6A CN103793388B (zh) 2012-10-29 2012-10-29 搜索结果的排序方法和装置

Publications (2)

Publication Number Publication Date
CN103793388A CN103793388A (zh) 2014-05-14
CN103793388B true CN103793388B (zh) 2017-08-25

Family

ID=50548372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210420861.6A Active CN103793388B (zh) 2012-10-29 2012-10-29 搜索结果的排序方法和装置

Country Status (4)

Country Link
US (2) US9633082B2 (zh)
CN (1) CN103793388B (zh)
TW (1) TWI567673B (zh)
WO (1) WO2014070624A1 (zh)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391847A (zh) * 2014-05-22 2015-03-04 艺龙网信息技术(北京)有限公司 一种基于用户行为的酒店排序方法、云端服务器及***
TW201544979A (zh) * 2014-05-23 2015-12-01 Chao-Yu Yueh 資訊查詢方法、資訊提供方法、資訊查詢系統及其伺服器
US9703859B2 (en) 2014-08-27 2017-07-11 Facebook, Inc. Keyword search queries on online social networks
US9754037B2 (en) * 2014-08-27 2017-09-05 Facebook, Inc. Blending by query classification on online social networks
CN105468652A (zh) * 2014-09-12 2016-04-06 北大方正集团有限公司 一种检索排序方法及***
CN105512122B (zh) * 2014-09-22 2019-05-24 华为技术有限公司 信息检索***的排序方法及装置
CN105635229B (zh) * 2014-11-06 2019-09-17 阿里巴巴集团控股有限公司 数据回填方法及装置
CN105760393A (zh) * 2014-12-17 2016-07-13 纽海信息技术(上海)有限公司 网页显示方法及***
US20160321716A1 (en) * 2015-04-30 2016-11-03 Wal-Mart Stores, Inc. System, method, and non-transitory computer-readable storage media for enhancing online product search through multiobjective optimization of product search ranking functions
US10007732B2 (en) 2015-05-19 2018-06-26 Microsoft Technology Licensing, Llc Ranking content items based on preference scores
CN115795147A (zh) * 2015-05-20 2023-03-14 电子湾有限公司 用于进行搜索的方法和***
US10997184B2 (en) 2015-05-22 2021-05-04 Coveo Solutions, Inc. System and method for ranking search results
CN104899766A (zh) * 2015-06-03 2015-09-09 北京京东尚科信息技术有限公司 选择对象属性的方法及装置
CN106503006B (zh) * 2015-09-07 2020-01-31 阿里巴巴集团控股有限公司 应用App中子应用的排序方法及装置
CN105224959B (zh) * 2015-11-02 2019-03-26 北京奇艺世纪科技有限公司 排序模型的训练方法和装置
CN105849730A (zh) * 2016-03-25 2016-08-10 马岩 数据抓取的方法及***
CN107291749B (zh) * 2016-03-31 2020-11-10 菜鸟智能物流控股有限公司 一种数据指标关联关系的确定方法及装置
CN105956887A (zh) * 2016-05-26 2016-09-21 宇宙世代信息技术(深圳)有限公司 商品信息的动态排序方法和商品信息的动态排序装置
CN107562756B (zh) * 2016-07-01 2021-02-02 阿里巴巴集团控股有限公司 一种确定对象信息的方法和设备
CN106326373A (zh) * 2016-08-15 2017-01-11 马岩 可信视频在大数据中的抓取方法及***
CN106294802A (zh) * 2016-08-15 2017-01-04 马岩 音频数据的抓取方法及***
US11368752B2 (en) 2017-01-03 2022-06-21 Bliss Point Media, Inc. Optimization of broadcast event effectiveness
US10878435B2 (en) * 2017-08-04 2020-12-29 Truecar, Inc. Method and system for presenting information for a geographically eligible set of automobile dealerships ranked based on likelihood scores
CN109446402B (zh) * 2017-08-29 2022-04-01 阿里巴巴集团控股有限公司 一种搜索方法及装置
CN107562873B (zh) * 2017-08-31 2021-02-02 北京小度互娱科技有限公司 推送瀑布流数据的方法及装置
CN110020282A (zh) * 2017-09-18 2019-07-16 北京国双科技有限公司 一种检索方法及检索装置
CN109656433B (zh) * 2017-10-11 2021-07-06 腾讯科技(深圳)有限公司 类目信息处理方法、装置、计算机设备和存储介质
CN107977405B (zh) * 2017-11-16 2021-01-22 北京三快在线科技有限公司 数据排序方法、数据排序装置、电子设备及可读存储介质
CN110020171B (zh) * 2017-12-28 2023-05-16 阿里巴巴集团控股有限公司 数据处理方法、装置、设备及计算机可读存储介质
CN110020173B (zh) * 2017-12-29 2023-07-18 阿里巴巴集团控股有限公司 用于优化搜索排序的方法、装置及电子设备
US11012319B2 (en) * 2018-07-24 2021-05-18 International Business Machines Corporation Entity selection in a visualization of a network graph
CN110807680B (zh) * 2018-08-06 2023-05-02 阿里巴巴集团控股有限公司 数据对象信息处理方法、装置及电子设备
CN109101630B (zh) * 2018-08-14 2021-12-17 广东小天才科技有限公司 一种应用程序搜索结果的生成方法、装置及设备
US10956507B2 (en) * 2018-08-16 2021-03-23 Rovi Guides, Inc. Reaction compensated result selection
CN110895594A (zh) * 2018-08-23 2020-03-20 武汉斗鱼网络科技有限公司 一种页面展示的方法以及相关设备
CN109949075A (zh) * 2019-02-25 2019-06-28 傲宝珠宝文化发展(深圳)有限公司 一种用于多家珠宝门店的实时数据远程监控***
CN111626805B (zh) * 2019-02-28 2023-11-03 北京沃东天骏信息技术有限公司 信息展示方法和装置
EP3764243B1 (en) * 2019-07-09 2023-11-29 ABB Schweiz AG An industrial information identification and retrieval system
CN110377830B (zh) * 2019-07-25 2022-03-29 拉扎斯网络科技(上海)有限公司 检索方法、装置、可读存储介质和电子设备
CN111210298A (zh) * 2019-12-24 2020-05-29 武汉诸相网络科技有限公司 一种基于大数据处理c2c平台商品货架智能排序的方法及***
CN111274093B (zh) * 2020-01-23 2023-12-01 湖南快乐阳光互动娱乐传媒有限公司 一种应用程序的排序方法及装置
US20210241332A1 (en) * 2020-02-05 2021-08-05 Coupang Corp. Computerized systems and methods for intelligent selection of available sellers and associated user interface modification.
TWI742568B (zh) * 2020-03-17 2021-10-11 昕力資訊股份有限公司 通用型資料庫模糊搜索的電腦程式產品及裝置
CN112434070A (zh) * 2020-12-14 2021-03-02 四川长虹电器股份有限公司 一种基于相似度算法的分页查询方法
US11100166B1 (en) 2020-12-21 2021-08-24 Coupang Corp. Systems and methods for automatically updating guaranteed computing counters
US20220327134A1 (en) * 2021-04-09 2022-10-13 Yandex Europe Ag Method and system for determining rank positions of content elements by a ranking system
CN113628004A (zh) * 2021-07-29 2021-11-09 陈子龙 终端显示设备图像显示方法
CN113792225B (zh) * 2021-08-25 2023-08-18 北京库睿科技有限公司 一种多数据类型分层排序方法和装置
CN114138152A (zh) * 2021-12-02 2022-03-04 连尚(新昌)网络科技有限公司 信息收藏方法和设备
CN114547064B (zh) * 2021-12-31 2023-07-07 广州万物集工业互联网科技有限公司 一种产品搜索方法、***、计算机设备及可读存储介质
CN115238126A (zh) * 2022-07-28 2022-10-25 腾讯科技(深圳)有限公司 搜索结果重排序方法、装置、设备及计算机存储介质
CN116226515B (zh) * 2022-12-29 2024-02-13 北京奇树有鱼文化传媒有限公司 一种搜索结果排序方法、装置、电子设备和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1818908A (zh) * 2006-03-16 2006-08-16 董崇军 一种在搜索引擎中应用搜索者反馈信息的方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002220172A1 (en) * 2000-11-15 2002-05-27 David M. Holbrook Apparatus and method for organizing and/or presenting data
US20070260597A1 (en) * 2006-05-02 2007-11-08 Mark Cramer Dynamic search engine results employing user behavior
US7603350B1 (en) 2006-05-09 2009-10-13 Google Inc. Search result ranking based on trust
US8510298B2 (en) 2006-08-04 2013-08-13 Thefind, Inc. Method for relevancy ranking of products in online shopping
US8117197B1 (en) 2008-06-10 2012-02-14 Surf Canyon, Inc. Adaptive user interface for real-time search relevance feedback
US8359309B1 (en) 2007-05-23 2013-01-22 Google Inc. Modifying search result ranking based on corpus search statistics
US8583633B2 (en) 2007-11-30 2013-11-12 Ebay Inc. Using reputation measures to improve search relevance
US8307390B2 (en) * 2009-02-26 2012-11-06 Comcast Cable Communications, Llc Re-addressable alternate content
US9412127B2 (en) * 2009-04-08 2016-08-09 Ebay Inc. Methods and systems for assessing the quality of an item listing
US9069843B2 (en) 2010-09-30 2015-06-30 International Business Machines Corporation Iterative refinement of search results based on user feedback
CN102542474B (zh) * 2010-12-07 2015-10-21 阿里巴巴集团控股有限公司 查询结果排序方法及装置
CN102591876A (zh) * 2011-01-14 2012-07-18 阿里巴巴集团控股有限公司 搜索结果排序方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1818908A (zh) * 2006-03-16 2006-08-16 董崇军 一种在搜索引擎中应用搜索者反馈信息的方法

Also Published As

Publication number Publication date
US20140122475A1 (en) 2014-05-01
CN103793388A (zh) 2014-05-14
TWI567673B (zh) 2017-01-21
US20170255630A1 (en) 2017-09-07
WO2014070624A1 (en) 2014-05-08
US9633082B2 (en) 2017-04-25
TW201417019A (zh) 2014-05-01

Similar Documents

Publication Publication Date Title
CN103793388B (zh) 搜索结果的排序方法和装置
CN101887437B (zh) 一种搜索结果生成方法及信息搜索***
CN104866474B (zh) 个性化数据搜索方法及装置
CN104679771B (zh) 一种个性化数据搜索方法和装置
US8161030B2 (en) Method and system for aggregating reviews and searching within reviews for a product
JP5542812B2 (ja) クエリ識別および関連付け
TWI615724B (zh) 基於電子資訊的關鍵字提取的資訊推送、搜尋方法及裝置
WO2017121251A1 (zh) 一种信息推送方法及装置
CN102279851B (zh) 一种智能导航方法、装置和***
US8407104B2 (en) Catalog based price search
CN105447186B (zh) 一种基于大数据平台的用户行为分析***
US20100057577A1 (en) System And Method For Providing Topic-Guided Broadening Of Advertising Targets In Social Indexing
US20060143158A1 (en) Method, system and graphical user interface for providing reviews for a product
US20100030647A1 (en) Advertisement selection for internet search and content pages
CN104252456B (zh) 一种权重估计方法、装置及***
US20080004986A1 (en) Method of providing customized information of commodity for on-line shopping mall users
US20090076927A1 (en) Distinguishing accessories from products for ranking search results
WO2010074847A2 (en) Context transfer in search advertising
KR20030091751A (ko) 분배 데이터베이스의 문서 분류 및 제시용 방법 및 장치
US10078706B2 (en) Information processing apparatus, information processing method, information processing program, and recording medium storing thereon information processing program which classifies and displays a plurality of elements constituting a list on a plurality of pages
CA2591441A1 (en) Method, system and graphical user interface for providing reviews for a product
CN106557556A (zh) 一种网页页面的展示方法、装置、服务器和***
CN107093122B (zh) 对象分类方法及装置
CN106202517A (zh) 一种基于大数据的网上商品在网页上的排序方法
CN110309274A (zh) 引导语推荐方法、装置及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1194500

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1194500

Country of ref document: HK