具体实施方式
本申请的主要思想在于,基于用户群偏好来对搜索结果进行排序。也就是,根据搜索用户所属群体的历史行为,动态地评估搜索结果中的各对象在该用户群下的人气,以此作为对搜索结果中各对象进行排序的依据。
更具体而言,根据搜索到的待排序对象所属的对象类目,确定能覆盖所有待排序对象的最小对象类目,并根据搜索用户所属的用户群对各个待排序对象产生的用户历史行为数据以及该用户群对最小类目下的各个对象的行为统计数据,确定各个待排序对象在用户所属的用户群的人气值,并根据该人气值对待排序对象进行排序。由此可以动态评估搜索结果中各对象的人气值,从而可以实现对搜索结果中各对象的动态排序,更好地满足用户的需求和方便用户的使用。
此外,本申请的思想还在于,针对无用户历史行为数据的待排序对象,通过对其所属的对象类目下的各个对象进行相似性聚类确定该待排序对象的用户历史行为数据,以确定其在用户所属的用户群的人气值。由此,可以给无用户历史行为数据的对象以适当的展示机会,从而可以更有效且合理地对搜索结果中的各对象进行排序,更好地满足用户的需求和方便用户的使用。
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
根据本申请的实施例,提供了一种对搜索结果进行排序的方法。
参考图1,图1是本申请实施例的一种对搜索结果进行排序的方法的流程图。
在步骤S101处,根据用户的搜索请求,获取与所述搜索请求中的搜索词相关的搜索结果中的各对象作为待排序对象。
具体地,用户的搜索请求可以是用户通过网上搜索平台的搜索栏输入搜索词进行的搜索,或者可以是用户通过选择网上搜索平台的页面上提供的对象类目进行的搜索,用户请求搜索的对象可以是商品。例如,用户在网上购物平台页面上的搜索栏通过输入关键词“平板电脑”进行搜索,或者用户通过点击页面上提供的商品类目,选择类目“手机数码”下的类目“平板电脑”进行搜索。
当接收到用户的搜索请求时,可以根据该搜索请求中包含的搜索词从对象索引中搜索标题、关键字等与该搜索词相关的一个或多个对象作为待排序对象。例如,当用户输入搜索词“平板电脑”时,从商品库的倒排索引中搜索标题、关键字等信息与搜索词“平板电脑”相关的商品作为待排序商品。
在步骤S102处,根据各个所述待排序对象所属的对象类目,确定能覆盖各个所述待排序对象的最小对象类目。
具体而言,所有对象都可以划分到不同的对象类目下,各子对象类目向上抽象形成上一级父对象类目,父对象类目可以再向上抽象形成更上一级的父对象类目,最终可以形成一个对象类目层次体系。可参考图2,图2是本申请的一个实施例的对象类目层次体系的部分结构图。应注意,图2只示出了本申请实施例的对象类目层次体系的一部分。
例如,搜索到的待排序对象分别为对象1、对象2、对象3和对象4,其中,对象1和对象2属于类目3,对象3和对象4属于类目4,类目3和类目4都属于类目1,因此,可以确定能覆盖对象1、对象2、对象3和对象4的最小对象类目为类目1。
在步骤S103处,根据所述用户所属的用户群对各个所述待排序对象产生的用户历史行为数据以及所述用户群对所述最小对象类目下的各个对象的行为统计数据确定各个所述待排序对象在所述用户群的人气值。
具体而言,可以根据预先基于用户的属性特征对用户进行分类的结果,确定该搜索用户所属的用户群。也就是说,可以预先根据用户的属性特征将用户分成若干个用户群。其中,用户的属性特征可以包括用户所属地域、用户所属年龄段等特征。例如,按照用户所属地域的特征可将用户分为东北用户、西北用户、华北用户、华中用户、华东用户、华南用户、西南用户、港澳台用户。按照用户所属年龄段特征可以将用户分为16~25岁、26~35岁、36~45岁、46~55岁、56岁及以上。
应该理解,本申请中进行用户群分类的方法不限于此,而是还可以根据具体情况的需要采取任何其他合适的方法。
所述用户所属的用户群对各个所述待排序对象产生的用户历史行为数据可以包括:所述用户所属的用户群对各个所述待排序对象的点击数据和下单数据。所述用户所属的用户群对所述最小对象类目下的各个对象行为统计数据可以包括:所述用户群对所述最小对象类目下的各个对象的点击数据和下单数据的行为统计数据。其中,所述用户所属的用户群对各个所述待排序对象产生的用户历史行为数据以及所述用户群对所述最小对象类目下的各个对象的点击数据和下单数据的行为统计数据,可以通过从预先对各个对象的用户历史行为数据进行统计而获得的各个用户群对各个对象产生的用户历史行为数据和各个用户群对各个对象类目下的各个对象的点击数据和下单数据的行为统计数据中获取。也就是说,预先对各个对象的用户历史行为数据进行统计,获得各个用户群对各个对象的点击数据、下单数据以及各个用户群对各个对象类目下的各个对象的点击数据和下单数据的行为统计数据。
当接收到用户的搜索请求,并根据该搜索请求搜索到待排序对象时,可以根据预先获得的各个用户群对各个对象的点击数据、下单数据以及各个用户群对各个对象类目下的各个对象的点击数据和下单数据的行为统计数据,确定当前进行搜索的用户所属的用户群对各个待排序对象的点击数据和下单数据以及该用户群对覆盖各个待排序对象的最小对象类目下各个对象的点击数据和下单数据的行为统计数据。
根据本申请的一个实施例,预先通过对各个对象的用户历史行为数据进行统计可以获得各个用户群对各个对象的点击数据、下单数据,根据各个用户群对各个对象的点击数据和下单数据可以计算得到各个用户群对各个对象类目下的各个对象的点击数据和下单数据的行为统计数据。
参考图3,图3是本申请实施例的预先统计获得各个用户群对各个对象类目下的各个对象的行为统计数据的步骤的流程图。根据本申请的一个实施例,预先统计获得各个用户群对各个对象类目下的各个对象的行为统计数据可以包括步骤S301~S302。
步骤S301,统计各个用户群对各个对象类目下的各个对象的点击数据和下单数据。
具体地,可以统计各个用户群对各个对象的点击次数和下单次数,并可以分别统计各个用户群对各个对象类目下的各个对象的点击数据集和下单数据集。
例如,可以定义各个用户群对各个对象的点击数据集如下:
Cs={cs,i}i∈[1,n](1)
Os={os,i}i∈[1,n] (2)
其中:
cs,i表示用户群s对对象i的点击数据(点击次数),cs,i>0,i∈[1,n];
os,i表示用户群s对对象i的下单数据(下单次数),os,i≥0,i∈[1,n];
[1,n]表示对象全集,即,对象类目层次体系中的全部对象。
各个用户群对各个对象类目下各个对象的点击数据集Cs,t和下单数据集Os,t分别为:
其中:
{t1,t2,…,tm}表示类目t下的对象在对象全集[1,n]中的子集;
tj表示类目t下的m个对象中的任意一个对象,j∈[1,m],tj∈[1,n];
表示用户群s对类目t下的对象tj的点击数据(点击次数), tj∈[1,n];
表示用户群s对类目t下的对象tj的下单数据(下单次数), tj∈[1,n];
Cs,t表示用户群s对类目t下所有对象的点击数据集;
Os,t表示用户群s对类目t下所有对象的下单数据集。
应当注意,当对象i属于对象类目t时,可以用tj来表示,本申请实施例中,当涉及到用户群s对某一对象类目t下的对象的点击数据、下单数据时,可以用tj表示该类目t下的对象,用和表示用户群s对对象tj的点击数据和下单数据。也就是说,当i∈t时,用户群s对对象i的点击数据cs,i和下单数据os,i与用户群s对对象tj的点击数据和下单数据相同的。
步骤S302,根据各个用户群对各个对象类目下的各个对象的点击数据和下单数据计算各个用户群对各个对象类目下的各个对象的点击数据和下单数据的行为统计数据。
其中,各个用户群对各个对象类目下的各个对象的点击数据和下单数据的行为统计数据可以包括:各个用户群对各个对象类目下的各个对象的点击数据集合中取值最大的预定个数的点击数据中取值最小的数据、各个用户群对各个对象类目下的各个对象的平均转化率、各个用户群对各个对象类目下的各个对象的转化率修正值的均值以及各个用户群对各个对象类目下的各个对象的转化率修正值的标准差。
根据本申请的一个实施例,可以针对各种不同的对象类目和用户群的组合,确定每一个<用户群,对象类目>的参数组合情况下的行为统计数据。
具体地,可以先根据各个用户群对各个对象类目下的各个对象的点击数据和下单数据,确定各个用户群对各个对象类目下的各个对象的点击数据集合中取值最大的预定个数的点击数据中取值最小的数据和各个用户群对各个对象类目下的各个对象的平均转化率。
通过步骤S301可以得到各个用户群对各个对象类目下各个对象的点击数据集,沿用上例,在每个参数组合(s,t)下,用户群s对类目t下的对象的点击数据集Cs,t中取值最大的N个点击数据中的最小值以及用户群s对类目t下的所有对象的平均转化率可以分别根据公式(5)和公式(6)进行统计:
其中,公式(5)中的Top(Cs,t,N)表示数据集Cs,t中取值最大的N个元素构成的子集,也就是说,用户群s对类目t下的各个对象的点击数据集Cs,t中取值最大的N个点击数据所组成的数据集,N为根据具体实施场景设定的常数。
公式(6)中,表示对用户群s对类目t下全部的m个对象t1,t2,…,tm的下单数据进行求和运算,表示对用户群s对类目t下全部的m个对象t1,t2,…,tm的点击数据进行求和运算。
本例中,用户群s对类目t下的全部对象t1,t2,…,tm的平均转化率的计算采用了微平均的计算方式,在本申请的另一个具体的实施例中,平均转化率还可以按照宏平均的方式进行计算,具体地,可以通过公式(6)’进行计算。
其中,表示用户群s对类目t下的任意一个对象tj的转化率,表示对用户群s对类目t下全部的m个对象t1,t2,…,tm的转化率进行求和运算。
确定了各个用户群对各个对象类目下的各个对象的点击数据集合中取值最大的预定个数的点击数据中取值最小的数据以及各个用户群对各个对象类目下的各个对象的平均转化率之后,可以根据上述得到的数据,确定各个用户群对各个对象类目下的各个对象的转化率修正值的均值,以及各个用户群对各个对象类目下的各个对象的转化率修正值的标准差。
首先,可以根据各个用户群对各个对象类目下的各个对象的点击数据集合中取值最大的预定个数的点击数据中取值最小的数据和各个用户群对各个对象类目下的各个对象的平均转化率,确定各个用户群对各个对象类目下的各个对象的转化率修正值。
具体地,可以在每个(s,t)参数组合下,根据用户群s对类目t下的对象的点击数据集Cs,t中取值最大的N个点击数据中的最小值以及用户群s对类目t下的所有对象的平均转化率利用贝叶斯公式(7)计算用户群s对对象类目t下各个对象tj的转化率其中,该转化率为转化率修正值,具体地为转化率的贝叶斯平均值,
统计用户群s对对象类目t下所有对象tj的转化率修正值可以得到用户群s对对象类目t下所有对象tj的转化率修正值的集合Rs,t,
其中,
确定了各个用户群对各个对象类目下的各个对象的转化率修正值之后,接下来,可以根据该转化率修正值计算得到各个用户群对各个对象类目下的各个对象的转化率修正值的均值以及各个用户群对各个对象类目下的各个对象的转化率修正值的标准差。
具体地,沿用上例,在每个(s,t)参数组合下,用户群s对对象类目t下各个对象tj的转化率修正值的均值与转化率修正值的标准差(标准偏差)可以利用公式(9)和公式(10)进行计算得到,
其中,表示对用户群s对对象类目t下m个对象的转化率修正值进行求和运算;表示对用户群s对对象类目t下m个对象的转化率修正值的方差进行求和运算,其得到的值为转化率修正值的标准差的无偏估计。
根据上述步骤S301~S302,可以得到每个(s,t)参数组合下的点击数据和下单数据的行为统计数据可以保存这些行为统计数据,用于在线上针对用户的搜索请求计算根据该搜索请求确定的各个待排序对象的人气得分。
参考图4,图4是根据所述用户所属的用户群对各个所述待排序对象产生的用户历史行为数据以及所述用户群对所述最小对象类目下的各个对象的行为统计数据,确定各个所述待排序对象在所述用户群的人气值的步骤(步骤S103)的具体流程图。
步骤S401,从预先统计获得的各个用户群对各个对象产生的用户历史行为数据中获取所述用户所属的用户群对各个所述待排序对象产生的用户历史行为数据。其中,所述用户所属的用户群对各个所述待排序对象产生的用户历史行为数据包括:所述用户所属的用户群对各个所述待排序对象的点击数据和下单数据。
具体地,可以先确定用户所属的用户群,再根据用户所属的用户群从预先统计获得的各个用户群对各个对象产生的用户历史行为数据中,获取所述用户所属的用户群对各个所述待排序对象产生的用户历史行为数据,也就是说,从预先统计获得的各个用户群对各个对象的点击数据和下单数据中,获取该用户群对各个待排序对象产生的点击数据和下单数据。
其中,针对有用户历史行为数据的待排序对象i,可以直接从预先统计获得的各个用户群对各个对象的点击数据和下单数据中,获取搜索用户所属的用户群s对该待排序对象i的点击数据cs,i和下单数据os,i,对于无用户历史行为数据的待排序对象i′,可以从预先统计获得的各个用户群对各个无用户历史行为数据的对象的点击数据预设值和下单数据预设值中,获取当前搜索用户所属的用户群s对该待排序对象i′的点击数据预设值和下单数据预设值,作为该用户群s对该无用户历史行为数据的待排序对象i′的点击数据cs,i′和下单数据os,i′。
根据本申请的一个实施例,对于无用户历史行为数据的对象,可以根据将所述对象所属的对象类目下的各个对象基于对象特征进行相似性聚类的结果,确定各个用户群对所述无用户历史行为数据的对象的点击数据预设值和下单数据预设值。可参考图5,图5为本申请实施例的预先统计获得各个用户群对各个无用户历史行为数据的对象的点击数据预设值和下单数据预设值的具体流程图。
步骤S501,根据对象特征的相似性,将所述无用户历史行为数据的对象所属的对象类目下的各个对象进行聚类,以得到一个或多个对象集。
例如,在网上购物平台,对象为商品,因此可以根据商品的各种类型的基础信息如标题、关键字、属性、价格、卖家服务能力、描述图片等确定对所有商品相似性聚类所参照的商品特征。基于以上商品基础信息,可以定义如下特征中的任意一个或多个的组合来表征商品:标题中的核心产品词、标题中的单词集、关键字的单词集、属性值、价格水平、卖家承诺消费者保护条款、卖家好评类、卖家投诉率、描述图片数、描述图片质量等。
基于对象特征,对同一对象类目下所有对象,根据对象特征间的相似性做层次聚类,类目t下的所有对象,可聚类到多个对象集Groupt,k中:
Clustert={Groupt,k},k∈[1,p] (11)
其中:
Groupt,k表示类目t下第k个对象集。p为根据问题场景预先设定或根据聚类迭代终止条件获得的对象集的个数。
应该理解,本申请不限于此,还可以采用其他任何可以适用于本申请的层次聚类方法,例如,还可以采用聚合式的层次聚类方法,故此处不做限制。
步骤S502,针对无用户历史行为数据的对象所属的对象集,统计各个用户群对该对象集中各个有用户历史行为数据的对象的点击数据和下单数据。
对于类目t下的所有对象,可聚类到多个对象集Groupt,k中,每个对象集中既包含有用户历史行为数据的对象tj,也包含无用户历史行为数据的对象i′,可以统计各个用户群对该无用户历史行为数据的对象所属的对象集中各个有用户历史行为数据的对象tj的点击数据和下单数据
步骤S503,根据所述各个用户群对所述有用户历史行为数据的对象的点击数据和下单数据,确定所述各个用户群对所述无用户历史行为数据的对象的点击数据预设值和下单数据预设值。
例如,对于无用户历史行为数据的对象,可以将用户所属的用户群对该对象所属的对象集中各个有用户历史行为数据的对象的点击数据和下单数据分别进行求和运算,以分别作为该无用户历史行为数据的对象的点击数据预设值和下单数据预设值。
具体地,可以定义其点击数据预设值与下单数据预设值如下:
其中,cs,i′表示用户群s对无用户历史行为数据的对象i′的点击数据预设值,累加项中的对象tj与对象i′在同一对象类目t中,且在同一对象集Groupt,k中;
os,i′表示用户群s对无用户历史行为数据的对象i′的下单数据预设值,累加项中的对象tj与对象i′在同一对象类目t中,且在同一对象集Groupt,k中。
通过上述步骤S501~S503可以预先得到各个用户群对各个无用户历史行为数据的对象的点击数据预设值和下单数据预设值,在线上计算对象的人气值时,可以从上述预先得到各个用户群对各个无用户历史行为数据的对象的点击数据预设值与下单数据预设值中,获取当前搜索用户所属的用户群s对该无用户历史行为数据的待排序对象i′的点击数据预设值cs,i′和下单数据预设值os,i′,并作为该用户群对该无用户历史行为数据的待排序对象的点击数据和下单数据。
至此,无论是有用户历史行为数据的待排序对象还是无用户历史行为数据的待排序对象,都可以获取到当前搜索用户所属的用户群对该待排序对象的点击数据和下单数据。
步骤S402,从预先统计获得的各个用户群对各个对象类目下的各个对象的行为统计数据中,获取所述用户所属的用户群对所述最小对象类目下的各个对象的行为统计数据。其中,所述用户所属的用户群对所述最小对象类目下的对象的行为统计数据包括:所述用户群对所述最小对象类目下的各个对象的点击数据和下单数据的行为统计数据。
具体地,可以根据用户所属的用户群和覆盖所有待排序对象的最小对象类目,从预先统计获得的各个用户群对各个对象类目下的对象的行为统计数据中,获取所述用户所属的用户群对所述最小对象类目下的各个对象的行为统计数据,也就是说,从预先统计获得的各个用户群对各个对象类目下的对象的点击数据和下单数据的行为统计数据中,获取所述用户所属的用户群对所述最小对象类目下的各个对象的点击数据和下单数据的行为统计数据。
其中,用户所属的用户群对所述最小对象类目下的各个对象的点击数据和下单数据的行为统计数据可以包括:所述用户所属的用户群s对所述最小对象类目tmin下的各个对象的点击数据集合中取值最大的预定个数的点击数据中取值最小的数据所述用户所属的用户群s对所述最小对象类目tmin下的各个对象的平均转化率所述用户所属的用户群s对所述最小对象类目tmin下的各个对象的转化率修正值的均值以及所述用户所属的用户群s对所述最小对象类目tmin下的各个对象的转化率修正值的标准差
步骤S403,根据所述用户所属的用户群对各个所述待排序对象产生的用户历史行为数据以及所述用户群对所述最小对象类目下的各个对象的行为统计数据,计算各个所述待排序对象在所述用户群的人气值。
在上述的步骤S401~S402中,获取了所述用户所属的用户群对各个所述待排序对象产生的用户历史行为数据以及所述用户所属的用户群对所述最小对象类目下的各个对象的行为统计数据后,可以根据获取到的上述数据,计算各个所述待排序对象在所述用户群的人气值。可参考图6,图6是本申请实施例的根据所述用户所属的用户群对各个所述待排序对象产生的用户历史行为数据以及所述用户群对所述最小对象类目下的各个对象产生的用户历史行为数据,计算各个所述待排序对象在所述用户群的人气值的具体流程图。
步骤S601,根据所述用户所属的用户群对各个所述待排序对象的点击数据和下单数据以及所述用户所属的用户群对所述最小对象类目下的各个对象的点击数据和下单数据的行为统计数据,计算所述用户所属的用户群在所述最小对象类目下对各个所述待排序对象的转化率。
沿用前面的例子,根据前述得到的所述用户所属的用户群对各个所述待排序对象的点击数据cs,i(或cs,i′)、下单数据os,i(或os,i′)以及所述用户所属的用户群对所述最小对象类目下的各个对象的行为统计数据可以根据公式(14)计算得到所述用户所属的用户群在所述最小对象类目tmin下对各个所述待排序对象i的转化率rs,i;
公式(14)为贝叶斯公式,其中,根据公式(14)计算得到的所述用户所属的用户群在所述最小对象类目下对各个所述待排序对象的转化率为贝叶斯平滑后的转化率修正值,即,用户群s对最小类目tmin下的待排序对象i的转化率修正值rs,i。
步骤S602,根据所述用户所属的用户群在所述最小对象类目下对各个所述待排序对象的转化率,计算各个所述待排序对象在所述用户群的人气值。
具体地,假设上述得到的该用户群在该最小对象类目tmin下对各个待排序对象i的转化率修正值rs,i服从正态分布,可以根据当前搜索用户所属的用户群对所述最小对象类目下的各个对象的行为统计数据利用公式(15)对rs,i进行随机变量标准化,以得到标准化的转化率修正值其中,标准化的转化率修正值服从N(0,1)正态分布,即,服从标准正态分布。
服从N(0,1)正态分布,可以根据公式(16)计算的累积概率分布值作为待排序对象i在用户群s的人气值,
公式(16)中,为服从N(0,1)标准正态分布的随机变量X的概率密度函数,因此,公式(16)用于计算的累积概率分布值P可以表示随机变量X小于或等于x的概率,也就是说,P的实际意义可以表示待排序对象i在当前转化率修正值下,比当前分布中多少比例的样本更优。该计算得到的累积概率分布值就是待排序对象i在用户群s的人气值,可以作为待排序对象i的人气得分。
在本例中,假设标准化后的转化率服从N(0,1)的标准正态分布,并采用标准正态分布的概率密度函数计算的累积概率分布值,应该理解,在实际实施本申请的技术方案时,还可以根据实际情况,选取符合当前问题场景下转化率修正值分布情况的概率密度函数来计算该转化率修正值的累积概率分布值,作为各个待排序对象在所述用户群的人气值。
通过上述的步骤,可以得到各个待排序对象在所述用户所属的用户群的人气值,接下来,在步骤S104中,根据各个所述待排序对象在所述用户群的人气值对所述待排序对象进行排序。
根据本申请的一个实施例,可以根据各个所述待排序对象与所述搜索词的相关度以及在所述用户群的人气值对所述待排序对象进行排序。
具体地,可以利用相关性度量技术,确定搜索到的待排序对象与搜索词的相关度,并综合统计待排序对象与搜索词的相关度和待排序对象在用户所属用户群的人气值,从而对对所述待排序对象进行排序。
例如,可以用BM25算法对搜索到的对象与搜索词的相关度进行打分,再将各个所述待排序对象与所述搜索词的相关度分数以及在所述用户群下的人气值分数,按预定权重加权求和得到所述待排序对象在所述用户群的综合分数,从而根据该综合分数对所述待排序对象进行排序。
至此结合图1至图6描述了根据本申请实施例的对搜索结果进行排序的方法。根据该方法,可以基于用户群偏好来动态地评估搜索结果中各对象的人气值,从而对搜索结果进行更有效且更合理的排序,进而更好地满足用户的需求和方便用户的使用。
这里需要指出的是,本申请的方案可以适用于对任意待排序对象的排序,但更优选地适用于在具有一定相关性或相近似的待排序对象之间进行排序。也就是说,本申请的方案在对具有一定相关性或相近似的待排序对象进行排序的情况下特别有用。
与上述对搜索结果进行排序的方法类似,本申请实施例还提供了一种对搜索结果进行排序的装置。
图7示意性地示出了根据本申请一个实施例的对搜索结果进行排序的装置700的结构框图。根据本申请的一个实施例,该装置700可以包括:获取模块701、第一确定模块702、第二确定模块703以及排序模块704。
其中,获取模块701可以用于根据用户的搜索请求,获取与所述搜索请求中的搜索词相关的搜索结果中的各对象作为待排序对象。
第一确定模块702可以用于根据各个所述待排序对象所属的对象类目,确定能覆盖各个所述待排序对象的最小对象类目。
第二确定模块703可以用于根据所述用户所属的用户群对各个所述待排序对象产生的用户历史行为数据以及所述用户群对所述最小对象类目下的各个对象的行为统计数据,确定各个所述待排序对象在所述用户群的人气值。
排序模块704可以用于根据各个所述待排序对象在所述用户群的人气值对所述待排序对象进行排序。
根据本申请的一个实施例,排序模块704可以进一步用于:根据各个所述待排序对象与所述搜索词的相关度以及在所述用户群的人气值对所述待排序对象进行排序。
根据本申请的一个实施例,第二确定模块703可以进一步包括:第一获取模块、第二获取模块以及计算模块。
第一获取模块,可以用于从预先统计获得的各个用户群对各个对象产生的用户历史行为数据中获取所述用户所属的用户群对各个所述待排序对象产生的用户历史行为数据。
第二获取模块,可以用于从预先统计获得的各个用户群对各个对象类目下的各个对象的行为统计数据中获取所述用户所属的用户群对所述最小对象类目下的各个对象的行为统计数据。
计算模块,可以用于根据所述用户所属的用户群对各个所述待排序对象产生的用户历史行为数据以及所述用户群对所述最小对象类目下的各个对象的行为统计数据,计算各个所述待排序对象在所述用户群的人气值。
根据本申请的一个实施例,其中,所述用户所属的用户群对各个所述待排序对象产生的用户历史行为数据可以包括:所述用户所属的用户群对各个所述待排序对象的点击数据和下单数据;所述用户所属的用户群对所述最小对象类目下的对象的行为统计数据可以包括:所述用户群对所述最小对象类目下的各个对象的点击数据和下单数据的行为统计数据。
根据本申请的实施例,第一获取模块可以进一步用于:从预先统计获得的各个用户群对各个无用户历史行为数据的对象的点击数据预设值和下单数据预设值中,获取所述用户所属的用户群对所述待排序对象中无用户历史行为数据的待排序对象的点击数据预设值和下单数据预设值,作为所述用户群对所述无用户历史行为数据的待排序对象的点击数据和下单数据。
第一获取模块还可以进一步包括:聚类子模块、第一统计子模块和确定子模块。
其中,聚类子模块可以用于根据对象特征的相似性,将所述无用户历史行为数据的对象所属的对象类目下的各个对象进行聚类,以得到一个或多个对象集,
第一统计子模块,可以用于针对所述无用户历史行为数据的对象所属的对象集,统计各个用户群对所述对象集中各个有用户历史行为数据的对象的点击数据和下单数据。
确定子模块,可以用于根据所述各个用户群对所述有用户历史行为数据的对象的点击数据和下单数据,确定所述各个用户群对所述无用户历史行为数据的对象的点击数据预设值和下单数据预设值。
根据本申请的一个实施例,所述用户所属的用户群对所述最小对象类目下的各个对象的点击数据和下单数据的行为统计数据可以包括:所述用户所属的用户群对所述最小对象类目下的各个对象的点击数据集合中取值最大的预定个数的点击数据中取值最小的数据、所述用户所属的用户群对所述最小对象类目下的各个对象的平均转化率、所述用户所属的用户群对所述最小对象类目下的各个对象的转化率修正值的均值以及所述用户所属的用户群对所述最小对象类目下的各个对象的转化率修正值的标准差。
根据本申请的一个实施例,第二获取模块可以进一步包括:
第二统计子模块,可以用于统计各个用户群对各个对象类目下的各个对象的点击数据和下单数据,以及第一计算子模块,可以用于根据各个用户群对各个对象类目下的各个对象的点击数据和下单数据计算各个用户群对各个对象类目下的各个对象的点击数据和下单数据的行为统计数据。
根据本申请的一个实施例,计算模块可以进一步包括:第二计算子模块和第三计算子模块。
第二计算子模块,可以用于根据所述用户所属的用户群对各个所述待排序对象的点击数据和下单数据以及所述用户所属的用户群对所述最小对象类目下的各个对象的点击数据和下单数据的行为统计数据,计算所述用户所属的用户群在所述最小对象类目下对各个所述待排序对象的转化率。
第三计算子模块,可以用于根据所述用户所属的用户群在所述最小对象类目下对各个所述待排序对象的转化率,计算各个所述待排序对象在所述用户群的人气值。
由于本实施例的装置所实现的功能基本相应于前述图1至图6所示的方法实施例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本申请的实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。