CN109064285B

CN109064285B - 一种获得商品推荐序列及商品推荐方法

Info

Publication number: CN109064285B
Application number: CN201810870249.6A
Authority: CN
Inventors: 管子玉; 雷燕; 王娟; 杨康
Original assignee: Northwestern University
Current assignee: Northwestern University
Priority date: 2018-08-02
Filing date: 2018-08-02
Publication date: 2021-02-02
Anticipated expiration: 2038-08-02
Also published as: CN109064285A

Abstract

本发明公开了一种获得商品推荐序列及商品推荐方法，用于为待推荐用户提供待推荐商品序列，根据待推荐用户的历史购买商品信息对待推荐用户的待推荐商品进行评分，获得预测评分；对待推荐用户的历史购买商品进行聚类，获得多个商品类别，计算每个待推荐商品与多个商品类别的距离，获得每个待推荐商品与多个商品类别之间的距离值；根据预测评分以及距离值，获得待推荐用户对应的每个待推荐商品的评价参数；根据每个待推荐商品的评价参数的大小，将所有的待推荐商品进行排序，将前K个商品推荐给待推荐用户。

Description

一种获得商品推荐序列及商品推荐方法

技术领域

本发明涉及数据挖掘推荐方法，具体涉及一种获得商品推荐序列及商品推荐方法。

背景技术

随着电子商务规模的不断扩大，商品个数和种类快速增长，顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。

现在的推荐***主要是利用用户的历史购买记录和用户的社交网络关系来对用户进行推荐，这些方法只能被动的去预测和推荐用户下一次购买的商品，很少能够去指导或者吸引用户去选择购买一些商品。在现在的推荐方法中，利用了已购买的商品之间的相似性去分析用户的喜好，但是却忽略了已购买的商品内部之间的关系，商品之间不是相互独立的，而是存在依赖关系。比如：我们在选择购买上衣的时候，我们会分析这件上衣是否与已购买中的哪些下装，鞋子，配饰比较协调，然后在选择是否购买。评分高的商品并不是和其他任何商品的组合都是评分高，同理评分中等的商品不是和其他任何商品的组合都是中等，有可能会组合成高评分。这些商品的组合不是简单的线性相加，而是一种非线性的关系，有些商品组合甚至是指数递增的关系。如果考虑购买的东西和已有的商品之间不能够达到最小的匹配度或者是中等匹配，那么购买的这件商品将无法与任何商品搭配协调或者是与任何商品的搭配效果平平，则用户不能最大化对它进行使用，可能这件商品只能够成为“透明的”。

此外，虽然有一些推荐是关于搭配，利用一些人为的搭配准则和图片的卷积，并且产生的这种搭配组合是主观意识上搭配协调的商品组合，并不针对某个特定的目标用户。

发明内容

本发明的目的在于提供一种获得商品推荐序列及商品推荐方法，用以解决现有技术中的商品推荐方法未考虑到商品之间存在的依赖关系，导致推荐准确率不高的问题。

为了实现上述任务，本发明采用以下技术方案：

一种获得商品推荐序列的方法，用于从多个待推荐商品中选择部分待推荐商品组成的序列作为用户的商品推荐序列，所述的用户具有历史购买商品，所述的方法包括：

步骤1、获得用户对每个待推荐商品的预测评分；

步骤2、对用户的历史购买商品进行聚类，获得多个商品类别，计算每个待推荐商品与多个商品类别之间的距离值；

步骤3、根据用户对每个待推荐商品的预测评分以及每个待推荐商品与多个商品类别之间的距离值，获得用户对每个待推荐商品的评价参数；

步骤4、根据用户对每个待推荐商品的评价参数的大小，将所有的待推荐商品进行排序，将前K个待推荐商品组成的序列作为商品推荐序列，K≥1，获得用户的商品推荐序列。

进一步地，所述的步骤1、采用基于内容扩充的协同过滤方法获得用户对每个待推荐商品的预测评分。

进一步地，在采用基于内容扩充的协同过滤方法获得用户对每个待推荐商品的预测评分时，采用向量空间模型和TF-IDF方法提取待推荐商品的特征。

进一步地，所述的步骤2、对用户的历史购买商品采用AGNES方法进行聚类，获得多个商品类别；在所述AGNES方法中，采用Wasserstein距离作为距离度量；计算每个待推荐商品与多个商品类别之间的Wasserstein距离值。

进一步地，所述的步骤3、根据用户对每个待推荐商品的预测评分以及每个待推荐商品与多个商品类别之间的距离值，采用式IX获得用户u对待推荐商品i的评价参数L(u,i)：

L(u,i)＝rec(u,i)+max{1-W(i,C_j)} 式IX

其中，rec(u,i)为步骤1中获得的用户u对待推荐商品i的预测评分，max{1-W(i,C_j)}为待推荐商品i与第j个商品类别之间匹配分数的最大值，W(i,C_j)为步骤2获得的待推荐商品i与第j个商品类别之间的距离值，C_j为第j个商品类别，u≥1，i≥1，j≥1。

一种商品推荐方法，用于为待推荐用户推荐商品，所述的方法包括：

步骤A、判断待推荐用户是否具有历史购买商品：若待推荐用户具有历史购买商品，则执行步骤B；否则，执行步骤C；

步骤B、采用上述的获得商品推荐序列的方法，获得待推荐用户的商品推荐序列，将所述商品推荐序列中的商品推荐给待推荐用户；

步骤C、获得待推荐用户与邻居用户之间的关系矩阵，每个所述的邻居用户均具有历史购买商品，采用以上所述的获得商品推荐序列的方法，获得每个邻居用户的商品推荐序列，根据每个邻居用户的商品推荐序列，获得待推荐用户的商品推荐序列，将所述商品推荐序列中的商品推荐给待推荐用户。

进一步地，所述的步骤C包括：

对待推荐用户与该待推荐用户的多个邻居用户的关系进行爬取，获得待推荐用户与邻居用户之间的关系矩阵，每个所述的邻居用户均具有历史购买商品；

采用以上所述的获得商品推荐序列的方法，获得每个邻居用户的待推荐商品序列；

对每个邻居用户的待推荐商品序列中每个待推荐商品的评价参数进行加权后求和，获得每个待推荐商品加权后的评价参数和；

根据每个待推荐商品的加权评价参数和的大小，将所有的待推荐商品进行排序，将前N个待推荐商品加入商品推荐序列中，N≥1，获得待推荐用户的商品推荐序列。

进一步地，所述的对每个邻居用户的待推荐商品序列中的每个待推荐商品的评价参数进行加权时，所述的权重为所述关系矩阵中待推荐用户与邻居用户之间的关系值。

本发明与现有技术相比具有以下技术特点:

1.本发明提供的商品推荐方法考虑到了推荐***中非线性组合效应的影响，即是评分高的商品与其他任何商品的组合不一定都评分高，同理评分低的商品与其他任何组合的评分不一定都是评分低，现在的推荐***的方法几乎只考虑了商品之间的相似性，忽略了选择购买的商品与历史购买商品的依赖性；本发明提供商品推荐方法考虑了这种依赖性，提出了最大化非线性组合效应的想法，最大化了待推荐商品的用途，提高了推荐的准确率；

2.本发明提供的商品推荐方法能够改善用户的使用体验，而且能够吸引更多的新用户的加入。

附图说明

图1为本发明提供的获得商品推荐序列方法的流程图。

具体实施方式

以下是发明人提供的具体实施例，以对本发明的技术方案作进一步解释说明。

实施例一

本发明公开了一种获得商品推荐序列的方法，用于从多个待推荐商品中选择部分待推荐商品组成的序列作为用户的商品推荐序列，所述的用户具有历史购买商品，。

本发明提出最大化非线性组合效应，期望能够推荐最大化用户的偏好和与已购买的商品之间的最大匹配的商品，利用该方法可以自动的学***平，则不能最大化对它进行使用，最后通过最大化评价参数，推荐一个即满足用户最大偏好的并且和已购买的商品中匹配指数最大的一组待推荐的商品。

所述的方法包括：

步骤1、获得用户对每个待推荐商品的预测评分；

本步骤实现对用户对应的待推荐商品进行预测评分，即计算用户的偏好，用户的预测评分越高，说明用户对该待推荐商品的喜好度越高。本发明在对待推荐商品进行推荐时，是基于用户对商品的喜好度。

在本步骤中，对待推荐的商品进行预测评分时，可以采用基于用户的协同过滤算法、基于商品的协同过滤算法或者是基于内容的协同过滤算法。

作为一种优选的实施方式，根据用户的历史购买商品对用户的待推荐商品进行评分时，采用基于内容扩充的协同过滤方法获得待推荐用户对每一个缺失商品的预测评分。

在步骤1中输入的是用户-商品-评分的文件，在对用户的待推荐商品进行评分之前，需要对用户-商品-评分的文件中的数据进行预处理，包括：

根据用户-商品-评分的文件中的数据，提取所有商品的特征，所有商品包括待推荐商品以及历史购买商品；

根据所有商品的特征，对用户-商品-评分的文件中的数据进行过滤，滤除掉常见的词语，保留重要的词语。

在提取所有商品的特征时，可以采用向量空间模型和TF-IDF方法、FP-Growth算法进行提取。

在本实施例中，为了提高方法的效率，采用过程较为简单的向量空间模型和TF-IDF方法提取待推荐商品的特征。

具体地，该方法包括：首先统计商品内容中的词频，词频指的是某一个给定的词语在该文件中出现的频率。这个数字是对词数的归一化，以防止它偏向长的文件，同一个词语在长文件里可能会比短文件有更高的词数，而不管该词语重要与否。对于在某一特定文件里的词语t_a来说，它的重要性可表示为：

其中，n_a,b是该词在文件d_b中的出现次数，而分母则是在文件d_b中所有字词的出现次数之和，a≥1，b≥1，c≥1。

然后统计商品内容的逆向文件频率，逆向文件频率是一个词语普遍重要性的度量。某一特定词语的IDF，可以由总文件数目除以包含该词语之文件的数目，再将得到的商取对数得到：

其中，|D|为语料库中的文件总数，|{b:t_a∈d_b}|包含词语t_a的文件数目，即n_a,b≠0的文件数目；如果该词语不在语料库中，就会导致被除数为零，因此一般情况下使用1+|{b:t_a∈d_b}|。

最后获得TF-IDF值向量tfidf_a,b：

tfidf_a,b＝tf_a,b×idf_a 式II

在某一特定文件内的高词语频率，以及该词语在整个文件集合中的低文件频率，可以产生出高权重的TF-IDF，因此，采用向量空间模型和TF-IDF方法能够过滤掉常见的词语，保留重要的词语。

在步骤中，采用基于内容扩充的协同过滤方法用户对每个待推荐商品的预测评分，包括：

步骤11、扩充用户评分向量:第i个待推荐商品是历史购买商品之中的商品，即第i个待推荐商品本身具有的真实评分，则r_u,i＝V_u,i；第i个待推荐商品不是历史购买商品之中的商品，即第i个待推荐商品本身不具有评分，则基于内容扩充待推荐商品i的预测评分r_u,i＝V^* _u,i；

步骤12、根据这些评分，包括对待推荐商品的真实评分和待推荐商品的预测评分。我们先计算出用户之间的关系，用Pearson相关系数来计算用户的相似性,主要是计算第p个用户与第q个用户之间评分之间的差值：

r_p,i为第p个用户对第i个商品的评分，r*_p为第p个用户对所有商品的平均评分，r_q,i为第q个用户对第i个商品的评分，r*_q为第q个用户对所有商品的平均评分。

步骤13、当用户共同评分的物品数超过50，效果会趋于稳定，在本步骤中用户的偏好，越稳定越好，所以用Sg_p,q来表示用户p与用户q之间评分的稳定性：

n_p,q为第p个用户与第q个用户共同评分过的物品总数。

步骤14、考虑到如果用户评分分数较少，基于内容的虚拟评分就相对不可信，所以用hm_p,q来表示用户p与用户q之间的评分影响度，hm_p,q>0：

其中，m_p为第p个用户的评分可靠度，

n_p为第p个用户评分过的商品总数，n_p≥1，m_q为第q个用户的评分可靠度，

n_q为第q个用户评分过的商品总数，n_q≥1。

如果原始评分值的个数超过50，那么用户的偏好会比较稳定，基于内容的预测评分就会更加的可靠；如果原始评分值的个数小于50，用户的偏好就不稳定，换种解释就是用户的偏好还是隐式的未被挖据。

步骤15、采用式VI计算用户p与用户q之间的混合关系权重，即用户p与用户q之间的关系和偏好稳定性：

hw_p,q＝Sg_p,q+hm_p,q 式VI

步骤16、采用式VII获得待推荐用户u对待推荐商品i的预测评分值rec(u,i)：

其中，m_u为第u个用户的评分可靠度，m_u>0，r_u,i为第u个用户对第i个商品的评分值，0≤r_u,i≤5,如果第i个待推荐商品是历史购买商品之中的商品，则r_u,i为已知评分，如果第i个待推荐商品不是历史购买商品之中的商品，即第i个待推荐商品没有评分，则r_u,i为步骤I中采用基于内容的方法获得的预测评分；v≠u表示在所有用户中除了第u个用户之外的用户均为v,v≥1；hw_u,v为第u个用户与第v个用户之间的评分影响度，hw_u,v>0；sim(u,v)为第u个用户与第v个用户之间评分之间的差值，sim(u,v)>0；r_v,i为第v个用户对第i个商品的评分，0≤r_v,i≤5。

在本步骤中，对用户的历史购买商品进行聚类时，可以采用K-means聚类方法、AGNES聚类方法等。

作为一种优选的是实施方式，对用户的历史购买商品采用AGNES方法进行聚类，获得多个商品类别；在所述AGNES方法中，采用Wasserstein距离作为距离度量；

计算每个待推荐商品与多个商品类别的Wasserstein距离值。

在本步骤中进行聚类时，仅对历史购买商品进行分类，获得多个商品类别，通过计算待推荐商品与商品类别之间的距离，获得待推荐商品与历史购买商品之间的匹配度，具体地，本步骤包括：

步骤21、获得第u个用户的历史购买记录{I₁,I₂,…,I_j,…,In}，n≥1，最大匹配距离max_dis；

步骤22、把读入的每一个历史购买的商品看成是一个初始聚类簇C_j＝{I_j}；

步骤23、初始化初始聚类簇之间的距离矩阵Ma，其中矩阵中每个值是对应的两个簇之间的距离；

步骤24、计算的聚类簇之间的距离矩阵采用的距离度量是Wasserstein距离，Wasserstein距离度量表示两个概率分布之间的距离，其距离如下：

W(i,C_j)＝inf_r～π_(i,Cj)E(X,Y)～[||X-Y||] 式VIII

π(i,C_j)是i,C_j分布组合起来的所有可能的联合分布的集合。对于每一个可能的联合分布γ，可以从中采样(X,Y)～γ得到一个样本X和Y，并计算出这对样本的距离||X-Y||，所以可以计算该联合分布γ下，样本对距离的期望值E(X,Y)～γ[||X-Y||]。在所有可能的联合分布中能够对这个期望值取到的下界

就是Wasserstein距离；

步骤25、根据聚类簇的距离矩阵，找到距离最近且距离大于max_dis的两个聚类簇；

步骤26、合并两个聚类簇C_m*＝C_m U C_n，删除距离阵中C_n簇的所有距离。

步骤27、重复步骤25-26，直到距离已经超过max_dis，则聚类停止；

步骤28、获得多个聚类簇C＝{C₁,C₂,…,C_j,…,C_k}，每个聚类簇为一个商品类别；

步骤29、采用式VIII获得每个待推荐商品与多个商品类别之间的Wasserstein。

步骤3、根据用户对每一个待推荐商品的预测评分以及每个待推荐商品与多个商品类别之间的距离值，获得用户对每个待推荐商品的评价参数；

在步骤中，根据用户对每一个待推荐商品的预测评分以及每个待推荐商品与多个商品类别之间的距离值，采用式IX获得用户u对待推荐商品i的评价参数L(u,i)：

L(u,i)＝rec(u,i)+max{1-W(i,C_j)} 式IX

在本步骤中，通过最大化待推荐商品i与商品类别之间匹配分数使得用户u对待推荐商品i的评价参数L(u,i)取到最大值。

步骤4、根据用户对每个待推荐商品的评价参数的大小，将所有的待推荐商品进行排序，将前K个待推荐商品加入商品推荐序列中，K≥1，获得待推荐用户的商品推荐序列。

以上步骤1-步骤4的方法针对于用户其本身已经具有历史购买商品信息，采用该方法对用户的历史购买商品信息进行处理，获得待推荐商品序列。

实施例二

步骤B、采用实施例一所述的获得商品推荐序列的方法，获得待推荐用户的商品推荐序列，将所述商品推荐序列中的商品推荐给待推荐用户；

步骤C、获得待推荐用户与邻居用户之间的关系矩阵，每个所述的邻居用户均具有历史购买商品，采用实施例一获得商品推荐序列的方法，获得每个邻居用户的商品推荐序列，根据每个邻居用户的商品推荐序列，获得待推荐用户的商品推荐序列，将所述商品推荐序列中的商品推荐给待推荐用户。

具体地，本步骤对待推荐用户与该待推荐用户的多个邻居用户的关系进行爬取，获得待推荐用户与邻居用户之间的关系矩阵，每个所述的邻居用户均具有历史购买商品；

网络上的待推荐用户不是孤立存在的，会存在与这个待推荐用户社交较为频繁的邻居用户，本发明通过网络爬取找到这个待推荐用户的邻居用户以及待推荐用户与邻居用户之间的关系，获得关系矩阵。

在本步骤中遍历社交网络，找到与用户在社交网络有联系的人，不只局限于一个单纯的购物网络，还有其他的网络。找到与用户有联系的人，是因为用户处于社会中，交往的绝大部分是生活在同一个朋友圈的人，关系越密切，对目标用户的影响就越大。在目标用户是新用户的条件下，没有任何历史购物数据以供我们参考，从目标用户的周围的人入手更合理。

采用实施例一中获得商品推荐序列的方法，获得每个邻居用户的待推荐商品序列；

所述的对每个邻居用户的待推荐商品序列中的每个待推荐商品的评价参数进行加权时，所述的权重为所述关系矩阵中待推荐用户与邻居用户之间的关系值。

实施例三

在本实施例中，待推荐用户具有历史购买商品，为待推荐用户推荐商品。

待推荐用户集合U＝{u₁,u₂,u₃,u₄}，商品集合Item＝{I₁,I₂,I₃,I₄,I₅,I₆,I₇,I₈,I₉}，其中{I₁,I₂,I₃,I₄,I₅}为历史购买商品，{I₆,I₇,I₈,I₉}为待推荐商品。

用户-商品评分矩阵Rating为：

[[3,4,5,1,2,？,？,？,？],

[2,4,3,4,5,3,2,1,4]

[2,3,2,4,2,5,4,3,4]

[2,3,5,4,3,4,3,5,4]]

在用户-商品评分矩阵Rating中，“？”代表了待推荐用户没有购买这个商品，需要采用基于内容扩充的协同过滤方法获得待推荐用户对每一个待推荐商品的预测评分。

Meta-data＝[[2,3,4,5,6,2,4,7,5],[2,3,5,4,2,7,4,5,8],[3,2,4,6,5,4,2,8,5],[3,4,5,7,6,5,4,3,2],[1,2,4,6,5,3,7,5,3],[3,4,6,2,3,4,5,3,2],[3,5,4,3,2,6,4,3,2],[4,3,2,4,3,2,1,4,6][2,3,5,3,6,4,5,3,2]]

Meta-data[i][j]代表了第i个商品的的第j个特征，在本实施例中设置max_dis＝0.8.推荐的商品数k＝1。

在本实施例中目标是为待推荐用户u₁提供待推荐商品序列。

步骤1、获得待推荐用户对每一个待推荐商品的预测评分；

采用基于内容扩充的协同过滤方法获得待推荐用户对每一个待推荐商品{I₆,I₇,I₈,I₉}的预测评分，其步骤如下：

计算每个邻居用户与待推荐用户的关系矩阵如下：

P＝[[1.0,0.956,0.845,0,867],[0.956,1.0,0.976,0.876][0.845,0.976,1.0,0.789][0.867,0.876,0.789,1.0]]

计算每个商品之间的关系强度，计算结果如下：PP＝[[1.0,0.960,0.760,0.890,0.938],[0.960,1.0,0.886,0.824,0.833],[0.760,0.886,1.0,0.881,0.886],[0.890,0.824,0.881,1.0,0.920],[0.938,0.833,0.886,0.920,1.0]],

采用式VII获得待推荐用户u₁对待推荐商品I₆、I₇、I₈的预测评分值，其分数如下：

R(I₆)＝3.55,R(I₇)＝4.65,R(I₈)＝4.34

将预测评分值转换至0到1之间获得：R(I₆)＝0.71,R(I₇)＝0.93,R(I₈)＝0.868

步骤2、对待推荐用户的历史购买商品进行聚类，获得多个商品类别，计算每个待推荐商品与多个商品类别之间的距离值；

采用改进的层次聚类中AGNES方法,其中通过聚类,我们可以把目标用户的已购买的商品聚类成如下的聚类簇:

初始化聚类,C1＝{I1}....C5＝{I5}；

初始化距离矩阵，其中每个元素是对应的聚类簇的Wasserstein距离，其结果如下：Ma＝[[1.0,0.860,0.960,0.890,0.938],[0.860,1.0,0.886,0.824,0.833],[0.966,0.886,1.0,0.881,0.886],[0.890,0.824,0.881,1.0,0.920],[0.938,0.833,0.886,0.920,1.0]；

从距离矩阵中选出最小距离即最大相似度，并且这个相似度要大于max_dis；即0.966，对应的聚类簇为C₁，C₃；

合并聚类簇并且更新矩阵，此时聚类簇和矩阵如下：

C₁＝{I₁,I₃},C₂＝{I₂},C₃＝{I₄},C₄＝{I₅}

Ma＝[[1.0,0.860,0.890,0.938],[0.860,1.0,0.824,0.833],[0.890,0.824,1.0,0.920],[0.938,0.833,0.920,1.0],

重复从距离矩阵中选出最小距离即最大相似度，并且这个相似度要大于max_dis以及合并聚类簇并且更新矩阵，直到没有满足条件的距离为止，最终的聚类结果为：C₁＝{I₁，I₄，I₃}C₂＝{I₂，I₅}，因此历史购买商品经过聚类后获得两个商品类别，分别是C₁和C₂。

步骤3、根据待推荐用户对每一个待推荐商品的预测评分以及每个待推荐商品与多个商品类别之间的距离值，采用式IX获得待推荐用户u₁对待推荐商品I₆、I₇、I₈的评价参数：

首先，采用式VII计算每个待推荐商品与商品类别的最大匹配分数：

rec(u₁,I₆)＝0.876，rec(u₁,I₇)＝0.767，rec(u₁,I₈)＝0.886；

其次，最大匹配分数加入待推荐商品的预测评分值对待推荐商品进行评价参数的计算，获得待推荐用户对应的每个待推荐商品的评价参数：L(u₁,I₆)＝1.586，L(u₁,I₇)＝1.697，L(u₁,I₈)＝1.754。

步骤4、根据待推荐用户对每个待推荐商品的评价参数的大小，将所有的待推荐商品进行排序，将前K个待推荐商品加入商品推荐序列中，K≥1，获得待推荐用户的商品推荐序列。

在本实施例中，当K＝1时,选取具有最大评价参数的待推荐商品进行推荐，在本实施例中为待推荐用户u₁的推荐序列为{I₈}。

将所述商品推荐序列中的商品推荐给待推荐用户。

在本实施例中，将商品I₈推荐给待推荐用户u₁。

实施例四

在本实施例中，待推荐用户没有历史购买商品信息，为待推荐用户推荐商品。

对待推荐用户与该待推荐用户的多个邻居用户的关系进行爬取，获得待推荐用户与邻居用户之间的关系矩阵；

对于待推荐用户A找到了3个邻居用户，分别是邻居用户B、邻居用户C以及邻居用户D，用户A、B、C、D之间的关系矩阵为：

其中，待推荐用户A与邻居用户B之间的关系值为Label_1,2＝1.1。

采用实施例一中所述的获得商品推荐序列的方法，获得每个邻居用户的待推荐商品序列；

在本实施例中，对每个邻居用户的历史购买商品信息以及待推荐商品信息进行处理，获得每个邻居用户的待推荐商品序列。

对于邻居用户B来说，他的待推荐商品序列为：[I₁,I₃,I₄,I₆]，其对应的评价参数为[0.90，0.89，0.86，0.83]；

对于邻居用户C来说，他的待推荐商品序列为：[I₁,I₂,I₅,I₈]，其对应的评价参数为[0.96,0.94,0.90,0.84]；

对于邻居用户D来说，他的待推荐商品序列为：[I₂,I₅,I₇,I₈]，其对应的评价参数为[0.92,0.90,0.88,0.82]；

作为一种优选的实施方式，所述的权重为所述关系矩阵中待推荐用户与邻居用户之间的关系值。

在本实施例中，待推荐商品I₁在邻居用户B,C的待推荐商品序列中，邻居B与待推荐用户A之间的关系值为1.1，邻居C与待推荐的用户A的关系值为1.5，所以待推荐商品I₁的加权评价参数和为1.1*0.90+1.5*0.96＝2.43；

待推荐商品I₂，在邻居用户C,D的待推荐商品序列中，邻居C与待推荐用户A之间的关系值为1.5，邻居C与待推荐的用户A的关系值为0.6，所以待推荐商品I₂的加权评价参数和为1.5*0.94+0.6*0.92＝1.96；

待推荐商品I₃，在邻居用户B的待推荐商品序列中，邻居B与待推荐用户A之间的关系值为1.1，所以待推荐商品I₃的加权评价参数和为1.1*0.89＝0.979；

待推荐商品I₄，在邻居用户B的待推荐商品序列中，邻居B与待推荐用户A之间的关系值为1.1，所以待推荐商品I₄的加权评价参数和为1.1*0.86＝0.946；

待推荐商品I₅在邻居用户C，D的待推荐商品序列中，邻居C与待推荐用户A之间的关系值为1.5，邻居C与待推荐的用户A的关系值为0.6，所以待推荐商品I₅的加权评价参数和为1.5*0.90+0.6*0.90＝1.89；

待推荐商品I₆在邻居用户B的待推荐商品序列中，邻居B与待推荐用户A之间的关系值为1.1，所以待推荐商品I₆的加权评价参数和为1.1*0.83＝0.913；

待推荐商品I₇在邻居用户D的待推荐商品序列中，邻居D与待推荐用户A之间的关系值为0.6，所以待推荐商品I₇的加权评价参数和为0.6*0.88＝0.528；

待推荐商品I₈，在邻居用户C,D的待推荐商品序列中，邻居C与待推荐用户A之间的关系值为1.5，邻居D与待推荐的用户A的关系值为0.6，所以待推荐商品I₈的加权评价参数和为1.5*0.84+0.6*0.82＝1.752。

在本实施例中，N＝3，将这8个待推荐商品的加权评价参数和进行排序：[2.43，1.96，1.89，1.752，0.979，0.946，0.913，0.528]，[I₁，I₂，I₅，I₈，I₃，I₄，I₆，I₇]，将前3个待推荐商品加入待推荐商品序列。

将所述商品推荐序列中的商品推荐给待推荐用户。

在本实施例中，商品推荐序列为{I₁、I₂、I₅}，因此将商品I₁、I₂、I₅推荐给待推荐用户A。

Claims

1.一种获得商品推荐序列的方法，用于从多个待推荐商品中选择部分待推荐商品组成的序列作为用户的商品推荐序列，所述的用户具有历史购买商品，其特征在于，所述的方法包括：

步骤1、获得用户对每个待推荐商品的预测评分；

2.如权利要求1所述的获得商品推荐序列的方法，其特征在于，所述的步骤1、采用基于内容扩充的协同过滤方法获得用户对每个待推荐商品的预测评分。

3.如权利要求2所述的获得商品推荐序列的方法，其特征在于，在采用基于内容扩充的协同过滤方法获得用户对每个待推荐商品的预测评分时，采用向量空间模型和TF-IDF方法提取待推荐商品的特征。

4.如权利要求1所述的获得商品推荐序列的方法，其特征在于，所述的步骤2、对用户的历史购买商品采用AGNES方法进行聚类，获得多个商品类别；在所述AGNES方法中，采用Wasserstein距离作为距离度量；计算每个待推荐商品与多个商品类别之间的Wasserstein距离值。

5.如权利要求1所述的获得商品推荐序列的方法，其特征在于，所述的步骤3、根据用户对每个待推荐商品的预测评分以及每个待推荐商品与多个商品类别之间的距离值，采用式IX获得用户u对待推荐商品i的评价参数L(u,i)：

L(u,i)＝rec(u,i)+max{1-W(i,C_j)} 式IX

6.一种商品推荐方法，用于为待推荐用户推荐商品，其特征在于，所述的方法包括：

步骤B、采用权利要求1-5任一项权利要求所述的获得商品推荐序列的方法，获得待推荐用户的商品推荐序列，将所述商品推荐序列中的商品推荐给待推荐用户；

步骤C、获得待推荐用户与邻居用户之间的关系矩阵，每个所述的邻居用户均具有历史购买商品，采用权利要求1-5任一项权利要求所述的获得商品推荐序列的方法，获得每个邻居用户的商品推荐序列，根据每个邻居用户的商品推荐序列，获得待推荐用户的商品推荐序列，将所述商品推荐序列中的商品推荐给待推荐用户。

7.如权利要求6所述的商品推荐方法，其特征在于，所述的步骤C包括：

采用权利要求1-5任一项权利要求所述的获得商品推荐序列的方法，获得每个邻居用户的待推荐商品序列；

8.如权利要求7所述的商品推荐方法，其特征在于，所述的对每个邻居用户的待推荐商品序列中的每个待推荐商品的评价参数进行加权时，加权的权重为所述关系矩阵中待推荐用户与邻居用户之间的关系值。