CN106776479A

CN106776479A - 一种面向多属性评分***的评分预测方法

Info

Publication number: CN106776479A
Application number: CN201611165152.2A
Authority: CN
Inventors: 袁汉宁; 杨静婷; 王少鹏; 王树良
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2016-12-16
Filing date: 2016-12-16
Publication date: 2017-05-31

Abstract

本发明提供了一种面向多属性评分***的评分预测方法，包括步骤：S1：输入数据：收集用户对商品的多个属性的评分，输入多个属性的评分数据；S2：构建模型：利用具有U、C、A三个维度的三维张量表达多属性评分信息；S3：设置参数，得到初始化矩阵S4：张量分解，计算得到中间矩阵和S5：张量填充，完成评分预测。使用本发明所述的方法，可以有效融合多个属性的评分信息，预测用户对商品各个属性的评分。

Description

一种面向多属性评分***的评分预测方法

技术领域

本发明涉及计算机应用领域，具体涉及一种面向多属性评分***的基于张量分解的多属性评分预测方法。

背景技术

今年来，随着互联网的快速发展，推荐***被广泛应用于电商的在线平台，尤其是个性化推荐技术的发展对于改善用户体验和提高服务质量起到了重要作用。个性化推荐主要是根据用户的兴趣特点和购买行为，向用户推荐用户感兴趣的信息和商品。

个性化推荐主要在计算机上通过推荐***来完成，推荐***是建立在海量数据挖掘基础上，传统的推荐主要依赖用户对项目的总体评分，而现在越来越多的在线平台倾向于利用用户提供项目的各属性评分，这些属性评分包含了更细粒度的商品评价信息。利用用户提供的多属性评分可以更全面地获取用户偏好信息或项目特征，从而实现更有效的推荐，目前多属性评分推荐已成为推荐领域的一个重要研究方向。

多属性评分推荐算法的研究刚刚起步，其核心是多属性评分预测。现有很多的多属性评分预测算法没有兼顾多属性评分***中各属性评分的关联关系，也没有有效解决稀疏性问题。因此针对多属性评分***，研究有效的多属性评分预测算法成为亟待解决的问题。

发明内容

本发明的主要目的，在于提供一种面向多属性评分***的评分预测方法，可以有效融合多个属性的评分信息，预测用户对商品各个属性的评分。

为达到上述目的，本发明所采取的技术方案是，

一种面向多属性评分***的评分预测方法，包括以下步骤：

S1：输入数据：收集用户对商品的多个属性的评分，输入多个属性的评分数据；

S2：构建模型：利用具有U、C、A三个维度的三维张量表达多属性评分信息，其中：U表示用户，C表示商品，A表示商品的属性；

S3：设置参数，得到初始化矩阵

基于典范分解模型，将多属性的评分张量分解为三个二维矩阵和一个三维对角张量的乘积，如公式(1)所示：

公式(1)中，为三维对角张量，即对角线上元素为1，其余元素都为0；

矩阵为|U|×k_r维，|U|表示用户个数；

矩阵为|C|×k_r维，|C|表示商品个数；

矩阵为|A|×k_r维，|A|表示属性个数；

k_r是一个大于0的正整数，表示张量分解的维度大小；

S4：张量分解，计算得到中间矩阵计算出目标函数的值，若目标函数未收敛或未达到迭代次数上限，使用随机梯度下降法(SGD)更新矩阵每次更新后重新计算目标函数的值，直到目标函数收敛或者达到迭代次数上限时停止，得到中间矩阵

S5：张量填充，完成评分预测：根据步骤S4分解得到的中间矩阵采用典范分解模型，计算用户对商品各个属性的评分，实现多属性评分张量的填充。

上述面向多属性评分***的评分预测方法，步骤S1中，多个属性的评分包括用户对商品的价格、服务多个属性的评分。

上述面向多属性评分***的评分预测方法，所述评分数据由一个或多个公共网站进行收集归纳。

上述面向多属性评分***的评分预测方法，步骤S3中，张量中的元素为

其中，

表示编号为u的用户对编号为c的商品的第a个属性的评分。

上述面向多属性评分***的评分预测方法，步骤S3中，设置的参数包括：迭代次数上限N、梯度下降参数λ、正则化参数β以及张量典范分解维度k_r。

上述面向多属性评分***的评分预测方法的改进在于：步骤S4包括S41，所述步骤S41为计算目标函数的值，

其中，目标函数计算的具体方法为：考虑张量中存在的非0评分信息，设计目标函数的形式如公式(3)：

其中，为损失函数，表示的是已知的真实的多属性评分张量，缺失值用0表示；中的元素表示中的真实评分值，是根据公式(2)计算得到的预测评分，表示权重张量，中的元素取值为1或者0，当的值不为0时，当的值等于0，为防止过度拟合添加的正则项，β为正则参数。

上述面向多属性评分***的评分预测方法的进一步改进在于：经步骤S41得到的目标函数若未收敛或未达到迭代次数上限，则步骤S4中还包括S42，步骤S42为使用SGD方法，利用公式(4)对步骤S41得到的目标函数的值进行更新，公式(4)如下所示：

其中表示的是真实值与预测值之间的误差，λ为梯度下降参数；每次更新后重复步骤S41，重新计算目标函数的值，直到目标函数收敛或者达到迭代次数上限时停止，得到中间矩阵

本发明的有益效果是：

本发明主要包括构建多属性评分张量表达模型、多属性评分张量的分解和多属性评分张量填充，采用随机梯度下降法(SGD)求解张量典范分解(canoncial polyadicdecomposition)模型，有效融合了多属性评分信息，可以充分利用多属性评分信息有效预测用户对商品的各个属性的评分，算法简单不复杂，适用于大规模高维稀疏数据。

附图说明

下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为本发明的算法全过程的简要流程图。

具体实施方式

下面结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是本发明还可以采用其他不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似推广，因此本发明不受下面公开的具体实施例的限制。

一种面向多属性评分***的评分预测方法，其简要流程请参阅图1所示，所述方法包括以下步骤S1、S2、S3、S4和S5，其中S4还包括步骤S41和S42。每一步骤的详细过程分别为：

S1：输入数据：多属性评分是用户对商品各个属性的评分，在一个或多个公共网站上收集用户对商品的多个属性的评分信息，公共网站如：Yelp(Yelp是美国最大的餐饮娱乐评价网站)、美团和大众点评网等。商品的属性可以包括用户对商品的价格、服务等多个具体属性。输入收集到的信息，作为多个属性的评分数据，评分数据中的总评分范围是1-5分，缺失值为0分。评分数据的输入格式为txt文本文件，输入方式举例如：第一列是用户编号，第二列是商品编号，第三、四、五、六列是用户对商品各个具体属性的单个评分。

S2：构建模型：利用具有U、C、A三个维度的三维张量表达多属性评分信息，其中：U表示用户，C表示商品，A表示商品的属性。张量中的元素记为表示编号为u的用户对编号为c的商品的第a个属性的评分。

S3：设置参数，得到初始化矩阵即对矩阵进行满足高斯分布的随机初始化。其中设置的参数是后续步骤需要用到的，参数主要包括有：迭代次数上限N、梯度下降参数λ、正则化参数β以及张量典范分解维度k_r。

公式(1)中，为三维对角张量，即对角线上元素为1，其余元素都为0；其中，

矩阵为|U|×k_r维，|U|表示用户个数；

矩阵为|C|×k_r维，|C|表示商品个数；

矩阵为|A|×k_r维，|A|表示属性个数；

k_r是一个大于0的正整数，表示张量分解的维度大小。

张量中的元素为表示编号为u的用户对编号为c的商品的第a个属性的评分，如公式(2)所示，

S4：基于典范分解模型和随机梯度下降法(SGD)方法对多属性评分进行张量分解，计算出目标函数的值，得到中间矩阵

S41：计算出目标函数的值，

其中，为损失函数，

表示的是已知的真实的多属性评分张量，缺失值用0表示。

中的元素表示中的真实评分值，

是根据公式(2)计算得到的预测评分，

表示权重张量，中的元素取值为1或者0，当的值不为0时，当的值等于0，

为防止过度拟合添加的正则项，β为正则参数。

分别为矩阵的模。

S42：经步骤S41得到的目标函数若未收敛或未达到迭代次数上限，需要执行此步骤。

步骤S42为使用SGD方法，根据公式(4)同时对步骤S41得到的目标函数的值进行更新。SGD方法，即让变量沿着目标函数负梯度的方向移动，直到移动到极小值点。公式(4)的推导过程为：

首先分别对求偏导，如下：

因为

则，

由此得到公式(4)：

其中表示的是真实值与预测值之间的误差，λ为梯度下降参数；按照公式(4)对同时进行更新，使沿着目标函数的方向向下移动到极小值，之后再执行步骤S41计算目标函数的值，如果目标函数收敛或者达到迭代次数上限时则停止迭代，此时即可得到中间矩阵

如果目标函数仍未收敛或未达到迭代次数上限，则继续利用公式(4)对进行更新，依次循环迭代步骤S41、S42，直到目标函数收敛或达到迭代次数上限为止。

S5：张量填充，完成评分预测：根据步骤S4分解得到的中间矩阵采用典范分解模型，即公式(2)，计算用户对商品各个属性的预测评分，实现多属性评分张量的填充，完成多属性评分预测。

以上说明内容仅为本发明较佳实施例，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

Claims

1.一种面向多属性评分***的评分预测方法，其特征在于，包括以下步骤：

S3：设置参数，得到初始化矩阵

\hat{F} \approx \hat{T} \times_{u} \hat{U} \times_{c} \hat{C} \times_{a} \hat{A} - - - (1)

矩阵为|U|×k_r维，|U|表示用户个数；

矩阵为|C|×k_r维，|C|表示商品个数；

矩阵为|A|×k_r维，|A|表示属性个数；

k_r是一个大于0的正整数，表示张量分解的维度大小；

S4：张量分解，计算得到中间矩阵计算目标函数的值，若目标函数未收敛或未达到迭代次数上限，使用随机梯度下降法更新矩阵每次更新后重新计算目标函数的值，直到目标函数收敛或者达到迭代次数上限时停止，得到中间矩阵

2.根据权利要求1所述的一种面向多属性评分***的评分预测方法，其特征在于：步骤S1中，多个属性的评分包括用户对商品的价格、服务多个属性的评分。

3.根据权利要求1所述的一种面向多属性评分***的评分预测方法，其特征在于：所述评分数据由一个或多个公共网站进行收集归纳。

4.根据权利要求1所述的一种面向多属性评分***的评分预测方法，其特征在于：步骤S3中，张量中的元素为

其中，

表示编号为u的用户对编号为c的商品的第a个属性的评分。

5.根据权利要求1所述的一种面向多属性评分***的评分预测方法，其特征在于：步骤S3中，设置的参数包括：迭代次数上限N、梯度下降参数λ、正则化参数β以及张量典范分解维度k_r。

6.根据权利要求1所述的一种面向多属性评分***的评分预测方法，其特征在于：步骤S4包括S41，步骤S41为计算目标函数的值，

L o s s (\hat{F}, \hat{Y}) = argmin [l (\hat{F}, \hat{Y}) + \frac{β}{2} (| | \hat{U} | |^{2} + | | \hat{C} | |^{2} + | | \hat{A} | |^{2})] - - - (3)

其中，为损失函数，

表示已知的真实的多属性评分张量，缺失值用0表示；中的元素表示中的真实评分值，

是根据公式(2)计算得到的预测评分，

为防止过度拟合添加的正则项，β为正则参数。

7.根据权利要求6所述的一种面向多属性评分***的评分预测方法，其特征在于：经步骤S41得到的目标函数若未收敛或未达到迭代次数上限，则步骤S4中还包括S42，步骤S42为使用SGD方法，利用公式(4)对步骤S41得到的目标函数的值进行更新，公式(4)如下所示：