CN106776479A - 一种面向多属性评分***的评分预测方法 - Google Patents

一种面向多属性评分***的评分预测方法 Download PDF

Info

Publication number
CN106776479A
CN106776479A CN201611165152.2A CN201611165152A CN106776479A CN 106776479 A CN106776479 A CN 106776479A CN 201611165152 A CN201611165152 A CN 201611165152A CN 106776479 A CN106776479 A CN 106776479A
Authority
CN
China
Prior art keywords
score
tensor
commodity
value
scoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611165152.2A
Other languages
English (en)
Inventor
袁汉宁
杨静婷
王少鹏
王树良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201611165152.2A priority Critical patent/CN106776479A/zh
Publication of CN106776479A publication Critical patent/CN106776479A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Mathematical Physics (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种面向多属性评分***的评分预测方法,包括步骤:S1:输入数据:收集用户对商品的多个属性的评分,输入多个属性的评分数据;S2:构建模型:利用具有U、C、A三个维度的三维张量表达多属性评分信息;S3:设置参数,得到初始化矩阵S4:张量分解,计算得到中间矩阵和S5:张量填充,完成评分预测。使用本发明所述的方法,可以有效融合多个属性的评分信息,预测用户对商品各个属性的评分。

Description

一种面向多属性评分***的评分预测方法
技术领域
本发明涉及计算机应用领域,具体涉及一种面向多属性评分***的基于张量分解的多属性评分预测方法。
背景技术
今年来,随着互联网的快速发展,推荐***被广泛应用于电商的在线平台,尤其是个性化推荐技术的发展对于改善用户体验和提高服务质量起到了重要作用。个性化推荐主要是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。
个性化推荐主要在计算机上通过推荐***来完成,推荐***是建立在海量数据挖掘基础上,传统的推荐主要依赖用户对项目的总体评分,而现在越来越多的在线平台倾向于利用用户提供项目的各属性评分,这些属性评分包含了更细粒度的商品评价信息。利用用户提供的多属性评分可以更全面地获取用户偏好信息或项目特征,从而实现更有效的推荐,目前多属性评分推荐已成为推荐领域的一个重要研究方向。
多属性评分推荐算法的研究刚刚起步,其核心是多属性评分预测。现有很多的多属性评分预测算法没有兼顾多属性评分***中各属性评分的关联关系,也没有有效解决稀疏性问题。因此针对多属性评分***,研究有效的多属性评分预测算法成为亟待解决的问题。
发明内容
本发明的主要目的,在于提供一种面向多属性评分***的评分预测方法,可以有效融合多个属性的评分信息,预测用户对商品各个属性的评分。
为达到上述目的,本发明所采取的技术方案是,
一种面向多属性评分***的评分预测方法,包括以下步骤:
S1:输入数据:收集用户对商品的多个属性的评分,输入多个属性的评分数据;
S2:构建模型:利用具有U、C、A三个维度的三维张量表达多属性评分信息,其中:U表示用户,C表示商品,A表示商品的属性;
S3:设置参数,得到初始化矩阵
基于典范分解模型,将多属性的评分张量分解为三个二维矩阵和一个三维对角张量的乘积,如公式(1)所示:
公式(1)中, 为三维对角张量,即对角线上元素为1,其余元素都为0;
矩阵为|U|×kr维,|U|表示用户个数;
矩阵为|C|×kr维,|C|表示商品个数;
矩阵为|A|×kr维,|A|表示属性个数;
kr是一个大于0的正整数,表示张量分解的维度大小;
S4:张量分解,计算得到中间矩阵计算出目标函数的值,若目标函数未收敛或未达到迭代次数上限,使用随机梯度下降法(SGD)更新矩阵每次更新后重新计算目标函数的值,直到目标函数收敛或者达到迭代次数上限时停止,得到中间矩阵
S5:张量填充,完成评分预测:根据步骤S4分解得到的中间矩阵采用典范分解模型,计算用户对商品各个属性的评分,实现多属性评分张量的填充。
上述面向多属性评分***的评分预测方法,步骤S1中,多个属性的评分包括用户对商品的价格、服务多个属性的评分。
上述面向多属性评分***的评分预测方法,所述评分数据由一个或多个公共网站进行收集归纳。
上述面向多属性评分***的评分预测方法,步骤S3中,张量中的元素为
其中,
表示编号为u的用户对编号为c的商品的第a个属性的评分。
上述面向多属性评分***的评分预测方法,步骤S3中,设置的参数包括:迭代次数上限N、梯度下降参数λ、正则化参数β以及张量典范分解维度kr
上述面向多属性评分***的评分预测方法的改进在于:步骤S4包括S41,所述步骤S41为计算目标函数的值,
其中,目标函数计算的具体方法为:考虑张量中存在的非0评分信息,设计目标函数的形式如公式(3):
其中,为损失函数,表示的是已知的真实的多属性评分张量,缺失值用0表示;中的元素表示中的真实评分值,是根据公式(2)计算得到的预测评分,表示权重张量,中的元素取值为1或者0,当的值不为0时,的值等于0,为防止过度拟合添加的正则项,β为正则参数。
上述面向多属性评分***的评分预测方法的进一步改进在于:经步骤S41得到的目标函数若未收敛或未达到迭代次数上限,则步骤S4中还包括S42,步骤S42为使用SGD方法,利用公式(4)对步骤S41得到的目标函数的值进行更新,公式(4)如下所示:
其中表示的是真实值与预测值之间的误差,λ为梯度下降参数;每次更新后重复步骤S41,重新计算目标函数的值,直到目标函数收敛或者达到迭代次数上限时停止,得到中间矩阵
本发明的有益效果是:
本发明主要包括构建多属性评分张量表达模型、多属性评分张量的分解和多属性评分张量填充,采用随机梯度下降法(SGD)求解张量典范分解(canoncial polyadicdecomposition)模型,有效融合了多属性评分信息,可以充分利用多属性评分信息有效预测用户对商品的各个属性的评分,算法简单不复杂,适用于大规模高维稀疏数据。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明的算法全过程的简要流程图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
一种面向多属性评分***的评分预测方法,其简要流程请参阅图1所示,所述方法包括以下步骤S1、S2、S3、S4和S5,其中S4还包括步骤S41和S42。每一步骤的详细过程分别为:
S1:输入数据:多属性评分是用户对商品各个属性的评分,在一个或多个公共网站上收集用户对商品的多个属性的评分信息,公共网站如:Yelp(Yelp是美国最大的餐饮娱乐评价网站)、美团和大众点评网等。商品的属性可以包括用户对商品的价格、服务等多个具体属性。输入收集到的信息,作为多个属性的评分数据,评分数据中的总评分范围是1-5分,缺失值为0分。评分数据的输入格式为txt文本文件,输入方式举例如:第一列是用户编号,第二列是商品编号,第三、四、五、六列是用户对商品各个具体属性的单个评分。
S2:构建模型:利用具有U、C、A三个维度的三维张量表达多属性评分信息,其中:U表示用户,C表示商品,A表示商品的属性。张量中的元素记为表示编号为u的用户对编号为c的商品的第a个属性的评分。
S3:设置参数,得到初始化矩阵即对矩阵进行满足高斯分布的随机初始化。其中设置的参数是后续步骤需要用到的,参数主要包括有:迭代次数上限N、梯度下降参数λ、正则化参数β以及张量典范分解维度kr
基于典范分解模型,将多属性的评分张量分解为三个二维矩阵和一个三维对角张量的乘积,如公式(1)所示:
公式(1)中, 为三维对角张量,即对角线上元素为1,其余元素都为0;其中,
矩阵为|U|×kr维,|U|表示用户个数;
矩阵为|C|×kr维,|C|表示商品个数;
矩阵为|A|×kr维,|A|表示属性个数;
kr是一个大于0的正整数,表示张量分解的维度大小。
张量中的元素为表示编号为u的用户对编号为c的商品的第a个属性的评分,如公式(2)所示,
S4:基于典范分解模型和随机梯度下降法(SGD)方法对多属性评分进行张量分解,计算出目标函数的值,得到中间矩阵
S41:计算出目标函数的值,
其中,目标函数计算的具体方法为:考虑张量中存在的非0评分信息,设计目标函数的形式如公式(3):
其中,为损失函数,
表示的是已知的真实的多属性评分张量,缺失值用0表示。
中的元素表示中的真实评分值,
是根据公式(2)计算得到的预测评分,
表示权重张量,中的元素取值为1或者0,当的值不为0时,的值等于0,
为防止过度拟合添加的正则项,β为正则参数。
分别为矩阵的模。
S42:经步骤S41得到的目标函数若未收敛或未达到迭代次数上限,需要执行此步骤。
步骤S42为使用SGD方法,根据公式(4)同时对步骤S41得到的目标函数的值进行更新。SGD方法,即让变量沿着目标函数负梯度的方向移动,直到移动到极小值点。公式(4)的推导过程为:
首先分别对求偏导,如下:
因为
则,
由此得到公式(4):
其中表示的是真实值与预测值之间的误差,λ为梯度下降参数;按照公式(4)对同时进行更新,使沿着目标函数的方向向下移动到极小值,之后再执行步骤S41计算目标函数的值,如果目标函数收敛或者达到迭代次数上限时则停止迭代,此时即可得到中间矩阵
如果目标函数仍未收敛或未达到迭代次数上限,则继续利用公式(4)对进行更新,依次循环迭代步骤S41、S42,直到目标函数收敛或达到迭代次数上限为止。
S5:张量填充,完成评分预测:根据步骤S4分解得到的中间矩阵采用典范分解模型,即公式(2),计算用户对商品各个属性的预测评分,实现多属性评分张量的填充,完成多属性评分预测。
以上说明内容仅为本发明较佳实施例,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

Claims (7)

1.一种面向多属性评分***的评分预测方法,其特征在于,包括以下步骤:
S1:输入数据:收集用户对商品的多个属性的评分,输入多个属性的评分数据;
S2:构建模型:利用具有U、C、A三个维度的三维张量表达多属性评分信息,其中:U表示用户,C表示商品,A表示商品的属性;
S3:设置参数,得到初始化矩阵
基于典范分解模型,将多属性的评分张量分解为三个二维矩阵和一个三维对角张量的乘积,如公式(1)所示:
F ^ ≈ T ^ × u U ^ × c C ^ × a A ^ - - - ( 1 )
公式(1)中, 为三维对角张量,即对角线上元素为1,其余元素都为0;
矩阵为|U|×kr维,|U|表示用户个数;
矩阵为|C|×kr维,|C|表示商品个数;
矩阵为|A|×kr维,|A|表示属性个数;
kr是一个大于0的正整数,表示张量分解的维度大小;
S4:张量分解,计算得到中间矩阵计算目标函数的值,若目标函数未收敛或未达到迭代次数上限,使用随机梯度下降法更新矩阵 每次更新后重新计算目标函数的值,直到目标函数收敛或者达到迭代次数上限时停止,得到中间矩阵
S5:张量填充,完成评分预测:根据步骤S4分解得到的中间矩阵采用典范分解模型,计算用户对商品各个属性的评分,实现多属性评分张量的填充。
2.根据权利要求1所述的一种面向多属性评分***的评分预测方法,其特征在于:步骤S1中,多个属性的评分包括用户对商品的价格、服务多个属性的评分。
3.根据权利要求1所述的一种面向多属性评分***的评分预测方法,其特征在于:所述评分数据由一个或多个公共网站进行收集归纳。
4.根据权利要求1所述的一种面向多属性评分***的评分预测方法,其特征在于:步骤S3中,张量中的元素为
其中,
表示编号为u的用户对编号为c的商品的第a个属性的评分。
5.根据权利要求1所述的一种面向多属性评分***的评分预测方法,其特征在于:步骤S3中,设置的参数包括:迭代次数上限N、梯度下降参数λ、正则化参数β以及张量典范分解维度kr
6.根据权利要求1所述的一种面向多属性评分***的评分预测方法,其特征在于:步骤S4包括S41,步骤S41为计算目标函数的值,
其中,目标函数计算的具体方法为:考虑张量中存在的非0评分信息,设计目标函数的形式如公式(3):
L o s s ( F ^ , Y ^ ) = argmin [ l ( F ^ , Y ^ ) + β 2 ( | | U ^ | | 2 + | | C ^ | | 2 + | | A ^ | | 2 ) ] - - - ( 3 )
其中,为损失函数,
表示已知的真实的多属性评分张量,缺失值用0表示;中的元素表示中的真实评分值,
是根据公式(2)计算得到的预测评分,
表示权重张量,中的元素取值为1或者0,当的值不为0时,的值等于0,
为防止过度拟合添加的正则项,β为正则参数。
7.根据权利要求6所述的一种面向多属性评分***的评分预测方法,其特征在于:经步骤S41得到的目标函数若未收敛或未达到迭代次数上限,则步骤S4中还包括S42,步骤S42为使用SGD方法,利用公式(4)对步骤S41得到的目标函数的值进行更新,公式(4)如下所示:
其中表示的是真实值与预测值之间的误差,λ为梯度下降参数;每次更新后重复步骤S41,重新计算目标函数的值,直到目标函数收敛或者达到迭代次数上限时停止,得到中间矩阵
CN201611165152.2A 2016-12-16 2016-12-16 一种面向多属性评分***的评分预测方法 Pending CN106776479A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611165152.2A CN106776479A (zh) 2016-12-16 2016-12-16 一种面向多属性评分***的评分预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611165152.2A CN106776479A (zh) 2016-12-16 2016-12-16 一种面向多属性评分***的评分预测方法

Publications (1)

Publication Number Publication Date
CN106776479A true CN106776479A (zh) 2017-05-31

Family

ID=58891678

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611165152.2A Pending CN106776479A (zh) 2016-12-16 2016-12-16 一种面向多属性评分***的评分预测方法

Country Status (1)

Country Link
CN (1) CN106776479A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109087177A (zh) * 2018-08-21 2018-12-25 北京京东尚科信息技术有限公司 向目标用户推荐商品的方法、装置及计算机可读存储介质
CN110390561A (zh) * 2019-07-04 2019-10-29 四川金赞科技有限公司 基于动量加速随机梯度下降的用户-金融产品选用倾向高速预测方法和装置
CN113688258A (zh) * 2021-08-20 2021-11-23 广东工业大学 一种基于柔性多维聚类的信息推荐方法及***

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109087177A (zh) * 2018-08-21 2018-12-25 北京京东尚科信息技术有限公司 向目标用户推荐商品的方法、装置及计算机可读存储介质
CN109087177B (zh) * 2018-08-21 2021-05-25 北京京东尚科信息技术有限公司 向目标用户推荐商品的方法、装置及计算机可读存储介质
CN110390561A (zh) * 2019-07-04 2019-10-29 四川金赞科技有限公司 基于动量加速随机梯度下降的用户-金融产品选用倾向高速预测方法和装置
CN110390561B (zh) * 2019-07-04 2022-04-29 壹融站信息技术(深圳)有限公司 基于动量加速随机梯度下降的用户-金融产品选用倾向高速预测方法和装置
CN113688258A (zh) * 2021-08-20 2021-11-23 广东工业大学 一种基于柔性多维聚类的信息推荐方法及***

Similar Documents

Publication Publication Date Title
CN104134159B (zh) 一种基于随机模型预测信息最大化传播范围的方法
Chau Application of a PSO-based neural network in analysis of outcomes of construction claims
Alkahtani et al. E-agricultural supply chain management coupled with blockchain effect and cooperative strategies
CN107563841B (zh) 一种基于用户评分分解的推荐***
Chen et al. Using fruit fly optimization algorithm optimized grey model neural network to perform satisfaction analysis for e-business service
CN104346629B (zh) 一种模型参数训练方法、装置及***
CN109690576A (zh) 在多个机器学习任务上训练机器学习模型
Elsaraiti et al. Application of long-short-term-memory recurrent neural networks to forecast wind speed
CN108021983A (zh) 神经架构搜索
CN104598611B (zh) 对搜索条目进行排序的方法及***
CN110599234A (zh) 一种产品销售预测方法
CN108090093A (zh) 生成推荐结果的方法和装置
CN104346440A (zh) 一种基于神经网络的跨媒体哈希索引方法
CN109544306A (zh) 一种基于用户行为序列特征的跨领域推荐方法及装置
CN115917577A (zh) 使用动态属性建模进行下一个篮子推荐的***和方法
Chen et al. Calibrating a Land Parcel Cellular Automaton (LP-CA) for urban growth simulation based on ensemble learning
CN112667877A (zh) 一种基于旅游知识图谱的景点推荐方法及设备
CN107003834B (zh) 行人检测设备和方法
CN112884551A (zh) 一种基于近邻用户和评论信息的商品推荐方法
CN109117943B (zh) 利用多属性信息增强网络表征学习的方法
CN108647216A (zh) 基于开发人员社交网络的软件众包任务推荐***及方法
Wang et al. Implicit 3D modeling of ore body from geological boreholes data using hermite radial basis functions
CN106776479A (zh) 一种面向多属性评分***的评分预测方法
CN115221413B (zh) 一种基于交互式图注意力网络的序列推荐方法及***
CN106354783A (zh) 一种基于信任关系隐含相似度的社会化推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531

RJ01 Rejection of invention patent application after publication