CN110543597B - 一种评分确定方法、装置及电子设备 - Google Patents

一种评分确定方法、装置及电子设备 Download PDF

Info

Publication number
CN110543597B
CN110543597B CN201910814373.5A CN201910814373A CN110543597B CN 110543597 B CN110543597 B CN 110543597B CN 201910814373 A CN201910814373 A CN 201910814373A CN 110543597 B CN110543597 B CN 110543597B
Authority
CN
China
Prior art keywords
domain
user
matrix
feature vector
eigenvector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910814373.5A
Other languages
English (en)
Other versions
CN110543597A (zh
Inventor
王颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201910814373.5A priority Critical patent/CN110543597B/zh
Publication of CN110543597A publication Critical patent/CN110543597A/zh
Application granted granted Critical
Publication of CN110543597B publication Critical patent/CN110543597B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种评分确定方法、装置及电子设备。方案如下:获取目标用户的目标特征数据,根据目标特征数据,从多个样本用户中确定与目标用户相似的相似用户,根据训练好的预设矩阵模型中包括的在基本域上相似用户的第一特征向量和每一待评分物品的第二特征向量,确定目标用户对每一待评分物品的预期评分,其中,预设矩阵模型中包括转换矩阵,以及不同数据域上的第一特征向量和第二特征向量,转换矩阵用于不同数据域的特征矩阵对应的第一特征向量间的转换,以及不同数据域的特征矩阵对应第二特征向量间的转换向目标用户推荐待评分物品。通过本发明实施例提供的技术方案,有效提高了评分确定的准确度。

Description

一种评分确定方法、装置及电子设备
技术领域
本发明涉及互联网技术领域,特别是涉及一种评分确定方法、装置及电子设备。
背景技术
随着互联网技术的不断发展,网络上的物品越来越多,如视频、电子书、商品等。随着网络上物品的增多,如何准确确定用户可能感兴趣的物品,显得尤为重要。一种常用的方式中,可以根据该用户对每一物品的评分,确定该用户感兴趣的物品。
在确定用户对每一物品的评分时,并不是所有的用户对每一物品均存在对应的评分,因此,不可避免的需要确定用户对每一物品的预期评分。目前,在确定预期评分时,可以根据多个样本用户的用户特征数据,多个待评分物品的物品特征数据,以及每一样本用户对每一待评分物品的历史评分,生成不同数据域上的特征矩阵,并根据不同数据域上的特征矩阵,随机生成对应数据域上的第一特征向量和第二特征向量。利用不同数据域上的特征矩阵、第一特征向量及第二特征向量对联合矩阵模型进行训练。在向用户推荐待评分物品时,根据训练好的联合矩阵模型中的第一特征向量和第二特征向量,预测该用户对每一待评分物品的预期评分。
然而,在联合矩阵模型训练过程中,往往忽略训练数据中数据量较小维度的特征数据,只考虑数据量较大维度的特征数据,这导致训练得到的联合矩阵模型中的第一特征向量以及第二特征向量不够准确,影响评分确定的准确度。
发明内容
本发明实施例的目的在于提供一种评分确定方法、装置及电子设备,以提高评分确定的准确度。具体技术方案如下:
本发明实施例提供了一种评分确定方法,包括:
获取目标用户的目标特征数据;
根据所述目标特征数据,从多个样本用户中确定与所述目标用户相似的相似用户;
根据训练好的预设矩阵模型中包括的在基本域上所述相似用户的第一特征向量和每一待评分物品的第二特征向量,确定所述目标用户对每一待评分物品的预期评分;其中,所述预设矩阵模型是利用预设训练集训练得到的,所述预设训练集包括不同数据域的特征矩阵,所述数据域包括基本域,用户域和/或物品域;所述基本域的特征矩阵为根据每一样本用户对每一待评分物品的历史评分确定的;所述用户域的特征矩阵为根据每一样本用户的用户特征数据确定的,所述物品域的特征矩阵为根据每一待评分物品的物品特征数据确定的;所述预设矩阵模型中包括转换矩阵,以及不同数据域上的第一特征向量和第二特征向量,所述转换矩阵用于不同数据域的特征矩阵对应的第一特征向量间的转换,以及不同数据域的特征矩阵对应第二特征向量间的转换,每一数据域上的第一特征向量和第二特征向量是根据该数据域的特征矩阵拆分得到的;
可选的,所述预设矩阵模型采用以下步骤训练得到,包括:
确定所述预设训练集;
将所述预设训练集中基本域的特征矩阵拆分为基本域上的第一特征向量和第二特征向量,将所述预设训练集中用户域的特征矩阵拆分为用户域上的第一特征向量和第二特征向量,将所述预设训练集中物品域的特征矩阵拆分为物品域上的第一特征向量和第二特征向量,每一数据域上的第一特征向量与第二特征向量的乘积值为该数据域的特征矩阵中的元素;
根据不同数据域上的第一特征向量和第二特征向量,确定不同数据域对应的转换矩阵;
根据不同数据域间对应的转换矩阵、以及不同数据域上的第一特征向量和第二特征向量,构建异构矩阵模型;
将所述预设训练集输入所述异构矩阵模型,得到损失值;
根据所述损失值,确定所述异构矩阵模型是否收敛;
若未收敛,则调节所述异构矩阵模型的参数,并返回执行所述将所述预设训练集输入所述异构矩阵模型,得到损失值的步骤;
若收敛,则将当前异构矩阵模型确定为所述预设矩阵模型。
可选的,所述转换矩阵至少包括第一转换矩阵、第二转换矩阵、第三转换矩阵和第四转换矩阵;
第一乘积值与所述基本域上第一特征向量的差值小于第一预设差值,所述第一乘积值为第一转换矩阵与所述用户域上的第一特征向量的乘积值,所述第一转换矩阵为所述用户域上第一特征向量和所述基本域上第一特征向量对应的转换矩阵;
第二乘积值与所述基本域上第二特征向量的差值小于第二预设差值,所述第二乘积值为第二转换矩阵与所述用户域上的第二特征向量的乘积值,所述第二转换矩阵为所述用户域上第二特征向量和所述基本域上第二特征向量对应的转换矩阵;
第三乘积值与所述基本域上第一特征向量的差值小于第三预设差值,所述第三乘积值为第三转换矩阵与所述物品域上的第一特征向量的乘积值,所述第三转换矩阵为所述物品域上第一特征向量与所述基本域上第一特征向量对应的转换矩阵;
第四乘积值与所述基本域上第二特征向量的差值小于第四预设差值,所述第四乘积值为第四转换矩阵与所述物品域上的第二特征向量的乘积值,所述第四转换矩阵为所述物品域上第二特征向量与所述基本域上第二特征向量对应的转换矩阵。
可选的,所述异构矩阵模型C表示为:
Figure BDA0002185931660000041
其中,wb、wo、wn为不同数据域上的预设权重,wb为基本域上的预设权重,wo为用户域上的预设权重,wn为物品域上的预设权重,Rbase为所述基本域,Ruser为所述用户域,Rres为所述物品域,u、u′、u″为第u个样本用户,i、i′、i″为第i个待评分物品,ru,i为所述基本域的特征矩阵中第u行第i列矩阵元素,ru′,i′为所述用户域的特征矩阵中第u′行第i′列对应的矩阵元素,ru″,i″为所述物品域的特征矩阵中第u″行第i″列对应的矩阵元素,pu为所述基本域上第u个样本用户的第一特征向量,qi为所述基本域上第i个待评分物品的第二特征向量,
Figure BDA0002185931660000042
为所述用户域上第u个样本用户的第一特征向量,
Figure BDA0002185931660000043
为所述用户域上第i个待评分物品的第二特征向量,
Figure BDA0002185931660000044
为所述物品域上第u个样本用户的第一特征向量,
Figure BDA0002185931660000045
为所述物品域的第i个待评分物品的第二特征向量,λp、λq
Figure BDA0002185931660000046
为预设正则系数,λp为所述基本域上第一特征向量的预设正则系数,λq为所述基本域上第二特征向量的预设正则系数,
Figure BDA0002185931660000047
为所述用户域上第一特征向量的预设正则系数,
Figure BDA0002185931660000048
为所述用户域上第二特征向量的预设正则系数,
Figure BDA0002185931660000049
为所述物品域上第一特征向量的预设正则系数、
Figure BDA0002185931660000051
为所述物品域上第二特征向量的预设正则系数,
Figure BDA0002185931660000052
为第一转换矩阵,
Figure BDA0002185931660000053
为第二转换矩阵,
Figure BDA0002185931660000054
为第三转换矩阵,
Figure BDA0002185931660000055
为第四转换矩阵,‖‖为范数操作,T为转置操作。
可选的,所述根据训练好的预设矩阵模型中包括的在基本域上所述相似用户的第一特征向量和每一待评分物品的第二特征向量,确定所述目标用户对每一待评分物品的预期评分的步骤,包括:
针对每一相似用户,利用以下公式,确定所述目标用户对每一待评分物品的预期评分:
Va,b=pa*qb;或
针对每一相似用户,利用以下公式,确定所述目标用户对每一待评分物品的预期评分:
Figure BDA0002185931660000056
其中,a为相似用户a,b为待评分物品b,Va,b为所述相似用户a对所述待评分物品b的预期评分,pa为所述基本域上相似用户a的第一特征向量,qb为所述基本域上待评分物品b的第二特征向量,
Figure BDA0002185931660000057
为所述用户域上相似用户a的第一特征向量,
Figure BDA0002185931660000058
为所述用户域上第一特征向量和所述基本域上第一特征向量对应的转换矩阵,
Figure BDA0002185931660000059
为所述用户域上待评分物品b的第二特征向量,
Figure BDA00021859316600000510
为所述用户域上第二特征向量和所述基本域上第二特征向量对应的转换矩阵,
Figure BDA00021859316600000511
为所述物品域上相似用户a的第一特征向量,
Figure BDA00021859316600000512
为所述物品域上第一特征向量与所述基本域上第一特征向量对应的转换矩阵,
Figure BDA00021859316600000513
为所述物品域上待评分物品b的第二特征向量,
Figure BDA00021859316600000514
为所述物品域上第二特征向量与所述基本域上第二特征向量对应的转换矩阵。
可选的,所述方法还包括:
根据所述目标用户对每一待评分物品的预期评分的大小,向所述目标用户推荐待评分物品。
本发明实施例还提供了一种评分确定装置,包括:
获取模块,用于获取目标用户的目标特征数据;
第一确定模块,用于根据所述目标特征数据,从多个样本用户中确定与所述目标用户相似的相似用户;
第二确定模块,用于根据训练好的预设矩阵模型中包括的在基本域上所述相似用户的第一特征向量和每一待评分物品的第二特征向量,确定所述目标用户对每一待评分物品的预期评分;其中,所述预设矩阵模型是利用预设训练集训练得到的,所述预设训练集包括不同数据域的特征矩阵,所述数据域包括基本域,用户域和/或物品域;所述基本域的特征矩阵为根据每一样本用户对每一待评分物品的历史评分确定的;所述用户域的特征矩阵为根据每一样本用户的用户特征数据确定的,所述物品域的特征矩阵为根据每一待评分物品的物品特征数据确定的;所述预设矩阵模型中包括转换矩阵,以及不同数据域上的第一特征向量和第二特征向量,所述转换矩阵用于不同数据域的特征矩阵对应的第一特征向量间的转换,以及不同数据域的特征矩阵对应第二特征向量间的转换,每一数据域上的第一特征向量和第二特征向量是根据该数据域的特征矩阵拆分得到的。
可选的,所述装置还包括:
第三确定模块,用于确定所述预设训练集;
拆分模块,用于将所述预设训练集中基本域的特征矩阵拆分为基本域上的第一特征向量和第二特征向量,将所述预设训练集中用户域的特征矩阵拆分为用户域上的第一特征向量和第二特征向量,将所述预设训练集中物品域的特征矩阵拆分为物品域上的第一特征向量和第二特征向量,每一数据域上的第一特征向量与第二特征向量的乘积值为该数据域的特征矩阵中的元素;
第四确定模块,用于根据不同数据域上的第一特征向量和第二特征向量,确定不同数据域对应的转换矩阵;
构建模块,用于根据不同数据域间对应的转换矩阵、以及不同数据域上的第一特征向量和第二特征向量,构建异构矩阵模型;
第五确定模块,用于将所述预设训练集输入所述异构矩阵模型,得到损失值;
第六确定模块,用于根据所述损失值,确定所述异构矩阵模型是否收敛;
调节模块,用于在所述第六确定模块的确定结果为否时,调节所述异构矩阵模型的参数,并返回执行所述将所述预设训练集输入所述异构矩阵模型,得到损失值的步骤;
第七确定模块,用于在所述第六确定模块的确定结果为是时,将当前异构矩阵模型确定为所述预设矩阵模型。
可选的,所述转换矩阵至少包括第一转换矩阵、第二转换矩阵、第三转换矩阵和第四转换矩阵;
第一乘积值与所述基本域上第一特征向量的差值小于第一预设差值,所述第一乘积值为第一转换矩阵与所述用户域上的第一特征向量的乘积值,所述第一转换矩阵为所述用户域上第一特征向量和所述基本域上第一特征向量对应的转换矩阵;
第二乘积值与所述基本域上第二特征向量的差值小于第二预设差值,所述第二乘积值为第二转换矩阵与所述用户域上的第二特征向量的乘积值,所述第二转换矩阵为所述用户域上第二特征向量和所述基本域上第二特征向量对应的转换矩阵;
第三乘积值与所述基本域上第一特征向量的差值小于第三预设差值,所述第三乘积值为第三转换矩阵与所述物品域上的第一特征向量的乘积值,所述第三转换矩阵为所述物品域上第一特征向量与所述基本域上第一特征向量对应的转换矩阵;
第四乘积值与所述基本域上第二特征向量的差值小于第四预设差值,所述第四乘积值为第四转换矩阵与所述物品域上的第二特征向量的乘积值,所述第四转换矩阵为所述物品域上第二特征向量与所述基本域上第二特征向量对应的转换矩阵。
可选的,所述异构矩阵模型C表示为:
Figure BDA0002185931660000081
其中,wb、wo、wn为不同数据域上的预设权重,wb为基本域上的预设权重,wo为用户域上的预设权重,wn为物品域上的预设权重,Rbase为所述基本域,Ruser为所述用户域,Rres为所述物品域,u、u′、u″为第u个样本用户,i、i′、i″为第i个待评分物品,ru,i为所述基本域的特征矩阵中第u行第i列矩阵元素,ru′,i′为所述用户域的特征矩阵中第u′行第i′列对应的矩阵元素,ru″,i″为所述物品域的特征矩阵中第u″行第i″列对应的矩阵元素,pu为所述基本域上第u个样本用户的第一特征向量,qi为所述基本域上第i个待评分物品的第二特征向量,
Figure BDA0002185931660000082
为所述用户域上第u个样本用户的第一特征向量,
Figure BDA0002185931660000083
为所述用户域上第i个待评分物品的第二特征向量,
Figure BDA0002185931660000084
为所述物品域上第u个样本用户的第一特征向量,
Figure BDA0002185931660000085
为所述物品域的第i个待评分物品的第二特征向量,λp、λq
Figure BDA0002185931660000086
为预设正则系数,λp为所述基本域上第一特征向量的预设正则系数,λq为所述基本域上第二特征向量的预设正则系数,
Figure BDA0002185931660000087
为所述用户域上第一特征向量的预设正则系数,
Figure BDA0002185931660000088
为所述用户域上第二特征向量的预设正则系数,
Figure BDA0002185931660000091
为所述物品域上第一特征向量的预设正则系数、
Figure BDA0002185931660000092
为所述物品域上第二特征向量的预设正则系数,
Figure BDA0002185931660000093
为第一转换矩阵,
Figure BDA0002185931660000094
为第二转换矩阵,
Figure BDA0002185931660000095
为第三转换矩阵,
Figure BDA0002185931660000096
为第四转换矩阵,‖‖为范数操作,T为转置操作。
可选的,所述第二确定模块,具体用于针对每一相似用户,利用以下公式,确定所述目标用户对每一待评分物品的预期评分:
Va,b=pa*qb;或
针对每一相似用户,利用以下公式,确定所述目标用户对每一待评分物品的预期评分:
Figure BDA0002185931660000097
其中,a为相似用户a,b为待评分物品b,Va,b为所述相似用户a对所述待评分物品b的预期评分,pa为所述基本域上相似用户a的第一特征向量,qb为所述基本域上待评分物品b的第二特征向量,
Figure BDA0002185931660000098
为所述用户域上相似用户a的第一特征向量,
Figure BDA0002185931660000099
为所述用户域上第一特征向量和所述基本域上第一特征向量对应的转换矩阵,
Figure BDA00021859316600000910
为所述用户域上待评分物品b的第二特征向量,
Figure BDA00021859316600000911
为所述用户域上第二特征向量和所述基本域上第二特征向量对应的转换矩阵,
Figure BDA00021859316600000912
为所述物品域上相似用户a的第一特征向量,
Figure BDA00021859316600000913
为所述物品域上第一特征向量与所述基本域上第一特征向量对应的转换矩阵,
Figure BDA00021859316600000914
为所述物品域上待评分物品b的第二特征向量,
Figure BDA00021859316600000915
为所述物品域上第二特征向量与所述基本域上第二特征向量对应的转换矩阵。
可选的,所述装置还包括:
推荐模块,用于根据所述目标用户对每一待评分物品的预期评分的大小,向所述目标用户推荐待评分物品。
本发明实施还提供了一种电子设备,所述电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的评分确定方法步骤。
本发明实施还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一评分确定方法的步骤。
本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一评分确定方法。
本发明实施例有益效果:
本发明实施例提供的评分确定方法及装置,可以获取目标用户的目标特征数据,根据目标特征数据,从多个样本用户中确定与目标用户相似的相似用户,根据训练好的预设矩阵模型中包括的在基本域上相似用户的第一特征向量和每一待评分物品的第二特征向量,确定目标用户对每一待评分物品的预期评分;其中,预设矩阵模型是利用预设训练集训练得到的,预设训练集包括不同数据域的特征矩阵,数据域包括基本域,用户域和/或物品域;基本域的特征矩阵为根据每一样本用户对每一待评分物品的历史评分确定的;用户域的特征矩阵为根据每一样本用户的用户特征数据确定的,物品域的特征矩阵为根据每一待评分物品的物品特征数据确定的;预设矩阵模型中包括转换矩阵,以及不同数据域上的第一特征向量和第二特征向量,转换矩阵用于不同数据域的特征矩阵对应的第一特征向量间的转换,以及不同数据域的特征矩阵对应第二特征向量间的转换,每一数据域上的第一特征向量和第二特征向量是根据该数据域的特征矩阵拆分得到的。
通过本发明实施例提供的技术方案,在对预设矩阵模型训练时,通过引入的转换矩阵实现不同数据域上的用户特征数据的转换和不同数据域上物品特征数据的转换,使得即使是某一数据域上较小的数据量,也可以影响到训练完成的预设矩阵模型中不同数据域上的第一特征向量与第二特征向量,提高了不同数据域上第一特征向量和第二特征向量的准确性,进而提高了根据训练完成的预设矩阵模型中包括的在基本域上的第一特征向量和第二特征向量,确定的目标用户对每一待评分物品的预期评分准确性,有效提高了评分确定的准确度。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的预设矩阵模型训练方法的一种流程示意图;
图2为本发明实施例提供的评分确定方法的一种流程示意图;
图3为本发明实施例提供的物品推荐方法的一种流程示意图;
图4为本发明实施例提供的评分确定装置的一种结构示意图;
图5为本发明实施例提供的电子设备的一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决联合矩阵模型训练得到的第一特征向量和第二特征向量不够准确,影响评分确定的准确度的问题,本发明实施例提供的评分确定方法。该方法应用于任一电子设备。电子设备获取目标用户的目标特征数据,根据目标特征数据,从多个样本用户中确定与目标用户相似的相似用户,根据训练好的预设矩阵模型中包括的在基本域上相似用户的第一特征向量和每一待评分物品的第二特征向量,确定目标用户对每一待评分物品的预期评分;其中,预设矩阵模型是利用预设训练集训练得到的,预设训练集包括不同数据域的特征矩阵,数据域包括基本域,用户域和/或物品域;基本域的特征矩阵为根据每一样本用户对每一待评分物品的历史评分确定的;用户域的特征矩阵为根据每一样本用户的用户特征数据确定的,物品域的特征矩阵为根据每一待评分物品的物品特征数据确定的;预设矩阵模型中包括转换矩阵,以及不同数据域上的第一特征向量和第二特征向量,转换矩阵用于不同数据域的特征矩阵对应的第一特征向量间的转换,以及不同数据域的特征矩阵对应第二特征向量间的转换,每一数据域上的第一特征向量和第二特征向量是根据该数据域的特征矩阵拆分得到的。
通过本发明实施例提供的方法,在对预设矩阵模型训练时,通过引入的转换矩阵实现不同数据域上的用户特征数据的转换和不同数据域上物品特征数据的转换,使得即使是某一数据域上较小的数据量,也可以影响到训练完成的预设矩阵模型中不同数据域上的第一特征向量与第二特征向量,提高了不同数据域上第一特征向量和第二特征向量的准确性,进而提高了根据训练完成的预设矩阵模型中包括的在基本域上的第一特征向量和第二特征向量,确定的目标用户对每一待评分物品的预期评分准确性,有效提高了评分确定的准确度。
下面通过具体实施例,对本发明实施例进行说明。
如图1所示,图1为本发明实施例提供的预设矩阵模型训练方法的一种流程示意图。该方法包括以下步骤。
步骤S101,确定预设训练集。
在本步骤中,电子设备可以获取多个样本用户的用户特征数据,该样本用户对待评分物品的历史评分,以及待评分物品的物品特征数据,作为样本特征数据。其中,样本用户的用户特征数据包括但不限于样本用户的用户标识(Identification,ID)、年龄、地域、爱好、性格。历史评分可以为样本用户对待评分物品的真实评分,也可以为根据样本用户对待评分物品的历史操作行为确定的评分。待评分物品包括但不限于样本用户浏览、观看、购买或评价过的物品。待评分物品的物品特征数据包括但不限于待评分物品的物品ID、类别。电子设备根据该样本特征数据,确定基本域的特征矩阵、用户域的特征矩阵和/或物品域的特征矩阵,作为预设训练集。其中,基本域的特征矩阵为根据每一样本用户对每一待评分物品的历史评分确定的。用户域的特征矩阵为根据每一样本用户的用户特征数据确定的。物品域的特征矩阵为根据每一待评分物品的物品特征数据确定的。
上述待评分物品可以为电子书、商品、视频等。根据上述电子设备的用途不同,上述待评分物品的物品特征数据也有所不同。例如,电子设备用于推荐电子书,则待评分物品为电子书,待评分物品的物品特征数据包括但不限于电子书的电子书ID、作者和类别。再例如,电子设备用于推荐视频,则待评分物品为视频,待评分物品的物品特征信息包括但不限于视频的视频ID、类别、导演和演员。
在本发明实施例中,上述预设训练集为不同数据域的特征矩阵。该数据域包括基本域、用户域和/或物品域。也就是该数据域可以为基本域和用户域,也可以为基本域和物品域,还可以是基本域、用户域和物品域。为方便理解,下面以数据域为基本域、用户域和物品域为例进行说明。
若基本域的特征矩阵为
Figure BDA0002185931660000131
用户域的特征矩阵为
Figure BDA0002185931660000132
物品域的特征矩阵为
Figure BDA0002185931660000133
进行说明。其中,样本用户的数量为m,待评分物品的数量为n。
针对基本域的特征矩阵中的每一元素为样本用户对待评分物品的历史评分。例如,x11为样本用户1对待评分物品的1的历史评分。xm1为样本用户m对待评分物品1的历史评分。x1n为样本用户1对待评分物品n的历史评分。xmn为样本用户m对待评分物品n的历史评分。
针对用户域的特征矩阵中的每一元素,该元素是根据样本用户的用户ID与该样本用户的其他特征数据确定的。其中,用户域的特征矩阵可以为0-1矩阵。
如表1所示,表1为本发明实施例提供的3个样本用户的性别信息。
表1
男性 女性
用户1 1 -
用户2 - 1
用户3 1 -
在表1中,-表示空值,用户1和用户3的性别为男性,用户2的性别为女性。根据表1,可以确定一个用户ID-性别的用户域的特征矩阵,也就是上述用户域的特征矩阵
Figure BDA0002185931660000141
具体可以表示为:
Figure BDA0002185931660000142
针对物品域的特征矩阵中的每一元素,该元素是根据待评分物品的物品ID与待评分物品的其他特征数据确定的。其中,物品域的特征矩阵可以为0-1矩阵。
以待评分物品为视频为例,如表2所示,表2为本发明实施例提供的3个待评分视频的导演信息。
表2
导演1 导演2 导演3
视频1 - 1 -
视频2 1 - 1
视频3 - - 1
在表2中,-表示空值,视频1的导演为导演2,视频2的导演为导演1和导演3,视频3的导演为导演3。根据表2,可以确定一视频ID-导演的物品域的特征矩阵,也就是上述物品域的特征矩阵
Figure BDA0002185931660000143
具体可以表示为:
Figure BDA0002185931660000144
在本发明实施例中,根据样本用户的用户特征数据和待评分物品的物品特征数据中包括的信息数量的不同,上述用户域的特征矩阵和物品域的特征矩阵的数量也有所不同。以样本用户的用户特征数据为例进行说明。一个示例中,若样本用户的用户特征数据包括样本用户的用户ID和年龄,则用户域的特征矩阵为用户ID-年龄所对应的特征矩阵。另一个示例中,若样本用户的用户特征数据包括用户ID、年龄和地域,则用户域的特征矩阵为用户ID-年龄、用户ID-地域所对应的特征矩阵。在此,对上述用户域的特征矩阵和物品域的特征矩阵的数量不作具体限定。另外,在上述实施例中,用户域的特征矩阵和物品域的特征矩阵是以0-1矩阵为例进行说明的。除此以外,根据实际需求,上述用户域的特征矩阵和物品域的特征矩阵中的矩阵元素也可以为其他数值,在此不作具体限定。
步骤S102,将预设训练集中基本域的特征矩阵拆分为基本域上的第一特征向量和第二特征向量,将预设训练集中用户域的特征矩阵拆分为用户域上的第一特征向量和第二特征向量,将预设训练集中物品域的特征矩阵拆分为物品域上的第一特征向量和第二特征向量。其中,每一数据域上的第一特征向量与第二特征向量的乘积值为该数据域的特征矩阵中的元素。
在本步骤中,电子设备分别将上述预设训练集中的不同数据域的特征矩阵拆分为不同数据域上的第一特征向量和第二特征向量,每一数据域上的第一特征向量与第二特征向量的乘积值为该数据域上特征矩阵中的元素。不同数据域可以包括基本域,用户域和/或物品域。
具体的,电子设备可以将基本域的特征矩阵拆分为基本域上的第一特征向量和第二特征向量,且基本域上的第一特征向量与第二特征向量的乘积值为基本域的特征矩阵的元素。电子设备可以将用户域的特征矩阵拆分为用户域上的第一特征向量和第二特征向量,且用户域上的第一特征向量与第二特征向量的乘积值为用户域的特征矩阵的元素。电子设备可以将物品域的特征矩阵拆分为物品域上的第一特征向量和第二特征向量,且物品域上的第一特征向量与第二特征向量的乘积值为物品域的特征矩阵的元素。具体可以如以下公式所示。
针对上述基本域的特征矩阵:
Figure BDA0002185931660000161
针对上述用户域的特征矩阵:
Figure BDA0002185931660000162
针对上述物品域的特征矩阵:
Figure BDA0002185931660000163
一个实施例中,电子设备可以将
Figure BDA0002185931660000164
Figure BDA0002185931660000165
以及
Figure BDA0002185931660000166
中的每一行元素构成的特征向量,确定为对应数据域上的第一特征向量,将
Figure BDA0002185931660000167
Figure BDA0002185931660000168
以及
Figure BDA0002185931660000169
中的每一列元素构成的特征向量确定为对应数据域上的第二特征向量。例如,向量(p11,...,p1k)为基本域上的第一特征向量,向量(q11,...,qk1)为基本域上的第二特征向量。向量(pu11,...,pu1k)为用户域上的第一特征向量,向量
Figure BDA00021859316600001610
为用户域上的第二特征向量。向量
Figure BDA00021859316600001611
为物品域上的第一特征向量,向量
Figure BDA00021859316600001612
为物品域上的第二特征向量。为方便理解,以下以该实施例为例进行说明。
为方便理解,以上述基本域的特征矩阵为例进行说明,若基本域的特征矩阵为
Figure BDA0002185931660000171
对该基本域的特征矩阵进行拆分,可以得到两个特征矩阵,即第一个特征矩阵
Figure BDA0002185931660000172
和第二特征矩阵
Figure BDA0002185931660000173
Figure BDA0002185931660000174
第一个特征矩阵中的每一行中的矩阵元素构成的特征向量可以表示为不同样本用户在基本域上的第一特征向量。第二个特征矩阵中的每一列中的矩阵元素构成的特征向量可以表示为不同待评分物品在基本域上的第二特征向量。例如,第一个特征矩阵中的第一行矩阵元素构成的向量(1,1,1)可以表示为用户A在基本域上的第一特征向量,第二个特征矩阵中第一列矩阵元素构成的向量(2,1,2)可以表示为待评分物品A在基本域上的第二特征向量。上述用户域和物品域上的第一特征向量和第二特征向量的确定方法,可以参照基本域上用于特征向量和第二特征向量的确定方法,在此不作具体说明。
在本发明实施例中,上述不同数据域上的第一特征向量与第二特征向量均是相互对应的。例如,向量(p11,...,p1k)为样本用户A在基本域上第一特征向量,向量(q11,...,qk1)为待评分物品A在基本域上的第二特征向量,则样本用户A在用户域上的第一特征向量为向量(pu11,...,pu1k),在物品域上的第一特征向量为向量
Figure BDA0002185931660000175
待评分物品A在用户域上的用于特征向量为向量
Figure BDA0002185931660000176
在物品域上的第二特征向量为向量
Figure BDA0002185931660000177
另一个实施例中,电子设备可以将
Figure BDA0002185931660000178
Figure BDA0002185931660000179
以及
Figure BDA00021859316600001710
中的每一行元素构成的特征向量,确定为对应数据域上的第二特征向量,将
Figure BDA0002185931660000181
Figure BDA0002185931660000182
以及
Figure BDA0002185931660000183
中的每一列元素构成的特征向量确定为对应数据域上的第一特征向量。在此,不作具体说明。
步骤S103,根据不同数据域上的第一特征向量和第二特征向量,确定不同数据域对应的转换矩阵。
在本步骤中,电子设备根据不同数据域上的第一特征向量和第二特征向量,可以确定不同数据域上的转换矩阵。该转换矩阵用于不同数据域的特征矩阵对应的第一特征向量间的转换,以及不同数据域的特征矩阵对应第二特征向量间的转换。也就是用于基本域上的第一特征向量和用户域上的第一特征向量间的转换,基本域上第二特征向量和用户域上第二特征向量间的转换,基本域上第一特征向量和物品域上第一特征向量间的转换,以及基本域上第二特征向量与物品域上第二特征向量的转换。
一个可选的实施例中,上述转换矩阵至少包括第一转换矩阵,第二转换矩阵,第三转换矩阵,以及第四转换矩阵。
根据用户域上第一特征向量和基本域上第一特征向量,确定第一转换矩阵。以第一转换矩阵与用户域上的第一特征向量的乘积值表示第一乘积值,第一乘积值与基本域上第一特征向量的差值小于第一预设差值。
根据用户域上第二特征向量和基本域上第二特征向量,确定第二转换矩阵。以第二转换矩阵与用户域上的第二特征向量的乘积值为第二乘积值,第二乘积值与基本域上第二特征向量的差值小于第二预设差值。
根据物品域上第一特征向量与基本域上第一特征向量,确定第三转换矩阵。以第三转换矩阵与物品域上的第一特征向量的乘积值为第三乘积值,第三乘积值与基本域上第一特征向量的差值小于第三预设差值。
根据物品域上第二特征向量与所基本域上第二特征向量,确定第四转换矩阵。以第四转换矩阵与物品域上的第二特征向量的乘积值为第四乘积值,第四乘积值与基本域上第二特征向量的差值小于第四预设差值。
为方便理解,以上述第一转换矩阵为例进行说明。若基本域上的第一特征向量为向量(4,5,3),用户域上第一特征向量为向量(1,1,1),则生成的第一转换矩阵可以表示为:
Figure BDA0002185931660000191
其中,第一乘积值表示为:
Figure BDA0002185931660000192
Figure BDA0002185931660000193
第一乘积值与基本域上第一特征向量相等。针对该第一转换矩阵,其他样本用户在用户域上的第一特征向量与该第一转换矩阵乘积值,与基本域上该其他样本用户对应的第一特征向量之间的差值小于第一预设差值。关于上述第二转换矩阵、第三转换矩阵以及第四转换矩阵的生成方法,可以参照上述第一转换矩阵的生成方法,在此不作具体说明。
在本发明实施例中,根据上述用户域的特征矩阵和物品域的特征矩阵对应的数量的不同,上述转换矩阵的数量也有所不同。以用户域的特征矩阵为例进行说明。若用户域的特征矩阵为上述用户ID-年龄的特征矩阵,则上述第一转换矩阵的数量为1个,第二转换矩阵的数量也为1个。若用户域的特征矩阵为上述用户ID-年龄和用户ID-地域的特征矩阵,则上述第一转换矩阵的数量为2个,第二转换矩阵的数量也为2个。在此,对上述转换矩阵的数量不作具体限定。
上述乘积值与第一特征向量或第二特征向量之间的差值,可以表示对应的特征向量的模长之间的差值。另外,上述第一预设差值、第二预设差值、第三预设差值以及第四预设差值可以相同,也可以不同。在本发明实施例中,对上述第一预设差值、第二预设差值、第三预设差值以及第四预设差值不作具体限定。
另一个可选的实施例中,电子设备也可以采用其他方式确定第一转换矩阵、第二转换矩阵、第三转换矩阵以及第四转换矩阵。
以根据用户域上第一特征向量和基本域上第一特征向量,确定的第一转换矩阵为例进行说明。电子设备也可以以第一转换矩阵与基本域上的第一特征向量的乘积值表示第一乘积值,第一乘积值与用户域上第一特征向量的差值小于第一预设差值。在此,对第二转换矩阵、第三转换矩阵以及第四转换矩阵不作具体说明了。
步骤S104,根据不同数据域间对应的转换矩阵、以及不同数据域上的第一特征向量和第二特征向量,构建异构矩阵模型。
在本步骤中,电子设备可以根据不同数据域间对应的第一转换矩阵,第二转换矩阵、第三转换矩阵和第四转换矩阵,以及不同数据域上的第一特征向量和第二特征向量,构建异构矩阵模型。
一个可选的实施例中,上述异构矩阵模型C表示为:
Figure BDA0002185931660000201
其中,wb、wo、wn为不同数据域上的预设权重,wb为基本域上的预设权重,wo为用户域上的预设权重,wn为物品域上的预设权重,Rbase为基本域,Ruser为用户域,Rres为物品域,u、u′、u″为第u个样本用户,i、i′、i″为第i个待评分物品,ru,i为基本域的特征矩阵中第u行第i列矩阵元素,ru′,i′为用户域的特征矩阵中第u′行第i′列对应的矩阵元素,ru″,i″为物品域的特征矩阵中第u″行第i″列对应的矩阵元素,pu为基本域上第u个样本用户的第一特征向量,qi为基本域上第i个待评分物品的第二特征向量,
Figure BDA0002185931660000202
为用户域上第u个样本用户的第一特征向量,
Figure BDA0002185931660000203
为用户域上第i个待评分物品的第二特征向量,
Figure BDA0002185931660000204
为物品域上第u个样本用户的第一特征向量,
Figure BDA0002185931660000211
为物品域的第i个待评分物品的第二特征向量,λp、λq
Figure BDA0002185931660000212
为预设正则系数,λp为基本域上第一特征向量的预设正则系数,λq为基本域上第二特征向量的预设正则系数,
Figure BDA0002185931660000213
为用户域上第一特征向量的预设正则系数,
Figure BDA0002185931660000214
为用户域上第二特征向量的预设正则系数,
Figure BDA0002185931660000215
为物品域上第一特征向量的预设正则系数、
Figure BDA0002185931660000216
为物品域上第二特征向量的预设正则系数,
Figure BDA0002185931660000217
为第一转换矩阵,
Figure BDA0002185931660000218
为第二转换矩阵,
Figure BDA0002185931660000219
为第三转换矩阵,
Figure BDA00021859316600002110
为第四转换矩阵,‖‖为范数操作,T为转置操作。
步骤S105,将预设训练集输入异构矩阵模型,得到损失值。
在本步骤中,电子设备将上述预设训练集的基本域的特征矩阵输入上述异构矩阵模型,也就是将不同数据域的特征矩阵中的矩阵元素代入上述异构矩阵模型,并将该异构矩阵模型的输出值确定为损失值。例如,上述异构矩阵模型中等号左侧的C的值,即为损失值。
步骤S106,根据损失值,确定异构矩阵模型是否收敛。若否,则执行步骤S107。若是,则执行步骤S108。
在本步骤中,电子设备将上述损失值与预设损失值阈值进行比较,确定上述异构矩阵模型是否收敛。
一个实施例中,若上述损失值不小于预设损失值阈值,也就是损失值大于或等于预设损失值阈值,则电子设备可以确定上述异构矩阵模型未收敛,执行步骤S107。若上述损失值小于预设损失值阈值,则电子设备可以确定上述异构矩阵模型收敛,执行步骤S108。
步骤S107,调节异构矩阵模型的参数,并返回执行步骤S105。
在本步骤中,在确定上述异构矩阵模型未收敛时,电子设备可以调整上述异构矩阵模型的参数,并返回执行上述步骤S105,也就是返回执行上述将预设训练集输入异构矩阵模型,得到损失值的步骤。
一个可选的实施例中,可以采用梯度下降法调节上述异构矩阵模型的参数。该参数除上述异构矩阵模型中的预设权重,预设正则系数外,还包括上述不同数据域间的转换矩阵,以及不同数据域上的第一特征向量和第二特征向量。
在本发明实施例中,在对异构矩阵模型中的参数进行调节时,由于转换矩阵是用于不同数据域的特征矩阵对应的第一特征向量间的转换,以及不同数据域的特征矩阵对应第二特征向量间的转换。因此,在对不同数据域上的第一特征向量、第二特征向量、以及转换矩阵进行调节时,电子设备可以先调节基本域上的第一特征向量和第二特征向量,再根据调节后的基本域上的第一特征向量和第二特征向量,调节转换矩阵,之后根据调节后的转换矩阵,调节用户域和物品域中的第一特征向量和第二特征向量。电子设备也可以先调节用户域和物品域上的第一特征向量和第二特征向量,在根据调节后的用户域和物品域上的第一特征向量和第二特征向量,调节转换矩阵,之后根据调节后的转换矩阵,调节基本域上的第一特征向量和第二特征向量。并且,在对其中的某一参数进行调节时,如在转换矩阵进行调节时,其他参数将保持不变,如不同数据域上的第一特征向量和第二特征向量等参数保持不变。
步骤S108,将当前异构矩阵模型确定为预设矩阵模型。
在本步骤中,在确定上述异构矩阵收敛时,电子设备可以确定已经完成对异构矩阵模型的训练步骤,并将当前异构矩阵模型确定为训练好的预设矩阵模型。
通过上述对异构矩阵模型的训练步骤,引入的转换矩阵实现不同数据域上的用户特征数据的转换和不同数据域上物品特征数据的转换,使得即使某一数据域上的数据量较小,也可以影响基本域上的第一特征向量与第二特征向量,使得基本域上的第一特征向量和第二特征向量的更加准确,进而提高了根据基本域上第一特征向量和第二特征向量,确定的目标用户对每一待评分物品的预期评分的准确性,有效提高了评分确定的准确度。
一个可选的实施例中,针对上述损失值,电子设备可以根据异构矩阵模型中的不同数据域间的转换矩阵,以及不同数据域上的第一特征向量和第二特征向量,预测每一样本用户对每一待评分物品的评分,并将根据该评分与基本域的特征向量中的历史评分,计算损失值。关于该损失值的计算,可以采用误差平方和(Sum of the Squared Errors,SSE)等方法确定。在此损失值的计算方法不作具体限定。
基于图1训练得到的预设矩阵模型,本发明实施例还提供了一种评分确定方法。具体如图2所示,图2为本发明实施例提供的评分确定方法的一种流程示意图。该方法包括以下步骤。
步骤S201,获取目标用户的目标特征数据。
在本步骤中,电子设备获取目标用户的用户特征数据和物品特征数据,作为目标特征数据。
一个实施例中,上述目标特征数据包括目标用户的用户特征数据和物品特征数据。其中,用户特征数据包括但不限于目标用户的ID、年龄、地域、爱好、性格。目标特征数据中的物品特征数据可以为该目标用户观看、购买过的物品或目标用户在电子设备提供的搜索栏中输入的待评分物品的关键字内容,在此不作具体限定。根据电子设备的用途的不同,上述物品特征数据也是不同的。具体可以参见上述待评分物品的物品特征数据,在此不作具体说明。
步骤S202,根据目标特征数据,从多个样本用户中确定与目标用户相似的相似用户。
在本步骤中,电子设备可以根据目标用户的用户特征数据和多个样本用户的用户特征数据,在多个样本用户中确定与该目标用户相似的相似用户。相似用户的数量可以为一个,也可以为多个,具体可以根据实际需求进行设定。在此,对相似用户的数量不作具体限定。
步骤S203,根据训练好的预设矩阵模型中包括的在基本域上相似用户的第一特征向量和每一待评分物品的第二特征向量,确定目标用户对每一待评分物品的预期评分。
在本步骤中,根据训练好的预设矩阵模型,从该预设矩阵模型中提取训练好的基本域上每一相似用户的第一特征向量和每一待评分物品的第二特征向量,确定每一相似用户对每一待评分物品的评分,将该评分作为目标用户对每一待评分物品的预期评分。其中,预设训练集包括不同数据域的特征矩阵,数据域包括基本域,用户域和/或物品域;基本域的特征矩阵为根据每一样本用户对每一待评分物品的历史评分确定的;用户域的特征矩阵为根据每一样本用户的用户特征数据确定的,物品域的特征矩阵为根据每一待评分物品的物品特征数据确定的;预设矩阵模型中包括转换矩阵,以及不同数据域上的第一特征向量和第二特征向量,预设矩阵模型是利用预设训练集训练得到的,转换矩阵用于不同数据域的特征矩阵对应的第一特征向量间的转换,以及不同数据域的特征矩阵对应第二特征向量间的转换,每一数据域上的第一特征向量和第二特征向量是根据该数据域的特征矩阵拆分得到的。
综上所述,采用本发明实施例提供的方法,在对预设矩阵模型训练时,通过引入的转换矩阵实现不同数据域上的用户特征数据的转换和不同数据域上物品特征数据的转换,使得即使是某一数据域上较小的数据量,也可以影响到训练完成的预设矩阵模型中不同数据域上的第一特征向量与第二特征向量,提高了不同数据域上第一特征向量和第二特征向量的准确性,进而提高了根据训练完成的预设矩阵模型中包括的在基本域上的第一特征向量和第二特征向量,确定的目标用户对每一待评分物品的预期评分准确性,有效提高了评分确定的准确度。
一个可选的实施例中,上述步骤S202,根据目标特征数据,从多个样本用户中确定与目标用户相似的相似用户,可以包括以下步骤。
步骤S2021,根据目标用户的目标特征数据,以及每一样本用户的样本特征数据,确定目标用户与每一样本用户之间的相似度。
一个实施例中,电子设备可以用特征向量表示目标用户的目标特征数据,以及每一样本用户的样本特征数据,利用欧式距离的计算公式,确定目标用户与每一样本用户之间的相似度。其中,欧式距离越小,相似度越大。欧式距离越大,相似度越小。
另一个实施例中,电子设备可以将目标用户的目标特征数据和每一样本用户的样本特征数据进行比较。针对每一特征数据,若相同,则记为1,若不相同,则记为0。根据每一特征数据的比较结果,计算一和值,并将该和值确定为目标用户与每一样本用户之间的相似度。
步骤S2022,将与目标用户的相似度大于预设相似度阈值的样本用户,确定为与目标用户相似的相似用户。
在本步骤中,电子设备可以将多个样本用户中与目标用户的相似度大于预设相似度阈值的样本用户,确定为与目标用户相似的相似用户。以预设相似度阈值为5为例进行说明,若目标用户与样本用户的相似度大于5,如7,则该样本用户为该目标用户的相似用户。若目标用户与样本用户的相似度小于5,如3,则该样本用户不是目标用户的相似用户。
通过目标用户的目标特征数据,在多个样本用户中确定该目标用户的相似用户,使得确定的相似用户与目标用户相似,进而使得根据相似用户在不同数据域上的第一特征向量和第二特征向量,以及不同数据域间的转换矩阵确定的预期评分更加准确,有效提高了评分确定的准确度。
一个可选的实施例中,为了降低数据的计算量,提高预期评分的计算效率,上述在确定目标用户对每一待评分物品的预期评分时,电子设备可以将目标用户对每一待评分物品的预期评分表示为基本域上每一相似用户的第一特征向量与每一待评分物品的第二特征向量的乘积值,具体表示如下:
Va,b=pa*qb
由于引入转换矩阵,使得不同数据域上的第一特征向量和第二特征向量相互影响,也就是基本域上的第一特征向量和第二特征向量是受到用户域和物品域上对应的第一特征向量和第二特征向量的影响。基本域上的第一特征向量和第二特征向量,相比于现有联合矩阵模型训练得到的基本域上的第一特征向量和第二特征向量,没有忽略较小数据量对其的影响。因此,本发明实施例训练好的基本域上的第一特征向量和第二特征向量更加准确,根据该第一特征向量和第二特征向量确定的预期评分也更加准确,有效提高了评分确定的准确性。
另一个可选的实施例中,上述在确定目标用户对每一待评分物品的预期评分时,电子设备可以针对每一相似用户,利用以下公式,确定目标用户对每一待评分物品的预期评分,也就是相似用户对每一待评分物品的预期评分:
Figure BDA0002185931660000251
其中,a为相似用户a,b为待评分物品b,Va,b为相似用户a对待评分物品b的预期评分,pa为基本域上相似用户a的第一特征向量,qb为基本域上待评分物品b的第二特征向量,
Figure BDA0002185931660000261
为用户域上相似用户a的第一特征向量,
Figure BDA0002185931660000262
为用户域上第一特征向量和基本域上第一特征向量对应的转换矩阵,即上述第一转换矩阵,
Figure BDA0002185931660000263
为用户域上待评分物品b的第二特征向量,
Figure BDA0002185931660000264
为用户域上第二特征向量和基本域上第二特征向量对应的转换矩阵,即上述第二转换矩阵,
Figure BDA0002185931660000265
为物品域上相似用户a的第一特征向量,
Figure BDA0002185931660000266
为物品域上第一特征向量与基本域上第一特征向量对应的转换矩阵,即上述第三转换矩阵,
Figure BDA0002185931660000267
为物品域上待评分物品b的第二特征向量,
Figure BDA0002185931660000268
为物品域上第二特征向量与基本域上第二特征向量对应的转换矩阵,即上述第四转换矩阵。
在上述实施例中,电子设备在确定预期评分时,综合考虑了基本域、用户域和物品域上对应的第一特征向量和第二特征向量对预期评分的影响,提高了预期评分确定的准确性。
再一个可选的实施例中,上述在确定目标用户对每一待评分物品的预期评分时,电子设备可以针对每一相似用户,利用以下公式,确定目标用户对每一待评分物品的预期评分,也就是相似用户对每一待评分物品的预期评分:
Figure BDA0002185931660000269
其中,W为基本域上对应的权值,W′为用户域对应的权值,W″为用户域物品域对应的权值。
在上述实施例中,电子设备在确定预期评分时,除了综合考虑了基本域、用户域和物品域上对应的第一特征向量和第二特征向量对预期评分的影响以外,还根据不同数据域对应的权值,确定预期评分,进一步提高了预期评分确定的准确性,进而提高了评分确定的准确度。
基于同一种发明构思,根据上述本发明实施例提供的评分确定方法,本发明实施例还提供了一种物品推荐方法。如图3所示,图3为本发明实施例提供的物品推荐方法的一种流程示意图。该方法包括以下步骤。
步骤S301,获取目标用户的目标特征数据。
步骤S302,根据目标特征数据,从多个样本用户中确定与目标用户相似的相似用户。
步骤S303,根据训练好的预设矩阵模型中包括的在基本域上相似用户的第一特征向量和每一待评分物品的第二特征向量,确定目标用户对每一待评分物品的预期评分。
上述步骤S301-步骤S303与上述步骤S201-步骤S203相同。
步骤S304,根据目标用户对每一待评分物品的预期评分的大小,向目标用户推荐待评分物品。
在本步骤中,电子设备可以根据上述步骤S303确定的预期评分的大小,也就是目标用户对每一待评分物品的预期评分的大小,向目标用户推荐预设数量个待评分物品。
一个可选的实施例中,电子设备可以选取预期评分大于预设评分阈值的待评分物品推荐给目标用户。
另一个可选的实施例中,电子设备可以按照预期评分从高到低的顺序,向目标用户推荐预设数量个待评分物品。
再一个可选的实施例中,上述预设训练集中的待评分物品为分类处理后的不同类别的待评分物品。在根据预期评分向目标用户推荐待评分物品时,电子设备可以从预期评分最高的类别中,获取预设数量个待评分物品推荐给目标用户。
通过图3所示的物品推荐方法,在对预设矩阵模型训练时,通过引入的转换矩阵实现不同数据域上的用户特征数据的转换和不同数据域上物品特征数据的转换,使得即使是某一数据域上较小的数据量,也可以影响到训练完成的预设矩阵模型中不同数据域上的第一特征向量与第二特征向量,提高了不同数据域上第一特征向量和第二特征向量的准确性,进而提高了根据训练完成的预设矩阵模型中包括的在基本域上的第一特征向量和第二特征向量,确定的目标用户对每一待评分物品的预期评分准确性,使得根据确定的预期评分进行的物品推荐更加准确,提高了物品推荐的准确度。
在本发明实施例中,上述在确定目标用户对每一待评分物品的预期评分后,电子设备根据该预期评分的大小,向该目标用户推荐待评分物品。除此以外,根据实际应用场景的变化,电子设备还可以将该预期评分用于其他场景。
为方便理解,以待评分物品为上述电子书为例,电子设备可以根据不同用户对某一电子书的预期评分,确定该电子书的是否可以继续上架。具体的,对于电子书往往是在作者撰写时,已经可以在电子设备上观看到已撰写完成的章节。由于并不是所有已观看该电子书的用户都会对该电子书进行评分。因此,在确定该电子书是否可以继续上架时,为综合用户对该电子书的评价,电子设备可以根据上述评分确定方法,确定看过该电子书的每一用户所对应的预期评分。若确定的预期评分中大于一预设评分的用户的数量达到预设数量阈值,则电子设备可以确定该电子书继续上架。若确定的预期评分大于该预设评分的用户的数量未达到预设数量阈值,则电子设备可以确定该电子书下架。
基于同一种发明构思,根据上述本发明实施例提供的评分确定方法,本发明实施例还提供了一种评分确定装置。如图4所示,图4为本发明实施例提供的评分确定装置的一种结构示意图。该装置包括以下模块。
获取模块401,用于获取目标用户的目标特征数据。
第一确定模块402,用于根据目标特征数据,从多个样本用户中确定与目标用户相似的相似用户。
第二确定模块403,用于根据训练好的预设矩阵模型中包括的在基本域上相似用户的第一特征向量和每一待评分物品的第二特征向量,确定目标用户对每一待评分物品的预期评分;其中,预设矩阵模型是利用预设训练集训练得到的,预设训练集包括不同数据域的特征矩阵,数据域包括基本域,用户域和/或物品域;基本域的特征矩阵为根据每一样本用户对每一待评分物品的历史评分确定的;用户域的特征矩阵为根据每一样本用户的用户特征数据确定的,物品域的特征矩阵为根据每一待评分物品的物品特征数据确定的;预设矩阵模型中包括转换矩阵,以及不同数据域上的第一特征向量和第二特征向量,转换矩阵用于不同数据域的特征矩阵对应的第一特征向量间的转换,以及不同数据域的特征矩阵对应第二特征向量间的转换,,每一数据域上的第一特征向量和第二特征向量是根据该数据域的特征矩阵拆分得到的。
可选的,上述评分确定装置可以还包括:
第三确定模块,用于确定预设训练集。
拆分模块,用于将预设训练集中基本域的特征矩阵拆分为基本域上的第一特征向量和第二特征向量,将预设训练集中用户域的特征矩阵拆分为用户域上的第一特征向量和第二特征向量,将预设训练集中物品域的特征矩阵拆分为物品域上的第一特征向量和第二特征向量,每一数据域上的第一特征向量与第二特征向量的乘积值为该数据域的特征矩阵中的元素。
第四确定模块,用于根据不同数据域上的第一特征向量和第二特征向量,确定不同数据域对应的转换矩阵。
构建模块,用于根据不同数据域间对应的转换矩阵、以及不同数据域上的第一特征向量和第二特征向量,构建异构矩阵模型。
第五确定模块,用于将预设训练集输入异构矩阵模型,得到损失值。
第六确定模块,用于根据损失值,确定异构矩阵模型是否收敛。
调节模块,用于在第六确定模块的确定结果为否时,调节异构矩阵模型的参数,并返回执行将预设训练集输入异构矩阵模型,得到损失值的步骤。
第七确定模块,用于在第六确定模块的确定结果为是时,将当前异构矩阵模型确定为预设矩阵模型。
可选的,上述转换矩阵至少可以包括第一转换矩阵、第二转换矩阵、第三转换矩阵和第四转换矩阵。
第一乘积值与基本域上第一特征向量的差值小于第一预设差值,第一乘积值为第一转换矩阵与用户域上的第一特征向量的乘积值,第一转换矩阵为用户域上第一特征向量和基本域上第一特征向量对应的转换矩阵。
第二乘积值与基本域上第二特征向量的差值小于第二预设差值,第二乘积值为第二转换矩阵与用户域上的第二特征向量的乘积值,第二转换矩阵为用户域上第二特征向量和基本域上第二特征向量对应的转换矩阵。
第三乘积值与基本域上第一特征向量的差值小于第三预设差值,第三乘积值为第三转换矩阵与物品域上的第一特征向量的乘积值,第三转换矩阵为物品域上第一特征向量与基本域上第一特征向量对应的转换矩阵。
第四乘积值与基本域上第二特征向量的差值小于第四预设差值,第四乘积值为第四转换矩阵与物品域上的第二特征向量的乘积值,第四转换矩阵为物品域上第二特征向量与基本域上第二特征向量对应的转换矩阵。
可选的,上述异构矩阵模型C可以表示为:
Figure BDA0002185931660000301
其中,wb、wo、wn为不同数据域上的预设权重,wb为基本域上的预设权重,wo为用户域上的预设权重,wn为物品域上的预设权重,Rbase为基本域,Ruser为用户域,Rres为物品域,u、u′、u″为第u个样本用户,i、i′、i″为第i个待评分物品,ru,i为基本域的特征矩阵中第u行第i列矩阵元素,ru′,i′为用户域的特征矩阵中第u′行第i′列对应的矩阵元素,ru″,i″为物品域的特征矩阵中第u″行第i″列对应的矩阵元素,pu为基本域上第u个样本用户的第一特征向量,qi为基本域上第i个待评分物品的第二特征向量,
Figure BDA0002185931660000302
为用户域上第u个样本用户的第一特征向量,
Figure BDA0002185931660000303
为用户域上第i个待评分物品的第二特征向量,
Figure BDA0002185931660000304
为物品域上第u个样本用户的第一特征向量,
Figure BDA0002185931660000305
为物品域的第i个待评分物品的第二特征向量,λp、λq
Figure BDA0002185931660000311
为预设正则系数,λp为基本域上第一特征向量的预设正则系数,λq为基本域上第二特征向量的预设正则系数,
Figure BDA0002185931660000312
为用户域上第一特征向量的预设正则系数,
Figure BDA0002185931660000313
为用户域上第二特征向量的预设正则系数,
Figure BDA0002185931660000314
为物品域上第一特征向量的预设正则系数、
Figure BDA0002185931660000315
为物品域上第二特征向量的预设正则系数,
Figure BDA0002185931660000316
为第一转换矩阵,
Figure BDA0002185931660000317
为第二转换矩阵,
Figure BDA0002185931660000318
为第三转换矩阵,
Figure BDA0002185931660000319
为第四转换矩阵,‖‖为范数操作,T为转置操作。
可选的,上述第二确定模块403,具体可以用于针对每一相似用户,利用以下公式,确定目标用户对每一待评分物品的预期评分:
Va,b=pa*qb;或
针对每一相似用户,利用以下公式,确定目标用户对每一待评分物品的预期评分:
Figure BDA00021859316600003110
其中,a为相似用户a,b为待评分物品b,Va,b为相似用户a对待评分物品b的预期评分,pa为基本域上相似用户a的第一特征向量,qb为基本域上待评分物品b的第二特征向量,
Figure BDA00021859316600003111
为用户域上相似用户a的第一特征向量,
Figure BDA00021859316600003112
为用户域上第一特征向量和基本域上第一特征向量对应的转换矩阵,
Figure BDA00021859316600003113
为用户域上待评分物品b的第二特征向量,
Figure BDA00021859316600003114
为用户域上第二特征向量和基本域上第二特征向量对应的转换矩阵,
Figure BDA00021859316600003115
为物品域上相似用户a的第一特征向量,
Figure BDA00021859316600003116
为物品域上第一特征向量与基本域上第一特征向量对应的转换矩阵,
Figure BDA00021859316600003117
为物品域上待评分物品b的第二特征向量,
Figure BDA00021859316600003118
为物品域上第二特征向量与基本域上第二特征向量对应的转换矩阵。
可选的,上述评分确定装置还可以包括:
推荐模块,用于根据目标用户对每一待评分物品的预期评分的大小,向目标用户推荐待评分物品。
通过本发明实施例提供的装置,在对预设矩阵模型训练时,通过引入的转换矩阵实现不同数据域上的用户特征数据的转换和不同数据域上物品特征数据的转换,使得即使是某一数据域上较小的数据量,也可以影响到训练完成的预设矩阵模型中不同数据域上的第一特征向量与第二特征向量,提高了不同数据域上第一特征向量和第二特征向量的准确性,进而提高了根据训练完成的预设矩阵模型中包括的在基本域上的第一特征向量和第二特征向量,确定的目标用户对每一待评分物品的预期评分准确性,有效提高了评分确定的准确度。
基于同一种发明构思,根据上述本发明实施例提供的评分确定方法,本发明实施例还提供了一种电子设备,如图5所示,包括处理器501、通信接口502、存储器503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信;
存储器503,用于存放计算机程序;
处理器501,用于执行存储器503上所存放的程序时,实现如下步骤:
获取目标用户的目标特征数据;
根据目标特征数据,从多个样本用户中确定与目标用户相似的相似用户;
根据训练好的预设矩阵模型中包括的在基本域上相似用户的第一特征向量和每一待评分物品的第二特征向量,确定目标用户对每一待评分物品的预期评分;其中,预设矩阵模型是利用预设训练集训练得到的,预设训练集包括不同数据域的特征矩阵,数据域包括基本域,用户域和/或物品域;基本域的特征矩阵为根据每一样本用户对每一待评分物品的历史评分确定的;用户域的特征矩阵为根据每一样本用户的用户特征数据确定的,物品域的特征矩阵为根据每一待评分物品的物品特征数据确定的;预设矩阵模型中包括转换矩阵,以及不同数据域上的第一特征向量和第二特征向量,转换矩阵用于不同数据域的特征矩阵对应的第一特征向量间的转换,以及不同数据域的特征矩阵对应第二特征向量间的转换,每一数据域上的第一特征向量和第二特征向量是根据该数据域的特征矩阵拆分得到的。
通过本发明实施例提供的电子设备,在对预设矩阵模型训练时,通过引入的转换矩阵实现不同数据域上的用户特征数据的转换和不同数据域上物品特征数据的转换,使得即使是某一数据域上较小的数据量,也可以影响到训练完成的预设矩阵模型中不同数据域上的第一特征向量与第二特征向量,提高了不同数据域上第一特征向量和第二特征向量的准确性,进而提高了根据训练完成的预设矩阵模型中包括的在基本域上的第一特征向量和第二特征向量,确定的目标用户对每一待评分物品的预期评分准确性,有效提高了评分确定的准确度。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
基于同一种发明构思,根据上述本发明实施例提供的评分确定方法,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一评分确定方法的步骤。
基于同一种发明构思,根据上述本发明实施例提供的评分确定方法,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一评分确定方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质及计算机程序产品等实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (13)

1.一种评分确定方法,其特征在于,包括:
获取目标用户的目标特征数据;
根据所述目标特征数据,从多个样本用户中确定与所述目标用户相似的相似用户;
根据训练好的预设矩阵模型中包括的在基本域上所述相似用户的第一特征向量和每一待评分物品的第二特征向量,确定所述目标用户对每一待评分物品的预期评分;其中,所述预设矩阵模型是利用预设训练集训练得到的,所述预设训练集包括不同数据域的特征矩阵,所述数据域包括基本域,用户域和/或物品域;所述基本域的特征矩阵为根据每一样本用户对每一待评分物品的历史评分确定的;所述用户域的特征矩阵为根据每一样本用户的用户特征数据确定的,所述物品域的特征矩阵为根据每一待评分物品的物品特征数据确定的;所述预设矩阵模型中包括转换矩阵,以及不同数据域上的第一特征向量和第二特征向量,所述转换矩阵用于不同数据域的特征矩阵对应的第一特征向量间的转换,以及不同数据域的特征矩阵对应第二特征向量间的转换,每一数据域上的第一特征向量和第二特征向量是根据该数据域的特征矩阵拆分得到的;
所述根据所述目标特征数据,从多个样本用户中确定与所述目标用户相似的相似用户,包括:
根据所述目标用户的目标特征数据,以及每一样本用户的样本特征数据,确定目标用户与每一样本用户之间的相似度;
将大于预设相似度阈值的所述相似度对应的样本用户,确定为与所述目标用户相似的相似用户。
2.根据权利要求1所述的方法,其特征在于,所述预设矩阵模型采用以下步骤训练得到,包括:
确定所述预设训练集;
将所述预设训练集中基本域的特征矩阵拆分为基本域上的第一特征向量和第二特征向量,将所述预设训练集中用户域的特征矩阵拆分为用户域上的第一特征向量和第二特征向量,将所述预设训练集中物品域的特征矩阵拆分为物品域上的第一特征向量和第二特征向量,每一数据域上的第一特征向量与第二特征向量的乘积值为该数据域的特征矩阵中的元素;
根据不同数据域上的第一特征向量和第二特征向量,确定不同数据域对应的转换矩阵;
根据不同数据域间对应的转换矩阵、以及不同数据域上的第一特征向量和第二特征向量,构建异构矩阵模型;
将所述预设训练集输入所述异构矩阵模型,得到损失值;
根据所述损失值,确定所述异构矩阵模型是否收敛;
若未收敛,则调节所述异构矩阵模型的参数,并返回执行所述将所述预设训练集输入所述异构矩阵模型,得到损失值的步骤;
若收敛,则将当前异构矩阵模型确定为所述预设矩阵模型。
3.根据权利要求2所述的方法,其特征在于,所述转换矩阵至少包括第一转换矩阵、第二转换矩阵、第三转换矩阵和第四转换矩阵;
第一乘积值与所述基本域上第一特征向量的差值小于第一预设差值,所述第一乘积值为第一转换矩阵与所述用户域上的第一特征向量的乘积值,所述第一转换矩阵为所述用户域上第一特征向量和所述基本域上第一特征向量对应的转换矩阵;
第二乘积值与所述基本域上第二特征向量的差值小于第二预设差值,所述第二乘积值为第二转换矩阵与所述用户域上的第二特征向量的乘积值,所述第二转换矩阵为所述用户域上第二特征向量和所述基本域上第二特征向量对应的转换矩阵;
第三乘积值与所述基本域上第一特征向量的差值小于第三预设差值,所述第三乘积值为第三转换矩阵与所述物品域上的第一特征向量的乘积值,所述第三转换矩阵为所述物品域上第一特征向量与所述基本域上第一特征向量对应的转换矩阵;
第四乘积值与所述基本域上第二特征向量的差值小于第四预设差值,所述第四乘积值为第四转换矩阵与所述物品域上的第二特征向量的乘积值,所述第四转换矩阵为所述物品域上第二特征向量与所述基本域上第二特征向量对应的转换矩阵。
4.根据权利要求2或3所述的方法,其特征在于,所述异构矩阵模型C表示为:
Figure FDA0003501163540000031
其中,wb、wo、wn为不同数据域上的预设权重,wb为基本域上的预设权重,wo为用户域上的预设权重,wn为物品域上的预设权重,Rbase为所述基本域,Ruser为所述用户域,Rres为所述物品域,u、u′、u″为第u个样本用户,i、i′、i″为第i个待评分物品,ru,i为所述基本域的特征矩阵中第u行第i列矩阵元素,ru′,i′为所述用户域的特征矩阵中第u′行第i′列对应的矩阵元素,ru″,i″为所述物品域的特征矩阵中第u″行第i″列对应的矩阵元素,pu为所述基本域上第u个样本用户的第一特征向量,qi为所述基本域上第i个待评分物品的第二特征向量,
Figure FDA0003501163540000032
为所述用户域上第u个样本用户的第一特征向量,
Figure FDA0003501163540000033
为所述用户域上第i个待评分物品的第二特征向量,
Figure FDA0003501163540000034
为所述物品域上第u个样本用户的第一特征向量,
Figure FDA0003501163540000035
为所述物品域的第i个待评分物品的第二特征向量,λp、λq
Figure FDA0003501163540000036
为预设正则系数,λp为所述基本域上第一特征向量的预设正则系数,λq为所述基本域上第二特征向量的预设正则系数,
Figure FDA0003501163540000037
为所述用户域上第一特征向量的预设正则系数,
Figure FDA0003501163540000041
为所述用户域上第二特征向量的预设正则系数,
Figure FDA0003501163540000042
为所述物品域上第一特征向量的预设正则系数、
Figure FDA0003501163540000043
为所述物品域上第二特征向量的预设正则系数,
Figure FDA0003501163540000044
为第一转换矩阵,
Figure FDA0003501163540000045
为第二转换矩阵,
Figure FDA0003501163540000046
为第三转换矩阵,
Figure FDA0003501163540000047
为第四转换矩阵,‖‖为范数操作,T为转置操作。
5.根据权利要求1所述的方法,其特征在于,所述根据训练好的预设矩阵模型中包括的在基本域上所述相似用户的第一特征向量和每一待评分物品的第二特征向量,确定所述目标用户对每一待评分物品的预期评分的步骤,包括:
针对每一相似用户,利用以下公式,确定所述目标用户对每一待评分物品的预期评分:
Va,b=pa*qb;或
针对每一相似用户,利用以下公式,确定所述目标用户对每一待评分物品的预期评分:
Figure FDA0003501163540000048
其中,a为相似用户a,b为待评分物品b,Va,b为所述相似用户a对所述待评分物品b的预期评分,pa为所述基本域上相似用户a的第一特征向量,qb为所述基本域上待评分物品b的第二特征向量,
Figure FDA0003501163540000049
为所述用户域上相似用户a的第一特征向量,
Figure FDA00035011635400000410
为所述用户域上第一特征向量和所述基本域上第一特征向量对应的转换矩阵,
Figure FDA00035011635400000411
为所述用户域上待评分物品b的第二特征向量,
Figure FDA00035011635400000412
为所述用户域上第二特征向量和所述基本域上第二特征向量对应的转换矩阵,
Figure FDA00035011635400000413
为所述物品域上相似用户a的第一特征向量,
Figure FDA00035011635400000414
为所述物品域上第一特征向量与所述基本域上第一特征向量对应的转换矩阵,
Figure FDA00035011635400000415
为所述物品域上待评分物品b的第二特征向量,
Figure FDA0003501163540000051
为所述物品域上第二特征向量与所述基本域上第二特征向量对应的转换矩阵。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述目标用户对每一待评分物品的预期评分的大小,向所述目标用户推荐待评分物品。
7.一种评分确定装置,其特征在于,包括:
获取模块,用于获取目标用户的目标特征数据;
第一确定模块,用于根据所述目标特征数据,从多个样本用户中确定与所述目标用户相似的相似用户;
第二确定模块,用于根据训练好的预设矩阵模型中包括的在基本域上所述相似用户的第一特征向量和每一待评分物品的第二特征向量,确定所述目标用户对每一待评分物品的预期评分;其中,所述预设矩阵模型是利用预设训练集训练得到的,所述预设训练集包括不同数据域的特征矩阵,所述数据域包括基本域,用户域和/或物品域;所述基本域的特征矩阵为根据每一样本用户对每一待评分物品的历史评分确定的;所述用户域的特征矩阵为根据每一样本用户的用户特征数据确定的,所述物品域的特征矩阵为根据每一待评分物品的物品特征数据确定的;所述预设矩阵模型中包括转换矩阵,以及不同数据域上的第一特征向量和第二特征向量,所述转换矩阵用于不同数据域的特征矩阵对应的第一特征向量间的转换,以及不同数据域的特征矩阵对应第二特征向量间的转换,每一数据域上的第一特征向量和第二特征向量是根据该数据域的特征矩阵拆分得到的;
所述第一确定模块,具体用于根据所述目标用户的目标特征数据,以及每一样本用户的样本特征数据,确定目标用户与每一样本用户之间的相似度;将大于预设相似度阈值的所述相似度对应的样本用户,确定为与所述目标用户相似的相似用户。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第三确定模块,用于确定所述预设训练集;
拆分模块,用于将所述预设训练集中基本域的特征矩阵拆分为基本域上的第一特征向量和第二特征向量,将所述预设训练集中用户域的特征矩阵拆分为用户域上的第一特征向量和第二特征向量,将所述预设训练集中物品域的特征矩阵拆分为物品域上的第一特征向量和第二特征向量,每一数据域上的第一特征向量与第二特征向量的乘积值为该数据域的特征矩阵中的元素;
第四确定模块,用于根据不同数据域上的第一特征向量和第二特征向量,确定不同数据域对应的转换矩阵;
构建模块,用于根据不同数据域间对应的转换矩阵、以及不同数据域上的第一特征向量和第二特征向量,构建异构矩阵模型;
第五确定模块,用于将所述预设训练集输入所述异构矩阵模型,得到损失值;
第六确定模块,用于根据所述损失值,确定所述异构矩阵模型是否收敛;
调节模块,用于在所述第六确定模块的确定结果为否时,调节所述异构矩阵模型的参数,并返回执行所述将所述预设训练集输入所述异构矩阵模型,得到损失值的步骤;
第七确定模块,用于在所述第六确定模块的确定结果为是时,将当前异构矩阵模型确定为所述预设矩阵模型。
9.根据权利要求8所述的装置,其特征在于,所述转换矩阵至少包括第一转换矩阵、第二转换矩阵、第三转换矩阵和第四转换矩阵;
第一乘积值与所述基本域上第一特征向量的差值小于第一预设差值,所述第一乘积值为第一转换矩阵与所述用户域上的第一特征向量的乘积值,所述第一转换矩阵为所述用户域上第一特征向量和所述基本域上第一特征向量对应的转换矩阵;
第二乘积值与所述基本域上第二特征向量的差值小于第二预设差值,所述第二乘积值为第二转换矩阵与所述用户域上的第二特征向量的乘积值,所述第二转换矩阵为所述用户域上第二特征向量和所述基本域上第二特征向量对应的转换矩阵;
第三乘积值与所述基本域上第一特征向量的差值小于第三预设差值,所述第三乘积值为第三转换矩阵与所述物品域上的第一特征向量的乘积值,所述第三转换矩阵为所述物品域上第一特征向量与所述基本域上第一特征向量对应的转换矩阵;
第四乘积值与所述基本域上第二特征向量的差值小于第四预设差值,所述第四乘积值为第四转换矩阵与所述物品域上的第二特征向量的乘积值,所述第四转换矩阵为所述物品域上第二特征向量与所述基本域上第二特征向量对应的转换矩阵。
10.根据权利要求8或9所述的装置,其特征在于,所述异构矩阵模型C表示为:
Figure FDA0003501163540000071
其中,wb、wo、wn为不同数据域上的预设权重,wb为基本域上的预设权重,wo为用户域上的预设权重,wn为物品域上的预设权重,Rbase为所述基本域,Ruser为所述用户域,Rres为所述物品域,u、u′、u″为第u个样本用户,i、i′、i″为第i个待评分物品,ru,i为所述基本域的特征矩阵中第u行第i列矩阵元素,ru′,i′为所述用户域的特征矩阵中第u′行第i′列对应的矩阵元素,ru″,i″为所述物品域的特征矩阵中第u″行第i″列对应的矩阵元素,pu为所述基本域上第u个样本用户的第一特征向量,qi为所述基本域上第i个待评分物品的第二特征向量,
Figure FDA0003501163540000081
为所述用户域上第u个样本用户的第一特征向量,
Figure FDA0003501163540000082
为所述用户域上第i个待评分物品的第二特征向量,
Figure FDA0003501163540000083
为所述物品域上第u个样本用户的第一特征向量,
Figure FDA0003501163540000084
为所述物品域的第i个待评分物品的第二特征向量,λp、λq
Figure FDA0003501163540000085
为预设正则系数,λp为所述基本域上第一特征向量的预设正则系数,λq为所述基本域上第二特征向量的预设正则系数,
Figure FDA0003501163540000086
为所述用户域上第一特征向量的预设正则系数,
Figure FDA0003501163540000087
为所述用户域上第二特征向量的预设正则系数,
Figure FDA0003501163540000088
为所述物品域上第一特征向量的预设正则系数、
Figure FDA0003501163540000089
为所述物品域上第二特征向量的预设正则系数,
Figure FDA00035011635400000810
为第一转换矩阵,
Figure FDA00035011635400000811
为第二转换矩阵,
Figure FDA00035011635400000812
为第三转换矩阵,
Figure FDA00035011635400000813
为第四转换矩阵,‖‖为范数操作,T为转置操作。
11.根据权利要求7所述的装置,其特征在于,所述第二确定模块,具体用于针对每一相似用户,利用以下公式,确定所述目标用户对每一待评分物品的预期评分:
Va,b=pa*qb;或
针对每一相似用户,利用以下公式,确定所述目标用户对每一待评分物品的预期评分:
Figure FDA00035011635400000814
其中,a为相似用户a,b为待评分物品b,Va,b为所述相似用户a对所述待评分物品b的预期评分,pa为所述基本域上相似用户a的第一特征向量,qb为所述基本域上待评分物品b的第二特征向量,
Figure FDA00035011635400000815
为所述用户域上相似用户a的第一特征向量,
Figure FDA00035011635400000816
为所述用户域上第一特征向量和所述基本域上第一特征向量对应的转换矩阵,
Figure FDA00035011635400000817
为所述用户域上待评分物品b的第二特征向量,
Figure FDA00035011635400000818
为所述用户域上第二特征向量和所述基本域上第二特征向量对应的转换矩阵,
Figure FDA0003501163540000091
为所述物品域上相似用户a的第一特征向量,
Figure FDA0003501163540000092
为所述物品域上第一特征向量与所述基本域上第一特征向量对应的转换矩阵,
Figure FDA0003501163540000093
为所述物品域上待评分物品b的第二特征向量,
Figure FDA0003501163540000094
为所述物品域上第二特征向量与所述基本域上第二特征向量对应的转换矩阵。
12.根据权利要求7所述的装置,其特征在于,所述装置还包括:
推荐模块,用于根据所述目标用户对每一待评分物品的预期评分的大小,向所述目标用户推荐待评分物品。
13.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-6任一所述的方法步骤。
CN201910814373.5A 2019-08-30 2019-08-30 一种评分确定方法、装置及电子设备 Active CN110543597B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910814373.5A CN110543597B (zh) 2019-08-30 2019-08-30 一种评分确定方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910814373.5A CN110543597B (zh) 2019-08-30 2019-08-30 一种评分确定方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN110543597A CN110543597A (zh) 2019-12-06
CN110543597B true CN110543597B (zh) 2022-06-03

Family

ID=68710933

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910814373.5A Active CN110543597B (zh) 2019-08-30 2019-08-30 一种评分确定方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN110543597B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111339124B (zh) * 2020-02-21 2024-04-12 北京衡石科技有限公司 显示数据方法、装置、电子设备和计算机可读介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107122407A (zh) * 2017-03-24 2017-09-01 首都师范大学 基于特征选择的多领域推荐方法
CN109446420A (zh) * 2018-10-17 2019-03-08 青岛科技大学 一种跨域协同过滤方法和***
CN109615452A (zh) * 2018-10-29 2019-04-12 华中科技大学 一种基于矩阵分解的产品推荐方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102426686A (zh) * 2011-09-29 2012-04-25 南京大学 一种基于矩阵分解的互联网信息产品推荐方法
US20130304739A1 (en) * 2012-05-10 2013-11-14 Samsung Electronics Co., Ltd. Computing system with domain independence orientation mechanism and method of operation thereof
CN105809275A (zh) * 2016-02-29 2016-07-27 海信集团有限公司 一种物品评分预测方法及装置
CN107273438B (zh) * 2017-05-24 2021-02-23 深圳大学 一种推荐方法、装置、设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107122407A (zh) * 2017-03-24 2017-09-01 首都师范大学 基于特征选择的多领域推荐方法
CN109446420A (zh) * 2018-10-17 2019-03-08 青岛科技大学 一种跨域协同过滤方法和***
CN109615452A (zh) * 2018-10-29 2019-04-12 华中科技大学 一种基于矩阵分解的产品推荐方法

Also Published As

Publication number Publication date
CN110543597A (zh) 2019-12-06

Similar Documents

Publication Publication Date Title
US20210271975A1 (en) User tag generation method and apparatus, storage medium, and computer device
CN106682114B (zh) 一种融合用户信任关系和评论信息的个性化推荐方法
CN108829808B (zh) 一种页面个性化排序方法、装置及电子设备
CN108985830B (zh) 基于异质信息网络的推荐评分方法、装置
US20180121434A1 (en) Method and apparatus for recalling search result based on neural network
WO2020133398A1 (zh) 应用推荐方法、装置、服务器和计算机可读存储介质
CN105247507A (zh) 品牌的影响力得分
CN111010592B (zh) 一种视频推荐方法、装置、电子设备及存储介质
WO2018068648A1 (zh) 一种信息匹配方法及相关装置
WO2020168992A1 (zh) 一种商品推荐方法、装置、设备以及存储介质
CN107203558B (zh) 对象推荐方法和装置、推荐信息处理方法和装置
CN113221019B (zh) 基于即时学习的个性化推荐方法和***
CN111080360A (zh) 行为预测方法、模型训练方法、装置、服务器及存储介质
WO2024131762A1 (zh) 一种推荐方法及相关设备
US20220172083A1 (en) Noise contrastive estimation for collaborative filtering
CN111339435B (zh) 一种基于潜在因子的矩阵分解补全混合推荐方法
Su et al. Effective social content-based collaborative filtering for music recommendation
CN111161009B (zh) 信息推送方法、装置、计算机设备和存储介质
CN111930859A (zh) 一种基于异质图神经网络的节点处理方法、装置及设备
CN110543597B (zh) 一种评分确定方法、装置及电子设备
CN110796504B (zh) 物品推荐方法和装置
CN117391824B (zh) 基于大语言模型和搜索引擎推荐物品的方法及装置
CN110085292A (zh) 药品推荐方法、装置及计算机可读存储介质
CN112199500B (zh) 针对评论的情感倾向识别方法、装置及电子设备
WO2022083596A1 (zh) 一种排序方法、装置、设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant