CN113220994B - 基于目标物品增强表示的用户个性化信息推荐方法 - Google Patents
基于目标物品增强表示的用户个性化信息推荐方法 Download PDFInfo
- Publication number
- CN113220994B CN113220994B CN202110498063.4A CN202110498063A CN113220994B CN 113220994 B CN113220994 B CN 113220994B CN 202110498063 A CN202110498063 A CN 202110498063A CN 113220994 B CN113220994 B CN 113220994B
- Authority
- CN
- China
- Prior art keywords
- feature vector
- target
- user
- articles
- recommended
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 124
- 239000013598 vector Substances 0.000 claims abstract description 139
- 238000005070 sampling Methods 0.000 claims abstract description 62
- 238000013507 mapping Methods 0.000 claims abstract description 23
- 230000006870 function Effects 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 16
- 238000010606 normalization Methods 0.000 claims description 13
- 239000000126 substance Substances 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 abstract description 9
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000013135 deep learning Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 6
- 230000006872 improvement Effects 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000003796 beauty Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000012733 comparative method Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于人工智能和深度学习技术领域,具体涉及一种基于目标物品增强表示的用户个性化信息推荐方法,旨在解决现有的个性化信息推荐方法受限于用户行为记录,进而导致推荐准确率低、鲁棒性差的问题。本方法包括获取用户历史记录中的物品及待推荐的目标物品,并映射为设定维度的特征向量;获取用户关于目标物品的兴趣表示;通过预设的采样方法从第一数据集、待推荐目标物品的交集中采样设定数目的物品,并映射为特征向量;获取关于目标物品的增强表示;预测得到用户对待推荐的目标物品的感兴趣程度,并将排序后的前N个感兴趣程度对应的待推荐的目标物品推荐给用户。本发明提升了现有个性化信息推荐方法的推荐准确性以及鲁棒性。
Description
技术领域
本发明属于人工智能和深度学习技术领域,具体涉及一种基于目标物品增强表示的用户个性化信息推荐方法、***、设备。
背景技术
随着科技的发展,信息产生的速度已经远远超过用户自身能够处理的程度。用户在寻找自己需要的信息时将花费大量的时间来筛选过滤无关的信息。个性化信息推荐的目的就在于通过分析用户的相关历史记录和用户个人资料来代替用户完成信息的筛选并将用户潜在感兴趣的信息推荐给用。
个性化信息推荐模型可以抽象为一个简单的二分类或者回归模型,其输入是用户相关的特征包括相关历史纪录和个人资料以及目标信息的特征,输出是用户是否感兴趣或者感兴趣的程度。模型根据用户的特征和目标信息的特征做对比,并作出决定是否将该信息推荐给用户。对于二分类模型可直接依据分类结果作为决定,对于回归模型可以通过对所有目标信息的得分做排序,得出最有可能感兴趣的前N条信息。
另现有的一些推荐算法如协同过滤算法,通过分析相似行为记录的用户来进行物品的推荐。但是这种方法受限于用户行为记录,导致模型在泛化能力上有所限制。近年来的一些方法使用深度神经网络来编码用户特征和物品特征,并通过多层感知机获得深度的非线性特征,取得了一定效果。基于此,本发明提出了一种基于目标物品增强表示的用户个性化信息推荐方法。
发明内容
为了解决现有技术中的上述问题,即为了解决现有的个性化信息推荐方法受限于用户行为记录,进而导致推荐准确率低、鲁棒性差的问题,本发明第一方面,提出了一种基于目标物品增强表示的用户个性化信息推荐方法,该方法包括:
S10,获取用户历史记录中的物品及待推荐的目标物品,并映射为设定维度的特征向量;将用户历史记录中的物品映射的特征向量作为第一特征向量,将待推荐的目标物品映射的特征向量作为第二特征向量;
S20,计算第一特征向量、第二特征向量的相似度,并对各相似度进行归一化处理;通过归一化后的相似度对各第一特征向量进行加权求和,作为用户关于目标物品的兴趣表示;
S30,获取第一数据集、待推荐目标物品的交集;通过预设的采样方法从所述交集中采样设定数目的物品,并映射为特征向量,作为第三特征向量;所述第一数据集为基于多个用户历史记录的物品构建的数据集;
S40,计算第二特征向量、第三特征向量的相似度,并对各相似度进行归一化处理;通过归一化后的相似度对各第三特征向量进行加权求和,作为关于目标物品的增强表示;
S50,将第二特征向量、用户关于目标物品的兴趣表示、关于目标物品的增强表示拼接后输入预构建的分类器,预测得到用户对待推荐的目标物品的感兴趣程度;并根据感兴趣程度进行排序,排序后,将前N个感兴趣程度对应的待推荐的目标物品推荐给用户;N为正整数。
在一些优选的实施方式中,步骤S20中“计算第一特征向量、第二特征向量的相似度,并对各相似度进行归一化处理”,其方法为:
通过多层感知机计算第一特征向量、第二特征向量的相似度;
采用softmax函数对各相似度进行归一化处理。
在一些优选的实施方式中,步骤S30中“通过预设的采样方法从所述交集中采样设定数目的物品”,其方法为:
通过全局采样方法、局部采样方法、带权采样方法、均匀采样方法中的任一种方法从所述交集中采样设定数目的物品。
在一些优选的实施方式中,所述带权采样方法为:
其中,表示物品k在全局采样方法下被采样的概率,表示物品k在局部采样方法下被采样的概率,α表示权重,表示物品k在第一数据集中出现的次数,表示物品k与待推荐的目标物品共同出现的次数,Oi表示物品i与第一数据集各用户历史记录中除物品i外的物品构建的集合,表示物品j在第一数据集中出现的次数,表示物品j在Oi中出现的次数。
在一些优选的实施方式中,所述分类器基于多层感知机构建;所述多层感知机为三层,各层之间采用ReLu激活函数,各层的维度依次为80、40和1。
本发明的第二方面,提出了一种基于目标物品增强表示的用户个性化信息推荐***,该***包括:特征映射模块、兴趣表示获取模块、共有物品采样模块、增强表示获取模块、目标物品推荐模块;
所述特征映射模块,配置为获取用户历史记录中的物品及待推荐的目标物品,并映射为设定维度的特征向量;将用户历史记录中的物品映射的特征向量作为第一特征向量,将待推荐的目标物品映射的特征向量作为第二特征向量;
所述兴趣表示获取模块,配置为计算第一特征向量、第二特征向量的相似度,并对各相似度进行归一化处理;通过归一化后的相似度对各第一特征向量进行加权求和,作为用户关于目标物品的兴趣表示;
所述共有物品采样模块,配置为获取第一数据集、待推荐目标物品的交集;通过预设的采样方法从所述交集中采样设定数目的物品,并映射为特征向量,作为第三特征向量;所述第一数据集为基于多个用户历史记录的物品构建的数据集;
所述增强表示获取模块,配置为计算第二特征向量、第三特征向量的相似度,并对各相似度进行归一化处理;通过归一化后的相似度对各第三特征向量进行加权求和,作为关于目标物品的增强表示;
所述目标物品推荐模块,配置为将第二特征向量、用户关于目标物品的兴趣表示、关于目标物品的增强表示拼接后输入预构建的分类器,预测得到用户对待推荐的目标物品的感兴趣程度;并根据感兴趣程度进行排序,排序后,将前N个感兴趣程度对应的待推荐的目标物品推荐给用户;N为正整数。
本发明的第三方面,提出了一种设备,至少一个处理器;以及与至少一个所述处理器通信连接的存储器;其中,所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现权利要求上述的基于目标物品增强表示的用户个性化信息推荐方法。
本发明的第四方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于被所述计算机执行以实现权利要求上述的基于目标物品增强表示的用户个性化信息推荐方法。
本发明的有益效果:
本发明提升了现有个性化信息推荐方法的推荐准确性以及鲁棒性。
1)本发明通过使用目标物品的共现物品,经过注意力计算后得到目标物品的增强表示,缓解由于低频次目标物品嵌入表示质量低引起的模型表现变差以及推荐受限于用户行为记录的问题;
2)本发明通过注意力机制从目标物品的共现物品中获取与目标物品相关的语义信息,通过这些信息丰富目标物品的语义使模型中的分类器学习到更准确的模式。使得本发明相比基线方法在公开数据集上取得更好的效果,提升了推荐准确性以及鲁棒性。
附图说明
通过阅读参照以下附图所做的对非限制性实施例所做的详细描述,本申请的其他特征、目的和优点将会变得更明显。
图1是本发明一种实施例的基于目标物品增强表示的用户个性化信息推荐方法的流程示意图;
图2是本发明一种实施例的基于目标物品增强表示的用户个性化信息推荐***的框架示意图;
图3是本发明一种实施例的个性化信推荐模型的结构示例图;
图4是本发明一种实施例的在不同数据集上相比其他模型Top-k推荐的效果对比的示意图;
图5是本发明一种实施例的在不同数据集上相比其他模型在低频次物品上的推荐效果对比的示意图;
图6是本发明一种实施例的适于用来实现本申请实施例的电子设备的计算机***的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本发明的一种基于目标物品增强表示的用户个性化信息推荐方法,如图1所示,该方法包括:
S10,获取用户历史记录中的物品及待推荐的目标物品,并映射为设定维度的特征向量;将用户历史记录中的物品映射的特征向量作为第一特征向量,将待推荐的目标物品映射的特征向量作为第二特征向量;
S20,计算第一特征向量、第二特征向量的相似度,并对各相似度进行归一化处理;通过归一化后的相似度对各第一特征向量进行加权求和,作为用户关于目标物品的兴趣表示;
S30,获取第一数据集、待推荐目标物品的交集;通过预设的采样方法从所述交集中采样设定数目的物品,并映射为特征向量,作为第三特征向量;所述第一数据集为基于多个用户历史记录的物品构建的数据集;
S40,计算第二特征向量、第三特征向量的相似度,并对各相似度进行归一化处理;通过归一化后的相似度对各第三特征向量进行加权求和,作为关于目标物品的增强表示;
S50,将第二特征向量、用户关于目标物品的兴趣表示、关于目标物品的增强表示拼接后输入预构建的分类器,预测得到用户对待推荐的目标物品的感兴趣程度;并根据感兴趣程度进行排序,排序后,将前N个感兴趣程度对应的待推荐的目标物品推荐给用户;N为正整数。
为了更清晰地对本发明基于目标物品增强表示的用户个性化信息推荐方法进行说明,下面结合附图对本发明方法一种实施例中各步骤进行展开详述。
S10,获取用户历史记录中的物品及待推荐的目标物品,并映射为设定维度的特征向量;将用户历史记录中的物品映射的特征向量作为第一特征向量,将待推荐的目标物品映射的特征向量作为第二特征向量;
在本实施例中,获取用户历史记录S={x1,x2,...,xt}中的物品xi及待推荐的目标物品xe,并通过嵌入层将用户历史记录中的物品及待推荐的目标物品进行嵌入表示,其中,用户历史记录中的物品及待推荐的目标物品由物品的ID表示,即将用户历史记录中的物品及待推荐的目标物品ID映射为维度为d的特征向量,用于表示该物品。
将用户历史记录中的物品映射的特征向量作为第一特征向量,将待推荐的目标物品映射的特征向量作为第二特征向量。
S20,计算第一特征向量、第二特征向量的相似度,并对各相似度进行归一化处理;通过归一化后的相似度对各第一特征向量进行加权求和,作为用户关于目标物品的兴趣表示;
在本实施例中,通过多层感知机MLP计算第一特征向量、第二特征向量的相似度。MLP为一种三层的多层感知机,每层的维度大小分别是80、40和1,层与层之间采用ReLU激活函数。
计算用户历史记录中的物品及待推荐的目标物品的相关性(即相似度)后,在整个用户行为历史上使用softmax函数进行归一化处理,即采用softmax函数对各相似度进行归一化处理,得到注意力评分。该注意力评分用于调整用户历史记录中每个物品在最终的用户兴趣表达中所占的比重,即将归一化处理后的相似度对第一特征向量进行加权求和,得到用户关于目标物品的兴趣表示。具体如公式(1)(2)(3)表示:
qi=MLP(concat(xi,xe)) (3)
其中,qi表示相似度,ai表示归一化后的相似度,即注意力评分,hu表示用户关于目标物品的兴趣表示,n表示用户历史记录中的物品的数量。
S30,获取第一数据集、待推荐目标物品的交集;通过预设的采样方法从所述交集中采样设定数目的物品,并映射为特征向量,作为第三特征向量;所述第一数据集为基于多个用户历史记录的物品构建的数据集;
在本实施例中,先在第一数据集中与目标物品共现过的所有物品中采样出固定数目的共现物品,第一数据集为基于多个用户历史记录的物品构建的数据集。即获取第一数据集、待推荐目标物品的交集,在交集中采样设定数目的物品,并映射为特征向量。
采样方法包括:全局采样方法、局部采样方法、带权采样方法、均匀采样方法中的任一种。
全局采样方法下每个物品被采样的概率为:
使用全局采样方法,模型倾向于使用高频次的共现物品用于补全目标商品语义。高频次的共现物品的优势在于,由于在整个第一数据集中出现次数较多,模型对其嵌入表示的训练比较充分。因而以这些共现物品嵌入表示计算得来的增强表示语义的明确性也更强。
局部采样方法下每个物品被采样的概率如下:
使用局部采样方法,模型倾向于使用高共现频次的物品用于补全目标物品语义。高共现频次物品的优势在于,共现频次可以大致视为和目标物品的相关度,物品越相关其共现频次会越高。因而以这些共现物品嵌入表示计算得来的增强表示与目标商品实际语义的相关度更高。
带权采样方法下每个物品被采样的概率如下:
带权采样方法用于调整最终增强表示的明确性和准确性。当α接近1时,该采样方法更倾向生成语义明确性强的增强表示,当α接近0时更倾向生成语义相关度高的增强表示。
均匀采样方法下每个物品被采样的概率如下:
均匀采样方法是一种无偏采样方法,每个共现物品的被采样概率是相同的。
S40,计算第二特征向量、第三特征向量的相似度,并对各相似度进行归一化处理;通过归一化后的相似度对各第三特征向量进行加权求和,作为关于目标物品的增强表示;
在本实施例中,通过多层感知机MLP计算第二特征向量、第三特征向量的相似度。MLP为一种三层的多层感知机,每层的维度大小分别是80、40和1,层与层之间采用ReLU激活函数。
采用softmax函数对各相似度进行归一化处理,并能过归一化后的相似度对各第三特征向量进行加权求和,作为关于目标物品的增强表示,具体如公式(10)(11)(12)所示:
qi=MLP(concat(xi,xe)) (12)
其中,re表示关于目标物品的增强表示,即经由带权求和得到的待推荐的目标物品的增强表示,Oe表示交集中采样设定数目的物品构建的集合。
S50,将第二特征向量、用户关于目标物品的兴趣表示、关于目标物品的增强表示拼接后输入预构建的分类器,预测得到用户对待推荐的目标物品的感兴趣程度;并根据感兴趣程度进行排序,排序后,将前N个感兴趣程度对应的待推荐的目标物品推荐给用户;N为正整数。
在本实施例中,先将第二特征向量、用户关于目标物品的兴趣表示、关于目标物品的增强表示拼接,将拼接后的向量输入预构建的分类器(所述分类器基于多层感知机构建,结构为三层,每层维度分别是80,40和1,层间采用ReLU激活函数),得到用户对待推荐的目标物品的感兴趣程度。具体如式(13)所示:
yue=MLP(concat(xe,hu,re)) (13)
其中,yue表示用户对待推荐的目标物品的感兴趣程度,concat表示的拼接函数,将输入的所有表示拼接为单个表示。
分类器输出待推荐的目标物品符合该用户兴趣的可能性yue,对于大量的目标物品,在计算其可能性后按得分排序取前N个待推荐的目标物品推荐给用户。
本发明中,个性化信息推荐模型其在训练的过程中采用的是反向传播算法,使用交叉熵作为目标函数。如公式(14)所示:
其中,表示第i个样本的标签和模型基于第i个样本的输出,N为训练集的大小。对于标签y∈{0,1},0表示用户对该目标物品不感兴趣,1表示用户感兴趣。个性化信息推荐模型包括嵌入映射模块、第一注意力模块、第二注意力模块、分类模块,如图3所示(图3中的共现物品集合即上文中的Oi);
嵌入模块,用于将用户历史记录中的物品及待推荐的目标物品映射为特征向量;将用户历史记录中的物品映射的特征向量作为第一特征向量,将待推荐的目标物品映射的特征向量作为第二特征向量;
第一注意力模块,用于将计算第一特征向量、第二特征向量的相似度,并对各相似度进行归一化处理;通过归一化后的相似度对各第一特征向量进行加权求和,作为用户关于目标物品的兴趣表示;
第二注意力模块,用于计算第二特征向量、第三特征向量的相似度,并对各相似度进行归一化处理;通过归一化后的相似度对各第三特征向量进行加权求和,作为关于目标物品的增强表示;
分类模块,用于将第二特征向量、用户关于目标物品的兴趣表示、关于目标物品的增强表示拼接后输入预构建的分类器,预测得到用户对待推荐的目标物品的感兴趣程度;并根据感兴趣程度进行排序,排序后,将前N个感兴趣程度对应的待推荐的目标物品推荐给用户。
另外,为了验证本发明方法的有效性,使用本发明方法在2个公开的亚马逊数据集上进行实验。亚马逊数据集使推荐领域常用的一种基准数据集,这里我们选用了Beauty和Books两种子集,每个商品的特征只包含商品ID。
以上所有数据集只保留行为记录数大于5的用户数据,且截断保留每个用户的后200个记录。模型在训练时采用的是使用前n-2个物品预测第n-1个物品,测试时采用的是使用前n-1个物品预测第n个物品,这里n指的是用户行为记录的长度。我们在表1中提供了所有数据集的统计数据。
表1
本实验中使用的对比方法由:(1)MF,一种利用用户和物品交互信息的标准矩阵分解模型。(2)MLP,这种方法使用多层感知机来代替点积学习打分函数。这里我们采用和本模型中相同的MLP结构。(3)Youtube Rec,Youtube公司在他们的视频推荐***上使用了这个方法。这个模型将所有用户交互过的视频的嵌入表示取了一个均值,然后送入多层感知机。(4)FISM是目前最好的基于物品推荐的方法之一,它使用用户交互过的所有物品来表示用户,并用点积来学习打分函数。(5)NAIS额外引入了注意力机制来动态调整每个历史物品在最终兴趣表示的比重。(6)DIN是一种在CTR领域被广泛使用的方法,它的结构和NAIS很相似,不过它采用MLP来学习打分函数。
在本实验中,每个物品的嵌入表示的维度为64。我们选择SGD作为优化器,采用1.0的学***性,我们对每个用户随机选择100个负样本,然后将目标物品在这100个负样本中进行排序。我们选择的评价标准包括击中率HR@10和NDCG@10。我们还采用了一种相对提升指标RelaImpr来表示模型效果相对基线模型的提升程度。对于所有的指标而言,数值越大表示模型的效果越好。
表2展现了本发明及对比的基线模型的实验结果对比,其中RI代表相对FISM的RelaImpr。
表2
从实验结果来看,首先我们可以看到我们的模型CER在所有数据集上均取得了最好的表现并且超过了基线中最好的方法NAIS和DIN很多。在Beauty数据集上,我们的方法相比FISM在HR上有大约10.42%的提升,在NDCG上大约有10.51%的相对提升。在Books数据集上,我们的方法相比FISM在HR上有大约17.87%的相对提升,在NDCG上有大约26.74%的相对提升。为了方便和其他方法比较,我们可以大致上将所有的基线模型分为三类。第一类是基于用户的方法包括MF和MLP。第二类使用物品来表示用户,包括Youtube、FISM、NAIS和DIN。最后一类是我们提出的模型,使用物品来表示用户和物品。如表中所示,每个类别下的方法会采用不同的模块如使用MLP或者注意力机制,这会导致这些模型在实际表现上存在一定的差异。然而,不同类别方法之间的表现往往存在一个比较明显的差距。
对于基于用户的方法,无论使用内积还是MLP作为交互函数,它在所有基线模型中总是取得的最差的结果。这是由于用户的兴趣是多维的,使用单一的向量表示用户的多个兴趣会限制模型的拟合和泛化能力。
与基于用户的方法相比,第二类方法在两个数据集上均取得了不错的表现。他们的提升主要来自于使用了更多的信息来编码用户的兴趣,这就提升了用户表示的质量。在这些方法中使用了注意力机制的方法要比没有使用注意力的方法表现更好一点。这证明了针对目标物品动态调整用户的兴趣表达对于提升模型表现有重要作用。
在第二类方法的基础之上,我们提出的CER方法提供了一个基于共现物品的目标物品的增强表示。这个增强表示有助于缓解长尾分布带来的低频次物品语义缺失的问题,因此对提升基于物品的协同过滤方法有重要的作用。正如我们在表2中看见的,我们的方法在两个数据集上都远好于第二类方法,证明了我们方法的有效性。
图4展示了各个模型在Top-k推荐任务上的表现,这里k的取值为1到10。我们可以从图中看到,我们提出的CER模型在所有位置上均比基线中的第二类模型要好。在这些基线模型中,NAIS和DIN在Beauty和Books数据集上表现得相对较好。
图5展示了各个模型在低频次目标物品上的表现。我们将测试集中的目标物品按照他们的全局频次进行分类。对于每一种频次,我们计算该频次下所有测试样本的两种评价指标。值得注意的是,由于在构建数据集时使用了截断,数据集的5-core属性也许会被打破。因为我们只关注低频次目标物品,这里我们选择了0到50的频次。首先,从图中我们可以看到,在所有基于物品的方法中,模型的表现随着目标物品全局频次的增长而变好。这证明了目标物品的频次对于基于物品方法的表现有重要的影响。此外,我们可以看到模型在较低频次目标物品(频次在0到30)的表现要远远低于模型在数据集上的整体表现。由于长尾分布的原因,这些目标物品会极大地拉低模型的整体表现。
其次,在Beauty数据集上,我们提出的模型要优于其他基线模型,特别是频次在0到30的区间上。在Books数据集上,我们的方法在两种评价指标上均要远好于其他基线模型。这说明了增强表示有助于缓解目标物品的语义缺失问题。为了更清楚地解释这张图,我们以Books数据集为例。考虑频次为10的HR值,基线模型中最好的表现时DIN,它的数值接近0.41。然而我们的模型对应值接近0.57,相比DIN有接近39%的相对提升。再考虑NDCG值为0.5时的频次,基线模型中表现最好的时DIN,对应的频率是44。对于我们的模型来说,这个数值是21。也就是说,想要取得相同的NDCG表现,我们的模型只需要目标物品在数据集中出现21次即可,而最好的基线方法则需要至少44次。总的来说,实验结果显示我们的模型在低频次目标物品上相比其他基于item的方法有着不可替代的优势。
本发明第二实施例的一种基于目标物品增强表示的用户个性化信息推荐***,如图2所示,具体包括以:特征映射模块100、兴趣表示获取模块200、共有物品采样模块300、增强表示获取模块400、目标物品推荐模块500;
所述特征映射模块100,配置为获取用户历史记录中的物品及待推荐的目标物品,并映射为设定维度的特征向量;将用户历史记录中的物品映射的特征向量作为第一特征向量,将待推荐的目标物品映射的特征向量作为第二特征向量;
所述兴趣表示获取模块200,配置为计算第一特征向量、第二特征向量的相似度,并对各相似度进行归一化处理;通过归一化后的相似度对各第一特征向量进行加权求和,作为用户关于目标物品的兴趣表示;
所述共有物品采样模块300,配置为获取第一数据集、待推荐目标物品的交集;通过预设的采样方法从所述交集中采样设定数目的物品,并映射为特征向量,作为第三特征向量;所述第一数据集为基于多个用户历史记录的物品构建的数据集;
所述增强表示获取模块400,配置为计算第二特征向量、第三特征向量的相似度,并对各相似度进行归一化处理;通过归一化后的相似度对各第三特征向量进行加权求和,作为关于目标物品的增强表示;
所述目标物品推荐模块500,配置为将第二特征向量、用户关于目标物品的兴趣表示、关于目标物品的增强表示拼接后输入预构建的分类器,预测得到用户对待推荐的目标物品的感兴趣程度;并根据感兴趣程度进行排序,排序后,将前N个感兴趣程度对应的待推荐的目标物品推荐给用户;N为正整数。
所述技术领域的技术人员可以清楚的了解到,为描述的方便和简洁,上述描述的***具体的工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
需要说明的是,上述实施例提供的基于目标物品增强表示的用户个性化信息推荐***,仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块来完成,即将本发明实施例中的模块或者步骤再分解或者组合,例如,上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块,以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称,仅仅是为了区分各个模块或者步骤,不视为对本发明的不当限定。
本发明第三实施例的一种设备,至少一个处理器;以及与至少一个所述处理器通信连接的存储器;其中,所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现权利要求上述的基于目标物品增强表示的用户个性化信息推荐方法。
本发明第四实施例的一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于被所述计算机执行以实现权利要求上述的基于目标物品增强表示的用户个性化信息推荐方法。
所述技术领域的技术人员可以清楚的了解到,未描述的方便和简洁,上述描述的存储装置、处理装置的具体工作过程及有关说明,可以参考前述方法实例中的对应过程,在此不再赘述。
下面参考图6,其示出了适于用来实现本申请***、方法、设备实施例的服务器的计算机***的结构示意图。图6示出的服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机***包括中央处理单元(CPU,Central Processing Unit)601,其可以根据存储在只读存储器(ROM,Read Only Memory)602中的程序或者从存储部分608加载到随机访问存储器(RAM,Random Access Memory)603中的程序而执行各种适当的动作和处理。在RAM603中,还存储有***操作所需的各种程序和数据。CPU601、ROM602以及RAM603通过总线604彼此相连。输入/输出(I/O,Input/Output)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管、液晶显示器等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如局域网卡、调制解调器等的网络接口卡的通讯部分609。通讯部分609经由诸如因特网的网络执行通讯处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通讯部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被CPU601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、RAM、ROM、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言,如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,如C语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网或广域网连接到用户计算机,或者可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
术语“第一”、“第二”等是用于区别类似的对象,而不是用于描述或表示特定的顺序或先后次序。
术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (9)
1.一种基于目标物品增强表示的用户个性化信息推荐方法,其特征在于,该方法包括以下步骤:
S10,获取用户历史记录中的物品及待推荐的目标物品,并映射为设定维度的特征向量;将用户历史记录中的物品映射的特征向量作为第一特征向量,将待推荐的目标物品映射的特征向量作为第二特征向量;
S20,计算第一特征向量、第二特征向量的相似度,并对各相似度进行归一化处理;通过归一化后的相似度对各第一特征向量进行加权求和,作为用户关于目标物品的兴趣表示;
S30,获取第一数据集、待推荐目标物品的交集;通过预设的采样方法从所述交集中采样设定数目的物品,并映射为特征向量,作为第三特征向量;所述第一数据集为基于多个用户历史记录的物品构建的数据集;
S40,计算第二特征向量、第三特征向量的相似度,并对各相似度进行归一化处理;通过归一化后的相似度对各第三特征向量进行加权求和,作为关于目标物品的增强表示;
S50,将第二特征向量、用户关于目标物品的兴趣表示、关于目标物品的增强表示拼接后输入预构建的分类器,预测得到用户对待推荐的目标物品的感兴趣程度;并根据感兴趣程度进行排序,排序后,将前N个感兴趣程度对应的待推荐的目标物品推荐给用户;N为正整数。
2.根据权利要求1所述的基于目标物品增强表示的用户个性化信息推荐方法,其特征在于,步骤S20中“计算第一特征向量、第二特征向量的相似度,并对各相似度进行归一化处理”,其方法为:
通过多层感知机计算第一特征向量、第二特征向量的相似度;
采用softmax函数对各相似度进行归一化处理。
3.根据权利要求1所述的基于目标物品增强表示的用户个性化信息推荐方法,其特征在于,步骤S30中“通过预设的采样方法从所述交集中采样设定数目的物品”,其方法为:
通过全局采样方法、局部采样方法、带权采样方法、均匀采样方法中的任一种方法从所述交集中采样设定数目的物品。
6.根据权利要求1所述的基于目标物品增强表示的用户个性化信息推荐方法,其特征在于,所述分类器基于多层感知机构建;所述多层感知机为三层,各层之间采用ReLu激活函数,各层的维度依次为80、40和1。
7.一种基于目标物品增强表示的用户个性化信息推荐***,其特征在于,该***包括:特征映射模块、兴趣表示获取模块、共有物品采样模块、增强表示获取模块、目标物品推荐模块;
所述特征映射模块,配置为获取用户历史记录中的物品及待推荐的目标物品,并映射为设定维度的特征向量;将用户历史记录中的物品映射的特征向量作为第一特征向量,将待推荐的目标物品映射的特征向量作为第二特征向量;
所述兴趣表示获取模块,配置为计算第一特征向量、第二特征向量的相似度,并对各相似度进行归一化处理;通过归一化后的相似度对各第一特征向量进行加权求和,作为用户关于目标物品的兴趣表示;
所述共有物品采样模块,配置为获取第一数据集、待推荐目标物品的交集;通过预设的采样方法从所述交集中采样设定数目的物品,并映射为特征向量,作为第三特征向量;所述第一数据集为基于多个用户历史记录的物品构建的数据集;
所述增强表示获取模块,配置为计算第二特征向量、第三特征向量的相似度,并对各相似度进行归一化处理;通过归一化后的相似度对各第三特征向量进行加权求和,作为关于目标物品的增强表示;
所述目标物品推荐模块,配置为将第二特征向量、用户关于目标物品的兴趣表示、关于目标物品的增强表示拼接后输入预构建的分类器,预测得到用户对待推荐的目标物品的感兴趣程度;并根据感兴趣程度进行排序,排序后,将前N个感兴趣程度对应的待推荐的目标物品推荐给用户;N为正整数。
8.一种设备,其特征在于,包括:
至少一个处理器;以及
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现权利要求1-6任一项所述的基于目标物品增强表示的用户个性化信息推荐方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于被所述计算机执行以实现权利要求1-6任一项所述的基于目标物品增强表示的用户个性化信息推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110498063.4A CN113220994B (zh) | 2021-05-08 | 2021-05-08 | 基于目标物品增强表示的用户个性化信息推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110498063.4A CN113220994B (zh) | 2021-05-08 | 2021-05-08 | 基于目标物品增强表示的用户个性化信息推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113220994A CN113220994A (zh) | 2021-08-06 |
CN113220994B true CN113220994B (zh) | 2022-10-28 |
Family
ID=77091638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110498063.4A Active CN113220994B (zh) | 2021-05-08 | 2021-05-08 | 基于目标物品增强表示的用户个性化信息推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113220994B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114581177B (zh) * | 2022-02-17 | 2024-07-09 | 平安科技(深圳)有限公司 | 产品推荐方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776881A (zh) * | 2016-11-28 | 2017-05-31 | 中国科学院软件研究所 | 一种基于微博平台的领域信息推荐***及方法 |
CN107967320A (zh) * | 2017-11-23 | 2018-04-27 | 南京邮电大学 | 一种用户社会地位增强的矩阵分解项目推荐算法 |
CN110110094A (zh) * | 2019-04-22 | 2019-08-09 | 华侨大学 | 基于社交网络知识图谱的跨网络人物关联方法 |
CN111310056A (zh) * | 2020-03-11 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 基于人工智能的信息推荐方法、装置、设备及存储介质 |
CN112069408A (zh) * | 2020-06-15 | 2020-12-11 | 北京理工大学 | 一种融合关系抽取的推荐***及方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9336546B2 (en) * | 2014-03-27 | 2016-05-10 | Microsoft Technology Licensing, Llc | Recommendation system with multi-dimensional discovery experience |
-
2021
- 2021-05-08 CN CN202110498063.4A patent/CN113220994B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776881A (zh) * | 2016-11-28 | 2017-05-31 | 中国科学院软件研究所 | 一种基于微博平台的领域信息推荐***及方法 |
CN107967320A (zh) * | 2017-11-23 | 2018-04-27 | 南京邮电大学 | 一种用户社会地位增强的矩阵分解项目推荐算法 |
CN110110094A (zh) * | 2019-04-22 | 2019-08-09 | 华侨大学 | 基于社交网络知识图谱的跨网络人物关联方法 |
CN111310056A (zh) * | 2020-03-11 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 基于人工智能的信息推荐方法、装置、设备及存储介质 |
CN112069408A (zh) * | 2020-06-15 | 2020-12-11 | 北京理工大学 | 一种融合关系抽取的推荐***及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113220994A (zh) | 2021-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gabriel De Souza et al. | Contextual hybrid session-based news recommendation with recurrent neural networks | |
Lau et al. | Parallel aspect‐oriented sentiment analysis for sales forecasting with big data | |
US11436487B2 (en) | Joint embedding of corpus pairs for domain mapping | |
CN112131350B (zh) | 文本标签确定方法、装置、终端及可读存储介质 | |
Chen et al. | General functional matrix factorization using gradient boosting | |
CN110110233B (zh) | 信息处理方法、装置、介质和计算设备 | |
CN112163165A (zh) | 信息推荐方法、装置、设备及计算机可读存储介质 | |
CN112231569B (zh) | 新闻推荐方法、装置、计算机设备及存储介质 | |
US10657189B2 (en) | Joint embedding of corpus pairs for domain mapping | |
US11276099B2 (en) | Multi-perceptual similarity detection and resolution | |
CN112395487B (zh) | 信息推荐方法、装置、计算机可读存储介质及电子设备 | |
US20220277031A1 (en) | Guided exploration for conversational business intelligence | |
Maupomé et al. | Early Detection of Signs of Pathological Gambling, Self-Harm and Depression through Topic Extraction and Neural Networks. | |
US20230237093A1 (en) | Video recommender system by knowledge based multi-modal graph neural networks | |
US10642919B2 (en) | Joint embedding of corpus pairs for domain mapping | |
CN111563158A (zh) | 文本排序方法、排序装置、服务器和计算机可读存储介质 | |
Yang et al. | Enhancing recommendation on extremely sparse data with blocks-coupled non-negative matrix factorization | |
CN111429161B (zh) | 特征提取方法、特征提取装置、存储介质及电子设备 | |
CN112784157A (zh) | 行为预测模型的训练方法、行为预测方法及装置、设备 | |
Ertekin et al. | Approximating the crowd | |
US20220366295A1 (en) | Pre-search content recommendations | |
CN113220994B (zh) | 基于目标物品增强表示的用户个性化信息推荐方法 | |
Bhatnagar et al. | A novel aspect based framework for tourism sector with improvised aspect and opinion mining algorithm | |
Vielma et al. | Sentiment analysis with novel GRU based deep learning networks | |
Shen et al. | A deep embedding model for co-occurrence learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |