CN116452293A

CN116452293A - 一种融合物品受众特征的深度学习推荐方法及***

Info

Publication number: CN116452293A
Application number: CN202310416927.2A
Authority: CN
Inventors: 邓江洲; 王永; 陈俊谕; 郭琦; 伍奇; 陈思彤; 张雪
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2023-04-18
Filing date: 2023-04-18
Publication date: 2023-07-18

Abstract

本发明提出一种融合物品受众特征的深度学习推荐方法及***，属于推荐技术领域。包括有数据收集及数据清洗；转化评分为隐式反馈矩阵；获取物品的历史交互用户列表；运用注意力机制，自适应计算物品的个性化受众特征；通过线性回归与向量内积学习数据中的低阶特征；设计特征交互层以显式地进行特征交叉；利用多层全连接神经网络进一步学习高阶特征；融合低阶和高阶特征信息输出目标用户对物品的预测值；对预测集合排序，进行top‑N推荐；经过多次实验验证，本发明能够充分挖掘历史交互信息中的潜在价值，提高推荐质量，展现出良好的应用潜力。

Description

一种融合物品受众特征的深度学习推荐方法及***

本发明属于推荐技术领域，具体的说是一种融合物品受众特征的深度学习推荐方法及***。

背景技术

信息***时代,如何从海量信息中快速过滤出适合用户的个性化产品和服务从而提高用户体验,是互联网数字平台需要解决的首要问题。推荐模型作为重要的决策支持工具,能够基于用户的历史行为(如评价,点击或浏览商品等)预测出用户接受推荐商品的可能性,从而有效缓解信息过载。目前,推荐***已被广泛应用于电子商务、网络营销、新闻平台等诸多领域。

尽管引入深度学习的方法有效增强了模型对数据进行非线性建模的能力,但这些模型难以有效捕获数据内部蕴含的价值信息,因为它们只是简单地将用户特征和物品特征映射为低维稠密向量,未强调推荐应用背后的机理引导以及对用户与物品的历史交互信息的有效挖掘。许多模型将用户与物品的交互信息仅用于模型参数的优化过程,而忽略了数据中潜在的协同信息,其能够揭示用户之间的行为相似性,这严重阻碍了模型性能的进一步提升。其次,现有的基于深度学习的推荐模型主要利用向量拼接与神经网络相结合的方式来提取高阶特征。然而,随着神经网络层数的加深,在网络前向传播过程中可能存在信息丢失的问题。同时,神经网络通常是以隐式方式进行特征交叉,过程难以控制,因此可能会出现无法有效学习多种特征组合的情况。

发明内容

针对上述问题，本发明一种融合物品受众特征的深度学习推荐方法及***，包括数据采集及处理模块、模型训练模块、模型预测模块以及推荐模块，其设置于服务器中，而服务器与多个数据库相连，所述数据库连接多个智能终端：

所述智能终端用于采集用户的行为数据，并交由数据库进行储存；

所述数据库用于存储用户的历史行为信息，并交由服务器进行处理

所述数据采集及处理模块，用于对数据库的数据信息进行加工处理，以获得满足***需要的标准化数据；

所述模型训练模块，用于对标准化数据进行建模并训练直到模型收敛；

所述模型预测模块，用于利用完成训练的模型对用户的个性化偏好进行预测；

所述推荐模块，用于根据预测评分值大小进行排序并形成推荐物品列表，以提高用户满意度。

本发明所述的深度学习推荐***，所述数据处理模块，用于将用户对物品的反馈信息转换为数值为0或1的隐式反馈矩阵其中数值为1代表用户与物品产生过交互，数值为0则代表用户与物品为产生过交互，|U|表示用户数，|I|表示物品数。采集物品的历史交互用户集合，并将物品和用户信息转换为低维稠密的特征向量e，其主要处理步骤如下：

S1：获取所有数据信息：用户id、物品id、评分信息、物品的历史交互用户集合H；

S2：根据评分信息生成隐式反馈矩阵R；

S3：将用户id转换为onehot向量x_u；

S4：将项目id转换为onehot向量x_i；

S5：将用户集合H中的用户分别转换为各自的onehot向量；

S6：随机初始化符合高斯分布的用户和物品的映射矩阵W_u、W_i

S7：将onehot向量转换为低维稠密的特征向量e，方式如下所示：

e_u＝W_ux_u

本发明所述的深度学习推荐***，所述模型训练模块由物品受众特征聚合模块、低阶特征提取模块、特征交互模块、全连接神经网络模块、模型参数更新模块。

所述物品受众特征聚合模块包括如下几个步骤：

S1：利用基于多层感知机的注意力机制计算目标用户与物品的历史交互用户的相关性系数，方式如下所示：

s_k＝h^Tσ(W_poolf(e_u，e_k，e_u⊙e_k)+b)

其中,σ分别为权重矩阵、偏置向量、回归系数以及激活函数,e_u为目标用户u的特征向量,t代表隐藏层的神经元个数,激活函数σ选择ReLU来增强非线性表达能力,f(x)为向量拼接操作函数,⊙代表向量对应元素积；

S2：通过softmax函数将相关性系数进行归一化得到注意力分布a_k，方式如下所示：

S3：根据注意力分布a_k，通过加权求和获取物品的受众特征向量，方式如下所示：

其中为物品i的历史交互用户集合，K为与物品i有交互的用户数量，为用户k的特征向量。

所述低阶特征提取模块，用于通过线性回归和向量内积学习数据中的低阶特征信息，其表达式如下：

其中,x为将目标用户和物品的one-hot向量拼接后的向量,e_u，e_i分别为目标用户和物品的特征向量,为物品受众的特征向量,/>为回归系数,·表示向量内积运算。

所述特征交互模块，用于进行显式地特征交叉来获取高阶特征信息并通过残差连接以保持信息在神经网络前向传播过程中的完整性，具体包含以下几个步骤：

S1：将目标用户的特征向量e_u、物品的特征向量e_i以及物品的受众特征向量并对所有输入向量进行堆叠,形成一个特定矩阵E；

S2：通过计算矩阵中任意两特征向量之间的对应元素积来进行显式的特征交叉,并将前一层的输出矩阵作为后一层的输入；

S3：利用残差连接将各层的输出矩阵融合成特征组合信息向量p：

其中，n特征交互层的层数,为第i层的输出矩阵，/>表示矩阵的第j行。

所述全连接神经网络模块，用于在特征组合信息向量p的基础上通过多层非线性神经网络进一步学习数据中的高阶特征，其表达式如下：

Z₁＝σ₁(W₁p+b₁)

Z₂＝σ₂(W₂Z₁+b₂)

Z_H＝σ_H(W_H-1Z_H-1+b_H-1)

其中,H代表全连接神经网络的层数,p为特征交互层的输出,W_H，b_H，σ_H分别代表第H层的权重矩阵、偏置向量、激活函数。最后，结合低阶和高阶特征信息输出预测值。

所述模型参数更新模块，用于根据损失值更新模型参数直至收敛，具体包含以下几个步骤：

S1：构建损失函数，其表达式如下：

其中,Θ＝{W_embed，W_pool，W_H，W_L},其分别为模型嵌入层、物品受众特征聚合模块、高阶特征提取模块、低阶特征提取模块的权重参数，将特征交互模块与全连接神经网络模块合称为高阶特征提取模块；Y，Y^-分别代表模型训练的正负样本集合；y_ui为真实值,为预测值,λ为正则项系数；

S2：根据预测值和真实值y_ui计算损失值；

S3：采用Adam优化器更新模型参数；

S4：循环遍历正负样本集合，直到损失函数值不再减小；

本发明所述的深度学习推荐***，所述模型预测模块，用于利用完成训练融的模型获取低阶和高阶特征信息，将其融合并输出预测值，其表达式如下：

其中,Z_L为低阶特征提取模块的输出,Z_H为高阶特征提取模块的输出,激活函数σ为sigmoid函数，其表达式如下：

本发明所述的深度学习推荐***，所述推荐模块，用于根据各个用户对不同物品的预测评分值大小进行排序推荐，并形成物品推荐列表，进而提高推荐质量。

本发明的有益效果在于：本发明利用注意力机制从用户与物品的历史交互记录中自适应地计算出物品的受众特征，将其作为反映目标用户偏好的重要补充信息,从而增强应对数据稀疏性问题的能力。提出了特征交互层,能够显式地控制各种特征的交叉,丰富特征交叉的方式，并通过残差连接来保证信息在神经网络前向传播的完整性。设计了低阶特征提取模块和高阶特征模块，同时学习数据中的低阶特征和高阶特征，以提高推荐性能。

附图说明

图1是本发明的***框图；

图2是本发明的模型框架图

图3是本发明中特征交互层的示例图；

图4是本发明在三个数据集下不同推荐列表长度下的precision值变化情况；

图5是本发明在三个数据集下不同推荐列表长度下的recall值变化情况；

图6是本发明在三个数据集下不同推荐列表长度下的f1值变化情况；

图7是本发明在三个数据集下不同推荐列表长度下的ndcg值变化情况；

具体实施方式

为了使本发明的目的、技术方案及优点更加明确，下面结合附图对本发明的具体实施方式以及工作原理作进一步详细说明。

从图1可以看出，一种融合物品受众特征的深度学习推荐方法及***，包括数据采集及处理模块、模型训练模块、模型预测模块以及推荐模块，其设置于服务器中，而服务器与多个数据库相连，所述数据库连接多个智能终端；用户在智能终端上产生行为信息；数据库负责采集不同智能终端的行为数据并进行储存；所述数据采集及处理模块，用于对数据库的数据信息进行加工处理，以获得满足***需要的标准化数据；所述模型训练模块，用于对标准化数据进行建模并训练直到模型收敛；所述模型预测模块，用于利用完成训练的模型对用户的个性化偏好进行预测；所述推荐模块，用于根据预测评分值大小进行排序并形成推荐物品列表，以提高用户满意度。

从图2可以看出，本发明所述的深度学习推荐***，所述模型训练模块由物品受众特征聚合模块、低阶特征提取模块、特征交互模块、全连接神经网络模块、模型参数更新模块。首先获取物品的历史交互用户集合，并将用户ID信息和物品ID信息转换为onehot向量；对onehot向量进行嵌入操作将其转换为低维稠密的特征向量；利用注意力机制计算目标用户与物品历史交互集合中的用户的相关性，并通过加权求和自适应地获取物品的个性化受众特征；在低阶特征提取模块利用线性回归和特征向量内积来学习数据中的低阶特征；提出特征交互层通过特征向量对应元素积以及残差连接来提取多阶特征信息组合；搭建多层全连接神经网络进一步学习数据中潜在的高阶特特征信息；融合低阶和高阶特征信息输出预测值；

图3是本发明中特征交互层的示例图。从图2可以看出，本发明设计的特征交互层首先将输入特征向量堆叠为一个特定矩阵；通过特征向量间的对应元素积以完成特征交叉，并将前层的输出作为后层的输入，因此交叉特征的阶数会随着特征交互层的加深而提高；最后通过残差连接融合各层捕获的交叉特征，其既能获取多阶特征组合信息，还能保持信息在神经网络前向传播的完整性，为后续神经网络进一步学习高阶特征奠定了良好基础。

进一步的，以下述情况为例子进行说明：

假设有m个用户U＝{u₁，u₂，...，u_m}和n个项目I＝{i₁，i₂，...，i_n}，用于将用户对物品的反馈信息转换为数值为0或1的隐式反馈矩阵其中数值为1代表用户与物品产生过交互，数值为0则代表用户与物品为产生过交互，|U|表示用户数，|I|表示物品数。物品i的历史交互用户集合H_i。

首先通过数据采集和数据清洗获取满足***需要的标准化数据信息，整个所提的推荐***的具体实施步骤如下所示：

S2：根据评分信息生成隐式反馈矩阵R；将用户id转换为onehot向量x_u；将项目id转换为onehot向量x_i；将用户集合H中的用户分别转换为各自的onehot向量；

S3：随机初始化符合高斯分布的用户和物品的映射矩阵W_u、W_i；将onehot向量转换为低维稠密的特征向量e，方式如下所示：

e_u＝W_ux_u

S4：利用基于多层感知机的注意力机制计算目标用户与物品的历史交互用户的相关性系数，方式如下所示：

s_k＝h^Tσ(W_poolf(e_u，e_k，e_u⊙e_k)+b)

其中,σ分别为权重矩阵、偏置向量、回归系数以及激活函数,e_u为目标用户u的特征向量,t代表隐藏层的神经元个数,激活函数σ选择ReLU来增强非线性表达能力,f(x)为向量拼接操作函数,⊙代表向量对应元素积；通过softmax函数将相关性系数进行归一化得到注意力分布a_k，方式如下所示：

根据注意力分布a_k，通过加权求和获取物品的受众特征向量，方式如下所示：

S5：在低阶特征提取模块中通过线性回归和向量内积学习数据中的低阶特征信息，其表达式如下：

S6：将目标用户的特征向量e_u、物品的特征向量e_i以及物品的受众特征向量并对所有输入向量进行堆叠,形成一个特定矩阵E；通过计算矩阵中任意两特征向量之间的对应元素积来进行显式的特征交叉,并将前一层的输出矩阵作为后一层的输入；利用残差连接将各层的输出矩阵融合成特征组合信息向量p：

S7：在全连接神经网络模块中，在特征组合信息向量p的基础上通过多层非线性神经网络进一步学习数据中的高阶特征，其表达式如下：

Z₁＝σ₁(W₁p+b₁)

Z₂＝σ₂(W₂Z₁+b₂)

Z_H＝σ_H(W_H-1Z_H-1+b_H-1)

其中,H代表全连接神经网络的层数,p为特征交互层的输出,W_H，b_H，σ_H分别代表第H层的权重矩阵、偏置向量、激活函数。

S7：融合低阶和高阶特征信息输出预测值，其表达式如下：

S8：训练参数并完成推荐。基于交叉熵误差来构建损失函数,并采用L₂正则化防止过拟合，其表达式如下：

其中,Θ＝{W_embed，W_pool，W_H，W_L},其分别为嵌入层、聚合层、高阶特征提取模块、低阶特征提取模块的权重参数；Y，Y^-分别代表训练的正负样本集合；y_ui为真实值,为预测值,λ为正则项系数；采用Adam优化器更新参数；利用优化后的参数输出用户对物品的偏好预测值，并按照评分预测值大小形成推荐物品列表。

图4-7分别度量了模型在四个方面的指标表现，分别为推荐精确率(Precision)、召回率(Recall)、F1值以及归一化折损累计增益(NDCG)，其定义式如下:

其中,S_r(u_i)为推荐给用户i的物品集,S_a(u_i)为用户i实际交互过的物品集。Precision用于测试推荐给用户的物品集中用户真实交互过的数量与推荐的物品集数量的比例。

Recall用于测试推荐给用户的物品集中用户真实交互过的数量与用户实际所有交互过的物品集数量的比例。F1值综合考虑了精确率和召回率:

NDCG用来衡量推荐排序质量。其中,表示向用户i推荐K个物品的折损累计增益,rel表示位置k的推荐结果的相关性,若物品在用户的真实购买物品集中,则rel_k的值为1,否则为0。/>是在按rel_k降序排列的推荐列表上计算得到的理想/>。K表示推荐列表长度的大小。

应当指出的是，以上实施说明并非是对本发明的限制，本发明也不局限于上述举例，本技术领域的普通技术人员在本发明的示值范围内所做出的变化、改动、添加修改或替换，其均应涵盖在本发明的权利要求范围之中。

Claims

1.一种融合物品受众特征的深度学习推荐方法及***，其特征在于，包括数据采集及处理模块、模型训练模块、模型预测模块以及推荐模块，其设置于服务器中，而服务器与多个数据库相连，所述数据库连接多个智能终端；

所述数据库用于存储用户的历史行为信息，并交由服务器进行处理；

2.根据权利要求1所述的一种融合物品受众特征的深度学习推荐方法及***，其特征在于，所述数据采集及处理模块，用于将用户对物品的反馈信息转换为数值为0或1的隐式反馈矩阵其中数值为1代表用户与物品产生过交互，数值为0则代表用户与物品为产生过交互，|U|表示用户数，|I|表示物品数。采集物品的历史交互用户集合，并将物品和用户信息转换为低维稠密的特征向量e，其主要处理步骤如下：

S2：根据评分信息生成隐式反馈矩阵R；

S3：将用户id转换为onehot向量x_u；

S4：将项目id转换为onehot向量x_i；

S5：将用户集合H中的用户分别转换为各自的onehot向量；

e_u＝W_ux_u。

3.根据权利要求1所述的一种融合物品受众特征的深度学习推荐方法及***，其特征在于，所述模型训练模块由物品受众特征聚合模块、低阶特征提取模块、特征交互模块、全连接神经网络模块、模型参数更新模块，所述物品受众特征聚合模块包括如下几个步骤：

s_k＝h^Tσ(W_poolf(e_u，e_k，e_u⊙e_k)+b)

其中，其中,σ分别为权重矩阵、偏置向量、回归系数以及激活函数,e_u为目标用户u的特征向量,t代表隐藏层的神经元个数,激活函数σ选择ReLU来增强非线性表达能力,f(x)为向量拼接操作函数,⊙代表向量对应元素积；

其中为物品i的历史交互用户集合，K为与物品i有交互的用户数量，/>为用户k的特征向量。

Z₁＝σ₁(W₁p+b₁)

Z₂＝σ₂(W₂Z₁+b₂)

…

Z_H＝σ_H(W_H-1Z_H-1+B_H-1)

S1：构建损失函数，其表达式如下：

S2：根据预测值和真实值y_ui计算损失值；

S3：采用Adam优化器更新模型参数；

S4：循环遍历正负样本集合，直到损失函数值不再减小。

4.根据权利要求1所述的一种融合物品受众特征的深度学习推荐方法及***，其特征在于，所述模型预测模块，用于利用完成训练融的模型获取低阶和高阶特征信息，将其融合并输出预测值，其表达式如下：

5.根据权利要求1所述的一种融合物品受众特征的深度学习推荐方法及***，其特征在于，所述推荐模块，用于根据各个用户对不同物品的预测评分值大小进行排序推荐，并形成物品推荐列表，进而提高推荐质量。