CN111178986B

CN111178986B - 用户-商品偏好的预测方法及***

Info

Publication number: CN111178986B
Application number: CN202010098177.5A
Authority: CN
Inventors: 王庆先; 张枭; 王昊天; 李欣欣
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2020-02-18
Filing date: 2020-02-18
Publication date: 2023-04-07
Anticipated expiration: 2040-02-18
Also published as: CN111178986A

Abstract

本发明公开了一种用户‑商品偏好的预测方法及***，涉及计算机数据处理技术领域，其中预测***包括日志召回模块、数据预处理模块、参数控制模块、模型训练模块、预测结果生成模块和数据输出模块，该方法利用深度学习突出的表征能力，通过在预测模型中引入深度学习思想，利用其表征能力来挖掘用户和商品的隐含特征，从而提供准确的用户‑商品评分预测结果，为用户提供个性化、便捷的推荐服务；同时本发明还加入了并行计算来缩短训练时间，实现了在保证准确性的同时将模型的计算消耗限制在可接受的范围内，确保其具有商用价值，可泛用于各种推荐***。

Description

用户-商品偏好的预测方法及***

技术领域

本发明涉及计算机数据处理技术领域，具体而言，涉及一种使用并行计算的基于深度隐特征的用户-商品偏好的预测方法及***。

背景技术

随着互联网的发展，电商平台因其便捷性和丰富性已深入日常生活的各个方面，然而在面对种类繁多的商品时，多数的用户往往淹没在诸多的选择中，无法迅速便捷地找到自己喜欢的商品，这与便捷的初衷恰恰相反。因此针对用户个人条件和喜好进行定制化的推荐就显得十分必要。在多数的电商平台中，每天活跃着大量的用户，交易记录、浏览历史、评分评价数据等为平台推荐提供了最原始的数据积累。通常的做法是利用用户对商品的评分形成庞大的用户-商品评分矩阵，然后通过评分高低来预测用户对商品的青睐程度，由于***中用户群体庞大加之商品种类繁多，实际应用中每个用户又不可能对所有的商品一一评分，所以通常情况下用户-商品评分矩阵表现为极为稀疏的高维矩阵。

根据在电商平台的历史评分和行为数据，我们可以了解分析用户(商品)的偏好(特征)，在此基础上建立有效的用户-商品喜好的预测模型。并通过用户的历史行为数据来仿真实验，从而为个性化的推荐策略提供重要的科学依据。

目前，已经有很多关于用户-商品偏好的预测方法。矩阵分解模型是推荐***中经典的协同过滤模型，其通过将用户和商品映射到低维向量空间，然后计算用户和商品的向量内积来预测新的未知评分。然而，在实际的场景中，用户对商品的评分记录并不容易获取，或者说评分数据只是推荐***中用户行为数据中非常小的一部分，大量的用户并不会对每个自己浏览过或者购买过的商品编写评价，所以单纯的评分数据并不能很好的建模用户和商品，对应的预测结果也就无法做到很高的准确度。

近年来，深度学***台中庞大的用户量和商品量将导致神经网络中的参数量、计算量和运行时内存消耗相对于经典算法以几何倍数增长，同时加之神经网络冗长的训练时间将进一步降低其实用价值。

发明内容

本发明在于提供一种用户-商品偏好的预测方法及***，其能够针对不同目标用户进行定制化的精准商品预测和推荐，以及在保证准确性的同时将模型的计算消耗限制在可接受的范围内，确保其具有商用价值。

本发明采取的技术方案如下：

第一方面，本发明提供了一种用户-商品偏好的预测方法，包括以下步骤：

S1、收集用户在购物平台上的日志文件，并从中获取用户的日常行为信息数据；

S2、对所述日常行为信息数据进行预处理，得到可直接使用的用户-商品评分数据；

S3、构建基于深度隐特征的用户-商品偏好预测模型，该模型为具有表征能力的分解模型，其能够挖掘用户和商品的隐含特征，初始化用户-商品偏好预测模型的权重参数，其中初始化迭代轮数T＝0，定义最大迭代轮数为Tm；

S4、对于目标用户和商品，利用用户-商品偏好预测模型，并行的计算用户和商品的抽象隐特征向量，以及当前未知的用户-商品预测评分；

S5、计算当前未知的用户-商品预测评分相对于用户-商品评分数据的误差；

S6、若用户-商品偏好预测模型收敛或者T＝Tm，则执行步骤S8，否则执行S7；

S7、根据误差进行反向传播，更新用户-商品偏好预测模型中的参数，T＝T+1，跳转至步骤S4；

S8、根据当前用户-商品偏好预测模型计算得到的用户和商品的抽象隐特征向量，生成最终的用户-商品预测评分；

S9、输出最终的用户-商品预测评分，以及该最终的用户-商品预测评分所对应的用户和商品的抽象隐特征向量，完成用户-商品偏好的预测。

本技术方案的技术效果是：引入深度学习思想，仅利用模型的表征能力来完成对用户和商品隐含特征的抽象建模，同时加入并行计算来缩短训练时间，能够根据用户-商品的历史交互记录进行准确的用户和商品抽象，能够针对不同用户进行定制化的精准商品预测和推荐；在保证准确性的同时将模型的计算消耗限制在可接受的范围内，确保其具有商用价值。

可选地，所述日常行为信息数据包括用户在购物平台上的点击行为、浏览行为、收藏行为、购买行为和评论行为。

具体地，所述步骤S2具体包括：

将日常行为信息数据中的用户集合记为M，商品集合记为N；

由日常行为信息数据中直接的评分数据构成了一个|M|行、|N|列的用户-商品评分矩阵R；

将日常行为信息数据中不包含评分的数据补充到用户-商品评分矩阵R中，得到用户-商品交互评分矩阵X：

其中，i∈M，j∈N；

将用户-商品交互评分矩阵X作为所述可直接使用的用户-商品评分数据。

更具体地，所述步骤S4中，用户i的抽象隐特征向量m_i和商品j的抽象隐特征向量n_j表示如下：

其中为V_i和V_j为用户-商品嵌入网络输出的用户i和商品j的稠密向量表示，W_U1和W_I1分别为用户和商品感知器第1层的权重矩阵，b_U1和b_I1分别为用户和商品感知器第1层的偏执参数，φ表示ReLu激活函数。

更具体地，

其中，emb(Θ)表示嵌入运算，fea_i和id_i分别表示用户i的属性和ID输入，fea_j和id_j分别表示商品j的属性和ID输入，Θ代表向量过程中的权重参数。

具体地，所述步骤S7中，使用利用梯度下降法对用户-商品偏好预测模型进行反向传播，更新模型的权重参数。

第二方面，本发明提供了一种用户-商品偏好预测***，包括：

日志召回模块，其用于收集用户在购物平台上的日志文件，并从中获取用户的日常行为信息数据；

数据预处理模块，其用于接收并预处理所述日常行为信息数据，得到模型训练过程中可直接使用的用户-商品评分数据；

参数控制模块，其用于初始化基于深度隐特征的用户-商品偏好预测模型的权重参数，并传递参数和控制用户-商品偏好预测模型的训练；

模型训练模块，其包括并行计算单元、线程通信单元和参数更新单元，所述并行计算单元用于并行的计算用户和商品的抽象隐特征向量和未知的用户-商品预测评分，所述线程通信单元用于使并行训练单元和参数更新单元的线程同步和数据交互，所述参数更新单元用于反向传播更新所述用户-商品偏好预测模型的权重参数；

预测结果生成模块，其用于生成最终未知的用户-商品预测评分；

数据输出模块，用于输出最终的用户-商品预测评分及其对应的用户和商品的抽象隐特征向量。

本技术方案的技术效果是：提供了一种实现用户-商品偏好预测方法的***，该***引入深度学习训练架构，模型训练模块设有并行计算单元，能够实现并行计算以缩短训练时间。

具体地，所述参数控制模块包括初始化单元和参数控制单元；所述初始化单元用于初始化基于深度隐特征的用户-商品偏好预测模型的权重参数，其包括并行的用户-商品的嵌入网络和后续的多层感知器层；所述参数控制单元用于传递参数和控制用户-商品偏好预测模型的训练。

更具体地，初始化单元配置为初始化模型参数，包括并行的用户-商品嵌入网络和多层用户-商品感知器层；用户-商品嵌入网络包括初始化用户和商品的嵌入层大小embed_size和初始稠密向量表示，embed_size为初始稠密表示的维度；多层感知器层的初始化层数小于10。

进一步地，该预测***还包括数据存储模块，其用于存储预测***中的数据。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举本发明实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1是实施例中所述用户-商品偏好的预测***示意框图；

图2是实施例中所述用户-商品偏好的预测方法流程示意图；

图3是实施例中通过用户i和商品j的隐特征来对未知评分值进行预测的过程示意图；

图4是实施例中前后数据分析过程中RMSE对比图，RMSE是预测误差的衡量尺度，RMSE越小精度越高。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

请参照图1，本实施例提供了一种用户-商品偏好预测***，包括：

数据预处理模块，其用于接收并预处理日常行为信息数据，得到模型训练过程中可直接使用的用户-商品评分数据；

参数控制模块，其包括初始化单元和参数控制单元，初始化单元用于初始化基于深度隐特征的用户-商品偏好的预测过程中涉及的相关参数；参数控制单元用于控制参数和模型的训练过程；

模型训练模块，其包括并行计算单元、线程通信单元和参数更新单元，并行计算单元用于并行的计算用户和商品的抽象隐特征向量和未知的用户-商品预测评分，线程通信单元用于使并行训练单元和参数更新单元的线程同步和数据交互，参数更新单元用于反向传播更新用户-商品偏好预测模型的权重参数；

预测结果生成模块，其用于生成最终未知的用户-商品预测评分，并将最终未知的用户-商品预测评分存入的数据存储模块，包括参数接收单元和预测结果生成单元；

数据输出模块，用于输出最终的用户-商品预测评分及其对应的用户和商品的抽象隐特征向量；

数据存储模块，其用于存储预测***中的数据。

用户在使用电商购物平台时会产生大量的与***交互的使用记录，在本实施例中，日志召回模块将在客户授权的情况下从客户端收集用户日常使用平台时产生的日志文件。

在本实施例中，日志召回模块将在客户授权的情况下从客户端收集用户日常使用平台时产生的日志文件。

在本实施例中，初始化单元配置为初始化模型参数，包括并行的用户、商品的嵌入网络和后续的多层感知器层。嵌入网络包括：初始化用户和商品的嵌入层大小embed_size，每个向量作为用户或商品的初始稠密表示，embed_size的大小即为初始的稠密向量的维度，使用标准正态分布进行初始化。多层感知器层包括：初始化多层感知器的层数layer_size，初始化为小于10的正整数；初始化多层感知器每一层的感知器数量ln(n＝1,2…,layer_size)，多层感知器最后一层感知器的数量即ln决定了最终用户和商品隐特征的维度，分别初始化递减的小于embed_size的正整数；初始化多层感知器的激活函数，默认初始化为ReLu。初始化整个模型的优化器optim，反向传播优化网络时使用的方法，默认初始化为SGD；初始化模型的学习率alpha，用于控制反向传播时的步长，初始化为较小的正数，默认为0.001；初始化dropout，训练中随机丢掉网络单元的比例，初始化为小于1的浮点数；初始化训练过程中停止训练的误差精度tol，tol是判断训练是否结束的参数，初始化为极小的正数。

实施例2

请参照图2，本实施例提供了一种用户-商品偏好的预测方法，其使用了实施例1所述用户-商品偏好的预测***，包括以下步骤：

S1、日志召回模块在用户允许的条件下，收集用户在购物平台上的日志文件，并从中获取用户的日常行为信息数据，提供给用户-商品偏好的预测***；

S2、利用用户-商品偏好的预测***的数据预处理模块接收日志召回模块收集的日常行为信息数据，将其处理成可直接使用的用户-商品评分数据并存入数据存储模块；

S3、结合预测***参数控制模块中的参数初始化单元进行用户-商品偏好预测模型的构建和初始化，其中初始化迭代轮数T＝0，定义最大迭代轮数为Tm；

S4、对于目标用户和商品，利用用户-商品偏好预测模型的并行计算单元并行的计算用户和商品的抽象隐特征向量，以及当前未知的用户-商品预测评分；

用户在使用购物平台时会产生大量的与***交互的使用记录，在本实施例中，日常行为信息数据包括用户在购物平台上的点击行为、浏览行为、收藏行为、购买行为和评论行为。

在日常行为信息数据中，包括少量直接可用的评分数据，以及大量的不包含评分但从一定程度上反应了用户偏好的历史行为数据，因此在本实施例中，步骤S2具体包括：

将日常行为信息数据中的用户集合记为M，商品集合记为N；

其中，i∈M，j∈N；

将用户-商品交互评分矩阵X作为可直接使用的用户-商品评分数据。

在本实施例中，步骤S3具体包括：构建如附图3所示的模型结构，初始化模型参数，包括并行的用户、商品的嵌入网络和后续的多层感知器层。嵌入网络包括：初始化用户和商品的嵌入层大小embed_size，每个向量作为用户或商品的初始稠密表示，embed_size的大小即为初始的稠密向量的维度，使用标准正态分布进行初始化。多层感知器层包括：初始化多层感知器的层数layer_size，初始化为小于10的正整数；初始化多层感知器每一层的感知器数量ln(n＝1,2…,layer_size)，多层干机器最后一层感知器的数量即ln决定了最终用户和商品隐特征的维度，分别初始化递减的小于embed_size的正整数；初始化多层感知器的激活函数，默认初始化为ReLu。初始化整个模型的优化器optim，反向传播优化网络时使用的方法，默认初始化为SGD；初始化模型的学习率alpha，用于控制反向传播时的步长，初始化为较小的正数，默认为0.001；初始化迭代轮数T＝0，定义最大迭代轮数为Tm；初始化dropout，训练中随机丢掉网络单元的比例，初始化为小于1的浮点数；初始化训练过程中停止训练的误差精度tol，tol是判断训练是否结束的参数，初始化为极小的正数。

在本实施例中，步骤S4生成的评分结果为训练中的临时数据(用来更新用户-商品偏好预测模型中的参数)，步骤S8生成的结果为训练好模型后输出的准确预测。

在本实施例的S4中，用户-商品偏好预测模型的输入包含2个部分，分别进行用户和商品的特征提取，输入分别为用户的属性数据、用户的ID和商品的属性数据、商品的ID。在嵌入层模型分为4个线程并行处理这些输入，针对连续型变量在该变量空间中进行标准化缩放：

使得所有变量落在(0,1)区间中；针对离散型变量则进行独热编码，转化为只包含0和1的向量。另外针对用户和商品ID这类极端稀疏的向量，模型在独热编码后紧接着添加了embedding layer来将这部分输入转化为稠密向量。Embedding的本质为一层全连接的神经网络：

Y＝WX+b

其中X为经过独热编码的极端稀疏的用户(商品)ID向量，W为网络的权重系数矩阵(矩阵大小于输入向量的维度和上文所述emb_size参数决定)，b为偏执(可根据使用环境决定是否需要)，Y为网络的输出，即对用户(商品)ID进行embedding后得到的稠密向量。在嵌入层的最后，将4个线程分别处理得到的属性和ID向量两两进行拼接得到原始的用户和商品的稠密向量表示：

其中V_i和V_j分别为用户和商品的抽象向量表示，emb(Θ)表示嵌入运算，fea_i和id_i分别表示用户i的属性和ID输入，fea_j和id_j分别表示商品j的属性和ID输入，Θ代表向量过程中的权重参数。

在上述4个线程分别对用户特征、用户ID、商品ID和商品属性进行处理的过程中，由于参数量和处理流程不同，在实际工作中对用户和商品属性相关的计算耗时会低于对ID相关的计算过程，此时将依赖本装置中线程通信单元阻塞率先完成的线程，并在所有线程完成计算后唤醒阻塞线程完成嵌入层最终的向量拼接工作。

得到用户和商品的向量表示后V_i和V_j，分别输入附图3所示模型结构的多层感知器层即MLP layer，运算得到最终的用户和商品的隐特征向量m_i和n_j：

其中为V_i和V_j为嵌入层输出的用户i和商品j的原始稠密向量，W_U1和W_I1分别为用户和商品感知器第1层的权重矩阵，b_U2和b_I2分别为用户和商品感知器第1层的偏执参数，φ表示ReLu激活函数，f表示后续多层中与第1层类似的运算。

在本实施例的S5中，当前未知的用户-商品预测评分相对于用户-商品评分数据的误差的计算具体为：

根据多层感知器输出的用户和商品的隐特征向量m_i和n_j，通过点击的方式计算对应的模型预测评分：

其中m_i和n_j分别为上述步骤中输出的用户和商品的隐特征向量，

表示通过模型计算得到的用户i对商品j的评分或者称为偏好，区别于实际交互分数X_ij，其间的误差将作为优化目标在反向传播中利用梯度下降法求解模型参数。在此过程中也将依赖线程通信单元完成多层感知器层用户和商品隐特征向量计算线程的同步工作。

在得到预测评分

后，根据已知的用户-商品交互矩阵X中的交互数据在下述L上累计误差：

其中X_ij为用户i对商品j的实际评分，

为由模型计算得到的用户i对商品j的预测评分，‖Θ‖表示模型中所有参数的正则化项(可选，根据不同情况而定，默认使用参数初始化单元中指定的dropout方法)。

在本实施例的步骤S6中，需比较误差L和允许误差tol，如果L小于tol，则说明模型收敛；如果L大于tol，则说明模型还未收敛，继续比较当前训练轮数T和最大迭代轮数Tm。

在本实施例的步骤S7中，根据误差L，使用参数控制模块的初始化单元中指定的优化器optim利用梯度下降法对模型进行反向传播，更新模型权重参数。

在本实施例的步骤S8中，预测结果生成模块的参数接收单元由参数控制模块传递的参数，结合模型训练模块构造和训练好的模型，预测结果生成模块利用用户和商品的隐特征向量对未知的评分做出预测：

生成的预测结果将存入装置所述的数据存储模块。图3为通过用户i和商品j的隐特征来对未知评分值进行预测的过程示意图。

由图4可以得出，应用本发明方法后，大大提高了模型在为用户进行个性化推荐时的准确度。在实际应用中，可以更好的为用户便捷且符合用户个性化需求的商品。具体地，由图4可以得到，运用了本发明的预测装置和方法后，推荐的准确率相较于之前提升了约5％。即运用本发明的预测装置和方法后，可以明显地提高用户的满意度。

通过以上预测方法与过程，可以提高模型对用户进行个性化推荐时的预测准确度，对平台产品的推销和用户的体验具有重要意义。

本发明所述的一种基于深度隐特征的用户-商品偏好的预测装置和方法，旨在利用深度学习突出的表征能力，通过在经典矩阵分解模型中引入深度学习思想，利用其表征能力来挖掘用户和商品的隐含特征，从而提供准确的用户-商品评分预测结果，为用户提供个性化、便捷的推荐服务；同时本发明还加入了并行计算来缩短训练时间，实现了在保证准确性的同时将模型的计算消耗限制在可接受的范围内，确保其具有商用价值，可泛用于各种推荐***。

以上仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种用户-商品偏好的预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述用户-商品偏好的预测方法，其特征在于，所述日常行为信息数据包括用户在购物平台上的点击行为、浏览行为、收藏行为、购买行为和评论行为。

3.根据权利要求2所述用户-商品偏好的预测方法，其特征在于，所述步骤S2具体包括：

将日常行为信息数据中的用户集合记为M，商品集合记为N；

其中，i∈M，j∈N；

4.根据权利要求3所述用户-商品偏好的预测方法，其特征在于，所述步骤S4中，用户i的抽象隐特征向量m_i和商品j的抽象隐特征向量n_j表示如下：

5.根据权利要求4所述用户-商品偏好的预测方法，其特征在于，

6.根据权利要求1所述用户-商品偏好的预测方法，其特征在于，所述步骤S7中，使用利用梯度下降法对用户-商品偏好预测模型进行反向传播，更新模型的权重参数。

7.一种用户-商品偏好预测***，其特征在于，包括：

预测结果生成模块，其用于生成最终的用户-商品预测评分；

8.根据权利要求7所述的用户-商品偏好的预测***，其特征在于，所述参数控制模块包括初始化单元和参数控制单元；所述初始化单元用于初始化基于深度隐特征的用户-商品偏好预测模型的权重参数，其包括并行的用户-商品的嵌入网络和后续的多层感知器层；所述参数控制单元用于传递参数和控制用户-商品偏好预测模型的训练。

9.根据权利要求7所述用户-商品偏好的预测方法，其特征在于，初始化单元配置为初始化模型参数，包括并行的用户-商品嵌入网络和多层用户-商品感知器层；用户-商品嵌入网络包括初始化用户和商品的嵌入层大小embed_size和初始稠密向量表示，embed_size为初始稠密表示的维度；多层感知器层的初始化层数小于10。

10.根据权利要求7所述的用户-商品偏好的预测***，其特征在于，该预测***还包括数据存储模块，其用于存储预测***中的数据。