CN108629665A

CN108629665A - 一种个性化商品推荐方法和***

Info

Publication number: CN108629665A
Application number: CN201810433175.XA
Authority: CN
Inventors: 张洪刚; 孙宇; 常剑; 徐彬; 高珊
Original assignee: Beijing University of Posts and Telecommunications; China Unicom Online Information Technology Co Ltd
Current assignee: Beijing University of Posts and Telecommunications; China Unicom Online Information Technology Co Ltd
Priority date: 2018-05-08
Filing date: 2018-05-08
Publication date: 2018-10-09
Anticipated expiration: 2038-05-08
Also published as: CN108629665B

Abstract

本发明公开一种个性化商品推荐方法和***，方法包括：获取预设时间段内多个用户的历史行为数据，按照预定规则整理后得到第一训练样本；基于余弦相似度方法得到影响因子作为第二训练样本；将第一训练样本和第二训练样本作为深度学习模型的训练样本进行训练，得到已训练的深度学习模型；输出模型预测出的用户感兴趣的商品列表。本发明有效地利用用户历史行为中商品的时序信息，使历史行为中的商品在推荐***计算中根据其交互行为发生的时间顺序而具有不同的权重值，商品影响因子体现了商品的全局特征及该用户对该商品的兴趣程度，有效增加深度学习模型获取到的特征量，有效提升对冷启动用户的个性化推荐效果。

Description

一种个性化商品推荐方法和***

技术领域

本发明涉及的是一种个性化商品推荐方法和***，属于推荐技术领域。

背景技术

随着互联网的普及和电子商务的快速发展，越来越多的用户通过电子商务平台浏览和购买商品。电子商务平台中商品种类繁多，若没有个性化推荐引擎的帮助，很难将用户感兴趣的商品准确地推荐给用户。

当前的电子商务平台采用的个性化推荐方法的主流方法之一：协同过滤方法，通过找寻与当前用户的历史浏览或购买行为相近的用户，将行为相似的用户感兴趣的商品推荐给当前用户。基于协同过滤的个性化推荐方法对于当前用户的所有历史浏览或购买的商品，在计算与其他商品的相似度时给予同样的权重，例如当前用户在十天前浏览的商品甲，在一小时前浏览了商品乙，在协同过滤方法中商品甲和商品乙对计算当前用户感兴趣商品时所发挥的作用是相同的。但从经验来看，一小时前浏览的商品乙往往比十天前浏览的商品甲对当前的个性化商品推荐的参考价值更大，因此基于协同过滤的个性化推荐方法不能体现出历史行为中不同顺序的商品在当前个性化推荐中的权重差别导致推荐效果不够准确。此外，在用户历史浏览或购买数据太少时协同过滤算法的效果不佳，即存在冷启动问题。

主流方法之二：基于递归神经网络的方法，通过将用户的历史行为依次输入递归神经网络中来进行训练和预测用户感兴趣的商品。该方法可以利用用户历史行为中的商品时序特征，因此在训练样本充足和递归神经网络参数调节合适的情况下，效果普遍优于协同过滤算法。基于递归神经网络的个性化推荐方法在用户历史行为数据较少的情况下，由于可用于递归网络预测兴趣度的历史浏览或购买商品数据太少，故存在冷启动问题。

上述两种方法均存在冷启动问题，即当可获取的用户历史操作记录较少时不能很好地推荐商品，影响了用户体验。冷启动问题是个性化推荐领域存在的普遍问题，由于所掌握的当前待推荐的用户的历史行为数据太少，难以准确地为用户提供其可能感兴趣的商品。

现有方案中关于冷启动问题的主要解决方法之一：基于用户信息的方法，根据用户的年龄、性别、居住地等基本信息进行推荐。但是，由于部分用户可能不会填写详细的个人信息，导致推荐***所能获取的用户信息有限。且根据用户性别、年龄等信息所做的推荐只能代表该用户群的普遍兴趣，不是针对该用户的个性化推荐。

现有方案中关于冷启动问题的主要解决方法之二：基于标签选择的方法，在用户首次注册使用时提供多种分类标签供用户选择，在用户行为数据不足的情况下将用户选择的标签分类下的商品推荐给用户。基于标签选择的方法存在的问题是：部分用户可能不会在使用之初填写分类标签，很可能选择“跳过该步骤”或随意选择，导致所选标签并不能真正代表用户兴趣。且用户感兴趣的商品可能随时间可改变，故原本选择的兴趣标签会与当前感兴趣商品之间存在较大差别，例如某用户在夏天时感兴趣商品可能为“防晒霜”，冬天则变化成“羽绒服”，若按用户原本选择标签进行推荐则会产生很大偏差。此外，由于商品种类多种多样，标签不能完全覆盖所有商品特征。

发明内容

针对上述缺陷，本发明提供了一种个性化商品推荐方法和***，获取用户历史行为数据后，对数据进行分析整理，利用当前用户的历史行为信息和历史行为中的商品对应的全局特征等计算得到当前用户对应的每个商品的影响因子，并将用户历史行为中的商品及其对应的影响因子按用户与商品交互的时间顺序依次输入预置的深度学习模型中，得到预测的当前用户感兴趣的商品，并依据预测的兴趣程度进行排序，并按所排顺序将用户兴趣程度最高的若干商品推荐给用户，深度学习模型采用了递归神经网络模型。

本发明可有效地利用用户历史行为中商品的时序信息，使历史行为中的商品在推荐***计算中根据其交互行为发生的时间顺序而具有不同的权重值，本发明中的商品影响因子体现了商品的全局特征及该用户对该商品的兴趣程度，在用户历史行为数据不足时可以有效增加深度学习模型获取到的特征量，有效提升对冷启动用户的个性化推荐效果。

为达到上述目的，本发明通过以下技术方案来具体实现：

本发明提供了一种个性化商品推荐方法，该方法包括：

获取预设时间段内多个用户的历史行为数据，按照预定规则整理后得到第一训练样本；

利用整理后的历史行为数据，基于余弦相似度方法计算出每个用户的历史行为数据中每个商品对应的影响因子作为第二训练样本；

将第一训练样本和第二训练样本作为深度学习模型的训练样本进行训练，得到已训练的深度学习模型；

将预推荐用户的第一训练样本和第二训练样本输入到已训练的深度学习模型中，输出模型预测出的用户感兴趣的商品列表，按照商品列表中的商品顺序推荐给预推荐用户。

进一步的，所述按照预定规则整理后得到第一训练样本的步骤包括：

基于获取的预设时间段内多个用户的历史行为数据，筛选出特定类别的交互行为数据；

将特定类别的交互行为数据中的信息转化为唯一编号形式存储；

将特定类别的交互行为数据中的每个用户的交互行为数据按时间顺序排序。

进一步的，所述基于余弦相似度方法计算出每个用户的历史行为数据中每个商品对应的影响因子的具体步骤包括：

基于余弦相似度方法计算得到特定商品的N维向量后对该向量进行最大值归一化，使向量中每个数值均在[0,1]之间，N维向量即为商品对应的影响因子，N为预处理后的历史行为数据中商品的总数量或预先从预处理后的历史行为数据中通过某些规则筛选后的候选商品数量，商品对应的N维向量表示的影响因子中的第i个数的值Value_i的具体计算方法包括：

其中，Count(特定商品&第i个商品)代表特定商品和第i个商品共同出现在预处理后的历史行为数据中的次数，i≥1且i≤N，Count(特定商品)代表特定商品在按照预定规则整理后的历史行为数据中的交互总次数，Count(第i个商品)代表第i个商品在按照预定规则整理后的历史行为数据中的交互总次数，Max(Values)代表每个用户的历史行为数据中所有商品对应的影响因子中的最大值。

进一步的，所述深度学习模型包括但不限于递归神经网络模型。

进一步的，所述按照商品列表中的商品顺序推荐给预推荐用户，包括：

按照商品列表中预测的商品兴趣度从高到低的顺序将排在前若干名的商品推荐给预推荐用户。

本发明还提供了一种个性化商品推荐***，包括：

获取模块，用于获取预设时间段内多个用户的历史行为数据，按照预定规则整理后得到第一训练样本；

计算模块，用于利用整理后的历史行为数据，基于余弦相似度方法计算出每个用户的历史行为数据中每个商品对应的影响因子作为第二训练样本；

训练模块，用于将第一训练样本和第二训练样本作为深度学习模型的训练样本进行训练，得到已训练的深度学习模型；

推荐模块，用于将预推荐用户的第一训练样本和第二训练样本输入到已训练的深度学习模型中，输出模型预测出的用户感兴趣的商品列表，按照商品列表中的商品顺序推荐给预推荐用户。

所述获取模块，包括：

筛选单元，用于基于获取的预设时间段内多个用户的历史行为数据，筛选出特定类别的交互行为数据；

转化单元，用于将特定类别的交互行为数据中的信息转化为唯一编号形式存储；

排序单元，用于将特定类别的交互行为数据中的每个用户的交互行为数据按时间顺序排序。

所述计算模块，包括：

计算单元，用于基于余弦相似度方法计算得到特定商品的N维向量后对该向量进行最大值归一化，使向量中每个数值均在[0,1]之间，N维向量即为商品对应的影响因子，N为预处理后的历史行为数据中商品的总数量或预先从预处理后的历史行为数据中通过某些规则筛选后的候选商品数量，商品对应的N维向量表示的影响因子中的第i个数的值Value_i的具体计算方法包括：

所述深度学习模型包括但不限于递归神经网络模型。

所述按照商品列表中的商品顺序推荐给预推荐用户，包括：

本发明的有益效果是：

通过本发明提供的技术方案，可以处理包含时序信息的用户历史行为数据，由于不同时间进行交互的商品与当前用户感兴趣的商品之间的相关性不同，在深度学习模型中对用户历史行为中包含的时序信息进行提取和利用能够更准确地对用户进行商品个性化推荐。本发明创造性地提出了商品影响因子，从多个用户的历史行为中发现各商品所具备的全局特征并由此计算出商品对应的影响因子，将预处理后的用户历史行为中的商品向量表达形式及其对应的影响因子的向量表达形式共同输入到深度学习模型中，由于影响因子包含了更多的信息，使得深度学习模型得到的预测商品更准确，在待对其进行个性化推荐的用户历史行为数据不充足的情况下更能体现出其优越性，在冷启动问题上优于原有个性化推荐方法。

附图说明

图1所示为本发明提供的一种个性化商品推荐方法的实施例一流程图。

具体实施方式

下面对本发明的技术方案进行具体阐述，需要指出的是，本发明的技术方案不限于实施例所述的实施方式，本领域的技术人员参考和借鉴本发明技术方案的内容，在本发明的基础上进行的改进和设计，应属于本发明的保护范围。

实施例一

本发明实施例一提供了一种个性化商品推荐方法，该方法包括步骤S110-S140：

在步骤S110中，获取预设时间段内多个用户的历史行为数据，按照预定规则整理后得到第一训练样本。

预设时间段具体值及提取的用户数量可根据实际情况进行设定，例如设置时间段为一个月，提取用户数量为Num，则从当前所有数据中提取一个月内的随机选择的Num个用户的历史行为数据。由于个性化推荐通常具有时效性，例如用户半年前浏览了“羽绒服”，而近期浏览了“连衣裙”，若仍考虑半年前用户的浏览数据则推荐效果可能会适得其反，因此预设时间段的具体值需根据实际应用情况进行设定。

进一步的，所述按照预定规则整理后得到第一训练样本的步骤包括：基于获取的预设时间段内多个用户的历史行为数据，筛选出特定类别的交互行为数据；将特定类别的交互行为数据中的信息转化为唯一编号形式存储；将特定类别的交互行为数据中的每个用户的交互行为数据按时间顺序排序。

其中，按照预定规则整理的步骤为本发明的预处理过程，为根据预设时间段内提取到的历史行为数据进行数据整理。由于具体实施场景不同，行为数据种类可能不同，例如行为数据可能为浏览、关注、收听、观看等多种形式，故采用“交互”代指用户和该商品产生了行为数据。预处理过程具体来说包括将特定类别的交互行为数据中的信息转化为唯一编号形式存储；将特定类别的交互行为数据中的每个用户的交互行为数据按时间顺序排序等操作。

基于获取的预设时间段内多个用户的历史行为数据，筛选出特定类别的交互行为数据即根据具体应用的需要从用户的所有交互行为数据中选择出特定类别的行为数据。例如购物网站中用户的行为数据可以有浏览、加入收藏夹、加入购物车、购买等行为，若拟定只利用用户的浏览数据进行个性化推荐，则提取出用户的浏览商品数据，而忽略用户加入收藏夹等交互行为。

将特定类别的交互行为数据中的信息转化为唯一编号形式存储即，将具体信息转化为编号形式代替，具体为将用户以编号的形式代替，商品以编号形式代替，不同用户所交互的同一商品编号相同，此步骤主要出于保护用户隐私的考虑。随后将商品编号转为向量形式表示，每个商品具有唯一的向量表示形式，便于作为深度学习模型的输入。将商品编号转为向量形式表示的方法有很多种，只要保证转化后每个商品具有唯一的向量表示形式而不会与其他商品混淆即可。例如，一种将商品编号转为向量形式表示的方法可以为：N为预处理后的历史行为数据中商品的总数量或预先从预处理后的历史行为数据中通过某些规则筛选后的候选商品数量，，构建一个N维向量，商品甲表示为[1,0,0,…,0,0]，即该向量除了第一位为1外，其他N-1位均为0，商品乙可表示为[0,1,0,…,0,0]，即该向量除了第二位为1外，其他N-1位均为0，以此方式将商品库中的N个商品转化为N个向量形式表示。

将特定类别的交互行为数据中的每个用户的交互行为数据按时间顺序排序即为将同一用户的筛选出特定交互行为后的商品按交互行为发生的时间先后的顺序排列，先发生交互的商品排在后发生交互的商品前面。

在步骤S120中，利用整理后的历史行为数据，基于余弦相似度方法计算出每个用户的历史行为数据中每个商品对应的影响因子作为第二训练样本。

其中，Count(特定商品&第i个商品)代表特定商品和第i个商品共同出现在预处理后的历史行为数据中的次数，i≥1且i≤N，Count(特定商品)代表特定商品在按照预定规则整理后的历史行为数据中的交互总次数，Count(第i个商品)代表第i个商品在按照预定规则整理后的历史行为数据中的交互总次数，Max(Values)代表每个用户的历史行为数据中所有商品对应的影响因子中的最大值。通过此方法计算得到最大值归一化后特定商品的N维向量，，且向量中每个数值均在[0,1]之间，此时的N维向量即为特定商品对应的影响因子。向量中第i个数的数值越大表示该特定商品与第i个数所对应的商品的相关性越大。

利用预处理后的历史行为数据，根据商品在历史行为数据中出现的次数可以判断出商品的热度，某两个商品被同一用户感兴趣的次数等信息。一般来说，被更多用户交互的商品更可能会引起当前用户交互，并且两个商品经常同时出现在同一用户的历史行为数据中时可表明这两个商品的关联性较强，若当前用户与其中一个商品产生交互时，则有较大概率会对另一个商品产生兴趣。

在步骤S130中，将第一训练样本和第二训练样本作为深度学习模型的训练样本进行训练，得到已训练的深度学习模型。

将步骤S110中得到的按照预定规则整理后得到的历史行为数据和步骤S120中得到的各商品的影响因子作为训练样本输入深度学习模型中进行训练。本方法采用的深度学习模型是递归神经网络模型，该递归神经网络模型可以为RNN模型及其改进模型，如LSTM等。

对于深度学习模型中的各参数先随机初始化，随后根据预处理后的历史行为数据中的用户编号，对于每个用户，按该用户对应的交互商品的交互发生时间先后顺序依次将交互的商品对应的向量表达式和影响因子的向量表达式输入递归神经网络模型中进行神经网络的训练。

对于递归神经网络模型来说，第i次的输入为预处理后的行为数据中该用户交互的第i个商品的向量表达形式及其影响因子的向量表达形式，此时模型得到一个预测的输出，将该输出与预处理后的行为数据中该用户交互的第i+1个商品进行对比，计算递归神经网络的偏差并根据偏差不断修正神经网络模型的参数。当一个用户在预处理后的行为数据中交互的全部商品的向量表达形式及其影响因子的向量表达形式均依次输入深度学习模型进行训练后，将预处理后的行为数据中下一用户的交互商品的向量表达形式及其影响因子的向量表达形式按时间顺序依次输入正在训练的递归神经网络模型中，继续进行训练，直至预处理后的行为数据中全部用户的交互商品的向量表达形式及其影响因子的向量表达形式全部输入深度学习模型训练完毕。此时得到已训练的深度学习模型。由于递归神经网络模型已经在深度学习领域普遍使用，因此对递归神经网络模型的具体搭建本方法不再赘述。

该模型可通过将待进行个性化推荐的用户预处理后的历史行为数据依次输入模型内来得到预测的下一商品，其具体输出为选定的商品库中的所有商品的预测分数，并按分值从高到低排列。选定的商品库可以为该推荐方法应用的平台中的全部商品，或根据某些原则预先筛选后的候选商品库。例如购物平台想对用户进行新商品推荐，从2000个新上线商品中选择若干商品推荐给用户，则此时的候选商品库包含的是这2000个新上线商品。

在步骤S140中，将预推荐用户的第一训练样本和第二训练样本输入到已训练的深度学习模型中，输出模型预测出的用户感兴趣的商品列表，按照商品列表中的商品顺序推荐给预推荐用户。

对预推荐用户或当前用户进行个性化推荐时，获取到预推荐用户或当前用户在所选时间段内的历史行为数据，并通过步骤S110和步骤S120中得到预推荐用户或当前用户的按照预定规则整理后的历史行为数据和各商品对应的影响因子输入到步骤S130中已训练的深度学习模型中进行计算。已训练的深度学习模型得到预测的商品库中各商品的分数，并按分数从高到低排序，即为当前用户感兴趣的商品列表，并按照预测的兴趣度从高到低的顺序将排在前若干名的商品推荐给当前用户。预测的兴趣程度越高的商品排在越靠前的位置。

若只对用户推荐候选商品库中的商品，例如2000个新上线商品，则只对此2000个商品的预测分数进行计算并排序。随后根据需要向当前用户推荐的具体的商品数量，从当前用户感兴趣的商品列表中选择排在前若干位的商品推荐给当前用户，完成对当前用户的个性化推荐。

本发明所述商品不限于服装、日用品等实体商品，对于多媒体平台来说，根据用户听歌列表或其他用户与音乐平台的交互信息来个性化推荐音乐给用户，或根据用户观影或与电影的其他交互信息将电影个性化推荐给用户等情况下，具体的音乐和电影均可视为商品。

可收集到多个用户在特定时间段内的交互行为，根据用户在互联网平台上的包含时序信息的交互行为，使用改进的递归神经网络模型来预测用户感兴趣的商品均可使用本方法进行个性化推荐。改进的递归神经网络模型可能是网络模型的神经元数量、网络模型层数、添加门限函数等，若改进结构后的递归神经网络模型不直接影响本方法提出的将商品时序信息与影响因子添加进递归神经网络模型的方式，则可视为本方法的实现方法之一。

所采用的深度学习模型可以是递归神经网络模型或对其进行改进后的模型，如LSTM模型等，若深度学习模型为递归性地按某规则对商品进行排序，并顺序性地依次输入当前商品对应的特征后其对应的深度学习输出是下一商品的特征，则均可视为递归神经网络模型及其改进模型。

交互行为可以是用户浏览商品、观看或收听、加入收藏夹、加入购物车、购买等多种行为之一或其组合行为。

若只更改了影响因子计算法的系数等仍属于本方法保护范围。

实施例二

本发明实施例二还提供了一种个性化商品推荐***，包括：

所述获取模块，包括：

所述计算模块，包括：

所述深度学习模型包括但不限于递归神经网络模型。

所述按照商品列表中的商品顺序推荐给预推荐用户，包括：

具体实现的功能和处理方式参见方法实施例一描述的具体步骤。

由于本实施例二的***所实现的处理及功能基本相应于前述图1所示的方法的实施例、原理和实例，故本实施例的描述中未详尽之处，可以参见前述实施例中的相关说明，在此不做赘述。

本发明的有益效果是：

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本发明可以通过硬件实现，也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解，本发明的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

以上公开的仅为本发明的几个具体实施例，但是，本发明并非局限于上述实施例，任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims

1.一种个性化商品推荐方法，其特征在于，该方法包括：

获取所述预设时间段内多个用户的历史行为数据，按照预定规则整理后得到第一训练样本；

2.如权利要求1所述的方法，其特征在于，所述按照预定规则整理后得到第一训练样本的步骤包括：

3.如权利要求1所述的方法，其特征在于，所述基于余弦相似度方法计算出每个用户的历史行为数据中每个商品对应的影响因子的具体步骤包括：

4.如权利要求1所述的方法，其特征在于，优选的，所述深度学习模型包括但不限于递归神经网络模型。

5.如权利要求1所述的方法，其特征在于，所述按照商品列表中的商品顺序推荐给预推荐用户，包括：

6.一种个性化商品推荐***，其特征在于，包括：

7.如权利要求6所述的***，其特征在于，所述获取模块，包括：

8.如权利要求6所述的***，其特征在于，所述计算模块，包括：

9.如权利要求6所述的***，其特征在于，所述深度学习模型包括但不限于递归神经网络模型。

10.如权利要求6所述的***，其特征在于，所述按照商品列表中的商品顺序推荐给预推荐用户，包括：