CN113344662A

CN113344662A - 一种产品推荐方法、装置及设备

Info

Publication number: CN113344662A
Application number: CN202110602015.5A
Authority: CN
Inventors: 王钰桥; 谭松波
Original assignee: Lenovo Beijing Ltd
Current assignee: Lenovo Beijing Ltd
Priority date: 2021-05-31
Filing date: 2021-05-31
Publication date: 2021-09-03

Abstract

本发明公开了一种产品推荐方法、装置及设备，该方法包括：获取预设时长内用户的行为，行为包括用户信息、近期交互的产品序列信息及远期交互的产品序列信息；获取多个待预测产品信息；对每个待预测产品信息，将待预测产品信息和用户信息进行组合，生成对应的第一信息；对近期交互的产品序列信息进行特征提取，对远期交互的产品序列信息进行向量转换，将提取的特征信息、向量转换后的远期交互的产品序列信息与第一信息进行级联，生成对应的第二信息；根据各第二信息在多个待预测产品信息中选择推荐的产品信息。通过对用户近期兴趣和长期兴趣进行表征，从而根据用户近期兴趣和长期兴趣可以准确表征用户兴趣变化趋势，提升个性化产品推荐的精准度。

Description

一种产品推荐方法、装置及设备

技术领域

本申请涉及产品推荐技术领域，尤其涉及一种产品推荐方法、装置及设备。

背景技术

目前，在电商平台，一般是通过对用户一段时间的行为进行学习，学习用户一段时间通用的兴趣走势特征，得到产品推荐模型，例如GRU4REC模型，然后采用产品推荐模型给用户推荐产品。然而，用户有时由于在操作时存在误点击或由于外界的偶然因素导致其一段时间的行为不能真正反映用户的兴趣变化趋势，同时，用户在购物时的兴趣有时是多变的，因此，在产品推荐时，如果仅考虑用户一段时间通用的兴趣走势特征，那么给用户推荐的产品可能并不是用户想要的，推荐效果受限。

发明内容

本发明实施例通过提供一种产品推荐方法、装置及设备，用以解决现有产品推荐方法仅考虑用户一段时间通用的兴趣走势特征，给用户推荐的产品可能并不是用户想要的，推荐效果受限的问题。

为了解决上述问题，第一方面，本发明实施例提供了一种产品推荐方法，包括：获取预设时长内用户的行为，行为包括用户信息、近期交互的产品序列信息及远期交互的产品序列信息；获取多个待预测产品信息；对每个待预测产品信息，将待预测产品信息和用户信息进行组合，生成对应的第一信息；对近期交互的产品序列信息进行特征提取，对远期交互的产品序列信息进行向量转换，将提取的特征信息、向量转换后的远期交互的产品序列信息与第一信息进行级联，生成对应的第二信息；根据各第二信息在多个待预测产品信息中选择推荐的产品信息。

可选地，对近期交互的产品序列信息进行特征提取，包括：将近期交互的产品序列信息进行独热编码；将独热编码后的近期交互的产品序列信息转换为第一词向量；对第一词向量进行卷积运算和最大池化运算，得到近期交互的产品序列信息的特征信息。

可选地，对第一词向量进行卷积运算和最大池化运算，得到近期交互的产品序列信息的特征信息，包括：采用特征提取模型对第一词向量进行卷积运算和最大池化运算，得到近期交互的产品序列信息的特征信息；其中，特征提取模型在训练时，对训练样本进行卷积运算之后，对训练样本进行最大池化运算之前，还对训练样本进行随机块丢弃操作。

可选地，对远期交互的产品序列信息进行向量转换，包括：将远期交互的产品序列信息进行独热编码；将独热编码后的远期交互的产品序列信息转换为第二词向量；计算第二词向量的平均值，得到向量转换后的远期交互的产品序列信息。

可选地，将提取的特征信息、向量转换后的远期交互的产品序列信息与第一信息进行级联，生成对应的第二信息，包括：将第一信息进行独热编码；将独热编码后的第一信息转换为第三词向量；将近期交互的产品序列信息的特征信息、向量转换后的远期交互的产品序列信息及第三词向量进行级联，生成对应的第二信息。

可选地，根据各第二信息在多个待预测产品信息中选择推荐的产品信息，包括：将各第二信息输入自注意力模型，得到对应的第三信息，将各第三信息输入产品点击概率模型，得到对应的点击概率；根据各点击概率在多个待预测产品信息中选择推荐的产品信息。

可选地，近期交互的产品序列信息包括近期交互的产品ID序列，远期交互的产品序列信息包括远期交互的产品ID序列，在对近期交互的产品序列信息进行特征提取，对远期交互的产品序列信息进行向量转换之前，产品推荐方法还包括：确定近期交互的产品ID序列的长度及远期交互的产品ID序列的长度；若近期交互的产品ID序列/远期交互的产品ID序列的长度小于预设长度，在近期交互的产品ID序列/远期交互的产品ID序列的末端补零；若近期交互的产品ID序列/远期交互的产品ID序列的长度大于预设长度，从近期交互的产品ID序列/远期交互的产品ID序列的始端移除预设长度之外的产品ID。

可选地，在获取预设时长内用户的行为之后，产品推荐方法还包括：删除近期交互的产品序列信息中最近一次交互的产品信息。

第二方面，本发明实施例提供了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器执行如第一方面或第一方面任意实施方式中的产品推荐方法。

第三方面，本发明实施例提供了一种产品推荐装置，包括：第一获取单元，用于获取预设时长内用户的行为，行为包括用户信息、近期交互的产品序列信息及远期交互的产品序列信息；第二获取单元，用于获取多个待预测产品信息；组合单元，用于对每个待预测产品信息，将待预测产品信息和用户信息进行组合，生成对应的第一信息；级联单元，用于对近期交互的产品序列信息进行特征提取，对远期交互的产品序列信息进行向量转换，并将提取的特征信息、向量转换后的远期交互的产品序列信息与第一信息进行级联，生成对应的第二信息；选择单元，用于根据各第二信息在多个待预测产品信息中选择推荐的产品信息。

本发明实施例提供的产品推荐方法、装置及设备，通过获取预设时长内用户的行为，行为包括用户信息、近期交互的产品序列信息及远期交互的产品序列信息；获取多个待预测产品信息；对每个待预测产品信息，将待预测产品信息和用户信息进行组合，生成对应的第一信息；对近期交互的产品序列信息进行特征提取，对远期交互的产品序列信息进行向量转换，将提取的特征信息、向量转换后的远期交互的产品序列信息与第一信息进行级联，生成对应的第二信息；根据各第二信息在多个待预测产品信息中选择推荐的产品信息；从而在产品推荐时，用户一段时间的行为被划分为近期交互的产品序列信息和远期交互的产品序列信息，从而可以对用户近期兴趣和长期兴趣进行表征，然后根据用户近期兴趣和长期兴趣准确表征用户兴趣变化趋势，提升个性化产品推荐的精准度。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

附图说明

图1示出了本发明实施例中一种产品推荐方法的流程示意图；

图2示出了本发明实施例中自注意力层的结构示意图；

图3示出了本发明实施例中第一词向量进行卷积运算和最大池化运算的流程示意图；

图4示出了本发明实施例中张量特征图进行随机块丢弃操作的示意图；

图5示出了本发明实施例中一种产品推荐装置的结构示意图；

图6示出了本发明实施例中一种电子设备的硬件结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供了一种产品推荐方法，可应用于电商平台进行产品推荐，产品推荐方法如图1所示，包括：

S101.获取预设时长内用户的行为，行为包括用户信息、近期交互的产品序列信息及远期交互的产品序列信息；具体地，当需要对某个用户进行产品推荐时，可以获取预设时长内该用户的行为，用户的行为中包括有用户信息、近期交互的产品序列信息和远期交互的产品序列信息。其中近期交互的产品序列信息和远期交互的产品序列信息是基于产品交互时刻进行划分的。例如，用户最近一个小时交互的产品序列信息为近期交互的产品序列信息，用户最近一个月交互的产品序列信息(除最近一个小时交互的产品序列信息)为远期交互的产品序列信息。用户信息包括用户ID，近期交互的产品序列信息包括近期交互的产品ID序列，远期交互的产品序列信息包括远期交互的产品ID序列。

S102.获取多个待预测产品信息；具体地，当需要对某个用户进行产品推荐时，可以从产品信息库中随机获取多个待预测产品信息。

S103.对每个待预测产品信息，将待预测产品信息和用户信息进行组合，生成对应的第一信息。具体地，由于需要对每个待预测产品信息进行预测，而每个待预测产品信息需要关联到该用户，因此，对于每个待预测产品信息，需要将待预测产品信息和用户信息进行组合，生成对应的第一信息。

S104.对近期交互的产品序列信息进行特征提取，对远期交互的产品序列信息进行向量转换，将提取的特征信息、向量转换后的远期交互的产品序列信息与第一信息进行级联，生成对应的第二信息；具体地，可以通过对近期交互的产品序列信息进行卷积运算和最大池化运算实现对近期交互的产品序列信息进行特征提取；可以通过向量转换运算实现对远期交互的产品序列信息进行向量转换。

S105.根据各第二信息在多个待预测产品信息中选择推荐的产品信息。具体地，可以将每个第二信息分别输入自注意力层，自注意力层如图2所示，该层在模型训练时可以学习得到近期交互的产品序列信息、长期交互的产品序列信息及第一信息的权重值。将每个第二信息分别输入自注意力层，则第二信息(输入特征向量，输入张量)中的特征信息、向量转换后的远期交互的产品序列信息与第一信息可以乘以各自对应的权重值后输出，得到第三信息，从而第三信息中包含了近期交互的产品序列信息及远期交互的产品序列信息对待预测产品信息的权重，然后再将第三信息输入若干层全连接层(DNN层)、ReLU函数层，最后经过sigmoid函数激活后输出，可以得到该用户点击待预测产品信息的概率值p，p越大说明用户点击该待预测产品信息的概率越高。可以取概率值最高的top k个待预测产品信息作为推荐的产品信息。k可以为线上实际展出的推荐栏数。

本发明实施例提供的产品推荐方法，通过获取预设时长内用户的行为，行为包括用户信息、近期交互的产品序列信息及远期交互的产品序列信息；获取多个待预测产品信息；对每个待预测产品信息，将待预测产品信息和用户信息进行组合，生成对应的第一信息；对近期交互的产品序列信息进行特征提取，对远期交互的产品序列信息进行向量转换，将提取的特征信息、向量转换后的远期交互的产品序列信息与第一信息进行级联，生成对应的第二信息；根据各第二信息在多个待预测产品信息中选择推荐的产品信息；从而在产品推荐时，用户一段时间的行为被划分为近期交互的产品序列信息和远期交互的产品序列信息，从而可以对用户近期兴趣和长期兴趣进行表征，然后根据用户近期兴趣和长期兴趣准确表征用户兴趣变化趋势，提升个性化产品推荐的精准度。

在一个可选的实施例中，步骤S104中，对近期交互的产品序列信息进行特征提取，包括：将近期交互的产品序列信息进行独热编码；将独热编码后的近期交互的产品序列信息转换为第一词向量；对第一词向量进行卷积运算和最大池化运算，得到近期交互的产品序列信息的特征信息。

具体地，将近期交互的产品序列信息进行独热编码为将近期交互的产品序列信息转化为one hot的形式。将独热编码后的近期交互的产品序列信息转换为第一词向量时，可以通过一层全连接网络构建的词向量嵌入层对one hot形式的近期交互的产品序列信息进行运算，得到第一词向量。对第一词向量进行卷积和最大池化运算的流程图如图3所示。近期交互的产品序列的长度为L，独热编码后的近期交互的产品序列信息经过词向量嵌入层后，得到维度为d的第一词向量(词嵌入向量)。第一词向量输入CNN模块(卷积计算层)，CNN模块对第一词向量进行卷积运算和最大池化运算。其中，可采用卷积层对第一词向量进行卷积运算，卷积运算为二维的卷积运算，包括横向卷积运算和纵向卷积运算，横向卷积运算的卷积核的大小为h×d，其中h<L，横向卷积运算可以得到第一特征图，第一特征图可以输入池化层进行最大池化运算，得到第二特征图。池化的目的是为了缩小第一特征图(或称为下采样或降采样)，其主要目的有两个：1、使得第一特征图符合显示区域的大小；2、生成对应第一特征图的缩略图。在连续的卷积层中间存在的就是池化层，可以说每卷积计算后加上偏置项后就池化一次；池化主要功能是：通过逐步减小表征的空间尺寸来减小参数量和网络中的计算；池化层在每个第一特征图上独立操作。

纵向卷积运算的卷积核的大小为L×1，纵向卷积运算可以得到第三特征图。第三特征图和第二特征图进行级联在一起，组成卷积计算层的输出向量，得到近期交互的产品序列信息的特征信息。近期交互的产品序列信息的特征信息仍然为词向量的形式。

在本发明实施例中，通过将近期交互的产品序列信息转换为第一词向量，并对第一词向量进行卷积运算和最大池化运算，得到近期交互的产品序列信息的特征信息，从而准确提取近期交互的产品序列信息的特征信息，并且，利用CNN模块对第一向量进行卷积运算和最大池化运算，可以实现计算的并行性，且减少了模型的参数，相较于RNN模型的训练和推理效率都大大提高。

在一个可实施的方式中，对第一词向量进行卷积运算和最大池化运算，得到近期交互的产品序列信息的特征信息，包括：采用特征提取模型对第一词向量进行卷积运算和最大池化运算，得到近期交互的产品序列信息的特征信息；其中，特征提取模型在训练时，对训练样本进行卷积运算之后，对训练样本进行最大池化运算之前，还对训练样本进行随机块丢弃操作。

具体地，特征提取模型的训练过程为：将近期交互的产品序列信息训练样本转化为one hot的形式；通过一层全连接网络构建的词向量嵌入层对one hot形式的近期交互的产品序列信息训练样本进行运算，得到近期交互的产品序列的词向量表示；近期交互的产品序列的词向量表示输入卷积网络模块(CNN模块)，通过卷积运算得到特征提取结果。由于神经网络的学***均值可以减少过拟合。Dropout就是利用这个原理，每次丢掉一半左右的隐藏层神经元，相当于在不同的神经网络上进行训练，这样就减少了神经元之间的依赖性，即每个神经元不能依赖于某几个其它的神经元(指层与层之间相连接的神经元)，使神经网络更加能学习到与其它神经元之间的更加健壮robust(鲁棒性)的特征。另外Dropout不仅减少过拟合，还能提高测试集准确率。

在本发明实施例中，采用dropout方法减少模型的过拟合，也即在卷积运算之后对特征提取结果进行随机块丢弃(dropout)操作。通过卷积运算得到的张量特征图为d×N(d为输入CNN模块的词向量表示维度，N为卷积输出通道数)，张量特征图随机块丢弃操作时，如图4所示，会根据伯努利函数随机选取某些连续区域(图4中黑色叉区域)乘以mask(灰色区域)，mask内的连续区域(灰色区域与黑色叉重叠的区域)的输出值为0，mask外的连续区域(灰色区域外的黑色叉区域)保持原有值输出，然后再进行最大池化运算，得到近期交互的产品序列信息训练样本的特征信息。

在本发明实施例中，采用特征提取模型对第一词向量进行卷积运算和最大池化运算，得到近期交互的产品序列信息的特征信息，可以简单、快速获取到近期交互的产品序列信息的特征信息；并且，特征提取模型在训练时，对训练样本进行卷积运算之后，对训练样本进行最大池化运算之前，还对训练样本进行随机块丢弃操作，可以有效防止模型训练中出现过拟合，增强了模型的泛化能力。

在一个可选的实施例中，步骤S104中，对远期交互的产品序列信息进行向量转换，包括：将远期交互的产品序列信息进行独热编码；将独热编码后的远期交互的产品序列信息转换为第二词向量；计算第二词向量的平均值，得到向量转换后的远期交互的产品序列信息。

具体地，将远期交互的产品序列信息进行独热编码为将远期交互的产品序列信息转化为one hot的形式。将独热编码后的远期交互的产品序列信息转换为第二词向量时，可以通过一层全连接网络构建的词向量嵌入层对one hot形式的远期交互的产品序列信息进行运算，得到第二词向量。在模型训练时，为了防止模型过拟合，可以在得到第二词向量之后，对第二词向量进行随机词向量替换操作，即会以一定概率p随机将第二词向量中的某个或某几个产品对应的词向量替换为其他产品对应的词向量。其中，在替换时，会从预设的映射关系表中查找到其他产品对应的词向量，然后从第二词向量中，随机选择某个或某几个产品的词向量，采用其他产品对应的词向量对该各或该几个产品的词向量进行替换。在产品推荐过程中，则会跳过随机词向量替换步骤)。由于远期交互的产品序列信息较近期交互的产品序列信息来说，交互的产品序列更多，因此采用CNN模块采集远期交互的产品序列信息的特征信息计算量庞大，因此，可以通过计算第二词向量的平均值，得到向量转换后的远期交互的产品序列信息。

在本发明实施例中，由于远期交互的产品序列信息较大，长度较长，因此，通过将远期交互的产品序列信息转换为第二词向量，计算第二词向量的平均值，得到向量转换后的远期交互的产品序列信息，可以实现对远期交互的产品序列信息进行特征表示。并且，在模型训练时，通过以一定概率p随机将第二词向量中的某个产品对应的词向量替换为其他产品对应的词向量，可以有效防止模型训练中出现过拟合，增强了模型的泛化能力。

在一个可选的实施例中，步骤S104中，将提取的特征信息、向量转换后的远期交互的产品序列信息与第一信息进行级联，生成对应的第二信息，包括：将第一信息进行独热编码；将独热编码后的第一信息转换为第三词向量；将近期交互的产品序列信息的特征信息、向量转换后的远期交互的产品序列信息及第三词向量进行级联，生成对应的第二信息。

具体地，将第一信息进行独热编码为将第一信息转化为one hot的形式。将独热编码后的第一信息转换为第三词向量时，可以通过一层全连接网络构建的词向量嵌入层对one hot形式的第一信息进行运算，得到矩阵分解的词向量，即第三词向量。然后将近期交互的产品序列信息的特征信息、向量转换后的远期交互的产品序列信息及第三词向量进行级联，生成对应的第二信息。

在一个可选的实施例中，步骤S105，根据各第二信息在多个待预测产品信息中选择推荐的产品信息，包括：将各第二信息输入自注意力模型，得到对应的第三信息，将各第三信息输入产品点击概率模型，得到对应的点击概率；根据各点击概率在多个待预测产品信息中选择推荐的产品信息。

具体地，自注意力模型在模型训练时会学习得到近期交互的产品序列信息、长期交互的产品序列信息及第一信息的权重值，将各第二信息(输入张量)输入自注意模型，可以实现对第二信息中的特征信息、向量转换后的远期交互的产品序列信息与第一信息乘以各自对应的权重值后输出，得到对应的第三信息(输出张量)。将各第三信息输入产品点击概率模型，是将各第三信息输入若干层全连接层(DNN层)，最后经过sigmoid函数激活后输出该用户点击待预测产品信息的概率值p。根据各点击概率，可以取概率值最高的top k个待预测产品信息作为推荐的产品信息。

在本发明实施例中，由于自注意力模型能够准确地学习出不同时期的兴趣对用户当前购买行为影响的权重，因此，将各第二信息输入自注意力模型，得到对应的第三信息，将各第三信息输入产品点击概率模型，得到对应的点击概率；根据各点击概率在多个待预测产品信息中选择推荐的产品信息，可以准确表征用户兴趣变化趋势，并准确得到用户点击各待预测产品信息的概率，从而可以进一步提升个性化推荐的精准度。

在一个可选的实施例中，近期交互的产品序列信息包括近期交互的产品ID序列，远期交互的产品序列信息包括远期交互的产品ID序列，在步骤S104，对近期交互的产品序列信息进行特征提取，对远期交互的产品序列信息进行向量转换之前，产品推荐方法还包括：确定近期交互的产品ID序列的长度及远期交互的产品ID序列的长度；若近期交互的产品ID序列/远期交互的产品ID序列的长度小于预设长度，在近期交互的产品ID序列/远期交互的产品ID序列的末端补零；若近期交互的产品ID序列/远期交互的产品ID序列的长度大于预设长度，从近期交互的产品ID序列/远期交互的产品ID序列的始端移除预设长度之外的产品ID。

具体地，在对近期交互的产品ID序列和远期交互的产品ID序列进行处理时，由于各个用户近期交互的产品ID序列及远期交互的产品ID序列的长度存在差异，为了便于模型对数据的处理，因此规定用户近期交互的产品ID序列和远期交互的产品ID序列均为定长。因此，在对近期交互的产品序列信息进行特征提取，对远期交互的产品序列信息进行向量转换之前，还需要确定近期交互的产品ID序列的长度及远期交互的产品ID序列的长度，如果产品ID序列的长度不足定长的，用0进行填充补齐，如果产品ID序列的长度超过定长的，移除定长之外的产品ID。

在本发明实施例中，通过补齐或移除产品ID，可以使得各用户近期交互的产品ID系列和远期交互的产品ID序列均为定长，从而采用模型对各用户近期交互的产品序列信息和远期交互的产品序列信息进行处理时，可以减少模型的计算量。

在一个可选的实施例中，在步骤S101，获取预设时长内用户的行为之后，产品推荐方法还包括：删除近期交互的产品序列信息中最近一次交互的产品信息。

具体地，在模型训练过程中，近期交互的产品序列信息训练样本中不包括最近一次交互的产品信息，最近一次交互的产品信息训练样本是单独作为正样本输入到模型中进行训练的，因此，在产品推荐过程中，为了提高产品推荐的精准度，近期交互的产品序列信息中需要删除最近一次交互的产品信息。

本发明实施例还提供了一种产品推荐装置，如图5所示，包括：

第一获取单元21，用于获取预设时长内用户的行为，行为包括用户信息、近期交互的产品序列信息及远期交互的产品序列信息；具体的实施方式详见上述方法实施例步骤S101的描述，在此不再赘述。

第二获取单元22，用于获取多个待预测产品信息；具体的实施方式详见上述方法实施例步骤S102的描述，在此不再赘述。

组合单元23，用于对每个待预测产品信息，将待预测产品信息和用户信息进行组合，生成对应的第一信息；具体的实施方式详见上述方法实施例步骤S103的描述，在此不再赘述。

级联单元24，用于对近期交互的产品序列信息进行特征提取，对远期交互的产品序列信息进行向量转换，并将提取的特征信息、向量转换后的远期交互的产品序列信息与第一信息进行级联，生成对应的第二信息；具体的实施方式详见上述方法实施例步骤S104的描述，在此不再赘述。

选择单元25，用于根据各第二信息在多个待预测产品信息中选择推荐的产品信息。具体的实施方式详见上述方法实施例步骤S105的描述，在此不再赘述。

本发明实施例提供的产品推荐装置，通过获取预设时长内用户的行为，行为包括用户信息、近期交互的产品序列信息及远期交互的产品序列信息；获取多个待预测产品信息；对每个待预测产品信息，将待预测产品信息和用户信息进行组合，生成对应的第一信息；对近期交互的产品序列信息进行特征提取，对远期交互的产品序列信息进行向量转换，将提取的特征信息、向量转换后的远期交互的产品序列信息与第一信息进行级联，生成对应的第二信息；根据各第二信息在多个待预测产品信息中选择推荐的产品信息；从而在产品推荐时，用户一段时间的行为被划分为近期交互的产品序列信息和远期交互的产品序列信息，从而可以对用户近期兴趣和长期兴趣进行表征，然后根据用户近期兴趣和长期兴趣准确表征用户兴趣变化趋势，提升个性化产品推荐的精准度。

基于与前述实施例中一种产品推荐方法同样的发明构思，本发明实施例还提供一种电子设备，如图6所示，包括：处理器31和存储器32，其中处理器31和存储器32可以通过总线或者其他方式连接，图6中以通过总线连接为例进行说明。

处理器31可以为中央处理器(Central Processing Unit，CPU)。处理器31还可以为其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片，或者上述各类芯片的组合。

存储器32作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块，如本发明实施例中的产品推荐方法对应的程序指令/模块。处理器31通过运行存储在存储器32中的非暂态软件程序、指令以及模块，从而执行处理器的各种功能应用以及数据处理，即实现上述方法实施例中的产品推荐方法。

存储器32可以包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需要的应用程序；存储数据区可存储处理器31所创建的数据等。此外，存储器32可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中，存储器32可选包括相对于处理器31远程设置的存储器，这些远程存储器可以通过网络连接至处理器31。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

上述的一个或者多个模块存储在存储器32中，当被处理器31执行时，执行如图1所示实施例中的产品推荐方法。

上述电子设备具体细节可以对应参阅图1所示的实施例中对应的相关描述和效果进行理解，此处不再赘述。

本领域技术人员可以理解，实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)、随机存储记忆体(Random AccessMemory，RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive，缩写：HDD)或固态硬盘(Solid-State Drive，SSD)等；所述存储介质还可以包括上述种类的存储器的组合。

本领域内的技术人员应明白，本发明的实施例可提供为方法、***、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程信息处理设备的处理器以产生一个机器，使得通过计算机或其他可编程信息处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程信息处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程信息处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种产品推荐方法，包括：

获取预设时长内用户的行为，所述行为包括用户信息、近期交互的产品序列信息及远期交互的产品序列信息；

获取多个待预测产品信息；

对每个待预测产品信息，将所述待预测产品信息和所述用户信息进行组合，生成对应的第一信息；

对所述近期交互的产品序列信息进行特征提取，对所述远期交互的产品序列信息进行向量转换，将提取的特征信息、向量转换后的所述远期交互的产品序列信息与所述第一信息进行级联，生成对应的第二信息；

根据各所述第二信息在所述多个待预测产品信息中选择推荐的产品信息。

2.根据权利要求1所述的产品推荐方法，对所述近期交互的产品序列信息进行特征提取，包括：

将所述近期交互的产品序列信息进行独热编码；

将独热编码后的所述近期交互的产品序列信息转换为第一词向量；

对所述第一词向量进行卷积运算和最大池化运算，得到所述近期交互的产品序列信息的特征信息。

3.根据权利要求2所述的产品推荐方法，所述对所述第一词向量进行卷积运算和最大池化运算，得到所述近期交互的产品序列信息的特征信息，包括：

采用特征提取模型对所述第一词向量进行卷积运算和最大池化运算，得到所述近期交互的产品序列信息的特征信息；

其中，所述特征提取模型在训练时，对训练样本进行卷积运算之后，对训练样本进行最大池化运算之前，还对训练样本进行随机块丢弃操作。

4.根据权利要求1所述的产品推荐方法，对所述远期交互的产品序列信息进行向量转换，包括：

将所述远期交互的产品序列信息进行独热编码；

将独热编码后的所述远期交互的产品序列信息转换为第二词向量；

计算所述第二词向量的平均值，得到向量转换后的所述远期交互的产品序列信息。

5.根据权利要求1-4任一项所述的产品推荐方法，将提取的特征信息、向量转换后的所述远期交互的产品序列信息与所述第一信息进行级联，生成对应的第二信息，包括：

将所述第一信息进行独热编码；

将独热编码后的所述第一信息转换为第三词向量；

将近期交互的产品序列信息的特征信息、向量转换后的远期交互的产品序列信息及所述第三词向量进行级联，生成对应的第二信息。

6.根据权利要求1所述的产品推荐方法，所述根据各所述第二信息在所述多个待预测产品信息中选择推荐的产品信息，包括：

将各所述第二信息输入自注意力模型，得到对应的第三信息，

将各所述第三信息输入产品点击概率模型，得到对应的点击概率；

根据各点击概率在所述多个待预测产品信息中选择推荐的产品信息。

7.根据权利要求1所述的产品推荐方法，所述近期交互的产品序列信息包括近期交互的产品ID序列，所述远期交互的产品序列信息包括远期交互的产品ID序列，

在对所述近期交互的产品序列信息进行特征提取，对所述远期交互的产品序列信息进行向量转换之前，还包括：

确定所述近期交互的产品ID序列的长度及所述远期交互的产品ID序列的长度；

若所述近期交互的产品ID序列/远期交互的产品ID序列的长度小于预设长度，在所述近期交互的产品ID序列/远期交互的产品ID序列的末端补零；

若所述近期交互的产品ID序列/远期交互的产品ID序列的长度大于预设长度，从所述近期交互的产品ID序列/远期交互的产品ID序列的始端移除预设长度之外的产品ID。

8.根据权利要求1所述的产品推荐方法，在所述获取预设时长内用户的行为之后，还包括：

删除所述近期交互的产品序列信息中最近一次交互的产品信息。

9.一种电子设备，包括：

至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行如权利要求1-8任意一项所述的产品推荐方法。

10.一种产品推荐装置，包括：

第一获取单元，用于获取预设时长内用户的行为，所述行为包括用户信息、近期交互的产品序列信息及远期交互的产品序列信息；

第二获取单元，用于获取多个待预测产品信息；

组合单元，用于对每个待预测产品信息，将所述待预测产品信息和所述用户信息进行组合，生成对应的第一信息；

级联单元，用于对所述近期交互的产品序列信息进行特征提取，对所述远期交互的产品序列信息进行向量转换，并将提取的特征信息、向量转换后的所述远期交互的产品序列信息与所述第一信息进行级联，生成对应的第二信息；

选择单元，用于根据各所述第二信息在所述多个待预测产品信息中选择推荐的产品信息。