CN115018552A

CN115018552A - 产品点击率确定方法

Info

Publication number: CN115018552A
Application number: CN202210754365.8A
Authority: CN
Inventors: 陈恩红; 张裕人; 金斌斌; 王皓; 侯旻; 于润龙
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2022-06-28
Filing date: 2022-06-28
Publication date: 2022-09-06

Abstract

本公开提供了一种产品点击率确定方法。该方法包括获取产品数据训练样本集，其中，产品数据训练样本集包括多个训练样本，每个训练样本包括多个产品特征向量和交互行为序列；针对每个训练样本，利用均值聚类模型处理多个产品特征向量，得到多个聚类中心向量；根据预设目标产品的预设特征向量和与交互行为序列对应的多个聚类中心向量，确定对应于每个聚类中心向量的采样概率；按照多个采样概率，对交互行为序列进行采样处理，得到多条交互行为子序列；利用预设特征向量和多条交互行为子序列训练深度兴趣网络，得到训练完成的点击率预测模型；将待预测产品的产品特征向量和待预测用户的交互行为序列输入点击率预测模型，输出预测结果。

Description

产品点击率确定方法

技术领域

本公开涉及神经网络技术领域，更具体地，涉及一种产品点击率确定方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

背景技术

点击率预测是信息时代发展背景下的一种新兴的用户行为预测技术，其普遍存在于互联网行业中，也是在线广告、电商推荐等线上应用的基础，目的是预测不同用户的潜在需求并推荐合适且高质量的点击内容。

现实场景中，由于信息技术的高速发展，用户在互联网平台上累积的行为记录日益增多，行为序列长度呈爆发式增长，并且涉及的需求多样，使得用户行为记录数据呈现出数量繁多与兴趣广泛的特点。

在实现本公开构思的过程中，发明人发现相关技术中至少存在如下问题：现有的点击率预测模型在对用户点击某一商品的点击率进行预测时，其预测精度较低。

发明内容

有鉴于此，本公开实施例提供了一种产品点击率确定方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

本公开实施例的一个方面提供了一种产品点击率确定方法，包括：

获取产品数据训练样本集，其中，上述产品数据训练样本集包括多个训练样本，每个上述训练样本包括具有预设维度的多个产品特征向量和交互行为序列，上述交互行为序列表征一个用户与多个产品发生交互行为的时间和顺序；

针对每个上述训练样本，利用均值聚类模型处理多个上述产品特征向量，得到多个聚类中心向量，其中，上述均值聚类模型是对K均值聚类模型进行预先训练得到的，每个上述聚类中心向量是指能够代表同一类中的多个上述产品特征向量的特征向量；

根据预设目标产品的预设特征向量和与上述交互行为序列对应的多个上述聚类中心向量，确定对应于每个上述聚类中心向量的采样概率；

按照多个上述采样概率，对上述交互行为序列进行采样处理，得到多条交互行为子序列；

利用上述预设特征向量和多条上述交互行为子序列训练深度兴趣网络，得到训练完成的点击率预测模型；

将待预测产品的产品特征向量和待预测用户的交互行为序列输入上述点击率预测模型，输出预测结果，其中，上述预测结果表征上述待预测用户点击上述待预测产品的概率。

根据本公开的实施例，上述多个产品特征向量是通过如下方式获得的：

对获取到的多个产品数据进行筛选处理，得到筛选后的产品数据；

针对多个上述筛选后的产品数据，在产品数据的产品属性符合第一预设条件的情况下，对产品数据的多个种类分别进行独热编码处理，得到与每个上述种类对应的第一独热向量，其中，上述产品属性包括产品价格、产品品牌或购买时间；

对多个上述第一独热向量进行拼接处理，得到上述产品数据的拼接特征向量；

在产品数据的产品属性不符合上述第一预设条件的情况下，利用分桶法处理上述产品，得到多个类别的类别向量；

对每个类别的类别向量进行独热编码处理，得到与每个类别对应的第二独热向量；

对多个上述第二独热向量进行拼接处理，得到上述产品数据的拼接特征向量；

将上述拼接特征向量进行预设维度的映射处理，得到一个上述产品特征向量。

根据本公开的实施例，上述对获取到的多个产品数据进行筛选处理，得到筛选后的产品数据，包括：

根据上述交互行为序列确定上述用户与每种产品的交互次数；

将上述交互次数大于预设阈值的产品确定为上述筛选后的产品数据。

根据本公开的实施例，上述产品特征向量是利用嵌入层对产品的产品信息进行处理得到的；采样概率是利用采样模块进行处理得到的；

根据本公开的实施例，上述方法还包括：

依次利用优化训练样本集中的样本训练初始神经网络，得到与上述优化训练样本对应的第一损失值，其中，上述优化训练样本集中的样本包括正样本和负样本，上述正样本包括用户的多条上述交互行为子序列，上述负样本包括至少一个其他用户的多条上述交互行为子序列；

在上述第一损失值不满足第一收敛阈值的情况下，利用随机梯度下降算法更新上述嵌入层的模型参数、上述采样模块的模型参数和上述初始神经网络的模型参数；

在上述第一损失值满足上述第一收敛阈值的情况下，将更新后的嵌入层的模型参数确定为上述嵌入层的目标模型参数、将更新后的采样模块的模型参数确定为上述采样模块的目标模型参数，以及将更新模型参数后的初始神经网络确定为训练完成的对比学习目标模型。

根据本公开的实施例，上述第一损失值L^C的计算如以下公式所示：

D_ω(p，q)＝exp(p^T·W·q)

其中，p和q表示用户两次采样得到的交互行为子序列；P^l表示采样得到的用户子序列的联合概率分布，即(p，q)～P^l；

则表示从至少一个其他用户的交互行为序列中随机采样得到的交互行为子序列；D_ω是初始神经网络中参数为ω的判别器，定义为log双线性模型；p^T表征对p进行转置。

根据本公开的实施例，上述利用均值聚类模型处理多个上述产品特征向量，得到多个聚类中心向量，包括：

利用均值聚类模型处理多个上述产品特征向量，得到对应于每个上述产品特征向量的多个产品特征分向量；

按照预设挑选条件，从多个产品的多个产品特征分向量中挑选得到多个目标产品特征分向量；

根据多个上述目标产品特征分向量，得到多个上述聚类中心向量，其中，上述聚类中心向量的数量小于上述产品特征向量的数量。

根据本公开的实施例，上述根据预设目标产品的预设特征向量和与上述交互行为序列对应的多个上述聚类中心向量，确定对应于每个上述聚类中心向量的采样概率，包括：

根据上述预设特征向量和上述交互行为序列，确定上述预设特征向量与每个上述聚类中心向量的相似性分数；

根据上述交互行为序列确定上述预设目标产品与每个上述聚类中心向量的相对时间差；

根据多个上述相似性分数和多个上述相对时间差，确定对应于每个上述产品的采样概率。

根据本公开的实施例，上述根据上述交互行为序列确定上述预设目标产品与每个上述聚类中心向量的相对时间差，包括：

采用相对时间差衡量与上述交互行为序列对应的多个上述聚类中心向量的时序关系，得到时间戳集合，其中，上述时间戳集合中的每个时间戳对应于用户与一个上述聚类中心向量发生交互行为的时间；

基于上述时间戳集合确定上述预设目标产品与每个上述聚类中心向量的相对时间差。

根据本公开的实施例，上述根据多个上述相似性分数和多个上述相对时间差，确定对应于每个上述产品的采样概率，包括：

针对每个上述相对时间差，将上述相对时间差转换为时序分数；

根据上述时序分数和与上述相对时间差对应的相似性分数，计算每个上述产品的采样概率。

根据本公开的实施例，上述利用上述预设特征向量和多条上述交互行为子序列训练深度兴趣网络，得到训练完成的点击率预测模型，包括：

将预设特征向量和与每条上述交互行为子序列对应的多个产品特征向量输入注意力机制层，得到多个相关性权重，其中，一个上述相关性权重表征上述预设特征向量和一个上述产品特征向量之间的相关性；

将上述多个相关性权重输入池化层，得到目标表征向量，其中，上述目标表征向量表征上述用户与上述预设目标产品之间关系的向量；

将上述目标表征向量输入多层感知机层，输出训练预测结果；

根据上述训练预测结果和损失函数，计算第二损失值；

在第二损失值不满足第二收敛阈值的情况下，利用随机梯度下降算法更新上述深度兴趣网络的模型参数；

在第二损失值满足第二收敛阈值的情况下，将更新后的深度兴趣网络确定为训练完成的点击率预测模型。

本公开实施例的另一个方面提供了一种产品点击率确定装置，包括：

获取模块，用于获取产品数据训练样本集，其中，上述产品数据训练样本集包括多个训练样本，每个上述训练样本包括具有预设维度的多个产品特征向量和交互行为序列，上述交互行为序列表征一个用户与多个产品发生交互行为的时间和顺序；

聚类模块，用于针对每个上述训练样本，利用均值聚类模型处理多个上述产品特征向量，得到多个聚类中心向量，其中，上述均值聚类模型是对K均值聚类模型进行预先训练得到的，每个上述聚类中心向量是指能够代表同一类中的多个上述产品特征向量的特征向量；

第一确定模块，用于根据预设目标产品的预设特征向量和与上述交互行为序列对应的多个上述聚类中心向量，确定对应于每个上述聚类中心向量的采样概率；

第二确定模块，用于按照多个上述采样概率，对上述交互行为序列进行采样处理，得到多条交互行为子序列；

训练模块，用于利用上述预设特征向量和多条上述交互行为子序列训练深度兴趣网络，得到训练完成的点击率预测模型；

预测模块，用于将待预测产品的产品特征向量和待预测用户的交互行为序列输入上述点击率预测模型，输出预测结果，其中，上述预测结果表征上述待预测用户点击上述待预测产品的概率。

本公开实施例的另一个方面提供了一种电子设备，包括：一个或多个处理器；存储器，用于存储一个或多个程序，其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如上所述的方法。

本公开实施例的另一个方面提供了一种计算机可读存储介质，存储有计算机可执行指令，所述指令在被执行时用于实现如上所述的方法。

本公开实施例的另一个方面提供了一种计算机程序产品，所述计算机程序产品包括计算机可执行指令，所述指令在被执行时用于实现如上所述的方法。

根据本公开的实施例，通过均值聚类模型对多个产品特征向量进行处理，以利用确定的聚类中心替换具体的产品特征向量，有利于消除噪声，以便于计算预设目标商品和每个聚类中心的采样概率，进而使得基于采样概率可以生成相关性高、噪声少、信息量高存留的交互行为子序列，利用交互行为子序列和预设特征向量训练生成的点击率预测模型在使用时具有较高的预测精度。

附图说明

通过以下参照附图对本公开实施例的描述，本公开的上述以及其他目的、特征和优点将更为清楚，在附图中：

图1示意性示出了根据本公开实施例的应用产品点击率确定方法的示例性***架构；

图2示意性示出了根据本公开实施例的产品点击率确定方法的流程图A；

图3示意性示出了根据本公开实施例的产品点击率确定方法的流程图B；

图4示意性示出了根据本公开实施例的产品特征向量的获取流程图；

图5示意性示出了根据本公开实施例的产品的推荐流程图；

图6示意性示出了根据本公开的实施例的产品点击率确定装置的框图；以及

图7示意性示出了根据本公开实施例的实现产品点击率确定方法的电子设备的框图。

具体实施方式

以下，将参照附图来描述本公开的实施例。但是应该理解，这些描述只是示例性的，而并非要限制本公开的范围。在下面的详细描述中，为便于解释，阐述了许多具体的细节以提供对本公开实施例的全面理解。然而，明显地，一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本公开的概念。

在此使用的术语仅仅是为了描述具体实施例，而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、操作、操作和/或部件的存在，但是并不排除存在或添加一个或多个其他特征、操作、操作或部件。

在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义，除非另外定义。应注意，这里使用的术语应解释为具有与本说明书的上下文相一致的含义，而不应以理想化或过于刻板的方式来解释。

在使用类似于“A、B和C等中至少一个”这样的表述的情况下，一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如，“具有A、B和C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。

现实场景中，由于信息技术的高速发展，用户在互联网平台上累积的行为记录日益增多，行为序列长度呈爆发式增长，并且涉及的需求多样，使得用户行为记录数据呈现出数量繁多与兴趣广泛的特点。其中，数量繁多指的是用户行为记录条数多、时间跨度大，带来明显的性能挑战；兴趣广泛指的是繁多的行为记录中蕴含的用户需求多种多样，同一个用户的两个行为记录之间既可能关联紧密，也可能毫无关系，这使得传统数据分析方法难以获得用户当前的准确兴趣。

经发明人研究发现，相关点击率预测方法大多数是截取近期的用户行为序列，如对长序列数据直接使用注意力机制等方法将在推理阶段带来巨大的时间花费且容易对点击率预测精度造成影响，难以在时间性能要求高的点击率预测任务中实际应用。

因此，设计一个能够高效提取信息并提高点击率预测精度的方法成为本领域技术人员急需解决的问题。

有鉴于此，本公开的实施例提供了一种产品点击率确定方法。该方法包括获取产品数据训练样本集，其中，产品数据训练样本集包括多个训练样本，每个训练样本包括具有预设维度的多个产品特征向量和交互行为序列，交互行为序列表征一个用户与多个产品发生交互行为的时间和顺序；针对每个训练样本，利用均值聚类模型处理多个产品特征向量，得到多个聚类中心向量，其中，均值聚类模型是对K均值聚类模型进行预先训练得到的，每个聚类中心向量是指能够代表同一类中的多个产品特征向量的特征向量；根据预设目标产品的预设特征向量和与交互行为序列对应的多个聚类中心向量，确定对应于每个聚类中心向量的采样概率；按照多个采样概率，对交互行为序列进行采样处理，得到多条交互行为子序列；利用预设特征向量和多条交互行为子序列训练深度兴趣网络，得到训练完成的点击率预测模型；将待预测产品的产品特征向量和待预测用户的交互行为序列输入点击率预测模型，输出预测结果，其中，预测结果表征待预测用户点击待预测产品的概率。

图1示意性示出了根据本公开实施例的可以应用产品点击率确定方法的示例性***架构100。需要注意的是，图1所示仅为可以应用本公开实施例的***架构的示例，以帮助本领域技术人员理解本公开的技术内容，但并不意味着本公开实施例不可以用于其他没备、***、环境或场景。

如图1所示，根据该实施例的***架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线和/或无线通信链路等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如点击率预测类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等。

服务器105可以是提供各种服务的服务器，例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的点击率预测请求等数据进行分析等处理，并将处理结果(例如根据用户请求获取或生成的点击率、网页、信息、或数据等)反馈给终端设备。

需要说明的是，本公开实施例所提供的产品点击率确定方法一般可以由服务器105执行。相应地，本公开实施例所提供的产品点击率确定装置一般可以设置于服务器105中。本公开实施例所提供的产品点击率确定方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地，本公开实施例所提供的产品点击率确定装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。或者，本公开实施例所提供的产品点击率确定方法也可以由终端设备101、102、或103执行，或者也可以由不同于终端设备101、102、或103的其他终端设备执行。相应地，本公开实施例所提供的产品点击率确定装置也可以设置于终端设备101、102、或103中，或设置于不同于终端设备101、102、或103的其他终端设备中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

图2示意性示出了根据本公开实施例的产品点击率确定方法的流程图A。图3示意性示出了根据本公开实施例的产品点击率确定方法的流程图B。

如图2和图3所示，该产品点击率确定方法包括操作S201～S206。

在操作S201，获取产品数据训练样本集，其中，产品数据训练样本集包括多个训练样本，每个训练样本包括具有预设维度的多个产品特征向量和交互行为序列，交互行为序列表征一个用户与多个产品发生交互行为的时间和顺序。

在操作S202，针对每个训练样本，利用均值聚类模型处理多个产品特征向量，得到多个聚类中心向量，其中，均值聚类模型是对K均值聚类模型进行预先训练得到的，每个聚类中心向量是指能够代表同一类中的多个产品特征向量的特征向量。

在操作S203，根据预设目标产品的预设特征向量和与交互行为序列对应的多个聚类中心向量，确定对应于每个聚类中心向量的采样概率。

在操作S204，按照多个采样概率，对交互行为序列进行采样处理，得到多条交互行为子序列。

在操作S205，利用预设特征向量和多条交互行为子序列训练深度兴趣网络，得到训练完成的点击率预测模型。

在操作S206，将待预测产品的产品特征向量和待预测用户的交互行为序列输入点击率预测模型，输出预测结果，其中，预测结果表征待预测用户点击待预测产品的概率。

根据本公开的实施例，产品特征向量是根据产品数据生成的，产品数据指的是用户交互序列中各产品的信息数据，包括但不限于产品的种类、价格等，用于提取产品的表征信息。多个训练样本中的产品特征向量可以是相同的。

根据本公开的实施例，交互行为序列可以是指：用户u的N个交互行为

组成该用户的行为序列，可以用符号

表示。

根据本公开的实施例，获取的产品数据和交互行为序列可以是预设时间段内的，预设时间段可以根据实际需求具体设定，例如可以是三年。预设维度可以是根据实际情况确定的，例如可以设定为50维。

根据本公开的实施例，均值聚类模型在预先训练时，可以利用本公开的多个产品特征向量作为预训练样本，也可以使用与本公开不同的多个产品特征向量作为预训练样本。

根据本公开的实施例，均值聚类模型在对产品特征向量进行处理时，还可以生成对应的映射表，映射表的作用在于根据预设特征向量确定与其最接近的聚类中心向量。

根据本公开的实施例，利用均值聚类模型处理训练样本中的多个产品特征向量，得到能够代表同一类中的多个产品特征向量的聚类中心。根据预先设定的预设目标产品的预设特征向量确定该预设特征向量与交互行为序列对应的每个聚类中心向量的采样概率。基于多个采样概率，从该交互行为序列采样得到少量相关产品，组成相关性高、噪音少、信息量高存留的交互行为子序列，其中，可以按照采样概率的大小进行采样，例如设定多个采样概率区间，将一个采样概率区间的产品组合成一个交互行为子序列。利用得到的预设特征向量e_t和多条交互行为子序列训练深度兴趣网络，以获得训练完成的点击率预测模型。

根据本公开的实施例，在使用该点击率预测模型时，可以将待预测产品的产品特征向量和待预测用户的交互行为序列输入点击率预测模型，输出待预测用户点击待预测产品的概率的预测结果，例如待预测用户点击待预测产品的概率为92％。

根据本公开的实施例，对获取到的多个产品数据进行筛选处理，得到筛选后的产品数据，包括如下操作：

根据交互行为序列确定用户与每种产品的交互次数。将交互次数大于预设阈值的产品确定为筛选后的产品数据。

根据本公开的实施例，预设阈值可以根据实际需求具体设定，例如为了对长序列数据进行处理，可以将预设阈值设置为50条。

根据本公开的实施例，产品特征向量是利用嵌入层对产品的产品信息进行处理得到的；采样概率是利用采样模块进行处理得到的。

根据本公开的实施例，产品点击率确定方法还包括如下操作：

依次利用优化训练样本集中的样本训练初始神经网络，得到与优化训练样本对应的第一损失值，其中，优化训练样本集中的样本包括正样本和负样本，正样本包括用户的多条交互行为子序列，负样本包括至少一个其他用户的多条交互行为子序列。

在第一损失值不满足第一收敛阈值的情况下，利用随机梯度下降算法更新嵌入层的模型参数、采样模块的模型参数和初始神经网络的模型参数。在第一损失值满足第一收敛阈值的情况下，将更新后的嵌入层的模型参数确定为嵌入层的目标模型参数、将更新后的采样模块的模型参数确定为采样模块的目标模型参数，以及将更新模型参数后的初始神经网络确定为训练完成的对比学习目标模型。

根据本公开的实施例，上述操作构成的辅助任务参考的是图象处理领域提出的对比学习方法，其思想在于对原始数据进行添加噪音、改变细节等方式获得与原始数据有所差异的负样本，再通过自监督学习使模型学会区分原始数据与负样本，进而在不需要更多数据的情形下有效增强模型的学习效果。

根据本公开的实施例，不同用户的兴趣差异往往较大，而同一用户的兴趣往往较为稳定、差异不大。基于这一常识假设，本实施例在每位用户的交互行为序列中进行多次采样，并将采样自同一用户的多条交互行为子序列作为正样本，采样自不同用户的多条交互行为子序列作为负样本，按照InfoNCE损失函数的类似形式构建自监督的对比学习目标模型进行训练。

根据本公开的实施例，第一损失值L^C的计算如公式(1)和(2)所示：

D_ω(p，q)＝exp(p^T·W·q) (2)

根据本公开的实施例，在每轮训练中，每位用户进行两次采样作为正样本p和q，并与其他用户的交互行为序列中采样得到的五个负样本

进行自监督对比学习，通过Adam优化器执行随机梯度下降算法优化参数ω，并由反向传播机制对嵌入层、采样模块等模型的参数进行优化更新，从而增强模型对用户兴趣的捕捉和区分，帮助点击率预测模型强化对每位用户的个人兴趣的记忆，进而有效提高预测的精度。

如图3所示，利用均值聚类模型处理多个产品特征向量，得到多个聚类中心向量，包括如下操作：

利用均值聚类模型处理多个产品特征向量，得到对应于每个产品特征向量的多个产品特征分向量。按照预设挑选条件，从多个产品的多个产品特征分向量中挑选得到多个目标产品特征分向量。根据多个目标产品特征分向量，得到多个聚类中心向量，其中，聚类中心向量的数量小于产品特征向量的数量。

根据本公开的实施例，聚类中心向量可以是多个产品特征向量中的一个，也可以是由多个产品特征向量拼接而成的一个聚类中心向量，拼接的聚类中心向量能够更能够代表该类中的多个产品特征向量。

根据本公开的实施例，使用K均值聚类算法基于所有产品特征向量进行聚类训练，其中聚类中心向量的数量C可以设定为产品总数的十分之一。对于M个产品，K均值聚类方法的损失函数如公式(3)所示：

其中e_i为产品i的产品特征向量，c_j为同一类的多个产品i对应的聚类中心向量。

根据本公开的实施例，在每轮训练时，将首先进行聚类训练，以保证聚类中心向量始终具有较好的代表性。经过这一步骤，可以得到产品-聚类中心映射表和K个聚类中心向量，最后一轮训练得到的映射表和K个聚类中心向量会存储下来，用于在线部署。

根据本公开的实施例，在聚类中心向量为拼接的聚类中心向量时，预设挑选条件可以是指按照不同产品种类进行挑选。例如从每种种类的多个产品的多个产品特征分向量中挑选出预设数量的产品目标产品特征分向量，将每种种类的预设数量的产品目标产品特征分向量进行拼接得到该种类的一个或多个聚类中心向量。

根据本公开的实施例，在聚类中心向量为多个产品特征向量中的一个时，可以直接从多个产品特征向量中挑选出一个或多个能够代表不同种类的聚类中心向量。

如图3所示，根据预设目标产品的预设特征向量和与交互行为序列对应的多个聚类中心向量，确定对应于每个聚类中心向量的采样概率，包括如下操作：

根据预设特征向量和交互行为序列，确定预设特征向量与每个聚类中心向量的相似性分数。根据交互行为序列确定预设目标产品与每个聚类中心向量的相对时间差。根据多个相似性分数和多个相对时间差，确定对应于每个产品的采样概率。

根据本公开的实施例，根据多个相似性分数和多个相对时间差，确定对应于每个产品的采样概率，包括如下操作：

针对每个相对时间差，将相对时间差转换为时序分数。根据时序分数和与相对时间差对应的相似性分数，计算每个产品的采样概率。

根据本公开的实施例，在进行上述操作之前，交互行为序列中的多个产品i已被确定的多个聚类中心向量i进行替换。

根据本公开的实施例，给定预设目标产品的预设特征向量e_t，首先采用加权向量内积来度量用户的交互行为序列中各聚类中心向量i与预设目标产品t的相似性，得到相似性分数r_i＝(W_ae_i)·(W_be_t)^T，其中W_a和W_b为对应权重，T为发生交互行为的时间。

根据本公开的实施例，根据交互行为序列确定预设目标产品与每个聚类中心向量的相对时间差，包括如下操作：

采用相对时间差衡量与交互行为序列对应的多个聚类中心向量的时序关系，得到时间戳集合，其中，时间戳集合中的每个时间戳对应于用户与一个聚类中心向量发生交互行为的时间。基于时间戳集合确定预设目标产品与每个聚类中心向量的相对时间差。

根据本公开的实施例，采用相对时间差衡量交互行为序列中各聚类中心向量i的时序关系。形式化地，对于用户u的交互行为序列，可获得每个行为的时间戳，时间戳集合记录为

根据本公开的实施例，在该交互行为序列中，最小的时间差记为

从而可得到交互行为序列中聚类中心向量i与预设预设目标产品t的相对时间差

将相对时间差通过编码器嵌入为时序分数，再与相似性分数加权求和，得到最终采样分数R_i＝r_i+W_c·E(l_i)，其中W_c为求和的权重。按照以上方式，可以计算得出给定预设目标产品t时用户u的交互行为序列中每个聚类中心向量i的采样得分，记为

由此，采用类似Softmax的方法，可以得到每个产品i的采样权重，即采样概率，采样概率如公式(4)所示。

根据本公开的实施例，在最后一轮训练中保存每位用户以多个聚类中心为交互行为序列时的采样权重，这样在线上推理时，可以直接将需要预测的待预测产品映射到某个聚类中心，再直接查找保存好的采样权重，即可免去计算采样权重的开销，直接在用户序列中进行耗时非常少的采样概率和后续的点击率预测，保证了时间效率。

图4示意性示出了根据本公开实施例的产品特征向量的获取流程图。

如图4所示，多个产品特征向量是通过如下操作S401～操作S407获得的。

在操作S401，对获取到的多个产品数据进行筛选处理，得到筛选后的产品数据。

在操作S402，针对多个筛选后的产品数据，在产品数据的产品属性符合第一预设条件的情况下，对产品数据的多个种类分别进行独热编码处理，得到与每个种类对应的第一独热向量，其中，产品属性包括产品价格、产品品牌或购买时间；

在操作S403，对多个第一独热向量进行拼接处理，得到产品数据的拼接特征向量。

在操作S404，在产品数据的产品属性不符合第一预设条件的情况下，利用分桶法处理产品，得到多个类别的类别向量。

在操作S405，对每个类别的类别向量进行独热编码处理，得到与每个类别对应的第二独热向量。

在操作S406，对多个第二独热向量进行拼接处理，得到产品数据的拼接特征向量。

在操作S407，将拼接特征向量进行预设维度的映射处理，得到一个产品特征向量。

根据本公开的实施例，出现频率极低的数据难以被学习，故本公开可以先对所有用户的交互行为序列中出现次数交底的产品数据进行去除。

根据本公开的实施例，第一预设条件可以是指产品价格、产品品牌、购买时间或产品种类是否连续。

在一种实施例的实施例中，在判定多个筛选后的产品数据的种类较为离散时，可以对每一个产品数据采用独热编码处理，得到对应的第一独热向量。例如，筛选后的产品数据的种类共计1882种，则每个产品将具有一个长度为1882的独热向量表征其种类。

在另一种实施例的实施例中，在判定多个筛选后的产品数据的产品价格、产品品牌、购买时间较为连续时，先对多个筛选后的产品数据进行分桶处理，例如将多个产品数据划分为低价区、平价区和高价区，得到转换后的类别特征再对其进行独热编码，得到对应的第二独热向量。

根据本公开的实施例，将每个产品所有的独热特征向量拼接，经过嵌入层(Embedding)映射为维度为50的稠密特征向量，即产品特征向量，作为产品的最终表征。形式化地表述，产品i的产品特征向量的最终表征为e_i＝E(x_i)，其中E为带权重的嵌入层编码器，x_i为产品拼接后的特征向量。

根据本公开的实施例，利用预设特征向量和多条交互行为子序列训练深度兴趣网络，得到训练完成的点击率预测模型，包括如下操作：

将预设特征向量和与每条交互行为子序列对应的多个产品特征向量输入注意力机制层，得到多个相关性权重，其中，一个相关性权重表征预设特征向量和一个产品特征向量之间的相关性。

将多个相关性权重输入池化层，得到目标表征向量，其中，目标表征向量表征用户与预设目标产品之间关系的向量。将目标表征向量输入多层感知机层，输出训练预测结果。

根据训练预测结果和损失函数，计算第二损失值。在第二损失值不满足第二收敛阈值的情况下，利用随机梯度下降算法更新深度兴趣网络的模型参数。在第二损失值满足第二收敛阈值的情况下，将更新后的深度兴趣网络确定为训练完成的点击率预测模型。

根据本公开的实施例，预测用户是否愿意点击预设目标产品为本公开的目标任务。在上文的阐述中，已采样获得用户行为短序列，因而在点击率预测模块只需使用这一短序列与预设目标产品的预设特征向量即可完成预测。

根据本公开的实施例，为了获得更快的预测速度和更加稳定、准确的预测效果，本公开选择基于注意力机制的DIN(Deep Interest Network)模型作为点击率预测模块。此模型采用Embedding&MLP架构，首先将预设目标产品的预设特征向量e_t和交互行为子序列中的聚类中心向量e_i，随后通过注意力机制进一步获得预设目标产品与交互行为子序列中各聚类中心向量e_i的相关性权重，再求和、池化获得用户与预设目标产品的共同向量表征作为目标表征向量，再将其输入到多层感知机(Multilayer Perception，MLP)中，最终通过多个训练样本完成点击率预测模型的训练。

需要说明的是，在将目标表征向量输入多层感知机时，还可以将目标表征向量和预设目标产品的附加特征进行拼接、平滑处理后的特征向量作为最终的目标表征向量，附加特征包括但不限于预设目标产品的商家位置、产品的受欢迎程度以及产品的推广内容。

点击率预测模型采用交叉熵损失函数对点击率预测模型进行训练优化，具体如公式(5)所示：

其中，B是数据量为D的产品数据训练样本集；x为目标表征向量；p(x)∈[0，1]表示多层感知机对某一样本预测的点击概率；y则是最终预测标签，其取值为1或0，分别表示此样本实际上属于正例或负例。

根据本公开的实施例，根据损失函数，在每轮训练中同样采用Adam优化器执行随机梯度下降方法进行梯度更新，训练至第二损失值满足第二收敛阈值。

图5示意性示出了根据本公开实施例的产品的推荐流程图。

如图5所示，由于点击率预测模型在训练时已学习到较长时间的的交互行为序列中隐含的用户偏好，并保存了对应的聚类中心向量、采样概率等少量参数，能够在预测时快速采样出相关性强的交互行为子序列并进行高效且准确的点击率预测，满足在线环境下较高的时效性要求。因此可以通过操作S501～操作504进行具体的使用。

操作S501，将点击率预测模型部署到电商平台，以便于通过上述产品点击率确定方法确定每一个产品的点击率.

操作S502，电商平台可以根据用户对每一产品的预测点击率并向用户进行推荐，以提高产品的购买量。

操作S503，电商平台可以每间隔一预设时间，在本地更新产品特征向量和交互行为序列并重新训练点击率预测模型。

操作S504，更新线上部署的点击率预测模型，使点击率预测模型能够时刻关注用户最新的兴趣，从而保证预测的准确性。

根据本公开的实施例，交互行为序列是通过如下操作确定的：

根据多个初始交互行为序列确定平均序列长度。根据平均序列长度对每个用户的初始交互行为序列进行截取或补齐操作，得到交互行为序列。

根据本公开的实施例，预先记录多个初始交互行为序列的平均长度N，再对初始交互行为序列执行截断或补齐操作，使所有交互行为序列均为N。之后，将初始交互行为序列中所有产品对应的聚类中心向量依次拼接，得到每位用户的特征向量，作为用户的最终表征u_i，如公式(6)所示：

经过以上处理，产品特征向量和交互行为序列均被处理为低维稠密的嵌入向量，便于参数训练和计算。聚类方法使用户的最终表征中仅包含代表性强的产品特征向量，即得到的聚类中心向量，有利于消除噪声，并且在后续计算中使用聚类中心替换具体产品，优化线上部署的存储和运算性能。

图6示意性示出了根据本公开的实施例的产品点击率确定装置的框图。

如图6所示，产品点击率确定装置600包括获取模块601、聚类模块602、第一确定模块603、第二确定模块604、训练模块605和预测模块606。

获取模块601，用于获取产品数据训练样本集，其中，产品数据训练样本集包括多个训练样本，每个训练样本包括具有预设维度的多个产品特征向量和交互行为序列，交互行为序列表征一个用户与多个产品发生交互行为的时间和顺序。

聚类模块602，用于针对每个训练样本，利用均值聚类模型处理多个产品特征向量，得到多个聚类中心向量，其中，均值聚类模型是对K均值聚类模型进行预先训练得到的，每个聚类中心向量是指能够代表同一类中的多个产品特征向量的特征向量。

第一确定模块603，用于根据预设目标产品的预设特征向量和与交互行为序列对应的多个聚类中心向量，确定对应于每个聚类中心向量的采样概率。

第二确定模块604，用于按照多个采样概率，对交互行为序列进行采样处理，得到多条交互行为子序列。

训练模块605，用于利用预设特征向量和多条交互行为子序列训练深度兴趣网络，得到训练完成的点击率预测模型。

预测模块606，用于将待预测产品的产品特征向量和待预测用户的交互行为序列输入点击率预测模型，输出预测结果，其中，预测结果表征待预测用户点击待预测产品的概率。

根据本公开的实施例，产品点击率确定装置600还包括筛选模块、第一编码模块、第一拼接模块、分桶模块、第二编码模块、第二拼接模块和映射模块。

筛选模块，用于对获取到的多个产品数据进行筛选处理，得到筛选后的产品数据。

第一编码模块，用于针对每个筛选后的产品数据，在产品数据的产品属性符合第一预设条件的情况下，对产品数据的多个种类分别进行独热编码处理，得到与每个种类对应的第一独热向量，其中，产品属性包括产品价格、产品品牌或购买时间。

第一拼接模块，用于对多个第一独热向量进行拼接处理，得到产品数据的拼接特征向量。

分桶模块，用于在产品数据的产品属性不符合第一预设条件的情况下，利用分桶法处理产品，得到多个类别的类别向量。

第二编码模块，用于对每个类别的类别向量进行独热编码处理，得到与每个类别对应的第二独热向量。

第二拼接模块，用于对多个第二独热向量进行拼接处理，得到产品数据的拼接特征向量。

映射模块，用于将拼接特征向量进行预设维度的映射处理，得到一个产品特征向量。

根据本公开的实施例，筛选模块包括第一确定单元和筛选单元。

第一确定单元，用于根据交互行为序列确定用户与每种产品的交互次数。

筛选单元，用于将交互次数大于预设阈值的产品确定为筛选后的产品数据。

根据本公开的实施例，产品点击率确定装置600还包括优化训练模块、第一更新模块和第二更新模块。

优化训练模块，用于依次利用优化训练样本集中的样本训练初始神经网络，得到与优化训练样本对应的第一损失值，其中，优化训练样本集中的样本包括正样本和负样本，正样本包括用户的多条交互行为子序列，负样本包括至少一个其他用户的多条交互行为子序列。

第一更新模块，用于在第一损失值不满足第一收敛阈值的情况下，利用随机梯度下降算法更新嵌入层的模型参数、采样模块的模型参数和初始神经网络的模型参数。

第二更新模块，用于在第一损失值满足第一收敛阈值的情况下，将更新后的嵌入层的模型参数确定为嵌入层的目标模型参数、将更新后的采样模块的模型参数确定为采样模块的目标模型参数，以及将更新模型参数后的初始神经网络确定为训练完成的对比学习目标模型。

根据本公开的实施例，聚类模块602包括第一得到单元、挑选单元和第二得到单元。

第一得到单元，用于利用均值聚类模型处理多个产品特征向量，得到对应于每个产品特征向量的多个产品特征分向量。

挑选单元，用于按照预设挑选条件，从多个产品的多个产品特征分向量中挑选得到多个目标产品特征分向量。

第二得到单元，用于根据多个目标产品特征分向量，得到多个聚类中心向量，其中，聚类中心向量的数量小于产品特征向量的数量。

根据本公开的实施例，第一确定模块603包括第二确定单元、第三确定单元和第四确定单元。

第二确定单元，用于根据预设特征向量和交互行为序列，确定预设特征向量与每个聚类中心向量的相似性分数。

第三确定单元，用于根据交互行为序列确定预设目标产品与每个聚类中心向量的相对时间差。

第四确定单元，用于根据多个相似性分数和多个相对时间差，确定对应于每个产品的采样概率。

根据本公开的实施例，第三确定单元包括得到子单元和确定子单元。

得到子单元，用于采用相对时间差衡量与交互行为序列对应的多个聚类中心向量的时序关系，得到时间戳集合，其中，时间戳集合中的每个时间戳对应于用户与一个聚类中心向量发生交互行为的时间。

确定子单元，用于基于时间戳集合确定预设目标产品与每个聚类中心向量的相对时间差。

根据本公开的实施例，第五确定单元包括转换子单元和计算子单元。

转换子单元，用于针对每个相对时间差，将相对时间差转换为时序分数。

计算子单元，用于根据时序分数和与相对时间差对应的相似性分数，计算每个产品的采样概率。

根据本公开的实施例，训练模块605包括输入单元、池化单元、感知单元、计算单元、更新单元和第五确定单元。

输入单元，用于将预设特征向量和与每条交互行为子序列对应的多个产品特征向量输入注意力机制层，得到多个相关性权重，其中，一个相关性权重表征预设特征向量和一个产品特征向量之间的相关性。

池化单元，用于将多个相关性权重输入池化层，得到目标表征向量，其中，目标表征向量表征用户与预设目标产品之间关系的向量。

感知单元，用于将目标表征向量输入多层感知机层，输出训练预测结果。

计算单元，用于根据训练预测结果和损失函数，计算第二损失值。

更新单元，用于在第二损失值不满足第二收敛阈值的情况下，利用随机梯度下降算法更新深度兴趣网络的模型参数。

第五确定单元，用于在第二损失值满足第二收敛阈值的情况下，将更新后的深度兴趣网络确定为训练完成的点击率预测模型。

根据本公开的实施例的模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路，例如现场可编程门阵列(Field ProgrammableGate Array，FPGA)、可编程逻辑阵列(Programmable Logic Arrays，PLA)、片上***、基板上的***、封装上的***、专用集成电路(Application Specific Integrated Circuit，ASIC)，或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现，或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者，根据本公开实施例的模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块，当该计算机程序模块被运行时，可以执行相应的功能。

例如，获取模块601、聚类模块602、第一确定模块603、第二确定模块604、训练模块605和预测模块606中的任意多个可以合并在一个模块/单元/子单元中实现，或者其中的任意一个模块/单元/子单元可以被拆分成多个模块/单元/子单元。或者，这些模块/单元/子单元中的一个或多个模块/单元/子单元的至少部分功能可以与其他模块/单元/子单元的至少部分功能相结合，并在一个模块/单元/子单元中实现。根据本公开的实施例，获取模块601、聚类模块602、第一确定模块603、第二确定模块604、训练模块605和预测模块606中的至少一个可以至少被部分地实现为硬件电路，例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC)，或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现，或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者，获取模块601、聚类模块602、第一确定模块603、第二确定模块604、训练模块605和预测模块606中的至少一个可以至少被部分地实现为计算机程序模块，当该计算机程序模块被运行时，可以执行相应的功能。

需要说明的是，本公开的实施例中产品点击率确定装置部分与本公开的实施例中产品点击率确定方法部分是相对应的，产品点击率确定装置部分的描述具体参考产品点击率确定方法部分，在此不再赘述。

图7示意性示出了根据本公开实施例的适于实现上文描述的方法的电子设备的框图。图7示出的电子设备仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图7所示，根据本公开实施例的电子设备700包括处理器701，其可以根据存储在只读存储器(Read-Only Memory，ROM)702中的程序或者从存储部分708加载到随机访问存储器(Random Access Memory，RAM)703中的程序而执行各种适当的动作和处理。处理器701例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如，专用集成电路(ASIC))，等等。处理器701还可以包括用于缓存用途的板载存储器。处理器701可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。

在RAM703中，存储有电子设备700操作所需的各种程序和数据。处理器701、ROM702以及RAM 703通过总线704彼此相连。处理器701通过执行ROM 702和/或RAM 703中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意，所述程序也可以存储在除ROM 702和RAM 703以外的一个或多个存储器中。处理器701也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。

根据本公开的实施例，电子设备700还可以包括输入/输出(I/O)接口705，输入/输出(I/O)接口705也连接至总线704。***700还可以包括连接至I/O接口705的以下部件中的一项或多项：包括键盘、鼠标等的输入部分706；包括诸如阴极射线管(CRT)、液晶显示器(Liquid Crystal Display，LCD)等以及扬声器等的输出部分707；包括硬盘等的存储部分708；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器710上，以便于从其上读出的计算机程序根据需要被安装入存储部分708。

根据本公开的实施例，根据本公开实施例的方法流程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读存储介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分709从网络上被下载和安装，和/或从可拆卸介质711被安装。在该计算机程序被处理器701执行时，执行本公开实施例的***中限定的上述功能。根据本公开的实施例，上文描述的***、设备、装置、模块、单元等可以通过计算机程序模块来实现。

本公开还提供了一种计算机可读存储介质，该计算机可读存储介质可以是上述实施例中描述的设备/装置/***中所包含的；也可以是单独存在，而未装配入该设备/装置/***中。上述计算机可读存储介质承载有一个或者多个程序，当上述一个或者多个程序被执行时，实现根据本公开实施例的方法。

根据本公开的实施例，计算机可读存储介质可以是非易失性的计算机可读存储介质。例如可以包括但不限于：便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM(Erasable Programmable Read Only Memory，EPROM)或闪存)、便携式紧凑磁盘只读存储器(Computer Disc Read-Only Memory，CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。

例如，根据本公开的实施例，计算机可读存储介质可以包括上文描述的ROM 702和/或RAM 703和/或ROM 702和RAM 703以外的一个或多个存储器。

本公开的实施例还包括一种计算机程序产品，其包括计算机程序，该计算机程序包含用于执行本公开实施例所提供的方法的程序代码，当计算机程序产品在电子设备上运行时，该程序代码用于使电子设备实现本公开实施例所提供的产品点击率确定方法。

在该计算机程序被处理器701执行时，执行本公开实施例的***/装置中限定的上述功能。根据本公开的实施例，上文描述的***、装置、模块、单元等可以通过计算机程序模块来实现。

在一种实施例中，该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中，该计算机程序也可以在网络介质上以信号的形式进行传输、分发，并通过通信部分709被下载和安装，和/或从可拆卸介质711被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输，包括但不限于：无线、有线等等，或者上述的任意合适的组合。

根据本公开的实施例，可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码，具体地，可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java，C++，python，“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。本领域技术人员可以理解，本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合，即使这样的组合或结合没有明确记载于本公开中。特别地，在不脱离本公开精神和教导的情况下，本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。

以上对本公开的实施例进行了描述。但是，这些实施例仅仅是为了说明的目的，而并非为了限制本公开的范围。尽管在以上分别描述了各实施例，但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围，本领域技术人员可以做出多种替代和修改，这些替代和修改都应落在本公开的范围之内。

Claims

1.一种产品点击率确定方法，包括：

获取产品数据训练样本集，其中，所述产品数据训练样本集包括多个训练样本，每个所述训练样本包括具有预设维度的多个产品特征向量和交互行为序列，所述交互行为序列表征一个用户与多个产品发生交互行为的时间和顺序；

针对每个所述训练样本，利用均值聚类模型处理多个所述产品特征向量，得到多个聚类中心向量，其中，所述均值聚类模型是对K均值聚类模型进行预先训练得到的，每个所述聚类中心向量是指能够代表同一类中的多个所述产品特征向量的特征向量；

根据预设目标产品的预设特征向量和与所述交互行为序列对应的多个所述聚类中心向量，确定对应于每个所述聚类中心向量的采样概率；

按照多个所述采样概率，对所述交互行为序列进行采样处理，得到多条交互行为子序列；

利用所述预设特征向量和多条所述交互行为子序列训练深度兴趣网络，得到训练完成的点击率预测模型；

将待预测产品的产品特征向量和待预测用户的交互行为序列输入所述点击率预测模型，输出预测结果，其中，所述预测结果表征所述待预测用户点击所述待预测产品的概率。

2.根据权利要求1所述的方法，其中，所述多个产品特征向量是通过如下方式获得的：

针对多个所述筛选后的产品数据，在产品数据的产品属性符合第一预设条件的情况下，对产品数据的多个种类分别进行独热编码处理，得到与每个所述种类对应的第一独热向量，其中，所述产品属性包括产品价格、产品品牌或购买时间；

对多个所述第一独热向量进行拼接处理，得到所述产品数据的拼接特征向量；

在产品数据的产品属性不符合所述第一预设条件的情况下，利用分桶法处理所述产品，得到多个类别的类别向量；

对多个所述第二独热向量进行拼接处理，得到所述产品数据的拼接特征向量；

将所述拼接特征向量进行预设维度的映射处理，得到一个所述产品特征向量。

3.根据权利要求2所述的方法，其中，所述对获取到的多个产品数据进行筛选处理，得到筛选后的产品数据，包括：

根据所述交互行为序列确定所述用户与每种产品的交互次数；

将所述交互次数大于预设阈值的产品确定为所述筛选后的产品数据。

4.根据权利要求1或2所述的方法，所述产品特征向量是利用嵌入层对产品的产品信息进行处理得到的；采样概率是利用采样模块进行处理得到的；

所述方法还包括：

依次利用优化训练样本集中的样本训练初始神经网络，得到与所述优化训练样本对应的第一损失值，其中，所述优化训练样本集中的样本包括正样本和负样本，所述正样本包括用户的多条所述交互行为子序列，所述负样本包括至少一个其他用户的多条所述交互行为子序列；

在所述第一损失值不满足第一收敛阈值的情况下，利用随机梯度下降算法更新所述嵌入层的模型参数、所述采样模块的模型参数和所述初始神经网络的模型参数；

在所述第一损失值满足所述第一收敛阈值的情况下，将更新后的嵌入层的模型参数确定为所述嵌入层的目标模型参数、将更新后的采样模块的模型参数确定为所述采样模块的目标模型参数，以及将更新模型参数后的初始神经网络确定为训练完成的对比学习目标模型。

5.根据权利要求4所述的方法，其中，所述第一损失值L^C的计算如公式(1)和(2)所示：

D_ω(p，q)＝exp(p^T·W·q) (2)

6.根据权利要求1所述的方法，其中，所述利用均值聚类模型处理多个所述产品特征向量，得到多个聚类中心向量，包括：

利用均值聚类模型处理多个所述产品特征向量，得到对应于每个所述产品特征向量的多个产品特征分向量；

根据多个所述目标产品特征分向量，得到多个所述聚类中心向量，其中，所述聚类中心向量的数量小于所述产品特征向量的数量。

7.根据权利要求1所述的方法，其中，所述根据预设目标产品的预设特征向量和与所述交互行为序列对应的多个所述聚类中心向量，确定对应于每个所述聚类中心向量的采样概率，包括：

根据所述预设特征向量和所述交互行为序列，确定所述预设特征向量与每个所述聚类中心向量的相似性分数；

根据所述交互行为序列确定所述预设目标产品与每个所述聚类中心向量的相对时间差；

根据多个所述相似性分数和多个所述相对时间差，确定对应于每个所述产品的采样概率。

8.根据权利要求7所述的方法，其中，所述根据所述交互行为序列确定所述预设目标产品与每个所述聚类中心向量的相对时间差，包括：

采用相对时间差衡量与所述交互行为序列对应的多个所述聚类中心向量的时序关系，得到时间戳集合，其中，所述时间戳集合中的每个时间戳对应于用户与一个所述聚类中心向量发生交互行为的时间；

基于所述时间戳集合确定所述预设目标产品与每个所述聚类中心向量的相对时间差。

9.根据权利要求7或8所述的方法，其中，所述根据多个所述相似性分数和多个所述相对时间差，确定对应于每个所述产品的采样概率，包括：

针对每个所述相对时间差，将所述相对时间差转换为时序分数；

根据所述时序分数和与所述相对时间差对应的相似性分数，计算每个所述产品的采样概率。

10.根据权利要求1所述的方法，其中，所述利用所述预设特征向量和多条所述交互行为子序列训练深度兴趣网络，得到训练完成的点击率预测模型，包括：

将预设特征向量和与每条所述交互行为子序列对应的多个产品特征向量输入注意力机制层，得到多个相关性权重，其中，一个所述相关性权重表征所述预设特征向量和一个所述产品特征向量之间的相关性；

将所述多个相关性权重输入池化层，得到目标表征向量，其中，所述目标表征向量表征所述用户与所述预设目标产品之间关系的向量；

将所述目标表征向量输入多层感知机层，输出训练预测结果；

根据所述训练预测结果和损失函数，计算第二损失值；

在第二损失值不满足第二收敛阈值的情况下，利用随机梯度下降算法更新所述深度兴趣网络的模型参数；