CN114329193B

CN114329193B - 基于时间感知兴趣演化的点击率预测方法

Info

Publication number: CN114329193B
Application number: CN202111596004.7A
Authority: CN
Inventors: 王佳萌; 陈乙雄
Original assignee: Chongqing University
Current assignee: Chongqing University
Priority date: 2021-12-24
Filing date: 2021-12-24
Publication date: 2024-06-25
Anticipated expiration: 2041-12-24
Also published as: CN114329193A

Abstract

本发明提出了一种基于时间感知兴趣演化的点击率预测方法，包括：S1，采集用户、目标项目、用户历史行为的用户数据信息；S2，根据所述用户数据信息预测所述用户在所述目标项目的点击概率；S3，将点击概率大于或者等于预设点击率阈值所对应的目标项目推荐给用户。本发明使用了时间感知注意力网络与ATT‑GRU，捕捉历史行为序列在不同时间维度(年份、月份、日份)的用户兴趣表示，通过捕捉每个维度的时间因素对注意力的影响，能够对于时间跨度较长期的用户的点击率得到更加精确的预估结果。

Description

基于时间感知兴趣演化的点击率预测方法

技术领域

本发明涉及点击率预测领域，特别是涉及一种基于时间感知兴趣演化的点击率预测方法。

背景技术

现代社会，人们每天都享受着互联网的便利，网上购物使得人们可以足不出户地购买自己想要的产品。与此同时，大量的用户行为数据被生成并记录下来。我们可以从这些数据中提取出一些重要的信息，例如用户的偏好和行为模式，推荐***可以利用这些信息为用户提供个性化的服务或内容，提升他们的体验。点击率(CTR)预测是在线广告和推荐***等电子商务的核心任务，因为它与整个平台的收入直接相关，也影响用户体验和满意度。对于点击率(CTR)预测模型，捕捉用户的兴趣是提高性能的关键部分。

Wide and Deep(WDL)和Product Neural Network(PNN)等许多点击率(CTR)预测模型都使用深度学习方法来提取项目特征表示以及特征之间的交互。然而，这些模型没有考虑到使用用户历史行为来捕捉用户的个性化兴趣。通过使用注意力机制，一些先进的点击率(CTR)预测模型基于用户历史行为提取行为特征来捕获用户兴趣。这些模型背后的基本思想是：用户的兴趣是多样化的，如果直接从用户行为数据中捕获用户兴趣，将会有噪声干扰。因此，根据目标项目，注意力机制被用于激活用户历史行为中的相关行为。与目标项目密切相关的行为将被给予较大的注意力分数，而其他行为将被较小的权重过滤掉。其中，深度兴趣网络(DIN)是第一个在推荐***中使用注意力机制的模型，它利用注意力来捕捉目标项目与用户历史行为的相关性，并得到自适应的用户兴趣表示。

虽然注意力可以有效地提高模型性能，但大多数模型，如DIN和DIEN，以顺序的方式来处理历史行为数据。这些序列模型在实践中只考虑了用户历史行为序列的顺序，而不去考虑用户历史行为的时间因素。对于时间跨度较为长期的用户历史序列，用户历史行为的出现与时间因素密切相关。考虑用户的个性化的偏好，用户的历史行为的时间因素一定程度上体现出用户的个性化兴趣。如在购物时，用户A喜欢在“双十一”购买生活用品，在年末购买服装；而用户B习惯每半年买一次生活用品，在换季时期购买服装。对于长期的用户行为，时间因素包含有有价值的信息，模型是否能够挖掘到这些信息也十分重要。为了更好的挖掘用户兴趣，我们我们提出了一个新的模型，即时间感知兴趣演化模型。该模型使用时间感知注意力网络，捕捉不同时间维度(年份、月份、日份)交互影响下的用户兴趣，并得到用户个性化的兴趣表示。对于时间跨度较大的历史行为数据，可以有效捕捉用户动态兴趣随时间进行的动态变化。

发明内容

本发明旨在至少解决现有技术中存在的技术问题，特别创新地提出了一种基于时间感知兴趣演化的点击率预测方法。

为了实现本发明的上述目的，本发明提供了一种基于时间感知兴趣演化的点击率预测方法，包括：

S1，采集用户、目标项目、用户历史行为的用户数据信息；

S2，根据所述用户数据信息预测所述用户在所述目标项目的点击概率；

S3，将点击概率大于或者等于预设点击率阈值所对应的目标项目推荐给用户。

进一步地，所述S2包括：

S2-1，通过预测模型的嵌入层将用户、目标项目和用户历史行为中的稀疏特征转化为低维密集向量，得到用户、目标项目和用户历史行为的嵌入向量；

S2-2，捕获用户的兴趣表示；

S2-3，将目标项目、用户的嵌入向量和用户的兴趣表示连接起来，得到连接的向量；

S2-4，将连接的向量送入多层感知器MLP；

S2-5，使用softmax函数预测用户点击目标项目的概率。

进一步地，所述S2-2包括：

S2-2-1，通过所述预测模型的兴趣提取层基于用户历史行为的嵌入向量提取用户历史行为的兴趣表示；

S2-2-2，通过所述预测模型的兴趣发展层基于目标项目的嵌入向量提取目标项目的兴趣表示。

进一步地，所述兴趣提取层包括：

采用GRU模型来模拟行为之间的依赖关系，其中GRU的输入是按发生时间排序的行为；

所述GRU模型包括：

u_t＝σ(W^ui_t+U^uh_t-1+b^u)

r_t＝σ(W^ri_t+U^rh_t-1+b^r)

其中u_t代表GRU的更新门；

σ(·)为sigmoid激活函数；

i_t是GRU的输入；

h_t-1表示GRU第t-1个隐藏层的状态；

r_t代表重置门；

代表候选集；

h_t表示GRU第t个隐藏层的状态；

tanh(·)为双曲正切函数；

为元素乘积符号；

W^u,W^r,W^h均为属于N_H×d_model维实数域的参数；

U^u,U^r,U^h均为属于N_H×N_H维实数域的参数；

b^u,b^r,b^h均为属于N_H×N_H维实数域的参数；

N_H为隐藏层的尺寸。

进一步地，所述兴趣发展层包括：

采用注意力机制和ATT-GRU模型相结合的模型；

所述注意力机制包括时间感知注意力网络，所述时间感知注意力网络包括：注意力分数p_a＝a(b_a,e_t)以及三个时间的注意力分数p_y，p_m，p_d；

当前年份与用户历史行为发生的年份进行交互，得到年份的注意力分数为：

p_y＝a(y_t,y_now)

其中a(·,·)为注意力函数；

y_t表示用户历史行为发生的年份；

y_now表示当前年份的嵌入向量；

当前年份与用户历史行为发生的月份进行交互，得到月份的注意力分数为：

p_m＝a(m_t,m_now)

其中m_t表示用户历史行为发生的月份；

m_now表示当前月份的嵌入向量；

当前日份与用户历史行为发生的日份进行交互，得到日份的注意力分数为：

p_d＝a(d_t,d_now)

其中d_t表示用户历史行为发生的日份；

d_now表示当前日份的嵌入向量；

最终输出非线性组合a′：

a′＝W₀p_a+W₁p_y+W₂p_m+W₃p_d+W₄p_yp_mp_d+W₅p_ap_yp_mp_d

其中W₀、W₁、W₂、W₃、W₄、W₅为向量参数。

进一步地，所述ATT-GRU模型包括：

其中u′_t代表ATT-GRU的包含注意力的更新门；

σ(·)为sigmoid激活函数；

i′_t是ATT-GRU的输入；

h′_t-1表示ATT-GRU第t-1个隐藏层的状态；

w_t指时间感知注意力网络得到的注意力分数；

r′_t代表ATT-GRU的包含注意力的重置门；

代表候选集；

z′_t代表额外的候选集；

y′_t代表i′_t的年份表示向量；

m′_t代表i′_t的月份表示向量；

d′_t代表i′_t的日份表示向量；

h′_t表示ATT-GRU第t个隐藏层的状态；

tanh(·)为双曲正切函数；

为元素乘积符号；

均为属于N_H×d_model维实数域的参数；

均为属于N_H×N_H维实数域的参数；

均为属于N_H×d_model维实数域的参数；

均为属于N_H×N_H维实数域的参数；

均为属于N_H×d_model维实数域的参数；

d_model为嵌入维度；

N_H为隐藏层的尺寸。

进一步地，所述预测模型还包括全局损失，所述全局损失为：

L＝L_target+α*L_aux

其中L_target为损失函数；

α是平衡兴趣特征表示和点击率预测的超参数；

L_aux为辅助损失函数。

进一步地，所述辅助损失包括：

其中y_aux表示用户正样本实例的激活函数值；

σ(·,·)为sigmoid激活函数，[x₁,x₂]表示向量x₁与向量x₂的拼接；

表示用户i的第t个GRU隐藏状态；

表示用户i点击的第t+1个项目的嵌入向量；

表示用户负样本实例的激活函数值；

表示排除/>的项目集合Ε中的项目的嵌入向量；

N表示用户的总数。

综上所述，由于采用了上述技术方案，本发明使用了时间感知注意力网络，捕捉历史行为序列在不同时间维度(年份、月份、日份)的用户兴趣表示，通过捕捉每个维度的时间因素对注意力的影响，能够对于时间跨度较长期的用户的点击率得到更加精确的预估结果。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1是本发明的预测模型示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

本发明提出了一种基于时间感知兴趣演化的点击率预测方法，具体内容如下：

1、相关工作

由于深度学习在特征表示和组合方面具有较强的能力，点击率(CTR)预测模型从传统的线性或非线性模型成为深度模型。大多数深度模型遵循嵌入和多层感知器(MLP)的结构。基于此，越来越多的模型开始关注特征之间的交互作用：WideandDeep和DeepFM将低阶和高阶特征结合起来，提高了特征的表达能力；PNN提出了一个产品层来捕获领域间类别之间的交互模式。然而，这些方法并不能清晰地反映出数据背后的用户兴趣。许多研究从用户的历史行为序列中学习用户兴趣表示，如CNN，RNN，Transformer和Capsule等。其中，利用注意力机制从历史行为中捕捉用户兴趣的用户兴趣模型已被广泛证明是有效的。DIN首次引入了注意力机制来激活给定目标项目的用户历史行为序列，成功捕捉用户兴趣的多样性特征。ATRANK提出了一个基于注意力的框架，对用户异构行为之间的影响进行建模。DIEN指出，历史行为之间的序列关系对于建模用户很重要。DIEN设计了基于GRU的带辅助损失的兴趣提取层，可以更好的表示用户兴趣。DSIN假设行为序列由会话组成，并使用自我注意在每个会话中提取用户的兴趣，并应用Bi-LSTM捕捉用户的跨会话兴趣。DHAN提出了一个分层的注意力网络，从较高层次的属性(例如，类别、价格或品牌)逐步向较低层次的属性或项目建模用户的兴趣。由于序列模型的限制，上述用户兴趣模型在处理用户行为序列时仍然存在问题。为了更好的利用用户行为序列的时间因素，TLSAN提出长、短期特征关注层，有效捕捉用户的长、短期偏好，实现准确的推荐。DINMP考虑使用不连续的方法处理用户序列，将用户的历史行为的时间因素编码与行为向量结合，得到时间因素影响下的用户兴趣表示。

2、TIEN模型

在本节中，我们将详细介绍时间感知兴趣演化模型(TIEN)。首先介绍了基本的深度点击率(CTR)预测模型的BaseModel，然后介绍了TIEN的模型设计。TIEN模型对用户个性化兴趣的提取和交互进行了建模。

2.1BaseModel

在本节中，我们主要介绍BaseModel中的特征表示、嵌入、多层感知器(MLP)和损失函数。

2.1.1特征表示

在点击率(CTR)预测任务中，信息特征占有重要的地位。总的来说，我们在BaseModel中输入了三组特征：用户、目标项目和用户历史行为。其中，我们将广告作为本文的目标项目。每组特征由一些字段组成：用户包含性别、年龄等；目标项目包含广告id、类别id等；用户行为是用户访问的广告id列表，主要由广告id组成。

2.1.2嵌入

嵌入是一种常用的将大规模稀疏特征转化为低维密集向量的技术。在数学上，稀疏特征可以用表示，其中/>表示M×d_model维的实数域，M是稀疏特征的维度，d_model是模型嵌入维度。用户特征、目标项目特征、用户历史行为特征的嵌入向量分别表示为u_i、b_a、S。在点击率(CTR)预测模型中，其中，用户特征可以用/>表示，N_u表示用户稀疏特征的个数。目标项目特征可以用/>表示，N_a表示项目稀疏特征的个数。用户历史行为特征S包含一个行为列表，可以用/>表示，T为用户历史行为的数量，e_t:{t＝1,2,...,T}为第t个行为的嵌入向量，K表示用户可以点击的商品总数。

2.1.3多层感知器(MLP)

首先，将用户、项目和用户历史行为中的稀疏特征拼接、平铺，然后通过PRELU/Dice等激活功能送入多层感知器(MLP)。最后使用softmax函数预测用户点击目标物品的概率。

2.1.4损失函数

负对数似然函数广泛应用于CTR模型中，通常定义为：

其中x＝[u_i,b_a,S]∈D，D为大小为N的训练数据集，N代表数据集用户的数目，训练时一个用户就是一条输入数据；y∈{0,1}表示用户是否点击了该目标项目，若用户点击了该项则y＝1，若用没有户点击该项则y＝0。p(·)为网络的最终输出，表示用户点击该目标项目的预测概率。训练数据集D每一项都包括网络输入x和正确输出y，即为(x，y)。训练时根据输入x以及正确答案y训练模型参数。

2.2注意力机制

不论是DIN还是DIEN，所使用的注意力思想都是：用户对目标广告的兴趣与与目标广告高度相似的那部分行为密切相关。具体来说，该模型首先构造一个关注度评分来衡量目标广告与用户的每个行为的关联程度，然后通过加权求和池运算来聚合用户历史行为的嵌入，公式如下：

其中b_a是当前样本i中目标广告的嵌入向量，{e_t:t＝1,2,...T}是用户历史行为的嵌入向量，a(·,·)表示注意力函数。公式(2)也可以理解为我们在当前样本i中将权重w_i的第t项分配给用户第t个历史行为的嵌入向量e_t。

2.3模型概述

在许多电子商务平台中，比如在线展示广告，用户并没有清晰地展示自己的意图，所以捕捉用户的兴趣对于点击率(CTR)预测很重要。与DIEN相比，TIEN算法通过时间感知注意力网络，捕获用户时间相关的个性化兴趣表示。如图1所示，TIEN由几个部分组成。首先，通过嵌入层对所有类别的特征进行变换。其次，TIEN通过两个步骤捕获用户个性化的兴趣表示：兴趣提取层基于用户历史行为序列提取兴趣表示序列；兴趣发展层相对于目标项目，通过时间感知注意力网络与ATT-GRU捕捉用户个性化兴趣。然后将广告、用户特征的嵌入向量和最终兴趣表示串联起来。将连接的向量送入MLP进行最终预测。其中MLP又名全连接前馈神经网络，包括输入层、全连接层、输出层，PReLU、Dice都是网络激活函数，200，80是dense函数维度大小参数。

如图1所示，输入的用户历史行为按时间排序，嵌入层将用户历史行为转换为嵌入向量S。然后兴趣提取层在辅助损失的帮助下提取每个用户历史行为的兴趣状态h_t。在兴趣发展层，时间感知注意力网络提取用户的时间感知的注意力分数，ATT-GRU对与目标项目相关的兴趣演化过程进行建模。最终兴趣状态h′_t和剩余特征的嵌入向量被连接，并被馈送到MLR用于最终CTR预测。

2.3.1兴趣提取层

在电子商务***中，用户行为是用户潜在兴趣的载体，用户采取一种行为后，兴趣就会发生变化。在兴趣提取层，我们从连续的用户行为中提取一系列用户兴趣状态。

电子商务***中用户的点击行为是丰富的，其中历史行为序列可能包含长期的用户行为。为了效率和性能之间的平衡，我们采用GRU模型来模拟行为之间的依赖关系，其中GRU的输入是按发生时间排序的行为。GRU克服了RNN的消失梯度问题，速度比LSTM快，非常适用于电子商务***。GRU的构造如下：

u_t＝σ(W^ui_t+U^uh_t-1+b^u) (3)

r_t＝σ(W^ri_t+U^rh_t-1+b^r) (4)

其中u_t代表更新门，r_t代表重置门，代表候选集，为网络内部结构。σ(·)为sigmoid激活函数，/>为元素乘积符号，/> N_H为隐藏层的尺寸。i_t是GRU的输入，i_t＝e_t表示用户采取的第t个行为，h_t即第t个隐藏层的状态即第t个历史行为的GRU隐藏层状态。W^u,W^r,W^h、U^u,U^r,U^h，b^u、b^r、b^h均为参数。

除此之外，DIEN的兴趣提取层使用了辅助损失来帮助GRU的每个隐藏状态都更好地表达兴趣。我们保留了这一模块，为嵌入层的学习提供了更多的语义信息，从而得到更好的嵌入矩阵。

只捕捉用户历史行为之间依赖关系的隐藏状态h_t不能有效地表示用户个性化兴趣。由于目标项目的点击行为是由最终的兴趣表示触发的，因此L_target中使用的标签只监督最终的兴趣预测，而历史的状态h_t(t<T)无法获得适当的监督。因此提出了辅助损失，利用行为第t+1次行为e_t+1来监督兴趣状态h_t的学习过程。除了使用真实的下一个行为作为正样本实例之外，我们还使用负样本实例，该实例从除了被点击的项目之外的项目集合中采样。代表用户i点击的第t个项目的嵌入向量，E表示整个项目集合，/>表示从项目集合中采样的项目(用户i在第t步点击的项目除外)的嵌入。辅助损失可表示为：

其中为sigmoid激活函数，y_aux表示用户正样本实例的激活函数值，/>表示用户负样本实例的激活函数值，/>表示用户i的第t个GRU隐藏状态。我们在点击率(CTR)预测模型中使用的全局损失为：

L＝L_target+α*L_aux (10)

其中α是平衡兴趣特征表示和点击率(CTR)预测的超参数，L_aux为辅助损失。

在辅助损失的帮助下，每个隐藏状态h_t都足够表达用户采取行为i_t后的兴趣状态。所有T个兴趣点[h₁,h₂,...,h_T]连接的兴趣表示序列，在兴趣发展层可以模拟兴趣演化的过程。其中h_T为兴趣提取层得到的第T个兴趣表示，T代表行为序列总个数。

2.3.2兴趣发展层

在外部环境和内部认知的共同影响下，不同类型的用户兴趣随着时间的推移而演变。以对衣服的兴趣为例，随着时间和用户品味的变化，用户对衣服的偏好也在演变。用户对服装兴趣的演变过程将直接决定对候选服装的点击率预测。DIEN对兴趣的演变过程进行建模，可以为最终兴趣的表达提供更多的相关历史信息，更好地预测目标项目的点击率。

兴趣在进化过程中表现出下面几个特征：

由于兴趣的多样性，用户的个性化兴趣可以漂移。兴趣漂移对行为的影响是用户可能在某一时间段对各种书籍感兴趣，而在另一时间段需要衣服。

虽然兴趣可能相互影响，但每一种兴趣都有自己的演变过程，比如书籍和服装的演变过程几乎是单独的。所以我们只关注与目标项目相关的兴趣的发展过程。

用户的长期兴趣与时间因素相关，如在购物时，某用户在月初购买生活用品，在换季时期购买服装。

对于时间跨度较为长期的用户历史行为，用户对目标项目的兴趣与时间因素有很大的相关性。因此，虽然GRU只对顺序因素进行建模，但我们可以在考虑目标项目的兴趣演化过程中，添加时间感知注意力网络层来代替DIEN原有的注意力。

新的时间感知注意力层的优势如下：

用户历史行为的时间因素，包括年份，月份和日份，可以添加到注意力分数里面。而DIN、DIEN、DISN等模型都未曾考虑这些信息。

新的时间感知注意力网络在考虑时间因素的同时，也考虑了旧的注意力。新的注意力分数可以更好的表示对目标项目在时间因素影响下的兴趣。

3.3.2.1时间感知注意力网络层

由于用户对目标项目的兴趣与时间因素有很大的相关性，因此我们提出了一种新颖的时间感知注意机制来考虑额外的时间信息。原来的注意力网络a(b_a,e_t)被新的注意力a′(e_t,b_a,q_t,T_now)所取代。

在这里q_t＝(y_t,m_t,d_t)表示用户历史行为发生的年份、月份、日份的嵌入向量，y_t表示用户历史行为发生的年份，m_t表示用户历史行为发生的月份，d_t表示用户历史行为发生的日份；T_now＝(y_now,m_now,d_now)表示当前的年份、月份、日份的嵌入向量。我们希望通过设计更合理的网络结构，将额外的时间信息整合到注意力网络中，以提高性能。虽然没有明确的方法来设计新的注意力网络，但我们希望保留几个直观的原则：

保留旧的注意力作为一部分，它以目标广告的嵌入和用户历史行为作为输入。

时间信息对每个行为的影响应该是个性化的。用户历史行为发生的年份、月份和日份，都可能会对最后的注意力分数产生影响。

在上述原则的激励下，通过多次测试，我们设计了如下的时间感知注意力网络。

首先，当前年份与用户历史行为发生的年份进行交互，得到年份的参数化结果为：

p_y＝a(y_t,y_now) (12)

其中a(·,·)为注意力函数。类似地，月份的参数化结果为p_m＝a(m_t,m_now)，日份的参数化结果为p_d＝a(d_t,d_now)。除了旧的注意力分数p_a＝a(b_a,e_t)之外，我们还有另外三个时间因素p_y，p_m，p_d，最终的输出是由一个非线性组合构建的：

a′＝W₀p_a+W₁p_y+W₂p_m+W₃p_d+W₄p_yp_mp_d+W₅p_ap_yp_mp_d (13)

其中W₀、W₁、W₂、W₃、W₄、W₅是网络的参数，具体为向量，维度为[p_a维度,注意力层维度]。

其中W_j是网络的参数。时间感知注意力网络如图1所示。最终得到的注意力分数结果为w_t＝a′(e_t,b_a,q_t,T_now)。

3.3.2.2ATT-GRU

接下来，我们设计了ATT-GRU来模拟兴趣演化过程。并与几种现有的注意力机制和GRU相结合的方法进行比较。

AIGRU、AGRU、AUGRU均为现有的结合注意力机制对GRU的改进。

AIGRU：为了在兴趣演化过程中激活相对兴趣，一种朴素的方法是使用带有注意力的输入的GRU。AIGRU利用注意力分数影响兴趣进化层的输入。如公式(12)所示：

i′_t＝h_t*w_t (14)

其中，h_t是GRU在兴趣提取层的第t个隐藏层状态，i′_t是用于兴趣演化的第二个GRU的输入，*意味着标量与向量乘积，w_t表示第t个历史行为的注意力分数。在AIGRU中，与目标项目不太相关的兴趣的权重可以通过注意力得分来降低。理想情况下，与目标项目十分不相关的输入值可以减少到零。然而，AIGRU的实际效果不太好。因为即使零输入也能改变GRU的隐藏层状态，即便相对兴趣减少，也会影响兴趣进化的学习。

AGRU：在问题回答领域，AGRU首先被提出。通过来自注意机制的嵌入信息修改GRU结构后，AGRU可以有效地提取复杂查询中的关键信息。详细来说，AGRU用注意力分数来代替公式(6)中GRU的更新门u_t，直接改变隐藏层状态。公式如下：

其中h′_t、h′_t-1分别是AGRU的第t层、第t-1层的隐藏层状态，是AGRU的候选集。在兴趣演化过程中，AGRU利用注意力分数直接控制隐藏层状态的更新。AGRU弱化了与目标项目不太相关的兴趣的影响，提高了注意力机制的影响力，帮助AGRU克服了AIGRU的缺陷。

AUGRU：虽然AGRU可以使用注意力分数来直接控制隐藏层状态的更新，但是它使用标量(注意力分数w_t)来替换向量(更新门u_t)，忽略了不同维度的重要性差异。DIEN提出了带有注意力更新门的GRU，将注意机制和GRU结合：

其中u′_t是原始的更新门，是DIEN为AUGRU设计的带有注意力的更新门，h′_t、h′_t-1分别是AGRU的第t层、第t-1层的隐藏层状态，/>是AUGRU的候选集，/>为元素乘积符号。AUGRU保留了更新门的原始维度信息，在区分维度信息的基础上，使用注意力分数来衡量更新门的所有维度，与目标项目不太相关的兴趣对隐藏状态的影响较小，这避免了兴趣漂移带来的干扰，可以推动相对兴趣平稳进化。

ATT-GRU：虽然AUGRU使用带注意力的更新门来衡量更新门的所有维度，减少与目标项目不太相关的兴趣对隐藏状态的影响。但是我们还需要将时间信息传递给GRU隐藏层，并为更新门和重置门一起提供注意力。为此，我们提出了一种新的将GRU与注意力机制相结合的模型，即ATT-GRU。公式如下：

其中u′_t代表包含注意力信息的更新门，r′_t代表包含注意力信息的重置门。此外，z′_t是一个额外的候选激活向量，被用来扩展正常的GRU隐藏层，y′_t代表i′_t的年份表示向量，m′_t代表i′_t的月份表示向量，d′_t代表i′_t的日份表示向量。

在ATT-GRU中，注意力分数被添加到了重置门和更新门作为其一部分，我们认为这对序列模型是有意义的。这可以衡量隐藏状态与目标项目的相关性，避免兴趣漂移带来的干扰。此外，如图1所示，一个额外的候选激活向量z′_t模拟了时间因素的相对贡献，用于扩展正常的GRU单元并添加到隐藏层中，这为用户的兴趣表示添加了时间信息，更个性化地表示了用户的兴趣。

4、结论

在本文中，对于时间跨度较为长期的用户历史序列，我们提出了一个时间感知的深度兴趣网络来提高点击率(CTR)预测的性能。提出的TIEN模型主要包括二个部分。兴趣提取层基于用户历史行为序列提取兴趣表示；兴趣进化层模拟与时间因素密切相关的用户动态兴趣随时间进行的演化过程，其中时间感知注意力网络捕捉考虑了用户行为序列的时间因素对注意力分数的影响，ATT-GRU结合了注意力分数与GRU，并为用户的兴趣表示添加了时间信息，更个性化地表示了用户的兴趣。最后，实验结果验证了我们的模型在广告和推荐数据集上的有效性。未来，我们将尝试构建更加个性化的兴趣模型进行点击率(CTR)预测。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

Claims

1.一种基于时间感知兴趣演化的点击率预测方法，其特征在于，包括：

S1，采集用户、目标项目、用户历史行为的用户数据信息；

S2-2，捕获用户的兴趣表示；

所述兴趣提取层包括：

所述GRU模型包括：

u_t＝σ(W^ui_t+U^uh_t-1+b^u)

r_t＝σ(W^ri_t+U^rh_t-1+b^r)

其中u_t代表GRU的更新门；

σ(·)为sigmoid激活函数；

i_t是GRU的输入；

h_t-1表示GRU第t-1个隐藏层的状态；

r_t代表重置门；

代表候选集；

h_t表示GRU第t个隐藏层的状态；

tanh(·)为双曲正切函数；

为元素乘积符号；

W^u,W^r,W^h均为属于N_H×d_model维实数域的参数；

U^u,U^r,U^h均为属于N_H×N_H维实数域的参数；

b^u,b^r,b^h均为属于N_H×N_H维实数域的参数；

N_H为隐藏层的尺寸；

S2-2-2，通过所述预测模型的兴趣发展层基于目标项目的嵌入向量提取目标项目的兴趣表示；

所述兴趣发展层包括：

采用注意力机制和ATT-GRU模型相结合的模型；

p_y＝a(y_t,y_now)

其中a(·,·)为注意力函数；

y_t表示用户历史行为发生的年份；

y_now表示当前年份的嵌入向量；

p_m＝a(m_t,m_now)

其中m_t表示用户历史行为发生的月份；

m_now表示当前月份的嵌入向量；

p_d＝a(d_t,d_now)

其中d_t表示用户历史行为发生的日份；

d_now表示当前日份的嵌入向量；

最终输出非线性组合a′：

a′＝W₀p_a+W₁p_y+W₂p_m+W₃p_d+W₄p_yp_mp_d+W₅p_ap_yp_mp_d

其中W₀、W₁、W₂、W₃、W₄、W₅为向量参数；

所述ATT-GRU模型包括：

其中u′_t代表ATT-GRU的包含注意力的更新门；

σ(·)为sigmoid激活函数；

i′_t是ATT-GRU的输入；

h′_t-1表示ATT-GRU第t-1个隐藏层的状态；

w_t指时间感知注意力网络得到的注意力分数；

r_t′代表ATT-GRU的包含注意力的重置门；

代表候选集；

z′_t代表额外的候选集；

y′_t代表i′_t的年份表示向量；

m′_t代表i′_t的月份表示向量；

d′_t代表i′_t的日份表示向量；

h′_t表示ATT-GRU第t个隐藏层的状态；

tanh(·)为双曲正切函数；

为元素乘积符号；

均为属于N_H×d_model维实数域的参数；

均为属于N_H×N_H维实数域的参数；

均为属于N_H×d_model维实数域的参数；

均为属于N_H×N_H维实数域的参数；

均为属于N_H×d_model维实数域的参数；

d_model为嵌入维度；

N_H为隐藏层的尺寸；

S2-4，将连接的向量送入多层感知器MLP；

S2-5，使用softmax函数预测用户点击目标项目的概率；

2.根据权利要求1所述的一种基于时间感知兴趣演化的点击率预测方法，其特征在于，所述预测模型还包括全局损失，所述全局损失为：

L＝L_target+α*L_aux

其中L_target为损失函数；

α是平衡兴趣特征表示和点击率预测的超参数；

L_aux为辅助损失函数。

3.根据权利要求2所述的一种基于时间感知兴趣演化的点击率预测方法，其特征在于，所述辅助损失包括：

其中y_aux表示用户正样本实例的激活函数值；

表示用户i的第t个GRU隐藏状态；

表示用户i点击的第t+1个项目的嵌入向量；

表示用户负样本实例的激活函数值；

表示排除/>的项目集合Ε中的项目的嵌入向量；

N表示用户的总数。