CN113888238A

CN113888238A - 一种广告点击率预测方法、装置及计算机设备

Info

Publication number: CN113888238A
Application number: CN202111243596.4A
Authority: CN
Inventors: 肖云鹏; 朱江湖; 王蓉; 贾朝龙; 李暾; 李茜; 卢星宇
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2021-10-25
Filing date: 2021-10-25
Publication date: 2022-01-04
Anticipated expiration: 2041-10-25
Also published as: CN113888238B

Abstract

本发明属于电商大数据推荐领域，涉及一种广告点击率预测方法、装置及计算机设备；所述方法包括获取电商平台的用户行为数据，用户肖像数据和广告数据；对用户行为数据进行预处理形成用户行为序列；将用户行为序列、用户肖像数据、广告数据分别进行编码表示，得到对应特征的嵌入向量；采用基于注意力机制的深度神经网络，提取出用户的兴趣表示向量；采用堆栈式自动编码机，提取出用户肖像特征与广告特征之间的隐形关系向量；将用户的兴趣表示向量和隐形关系向量输入到多层感知机中进行联合训练，得到广告点击率的预测结果；本发明能够有效提高电商平台广告的点击率，实现精准营销和推荐的效果。

Description

一种广告点击率预测方法、装置及计算机设备

技术领域

本发明属于电商大数据推荐领域，特别涉及一种基于用户兴趣与时序行为的广告点击率预测方法、装置及计算机设备。

背景技术

随着信息技术的发展，许多国内外互联网电商平台越来越关注在线广告***的盈利效果，注重实现个性化、精准化的营销策略。广告点击率(CTR，Click Through Rate)是电商平台***中最核心的指标之一，在广告推荐、网页搜索、赞助推荐等领域至关重要。点击率预测的准确度不仅会影响电商平台的收益，还会影响用户的满意度和消费体验。

在当前的电商平台中，尽管营销人员想知道网络访问者的反应，但是使用当前技术几乎不可能量化对网站的情感反应以及该网站对公司品牌的影响。不过，点击率却是很容易获得。点击率衡量的是页面访问者数量与该页面商品广告点击后并将其重定向到另一个页面的访问者的比例，在该页面中，他们可以购买商品或了解有关产品或服务的更多信息。通常，点击率越高，则表明该广告商品更有商业价值或是该营销活动更吸引人。大多数电商网站旨在通过点击率来调整主页商品广告的展示，做个性化推荐。

目前，许多国内外学者都对CTR模型展开了深入的研究，研究成果主要体现在以下几个方面：一方面，随着深度学习技术的发展，深度CTR模型逐步取代了需要人工特征工程的LR等基于机器学习的CTR模型。另一方面，一些深度CTR模型注重于特征的压缩与交互。此外，也有模型重点关注用户行为序列特征的提取。但是现阶段的广告点击率仍存在以下不足：

1.用户历史行为序列的时效性。传统时序模型忽略了顺序行为之间的时间间隔对用户兴趣表达的影响，传统的RNN可以很好地捕捉行为序列中的顺序关系之间的依赖关系，但用户行为不仅仅是顺序关系，行为的时间间隔和行为的特点等含有更多的先验信息，这些信息对用户兴趣的表示至关重要。

2.用户兴趣的泛化性和复杂性。用户的兴趣具有多样性并且有变化的趋势，用户在某一段时间内的喜好具有集中性，并且每种兴趣都有自己的演变趋势，不同种类的兴趣之间很少相互影响。

3.数据特征的维度高，隐性信息量大。电商平台广告数据输入特征除了用户行为序列特征外，上下文特征、广告特征等特征之间的关系也影响着点击率预估的准确度。这些特征维度高，隐含信息大，获取它们之间的关系变得困难。

发明内容

针对上述不足，本发明提出一种广告点击率预测方法、装置及计算机设备用以解决广告点击率的预测问题。

在本发明的第一方面，本发明提供了一种广告点击率预测方法，所述方法包括：

获取电商平台的用户行为数据，用户肖像数据以及广告数据；

对电商平台的用户行为数据进行预处理，并形成用户行为序列；

将用户行为序列、用户肖像数据、广告数据分别进行编码表示，得到对应特征的嵌入向量；

输入用户行为序列特征，采用基于时间因子的Time-GRU的深度神经网络，输出用户的兴趣表示向量；

输入用户的兴趣表示向量，采用基于注意力机制的AT-GRU的深度神经网络，模拟兴趣的更新过程，并输出用户的兴趣更新向量；

输入用户肖像特征和广告特征，采用堆栈式自动编码机，提取出用户肖像特征与广告特征之间的隐形关系向量；

将用户的兴趣表示向量和用户肖像特征与广告特征之间的隐形关系向量输入到多层感知机中进行联合训练，得到广告点击率的预测结果。

在本发明的第二方面，本发明还提供了一种广告点击率预测装置，所述装置包括：

获取模块，用于获取电商平台的用户行为数据，用户肖像数据以及广告数据；

处理模块，用于对电商平台的用户行为数据进行预处理，并形成用户行为序列；

嵌入模块，用于将用户行为序列、用户肖像数据、广告数据分别进行编码表示，得到对应特征的嵌入向量；

第一特征提取模块，用于输入用户行为序列特征，采用基于时间因子的Time-GRU的深度神经网络，输出用户的兴趣表示向量；

第二特征提取模块，用于输入用户的兴趣表示向量，采用基于注意力机制的AT-GRU的深度神经网络，模拟兴趣的更新过程，并输出用户的兴趣更新向量；

第三特征提取模块，用于输入用户肖像特征和广告特征，采用堆栈式自动编码机，提取出用户肖像特征与广告特征之间的隐性关系向量；

广告点击率预测模块，用于将用户的兴趣表示向量和用户肖像特征与广告特征之间的隐形关系向量输入到多层感知机中进行联合训练，得到广告点击率的预测结果。

在本发明的第三方面，本发明还提供了一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如本发明第一方面所述方法的步骤。

本发明的有益效果：

本发明利用电商平台的用户行为数据和目标广告数据，针对用户时序行为序列背后隐藏的用户兴趣，通过对其兴趣更新过程进行更新与建模得到兴趣表示，结合其它非时序特征之间的隐形关联进行广告点击率的预测，本发明能够有效提高电商平台广告的点击率，实现精准营销和推荐的效果。

附图说明

图1为本发明实施例中广告点击率预测框架图；

图2为本发明实施例中广告点击率预测方法流程图；

图3为本发明构建时序模型模拟用户兴趣特征示图；

图4为本发明构建注意力机制的兴趣更新模型示图；

图5为本发明引入一种非监督的特征提取方法示图；

图6为本发明是私立中广告点击率预测装置结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明实施例中广告点击率预测框架图，如图1所示，在本实施例的预测框架中，主要包括四个部分，首先，采集用户行为数据，用户肖像数据以及广告数据；对这些数据进行处理后得到用户行为序列、用户肖像特征和广告特征；其次，采用数据特征处理的方式，利用用户行为序列构建出兴趣更新模型，再利用兴趣模拟模型得到用户的兴趣表示向量，同时还利用特征交互模型对用户肖像数据以及广告数据进行处理，提取出隐性关系向量；然后再结合用户最终兴趣表示和非时序特征隐形关系构建出点击率预测模型；利用该点击率预测模型可以预测出广告点击率，还可以根据广告点击率完成精准的广告推送。

图2为本发明实施例中一种广告点击率预测方法流程图，如图2所示，所述方法包括：

S1、获取电商平台的用户行为数据，用户肖像数据以及广告数据；

在本发明实施例中，可以获取电商平台的一些基础数据，包括用户历史行为数据、用户肖像数据和广告数据。以淘宝电商平台在线广告展示数据集为例，这个数据集主要是记录了淘宝用户在电商平台的浏览/点击记录，包括用户行为历史、用户肖像和广告基本信息三个部分。用户行为历史数据包括用户ID、广告ID、时间以及是否点击等字段，是体现用户隐含兴趣的时序特征数据，通过对用户行为数据经过处理，可以得到用户行为序列。用户肖像数据包括用户ID、年龄、性别和购物深度等特征信息，反应了用户的基本特征信息。广告基本数据包括广告ID、商品类目ID、商品品牌ID和价格等特征信息，广告数据表明了待推荐广告的一些基础特征，是非时序数据的重要组成部分。

在本发明实施例中，对于获取数据的方法，可以从电商平台提供的数据源或直接下载现有公开数据源，这些方式都可以得到原始数据，本发明对此不作限定。

通常获取的原始数据都是非结构化的，不能直接用于数据分析。通过简单的数据清洗可以使大部分非结构化数据结构化。例如，删除重复数据、清理无效节点如部分游客数据等。

S2、对电商平台的用户行为数据进行预处理，并形成用户行为序列；

在本发明实施例中，可以去除无效的用户行为数据；举个例子，一些浏览时间过短的用户行为会影响数据的有效性，本发明定义广告点击有效性的浏览阈值为25秒。当用户在一个广告页面浏览时间高于这个阈值时，则认为这个数据是有效的，否则就是无效的数据；将这些无效的数据删除。

在本发明实施例中，可以按照用户的数量进行数据的统计，并按照每个用户的ID、浏览广告和时间戳信息拼接出原始的用户行为数据；按照这种方式形成一系列的用户行为数据。

在本发明实施例中，可以采用多重插值的方法对统计后的用户行为数据进行补全；例如当缺失率超过15％时直接去除数据，对于不超过15％的数据值进行补充，其中的补充方式本领域技术人员可以根据实际需求进行设置。

在本发明实施例中，构建出基于时间差的用户行为序列；并根据用户ID对用户行为数据进行分组，将用户行为数据以时间的先后顺序排序，构成用户行为序列；对于其中的每一个行为序列，使用下一个行为的时间戳与当前行为的时间戳之差作为时间因子特征。

S3、将用户行为序列、用户肖像数据、广告数据分别进行编码表示，得到对应特征的嵌入向量；

在本发明实施例中，将经过处理得到的用户行为序列、广告数据和用户肖像数据进行one-hot编码，然后还可以分别对数据特征进行归一化处理。然后使用特征嵌入的方法将输入的高维稀疏特征向量转化为低维的稠密向量，得到特征数据的嵌入表示，即可输出低维稠密的用户行为序列特征、广告特征以及用户肖像特征。

在本发明的优选实施例中，所述用户行为序列特征采用了时序建模，即假设用户行为序列特征是用户行为-时间序列特征二元集合U(B,ΔT)，具体表示为；

U(B,ΔT)＝{(b₁,δt₁),(b₂,δt₂),…,(b_n,δt_n)}

用户行为-时间序列特征二元集合U(B,ΔT)被定义为B和ΔT构成的二元集合，表示为：

B＝{b₁,b₂,...,b_n}

ΔT＝{δt₁,δt₂,...,δt_n|δt₁＝0，δt_i＝time(b_i)-time(b_i-1)i>1}

其中，B表示用户的历史行为序列特征集合，ΔT表示B中相邻两个用户行为对应的时间之差，其中δt₁＝0表示第一个序列集合对应的时间差为0。

S4、输入用户行为序列特征，采用基于时间因子的Time-GRU的深度神经网络，输出用户的兴趣表示向量；

其中，在本发明实施例中，基于时间因子的门控循环单元(Time-Gate RecurrentUnit，简称Time-GRU)采用了时间因子与GRU结合的方式；本发明中模拟用户的兴趣表示向量的过程主要是根据用户行为序列，采用时间门控循环单元学习用户的静态兴趣组状态集合，表示为Intres_s＝Time-GRU(e_u)＝{h'₁,h'₂,...,h'_n}。

其中，静态兴趣组状态集合Intres_s定义为对用户行为-时间序列特征二元组集合经过特征嵌入处理后，经过时序建模后输出的每一时刻的隐状态集合，其中e_u表示用户行为-时间序列特征二元组集合的嵌入表示，该集合中每一个隐状态反映了这一时刻从用户行为序列中提取的用户兴趣；Time-GRU(e_u)表示对嵌入向量e_u采用时间门控循环单元得出的结果；h'_n表示第n个隐藏兴趣状态。

图3为本发明实施例构建时序模型模拟用户兴趣特征示图，如图3所示，该结构表示的是时序模型中的Time-GRU核结构，该结构通过结合上一个行为序列的隐藏兴趣状态h_t-1与当前行为序列中输入用户的行为特征i_t和时间因子Δt，经过时间门、更新门和重置门的作用，输出下一个隐藏兴趣状态的代表的用户兴趣h_t。时间门控循环单元加强了用户行为序列中时间因子对用户兴趣的影响，它的每一个中间隐藏兴趣状态突出了某个时刻体现用户短期、高频行为的用户静态兴趣。

在本发明的优选实施例中，所述步骤S4具体包括以下步骤：

S41、根据输入的时间间隔和输入特征，计算时间门权重，具体公式如下，T_g＝σ(W_t[Δt,i_t])：其中Δt是时间因子，即当前行为的时间戳与上一个行为的时间戳之差。考虑到在序列化模型中，用户的浏览、点击等偏好行为随时间的衰减符合长尾分布，因此本发明对时间因子Δt加入对数处理，改进后的时间门权重T_t的公式如下：

T_t＝σ(W_t[log(Δt+ζ),i_t])

当输入时间因子Δt越小时，时间门权重T_g越小，对数处理后的时间门权重T_t也越小，当前步骤保留的信息越少，上一步保留的信息越多。即用户两个相邻行为之间的时间间隔较短，两个行为之间的依赖关系就较高；

S42、根据输入的特征、时间间隔和上一个状态的状态，分别更新重置门r_t、更新门z_t和中间隐藏兴趣状态

具体公式如下所示：

z_t＝σ(W^zi_t+U^zh_t-1+b^z)，

r_t＝σ(W^ri_t+U^rh_t-1+b^r)，

其中，σ是sigmoid激活函数，ο是逐元素相乘，w^z,w^r,

U^z,U^r,U^h∈n_H×n_H，n_H是隐藏层的大小，n_I是输入层的大小。i_t表示Time-GRU的输入向量，

表示第t个隐藏兴趣状态的临时状态，z_t是更新门(update gate),r_t是重置门(reset gate)。z_t和r_t在sigmoid函数的映射作用下取值范围为0到1；

S43、将时间门权重加入到更新门的更新策略中，具体公式如下所示：

在本发明实施例中，在门结构中新增了时间因子作为输入，同时在内部引入了时间权重作为辅助参与到更新门的更新策略中，使时间因子能够作为一个重要因素参与兴趣模拟的过程中。

S5、输入用户的兴趣表示向量，采用基于注意力机制的AT-GRU的深度神经网络，模拟兴趣的更新过程，并输出用户的兴趣更新向量；

在本发明实施例中，基于注意力机制的门控循环单元(Attention-GateRecurrent Unit，简称AT-GRU)采用了注意力机制与GRU结合的方式，下来将来详细介绍该网络。

图4为本发明构建注意力机制的兴趣更新模型示图，如图4所示，该结构是一个基于注意力机制的门控循环单元AT-GRU的核结构，该结构的输入部分是表示当前步骤t中经过时序模型模拟的用户静态兴趣h_t与这个兴趣与目标广告相关的注意力分数α_t，经过改进后的更新门的作用，模拟用户兴趣沿着与目标广告相关的过程进行更新，最后一个单元输出的就是模拟的最终兴趣兴趣状态。在本发明实施例中，所述步骤S5可以包括以下步骤：

S51、根据所述静态兴趣组状态集合，计算每个兴趣状态与目标广告的注意力分数集合，表示为Atns＝{α_i|i＝1,2,...T}；

在本发明实施例中，α_i表示第i个注意力分数，T表示兴趣状态的数量；α_i定义为SI中每个兴趣状态h'_i与目标广告q的一种经过权重参数分配机制计算后的相似度衡量，可以捕获模型中重要的特征。

其中，s(h'_i,q)表示兴趣状态h'_i与目标广告q经过双线性模型的相似度函数计算过后的相似度权重，

S52、根据静态兴趣组状态集合和注意力分数集合，采用基于注意力机制的门控循环单元学习兴趣最终更新状态，表示为H＝AT-GRU(Intres_s，Atns)＝{h_i|i＝1,2...T}，T为AT-GRU中隐藏层的大小；

考虑到用户兴趣的动态性和泛化性，兴趣更新最终状态定义为静态兴趣组状态Intres_s在基于注意力机制更新策略下，经过兴趣更新模型提取出的最终兴趣表示向量。

在本发明的优选实施例中，所述步骤S52具体包括以下步骤：

S521、根据步骤S51的公式，可得到每个兴趣与候选广告的相关度权重，即注意力分数a_i，具体如下：

其中，e_ad是来自不同类别广告字段的嵌入向量的连接，

是参数矩阵，n_H是隐藏兴趣状态向量的维度，n_A是广告的嵌入向量的维度。注意力分数a_i反映了目标广告与输入兴趣状态的之间的相关度，兴趣状态与目标广告越相关，注意力分数越大。

S522、根据上述步骤计算的注意力分数，引入一种基于注意力机制的门控循环单元AT-GRU，该结构能够根据注意力分数的大小来决定隐藏兴趣状态的更新力度，即与目标广告相关的兴趣状态能够更大力度地参与到最终兴趣状态的更新过程中，与目标广告不相关的兴趣能够较小甚至不参与到更新过程，具体更新策略如下：

r’_t＝σ(W^rii'_t+U^rih'_t-1+b^ri)，

其中h'_t、h'_t-1和

都是AT-GRU的隐状态，w^ri，

U^ri,U^hi∈n_Hi×n_Hi，n_Hi是AT-GRU隐藏层的大小，n_Ii是AT-GRU输入层的大小。i'_t表示AT-GRU的输入向量,即经过时间门控循环单元学习的用户静态兴趣，a_t是注意力分数，与原始的GRU结构相比，AT-GRU结构将使用注意力分数代替了原来的更新门，AT-GRU可以有效地避免因为用户兴趣的泛化性和异构性带来的兴趣漂移问题，实现从用户不断变化发展的兴趣中模拟兴趣发展更新的过程，推动最终兴趣沿着与目标广告相关的方向更新。

S6、输入用户肖像特征和广告特征，采用堆栈式自动编码机，提取出用户肖像特征与广告特征之间的隐形关系向量；

在本发明实施例中，根据用户肖像特征数据和目标广告特征数据，计算这些特征之间的隐性关系，表示为R_implicit＝SAE(I,P)。

由于目标广告和用户肖像等非时序特征之间也存在着隐性关系，因此本发明实施例定义R_implicit为经过堆栈式编码机经过特征压缩后提取的这些特征之间的隐性关系，其中I为目标广告特征嵌入向量集合，P为用户肖像嵌入向量集合。

在本发明实施例中，本实施例设计一个堆栈式自动编码机结构用于获取进一步的其它非时序特征的关系，其中单层自动编码机的结构如图5所示，该结构由编码器和解码器组成，分为三个部分，分别是输入层、隐藏层和输出层。编码器层在编码器函数的作用将输入层的特征转化为隐藏层的特征，然后在解码器函数的作用下将隐藏层特征转化为输出层。堆栈式自动编码机通过逐层非监督学习的预训练来初始化深度网络的参数，预训练完毕后利用训练参数，可以学习到非时序特征之间高维非线性的元素交互关系。

在本发明的优选实施例中，所述步骤S6可以具体包括如下步骤：

S61、根据输入的用户肖像特征和目标广告特征，进行编码层的计算，编码层负责将输入层的输入数据X转化为隐层的状态H，具体公式如下：

Z＝sigmoid(W₁X+b₁)，

其中，W₁是权重矩阵，b₁是第一训练偏置，

是激活函数；

S62、类似的，进行解码层的计算，解码层将隐层的状态H转化为输出层Y，定义为：

Y＝sigmoid(W₂Z+b₂)，

其中，W₂是权重矩阵，b₂是第二训练偏置。

S63、进行重构误差的计算，使得输出Y与原始的X之间的误差足够小，具体公式为，

其中，W是W₁和W₂的组合，λ是正则化系数,可以添加惩罚因子λ来控制权重的大小，防止过拟合。

S64、重复上述步骤S61-S63的训练过程，通过层层叠加训练的方式，得到整个堆栈式自动编码机的训练参数，然后根据这些参数学习到非时序特征之间的隐性关系。

S7、将用户的兴趣表示向量和用户肖像特征与广告特征之间的隐形关系向量输入到多层感知机中进行联合训练，得到广告点击率的预测结果。

在本发明实施例中，将用户的兴趣更新向量以及所述隐形关系向量进行连接，对连接后的向量进行平滑处理；分别对兴趣模拟与更新模型中的时间门控循环单元的辅助损失函数和多层感知机的预测目标损失函数进行联合训练，训练完成后得到广告点击率的预测结果。

其中，在训练预测模型时，采用联合训练的方式，分别对Time-GRU部分和预测模型的目标损失函数进行联合训练，模型的全局损失函数表示为：

L＝L_target+λ*L_aux

其中λ是超参数，用户平衡兴趣的模拟和广告点击率的预测,L_aux表示Time-GRU的辅助损失。本发明实施例，对目标损失函数L_target进行改进，即改进MLP的损失函数时，将MLP损失函数设置为带权重的均方误差，并根据现有数据中正、负样本的比例，设置损失函数的系数，改进后目标损失函数表示为：

其中，L_target为改进后的多层感知机的目标损失函数；N1表示正样本数量；N2表示负样本数量；y是指示变量，如果该类别和样本的类别相同就是1，否则是0；p(Y＝0|X)和p(Y＝1|X)分别是网络输出属于标签的不同预测概率。同时，本发明还引入了辅助损失L_aux，所述辅助损失表示为：

其中，

表示用户单击的第t个嵌入向量，G是整个项目集合；

表示用户i在第t步点击的项目之外的样本的嵌入；

是sigmoid激活函数，

表示用户i在Time-GRU中的第t个隐藏兴趣状态。辅助损失使用下一个正负点击样本行为来监督当前兴趣状态的学习。辅助损失的设计引入了用户的全网行为反馈信息，同时不会引入多场景之间的点击偏差以及造成多场景耦合；从优化的角度来讲辅助损失可以在GRU的长序列建模中减少梯度反向传播的难度。Time-GRU在辅助损失的作用下，可以将每一个单元的输出的隐藏兴趣状态与下一个点击行为发生关联，从而能够更好的根据用户行为序列模拟用户的兴趣；同时，Time-GRU在时间门的更新策略下，加强用户行为序列中时间间隔对兴趣模拟的影响，使得时间间隔越短、点击越频繁的行为对用户兴趣的影响越大。

图6是本发明实施例的一种广告点击率预测装置结构图，如图6所示，所述装置包括：

201、获取模块，用于获取电商平台的用户行为数据，用户肖像数据以及广告数据；

202、处理模块，用于对电商平台的用户行为数据进行预处理，并形成用户行为序列；

203、嵌入模块，用于将用户行为序列、用户肖像数据、广告数据分别进行编码表示，得到对应特征的嵌入向量；

204、第一特征提取模块，用于输入用户行为序列特征，采用基于时间因子的Time-GRU的深度神经网络，输出用户的兴趣表示向量；

205、第二特征提取模块，用于输入用户的兴趣表示向量，采用基于注意力机制的AT-GRU的深度神经网络，模拟兴趣的更新过程，并输出用户的兴趣更新向量；

206、第三特征提取模块，用于输入用户肖像特征和广告特征，采用堆栈式自动编码机，提取出用户肖像特征与广告特征之间的隐性关系向量；

207、广告点击率预测模块，用于将用户的兴趣表示向量和用户肖像特征与广告特征之间的隐性关系向量输入到多层感知机中进行联合训练，得到广告点击率的预测结果。

在本发明的优选实施例中，本发明的一种计算机设备可以包括存储器和处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如本发明所述广告点击率预测方法的步骤。计算机设备可以为终端或服务器。该计算机设备包括通过***总线连接的处理器、存储器和网络接口。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质可存储操作***和计算机程序。该计算机程序被执行时，可使得处理器执行一种广告点击率预测方法。该计算机设备的处理器用于提供计算和控制能力，支撑整个计算机设备的运行。该内存储器中可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行一种偏好预测方法。计算机设备的网络接口用于进行网络通信。

在一个实施例中，本申请提供的广告点击率预测装置可以实现为一种计算机程序的形式，计算机程序可在上述计算机设备上运行，计算机设备的非易失性存储介质可存储组成该广告点击率预测装置的各个程序模块。比如，图6所示的获取模块、处理模块、嵌入模块、第一特征提取模块、第二特征提取模块以及广告点击率预测模块。各个程序模块所组成的计算机程序用于使该计算机设备执行本说明书中描述的本申请各个实施例的广告点击率预测方法中的步骤。

在本发明的描述中，需要理解的是，术语“同轴”、“底部”、“一端”、“顶部”、“中部”、“另一端”、“上”、“一侧”、“顶部”、“内”、“外”、“前部”、“中央”、“两端”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

在本发明中，除非另有明确的规定和限定，术语“安装”、“设置”、“连接”、“固定”、“旋转”等术语应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或成一体；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系，除非另有明确的限定，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种广告点击率预测方法，其特征在于，具体包括以下步骤：

将用户的兴趣更新向量，用户肖像特征与广告特征之间的隐形关系向量分别输入到多层感知机中进行联合训练，得到广告点击率的预测结果。

2.根据权利要求1所述的一种广告点击率预测方法，其特征在于，所述对电商平台的用户行为数据进行预处理包括去除无效的用户行为数据；按照用户的数量进行数据的统计，并按照每个用户的ID、浏览广告和时间戳信息拼接出原始的用户行为数据；采用多重插值的方法对统计后的用户行为数据进行补全；构建出基于时间差的用户行为序列；并根据用户ID对用户行为数据进行分组，将用户行为数据以时间的先后顺序排序，构成用户行为序列；对于其中的每一个行为序列，使用下一个行为的时间戳与当前行为的时间戳之差作为时间。

3.根据权利要求1所述的一种广告点击率预测方法，其特征在于，所述输出用户的兴趣表示向量包括根据用户行为序列，采用基于时间因子的Time-GRU即时间门控循环单元学习用户的静态兴趣组状态集合；也即是根据输入的用户行为序列特征，计算出时间门权重；将所述时间门权重加入到更新门的第一更新策略中；通过时间门控循环单元中的重置门和更新门来选择出的静态兴趣组状态集合。

4.根据权利要求3所述的一种广告点击率预测方法，其特征在于，所述第一更新策略表示为

其中，h_t表示Time-GRU中第t个隐藏兴趣状态；z_t是Time-GRU中更新门；

是逐元素相乘，T_t表示时间门权重，h_t-1表示Time-GRU中第t-1个隐藏兴趣状态；T_t＝σ(W_t[log(Δt+ζ),i_t])；σ是sigmoid激活函数，W_t表示时间门的第t个隐含状态矩阵；Δt表示时间因子，即当前行为的时间戳与上一个行为的时间戳之差；ζ表示时间门偏置；i_t表示Time-GRU的输入向量；

表示Time-GRU中第t个隐藏兴趣状态的临时状态。

5.根据权利要求3或4所述的一种广告点击率预测方法，其特征在于，所述输出用户的兴趣更新向量包括根据所述静态兴趣组状态集合，计算每个兴趣状态与目标广告的注意力分数；根据静态兴趣组状态集合和所述注意力分数，采用基于注意力机制的AT-GRU即基于注意力机制的门控循环单元计算得到兴趣最终更新状态，也即是将注意力分数作为更新门，采用注意力分数的大小作为更新门的第二更新策略，通过该更新门和时间门控循环单元中的重置门来选择出的兴趣最终更新状态。

6.根据权利要求5所述的一种广告点击率预测方法，其特征在于，所述第二更新策略表示为

其中，h'_t表示AT-GRU的第t个隐藏兴趣状态；a_t表示注意力分数；

是逐元素相乘，h'_t-1表示AT-GRU的第t-1个隐藏兴趣状态；

表示AT-GRU中第t个隐藏兴趣状态的临时状态。

7.根据权利要求1所述的一种广告点击率预测方法，其特征在于，所述将用户的兴趣更新向量，用户肖像特征与广告特征之间的隐形关系向量分别输入到多层感知机中进行联合训练，得到广告点击率的预测结果包括将用户的兴趣更新向量以及所述隐形关系向量进行连接，对连接后的向量进行平滑处理；分别对基于时间因子的Time-GRU的深度神经网络部分的局部损失函数和多层感知机的全局损失函数进行联合训练，训练完成后得到广告点击率的预测结果；其中，

所述全局损失函数表示为：

L＝L_target+λ*L_aux

其中，L表示多层感知机的全局损失函数；λ是超参数，L_aux表示时间门控循环单元的辅助损失函数；

N表示用户数量；

表示用户i单击的第t个嵌入向量，G是整个行为序列嵌入集合；

表示用户i在第t步点击的项目之外的样本的嵌入向量；σ表示sigmoid激活函数，

表示用户i在Time-GRU中的第t个隐藏兴趣状态；L_target表示根据正负样本比例改进的目标损失函数；

N1表示正样本数量；N2表示负样本数量；y是指示变量，如果该类别Y和样本X的类别相同就是1，否则是0；p表示多层感知机网络输出属于标签的预测概率。

8.根据权利要求1或7所述的一种广告点击率预测方法，其特征在于，所述广告点击率的预测结果表示为：

y＝sigmoid(W_L(...(W_c(R_c)+b_c)...)+b_L)

其中，R_c表示将用户的兴趣更新向量与隐形关系向量的连接向量；W_L为第一权值参数矩阵；W_c为第二权值参数矩阵，b_c表示第一训练偏置；b_L为第二训练偏置。

9.一种广告点击率预测装置，其特征在于，所述装置包括：

10.一种计算机设备，其特征在于，包括存储器和处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行权利要求1至8中任一项所述方法的步骤。