CN116957685A

CN116957685A - 广告推荐方法、装置、设备及介质

Info

Publication number: CN116957685A
Application number: CN202310125188.1A
Authority: CN
Inventors: 王唯康
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2023-02-02
Filing date: 2023-02-02
Publication date: 2023-10-27

Abstract

本申请提供了一种广告推荐方法、装置、设备及介质，涉及机器学习领域，该方法包括：提取广告文本对应的文本标签集合，文本标签集合用于表示广告文本的内容的关键词；计算文本标签集合中各个文本标签对应的第一概率分布和第二概率分布，第一概率分布用于表示具有文本标签集合的帐号对不同类型的广告文本的点击概率分布，第二概率分布用于表示全体帐号对不同类型的广告文本的点击概率分布；根据第一概率分布和第二概率分布，更新文本标签集合，得到更新后的文本标签集合；根据更新后的文本标签集合得到推荐广告。该方法可以突出用户的喜好偏好，使得更新后的文本标签集合对用户的画像的刻画更加准确，推荐广告更加适合用户。

Description

广告推荐方法、装置、设备及介质

技术领域

本申请涉及机器学习领域，特别涉及一种广告推荐方法、装置、设备及介质。

背景技术

随着媒体的发展，广告成为现代生活中不可缺少的部分，如何向用户推荐他们需要的广告是一项重要的活动。

现有技术中，用户在阅读一篇广告文本后，***会根据广告文本的关键词生成用户标签，生成的用户标签会输入到广告推荐模型中为用户检索推荐广告。比如，用户在阅读一篇和留学相关的广告文本时，***生成的用户标签是留学、硕士、英语和教育体制，***根据上述用户标签得到和海外留学相关的广告。

现有技术在提取用户标签的时候，得到的用户标签不够准确，无法保证提取到的用户标签和广告业务场景具有一致。例如，在上面的例子中，“教育体制”在教育领域内没有足够的区分性，该用户标签对教育产品的广告推荐没有指导作用。因此，现有技术得到的用户标签会影响广告推荐的准确率。

发明内容

本申请实施例提供了一种广告推荐方法、装置、设备及介质，该方法会对文本标签集合进行更新，使得文本标签集合更能体现出对象的喜好，进而得到更加合理的推荐广告。该技术方案包括：

根据本申请的一方面，提供了一种广告推荐方法，该方法包括：

提取广告文本对应的文本标签集合，所述文本标签集合用于表示所述广告文本的内容的关键词；

计算所述文本标签集合中各个文本标签对应的第一概率分布和第二概率分布，所述第一概率分布用于表示具有所述文本标签集合的帐号对不同类型的广告文本的点击概率分布，所述第二概率分布用于表示全体帐号对不同类型的广告文本的点击概率分布；

根据所述第一概率分布和所述第二概率分布，更新所述文本标签集合，得到更新后的文本标签集合；

根据所述更新后的文本标签集合得到推荐广告。

根据本申请的另一方面，提供了一种广告推荐装置，该装置包括：

提取模块，用于提取广告文本对应的文本标签集合，所述文本标签集合用于表示所述广告文本的内容的关键词；

计算模块，用于计算所述文本标签集合中各个文本标签对应的第一概率分布和第二概率分布，所述第一概率分布用于表示具有所述文本标签集合的帐号对不同类型的广告文本的点击概率分布，所述第二概率分布用于表示全体帐号对不同类型的广告文本的点击概率分布；

更新模块，用于根据所述第一概率分布和所述第二概率分布，更新所述文本标签集合，得到更新后的文本标签集合；

推荐模块，用于根据所述更新后的文本标签集合得到推荐广告。

在一个可选设计中，所述更新模块，还用于根据所述第一概率分布和所述第二概率分布之间的差值，计算行为分布差异，所述行为分布差异用于表示具有所述文本标签集合的帐号和所述全体帐号的点击行为差异；去除所述文本标签集合中所述行为分布差异小于行为差异分布阈值的文本标签，得到所述更新后的文本标签集合。

在一个可选设计中，所述更新模块，还用于计算所述第一概率分布和所述第二概率分布的相对熵，得到所述行为分布差异；或者，采用卡方检验计算所述第一概率分布和所述第二概率分布之间的偏离程度，得到所述行为分布差异。

在一个可选设计中，所述计算模块，还用于对于所述文本标签集合对应的第k类型广告文本，统计点击所述第k类型广告文本且浏览包含第j个文本标签的文本的第一帐号数量，k，j为正整数；统计浏览包含所述第j个文本标签的文本的第二帐号数量；根据所述第一帐号数量和所述第二帐号数量的比值，得到所述第k类型广告文本的第一概率分布。

在一个可选设计中，所述计算模块，还用于对于所述文本标签集合对应的第k类型广告文本，统计点击第k类型广告文本的第三帐号数量；根据所述第三帐号数量与帐号总数的比值，得到所述第k类型广告文本的第二概率分布。

在一个可选设计中，所述提取模块，还用于对所述广告文本中的文本字符进行编码，得到所述文本字符对应的特征向量；根据所述特征向量预测文本标签在所述广告文本中的位置，得到所述文本标签集合。

在一个可选设计中，所述提取模块，还用于对所述特征向量进行分类，得到所述文本字符的位置概率；根据所述位置概率从所述广告文本中提取所述文本标签，得到所述文本标签集合；其中，所述位置概率包括第一位置概率、第二位置概率和第三位置概率中的至少一种，所述第一位置概率用于表示所述文本字符位于所述文本标签的开始位置的概率，所述第二位置概率用于表示所述文本字符位于所述文本标签的中间位置的概率，所述第三位置概率用于表示所述文本字符不属于所述文本标签的概率。

在一个可选设计中，所述推荐模块，还用于调用召回模型，根据所述更新后的文本标签集合，对候选广告集进行筛选处理，得到筛选广告集合；调用排序模型，根据所述更新后的文本标签集合，对所述筛选广告集合进行排序处理，得到推荐广告排序列表；从所述推荐广告排序列表中获取所述推荐广告。

在一个可选设计中，所述召回模型包括p个，所述p表示所述更新后的文本标签集合的元素数量；所述推荐模块，还用于取所述更新后的文本标签集合中的第q个文本标签，q为初始值为1的整数；调用第q个所述召回模型，对所述第q个文本标签和所述候选广告集进行编码操作，得到第q个标签特征和候选广告特征；计算所述第q个标签特征和所述候选广告特征之间的第一相似度；将所述候选广告中所述第一相似度小于第一相似度阈值的候选广告放入所述筛选广告集合；将q更新为q+1，重复上述四个步骤p次，得到所述筛选广告集合。

在一个可选设计中，所述推荐模块，还用于调用所述排序模型，对所述更新后的文本标签集合和所述筛选广告集合进行编码操作，得到标签特征和候选广告特征；计算所述标签特征与各个所述候选广告特征之间的第二相似度；根据所述第二相似度对所述推荐广告进行排序，得到所述推荐广告排序。

根据本申请的另一方面，提供了一种计算机设备，该计算机设备包括：处理器和存储器，存储器中存储有至少一条指令、至少一段程序、代码集或指令集，至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如上方面所述的广告推荐方法。

根据本申请的另一方面，提供了一种计算机存储介质，计算机可读存储介质中存储有至少一条程序代码，程序代码由处理器加载并执行以实现如上方面所述的广告推荐方法。

根据本申请的另一方面，提供了一种计算机程序产品或计算机程序，上述计算机程序产品或计算机程序包括计算机指令，上述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从上述计算机可读存储介质读取上述计算机指令，上述处理器执行上述计算机指令，使得上述计算机设备执行如上方面所述的广告推荐方法。

本申请实施例提供的技术方案带来的有益效果至少包括：

本方案获取文本标签集合中各个文本标签的第一概率分布和第二概率分布，根据第一概率分布和第二概率分布更新文本标签集合，并使用更新后的文本标签集合得到推荐广告。由于第一概率分布体现了用户的喜好偏好，第二概率分布体现了全体人群的喜好偏好，第一概率分布和第二概率分布之间的差异能够体现出用户和全体人群的差异，突出用户的喜好偏好，使得更新后的文本标签集合对用户的画像的刻画更加准确，推荐广告更加适合用户。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本申请实施例提供的一种广告推荐方法的示意图；

图2示出了本申请实施例提供的一种计算机***的结构示意图；

图3示出了本申请实施例提供的一种广告推荐方法的流程示意图；

图4示出了本申请实施例提供的一种关键词提取的示意图；

图5示出了本申请实施例提供的一种广告推荐方法的流程示意图；

图6示出了本申请实施例提供的一种召回模型的调用方法的流程示意图；

图7示出了本申请实施例提供的一种排序模型的调用方法的流程示意图；

图8示出了本申请实施例提供的一种广告推荐装置的结构示意图；

图9示出了本申请实施例提供的一种计算机设备的示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

首先，对本申请实施例中涉及的名词进行介绍：

人工智能(Artificial Intelligence，AI)：利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(Machine Learning，ML)：是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。

需要进行说明的是，本申请在收集用户的相关数据之前以及在收集用户的相关数据的过程中，都可以显示提示界面、弹窗或输出语音提示信息，该提示界面、弹窗或语音提示信息用于提示用户当前正在搜集其相关数据，使得本申请仅仅在获取到用户对该提示界面或者弹窗发出的确认操作后，才开始执行获取用户相关数据的相关步骤，否则(即未获取到用户对该提示界面或者弹窗发出的确认操作时)，结束获取用户相关数据的相关步骤，即不获取用户的相关数据。换句话说，本申请所采集的所有用户数据都是在用户同意并授权的情况下进行采集的，且相关用户数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本方案可以通过用户对广告文本的点击或阅读行为，来为用户实时推荐广告。用户101在点击广告文本102后，获取到广告文本102的文本标签集合103，文本标签集合103表示广告文本102的内容的关键词。之后，确定第一类型帐号104和全体帐号105，第一类型帐号104指具有文本标签集合103的帐号，这里的文本标签集合103还起到用户的画像的作用。而后，计算第一概率分布106和第二概率分布107，第一概率分布106指第一类型帐号104对不同类型的广告文本的点击概率分布，第二概率分布107指全体帐号105对不同类型的广告文本的点击概率分布。基于第一概率分布106和第二概率分布107计算行为分布差异108。当行为分布差异108足够大时，行为分布差异108可以体现出第一类型帐号104的广告点击行为与全体帐号105的广告点击行为之间的差异，也就是说，具有文本标签集合103的帐号的广告点击行为具有倾向性，文本标签集合103与点击广告文本102的行为存在强关联，使得文本标签集合103能明确地刻画出点击广告文本102的用户101具有的特征。去除文本标签集合103中行为分布差异108小于行为差异分布阈值的文本标签，得到更新后的文本标签集合109。通过广告推荐模型110和更新后的文本标签集合109得到推荐广告111。其中，广告推荐模型110包括召回模型和排序模型，召回模型做一个比较粗略的筛选，使用更新后的文本标签集合109中的单个文本标签进行筛选，得到筛选广告集合；排序模型做一个比较精细的筛选，使用更新后的文本标签集合109中的全部文本标签进行筛选，得到推荐广告111。

图2示出了本申请一个示例性实施例提供的计算机***的结构示意图。计算机***200包括：终端220和服务器240。

终端220上安装有应用程序，该应用程序与广告展示相关。在一些实施例中，前述模型采用TSFM(Temporal Spatial Fusion Model，时空融合模型)、LSTM(Long Short-TermMemory，长短时记忆结构)、DNN(Deep Neural Networks，深度神经网络)、CNN(Convolutional Neural Networks，卷积神经网络)中的至少一种模型结构。该应用程序可以是app(application，应用程序)中的小程序，也可以是专门的应用程序，也可以是网页客户端。终端220是智能手机、平板电脑、电子书阅读器、MP3播放器、MP4播放器、膝上型便携计算机和台式计算机中的至少一种。

终端220通过无线网络或有线网络与服务器240相连。

服务器240可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式***，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。服务器240用于为模型训练提供后台服务。可选地，服务器240承担主要计算工作，终端220承担次要计算工作；或者，服务器240承担次要计算工作，终端220承担主要计算工作；或者，服务器240和终端220两者采用分布式计算架构进行协同计算。

图3示出了本申请实施例提供的一种广告推荐方法的流程示意图。该方法可由图2所示的计算机***执行。该方法包括：

步骤302：提取广告文本对应的文本标签集合，文本标签集合用于表示广告文本的内容的关键词。

可选地，广告文本是用户点击或阅读的广告，响应于对候选广告文本的点击操作，将候选广告文本作为该步骤使用的广告文本。或者，响应于对候选广告文本的点击操作且候选广告文本的停留时间大于时间上限，将候选广告文本作为该步骤使用的广告文本。

文本标签集合包括至少一个文本标签。

可选地，对广告文本中的文本字符进行编码，得到文本字符对应的特征向量；根据特征向量预测文本标签在广告文本中的位置，得到文本标签集合。在一些实施例中，采用BERT(Bidirectional Encoder Representation from Transformers，来自编码器的双向编码表示)模型完成文本标签集合的提取。

可选地，通过向量查找表确定文本字符对应的特征向量。向量查找表用于表示文本字符与特征向量之间的对应关系。例如，向量查找表记录了字符“他”对应特征向量(1，5，5)，字符“低”对应特征向量(4，54，69)。

可选地，对特征向量进行分类，得到文本字符的位置概率；根据位置概率从广告文本中提取文本标签，得到文本标签集合；其中，位置概率包括第一位置概率、第二位置概率和第三位置概率中的至少一种，第一位置概率用于表示文本字符位于文本标签的开始位置的概率，第二位置概率用于表示文本字符位于文本标签的中间位置的概率，第三位置概率用于表示文本字符不属于文本标签的概率。可选地，根据第一位置概率、第二位置概率和第三位置概率中的最大值确定文本字符的类型。例如，文本字符“学”对应的第二位置概率是最大值，则认为“学”位于文本标签的中间位置。

示例性的，通过如下计算方式得到位置概率：

x_i＝LP(emb_i)；

p_i＝oftmax(x_i)；

其中，emb_i表示第i个文本字符对应特征向量，MLP(*)表示多层感知机，p_i表示第i个文本字符的位置概率，softmax(*)表示归一化函数。

在一些实施例中，请参考图4，当广告文本是“为您打造个性化留学方案在国外读书无疑有诸多的好处。第一是学……”，这里以其中的“留学方案”为例进行说明，“留”的预测结果是“B”，“B”表示该字符是文本标签的开始位置，“学”的预测结果是“I”，“I”表示该字符是文本标签的中间位置，“方”和“案”的预测结果是“O”，“O”表示该字符不属于文本标签。

在一些实施例中，文本标签还可以用于表示帐号的点击喜好或偏好。示例性的，文本标签包括“教育”，则说明该帐号对应的用户偏好浏览教育类的文章，对教育类文章具有更大的点击意愿。

步骤304：计算文本标签集合中各个文本标签对应的第一概率分布和第二概率分布，第一概率分布用于表示具有文本标签集合的帐号对不同类型的广告文本的点击概率分布，第二概率分布用于表示全体帐号对不同类型的广告文本的点击概率分布。

其中，第一概率分布对应的帐号均具有文本标签集合。第二概率分布中的全体帐号指计算机***存储的全部帐号。

可选地，第一概率分布采用离散的分布形式，第一概率分布的横坐标表示文本标签集合中的文本标签，第一概率分布的纵坐标表示具有文本标签集合的帐号对具有文本标签的广告文本的点击概率。

可选地，第二概率分布采用离散的分布形式，第二概率分布的横坐标表示文本标签集合中的文本标签，第二概率分布的纵坐标表示全体帐号对具有文本标签的广告文本的点击概率。

在一些实施例中，第一概率分布和第二概率分布存在明确的区别。示例性的，对于同样的文本标签a，第一概率分布对应的点击概率与第二概率分布对应的点击概率的差值大于预设概率差值。

可选地，对于文本标签集合对应的第k类型广告文本，统计点击第k类型广告文本且浏览包含第j个文本标签的文本的第一帐号数量，k，j为正整数；统计浏览包含第j个文本标签的文本的第二帐号数量；根据第一帐号数量和第二帐号数量的比值，得到第k类型广告文本的第一概率分布。

其中，第一帐号数量对应的第一帐号需要满足同时满足两个条件：1、该帐号对应的用户在第一预设时间段内点击过第k类型广告文本，第一预设时间段可由技术人员自行设置(例如，将第一预设时间段设置为过去7天)；2、该帐号包含第j个文本标签。第二帐号数量对应的第二帐号指要求包含第j个文本标签的帐号。

可选地，对于文本标签集合对应的第k类型广告文本，统计点击第k类型广告文本的第三帐号数量；根据第三帐号数量与帐号总数的比值，得到第k类型广告文本的第二概率分布。

其中，第三帐号数量对应的第三帐号在第二预设时间段内点击过第k类型广告文本，第二预设时间段可由技术人员自行设置。

步骤306：根据第一概率分布和第二概率分布，更新文本标签集合，得到更新后的文本标签集合。

可选地，根据第一概率分布和第二概率分布的差值，更新文本标签集合，得到更新后的文本标签集合。该差值用于表示第一概率分布和第二概率分布之间的距离。

示例性的，根据第一概率分布和第二概率分布的差值，计算行为分布差异。去除文本标签集合中行为分布差异小于行为差异分布阈值的文本标签，得到更新后的文本标签集合。行为差异分布用于度量第一概率分布和第二概率分布之间的距离。当标签的行为差异分布打分高于行为差异分布阈值，说明标签和广告点击行为存在更强的关联关系，推荐对应的广告可以让用户有更强的点击意愿。

步骤308：根据更新后的文本标签集合得到推荐广告。

可选地，根据更新后的文本标签集合从候选广告集中确定推荐广告。由于在实际情况下，候选广告集存在大量广告，如何在大量广告中选出推荐广告是本申请需要考虑的一个方面。本申请实施例采用二次筛选来得到推荐广告，在第一次筛选中，从候选广告集中确定筛选广告集合；在第二次筛选中，从筛选广告集合中确定推荐广告。第一次筛选对候选广告集进行粗略筛选，得到筛选广告集，第一次筛选可将以万计数的候选广告集降到以百计数的筛选广告集；第二次筛选对筛选广告集进行一次详细筛选，得到推荐广告。

在本申请实施例中，采用召回排序模型处理候选广告集，召回排序模型包括两部分，分别是召回模型和排序模型。在第一次筛选时，调用召回模型，根据更新后的文本标签集合，对候选广告集进行筛选处理，得到筛选广告集合。在一些实施例中，召回模型包括q个，每个召回模型用于处理不同的类型的文本标签。

在第二次筛选时，调用排序模型，根据更新后的文本标签集合，对筛选广告集合进行排序处理，得到推荐广告排序列表；从推荐广告排序列表中获取推荐广告。推荐广告排序列表用于表示筛选广告集合中各个筛选广告的推荐程度。可选地，按照推荐广告排序列表中各个筛选广告的推荐程度获取推荐广告。

综上所述，本实施例获取文本标签集合中各个文本标签的第一概率分布和第二概率分布，根据第一概率分布和第二概率分布更新文本标签集合，并使用更新后的文本标签集合得到推荐广告。由于第一概率分布体现了用户的喜好偏好，第二概率分布体现了全体人群的喜好偏好，第一概率分布和第二概率分布之间的差异能够体现出用户和全体人群的差异，突出用户的喜好偏好，使得更新后的文本标签集合对用户的画像的刻画更加准确，推荐广告更加适合用户。

在接下来的实施例中，需要计算第一概率分布和第二概率分布之间的差值，得到行为分布差异。如果行为分布差异足够大，说明第一概率分布和第二概率分布这两个分布差异大，说明对于某一标签限定的帐号而言，这类帐号对应的用户的广告点击行为和整体人群差异较大。标签和广告点击行为存在更强的关联关系，推荐对应的广告可以让用户有更强的点击意愿。

图5示出了本申请实施例提供的一种广告推荐方法的流程示意图。该方法可由图2所示的计算机***执行。该方法包括：

步骤501：提取广告文本对应的文本标签集合。

其中，文本标签集合用于表示广告文本的内容的关键词。

文本标签集合包括至少一个文本标签。

可选地，对广告文本中的文本字符进行编码，得到文本字符对应的特征向量；根据特征向量预测文本标签在广告文本中的位置，得到文本标签集合。

可选地，对广告文本中的文本字符进行编码，得到文本字符对应的特征向量；根据特征向量预测文本标签在广告文本中的位置，得到文本标签集合。在一些实施例中，采用BERT模型完成文本标签集合的提取。

可选地，通过向量查找表确定文本字符对应的特征向量。向量查找表用于表示文本字符与特征向量之间的对应关系。

可选地，对特征向量进行分类，得到文本字符的位置概率；根据位置概率从广告文本中提取文本标签，得到文本标签集合。

其中，位置概率包括第一位置概率、第二位置概率和第三位置概率中的至少一种，第一位置概率用于表示文本字符位于文本标签的开始位置的概率，第二位置概率用于表示文本字符位于文本标签的中间位置的概率，第三位置概率用于表示文本字符不属于文本标签的概率。

步骤502：计算文本标签集合中各个文本标签对应的第一概率分布。

示例性的，使用三元组(u_i,t_j,a_k)记录帐号的点击行为，u_i表示第i个帐号，t_j表示第j个文本标签，a_k表示第k类型广告文本。该三元组可以认为是帐号u_i对应的用户阅读了某篇包含文本标签t_j的广告文本，同时该用户还点击过属于a_k类别的文本广告。则第一概率分布的计算方式如下所示：

其中，∑_iCount(u_i,t_j,a_k)表示同时点击a_k类别的文本广告且同时阅读了包含标签t_j广告文本的帐号数量，∑_i,kCount(u_i,t_j,a_k)则表示阅读了包含标签t_j广告文本的帐号数量。

步骤503：计算文本标签集合中各个文本标签对应的第二概率分布。

示例性的，同样使用三元组(u_i,t_j,a_k)记录帐号的点击行为，则第二概率分布的计算方式如下所示：

其中，∑_i,j,kCount(u_i,t_j,a_k)表示三元组(u_i,t_j,a_k)所有的个数，∑_i,j,kCount(u_i,t_j,a_k)也表示上述的帐号总数，∑_i,jCount(u_i,t_j,a_k)表示点击了a_k类别的文本广告的帐号数目。u_i表示第i个帐号，t_j表示第j个文本标签，a_k表示第k类型广告文本。

步骤504：根据第一概率分布和第二概率分布之间的差值，计算行为分布差异。

可选地，计算第一概率分布和第二概率分布的相对熵，得到行为分布差异。

示例性的，将第一概率分布设为p，将第二概率分布设为q，则行为分布差异score(t_i)可采用以下算式计算：

其中，KL(*)表示计算相对熵，u_i表示第i个帐号，t_j表示第j个文本标签，a_k表示第k类型广告文本。

可选地，采用卡方检验计算第一概率分布和第二概率分布之间的偏离程度，得到行为分布差异。卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度，实际观测值与理论推断值之间的偏离程度就决定卡方值的大小，如果卡方值越大，二者偏差程度越大；反之，二者偏差越小；若两个值完全相等时，卡方值就为0，表明理论值完全符合。

步骤505：去除文本标签集合中行为分布差异小于行为差异分布阈值的文本标签，得到更新后的文本标签集合。

行为差异分布度量了第一概率分布和第二概率分布之间的距离，如果两个分布差异大，说明对于某一标签限定的帐号而言，这类帐号对应的用户的广告点击行为和整体人群差异较大。也就是说，该标签对用户在广告***上的行为具备足够的区分度。所以，当标签的行为差异分布打分高于行为差异分布阈值，说明标签和广告点击行为存在更强的关联关系，推荐对应的广告可以让用户有更强的点击意愿。

步骤506：根据更新后的文本标签集合得到推荐广告。

可选地，根据更新后的文本标签集合从候选广告集中确定推荐广告。本申请实施例采用二次筛选来得到推荐广告，在第一次筛选中，从候选广告集中确定筛选广告集合；在第二次筛选中，从筛选广告集合中确定推荐广告。第一次筛选对候选广告集进行粗略筛选，得到筛选广告集，第一次筛选可将以万计数的候选广告集降到以百计数的筛选广告集；第二次筛选对筛选广告集进行一次详细筛选，得到推荐广告。

在第一次筛选时，调用召回模型，根据更新后的文本标签集合，对候选广告集进行筛选处理，得到筛选广告集合。在一些实施例中，召回模型包括q个，每个召回模型用于处理不同的类型的文本标签。

而且，在行为分布差异足够大时，说明第一概率分布和第二概率分布这两个分布差异大，说明对于某一标签限定的帐号而言，这类帐号对应的用户的广告点击行为和整体人群差异较大。标签和广告点击行为存在更强的关联关系，推荐对应的广告可以让用户有更强的点击意愿。

在接下来的实施例中，确定推荐广告需要分两次进行，第一次是粗筛，第二次是细筛。第一次粗筛可以降低选取推荐广告的范围，第二次细筛可以实现更加精细化的筛选，选出更加合适的推荐广告。确定推荐广告的步骤如下所示：

1、调用召回模型，根据更新后的文本标签集合，对候选广告集进行筛选处理，得到筛选广告集合。

步骤601：取更新后的文本标签集合中的第q个文本标签，q为初始值为1的整数。

其中，召回模型包括p个，p表示更新后的文本标签集合的元素数量。

需要说明的是，第q个文本标签的数量小于p个。示例性的，p是5时，q可以是1或2。在接下来的实施例中，认为第q个文本标签只包括一个文本标签。

步骤602：调用第q个召回模型，对第q个文本标签和候选广告集进行编码操作，得到第q个标签特征和候选广告特征。

可选地，调用第q个召回模型，对第q个文本标签进行编码操作，得到第q个标签特征。示例性的，调用第q个召回模型，通过向量查找表确定第q个文本标签中各个字符的向量，得到第q个标签特征。向量查找表用于记录字符与向量之间的对应关系。例如，字符“对”对应的向量是[4，8]，而字符“方”对应的向量是[8，89]。

可选地，调用第q个召回模型，对候选广告集进行编码操作，得到候选广告特征。候选广告特征包括至少一个特征。类似的，调用第q个召回模型，通过向量查找表确定候选广告集中各个字符的向量，得到候选广告特征。

在一些实施例中，召回模型包括第一编码器，该第一编码器用于表示文本符号与特征向量之间的映射关系。例如，该映射关系包括文本符号“上”与特征向量[45，48]。

步骤603：计算第q个标签特征和候选广告特征之间的第一相似度。

第一相似度用于表示第q个标签特征和候选广告特征之间的向量距离。

示例性的，通过欧式距离计算第一相似度。例如，第q个标签特征是(1，2，0)，候选广告特征包括(4，2，4)和(1，2，3)，则可得到两个欧式距离是5和3，第一相似度是5+3＝8。

步骤604：将候选广告中第一相似度小于第一相似度阈值的候选广告放入筛选广告集合。

第一相似度阈值可由技术人员自行设置。第一相似度阈值为一常数。

筛选广告集合用于存储符合需求的候选广告。在一些实施例中，筛选广告集合存储筛选广告的名称、编号、URL(Uniform Resource Locator，统一资源***)、作者、类型、种类、中的至少一种。

步骤605：将q更新为q+1，重复上述四个步骤p次，得到筛选广告集合。

重复上述四个步骤p次，可以遍历更新后的文本标签集合中的全部文本标签。进而从全部的文本标签中确定需要的筛选广告。

2、调用排序模型，根据更新后的文本标签集合，对筛选广告集合进行排序处理，得到推荐广告排序列表；从推荐广告排序列表中获取推荐广告。

步骤701：调用排序模型，对更新后的文本标签集合和筛选广告集合进行编码操作，得到标签特征和候选广告特征。

可选地，调用排序模型，对更新后的文本标签集合进行编码操作，得到标签特征。需要说明的是，本步骤使用了更新后的文本标签集合中的全部标签。标签特征包括至少一个特征。

可选地，调用排序模型，对筛选广告集合进行编码操作，得到候选广告特征。

在一些实施例中，排序模型包括第二编码器，该第二编码器用于表示文本符号与特征向量之间的映射关系。

步骤702：计算标签特征与各个候选广告特征之间的第二相似度。

第二相似度用于表示标签特征与各个候选广告特征之间的向量距离。

可选地，通过欧式距离计算第二相似度。例如，标签特征是(1，2，0)，候选广告特征包括(6，2，12)和(1，2，3)，则可得到两个欧式距离是13和3，第一相似度是13+3＝16。

步骤703：根据第二相似度对筛选候选广告进行排序，得到推荐广告排序。

在一些实施例中，根据第二相似度，将筛选广告从大到小排列，得到推荐广告排序；取前a个筛选广告作为推荐广告，a为正整数，a的取值可由技术人员自行设置。

综上所述，本申请实施例采用二次筛选选取推荐广告，不仅可以提高广告筛选的效率，而且推荐广告更加贴合用户的喜好。

在接下来的实施例中，将说明更新文本标签的方法，该方法可准确地刻画用户的画像。为用户提供合适的推荐广告，向用户提供喜好或偏好的内容，提高用户对推荐广告的点击率。

步骤1：获取文本标签；

该步骤通过对广告文本的文本字符进行编码，最终获得每个文本字符的表征，最后预测每个广告文本的文本片段位置。然后拼接上两个特殊符号“[CLS][SEP]”。处理完成后就可以将这个文本字符序列送给BERT模型，BERT模型得到每个文本字符的特征向量。然后通过以下公式得到每个文本字符被预测为BIO的概率，其中B表示对应的文本字符属于文本标签的开始位置，I表示对应的文本字符属于文本标签的中间位置，O表示对应的文本字符不属于文本标签的一部分：

x_i＝MLP(emb_i)；

p_i＝softmax(x_i)；

其中，emb_i表示第i个文本字符在bert模型中的特征向量，MLP(*)表示多层感知机，p_i表示第i个文本字符被预测为BIO的概率。

步骤2：计算各个标签帐号下广告文本的点击行为分布；

在获取了信息流场景中每篇文章的标签后，可以构建一个初步的标签体系T。此外，可以通过用户在信息流场景中的浏览行为以及在广告***中的点击行为，生成一个三元组(u_i,t_j,a_k)。其中，u_i表示第i个用户，t_j表示原始信息流标签体系中的第j个标签，a_k表示广告***定义的第k个广告类目。该三元组的含义是，在一定时间窗口内(例如最近90天)，用户u_i阅读了某篇包含标签t_j的信息流文章，同时他还点击过属于a_k类别的一个广告。基于用户在信息流场景中的阅读行为以及在广告***中的点击行为，我们可以为所有的用户生成这样的三元组。基于大量的三元组共现关系，我们可以统计在信息流标签t_j限定的人群下，广告类目a_k被点击的概率：

其中，∑_iCount(u_i,t_j,a_k)表示同时点击广告类目a_k且同时阅读了包含标签t_j广告文本的帐号数量，∑_i,kCount(u_i,t_j,a_k)则表示阅读了包含标签t_j广告文本的帐号数量。u_i表示第i个用户，t_j表示原始信息流标签体系中的第j个标签，a_k表示广告***定义的第k个广告类目。基于上述公式，可以得到在每个信息流文章标签下，用户对不同类型广告的点击概率分布。

步骤3:计算整体帐号下广告文本的点击行为分布；

和步骤2类似，整体人群在广告下的点击分布可以采用下面的公式得到：

其中，∑_i,j,kCount(u_i,t_j,a_k)表示三元组(u_i,t_j,a_k)所有的个数，∑_i,jCount(u_i,t_j,a_k)表示点击了广告类目a_k的用户数目。q(a_k)表示了广告***中不同类目广告被点击的先验概率。u_i表示第i个用户，t_j表示原始信息流标签体系中的第j个标签，a_k表示广告***定义的第k个广告类目。

步骤4:统计标签帐号和全体帐号的行为分布差异；

如图3所示，步骤2通过标签t_i限定人群得到每个广告类目被点击的概率p(a_k|t_j)，步骤3则在没有任何限定条件下，得到每个广告类目被点击的先验概率分布q(a_k)。最终，我们通过如下打分函数得到每个标签的重要度：

其中，score(t_i)度量了p和q两个分布之间的距离，如果两个分布差异大，说明对于标签t_i限定的用户而言，他们的广告点击行为和整体人群差异较大。也就是说，标签t_i对用户在广告***上的行为具备足够的区分度。所以，当标签t_i的重要度打分高于某一阈值，说明标签和广告点击行为存在更强的关联关系。对于步骤1中初始的标签体系T，如果其中t_i的打分较大则保留，否则过滤掉。过滤后的标签集合将用于广告推荐中用户的特征的刻画。

图8示出了本申请实施例提供的一种广告推荐装置的示意图。该装置800包括：

提取模块801，用于提取广告文本对应的文本标签集合，所述文本标签集合用于表示所述广告文本的内容的关键词；

计算模块802，用于计算所述文本标签集合中各个文本标签对应的第一概率分布和第二概率分布，所述第一概率分布用于表示具有所述文本标签集合的帐号对不同类型的广告文本的点击概率分布，所述第二概率分布用于表示全体帐号对不同类型的广告文本的点击概率分布；

更新模块803，用于根据所述第一概率分布和所述第二概率分布，更新所述文本标签集合，得到更新后的文本标签集合；

推荐模块804，用于根据所述更新后的文本标签集合得到推荐广告。

在一个可选设计中，所述更新模块803，还用于根据所述第一概率分布和所述第二概率分布之间的差值，计算行为分布差异，所述行为分布差异用于表示具有所述文本标签集合的帐号和所述全体帐号的点击行为差异；去除所述文本标签集合中所述行为分布差异小于行为差异分布阈值的文本标签，得到所述更新后的文本标签集合。

在一个可选设计中，所述更新模块803，还用于计算所述第一概率分布和所述第二概率分布的相对熵，得到所述行为分布差异；或者，采用卡方检验计算所述第一概率分布和所述第二概率分布之间的偏离程度，得到所述行为分布差异。

在一个可选设计中，所述计算模块802，还用于对于所述文本标签集合对应的第k类型广告文本，统计点击所述第k类型广告文本且浏览包含第j个文本标签的文本的第一帐号数量，k，j为正整数；统计浏览包含所述第j个文本标签的文本的第二帐号数量；根据所述第一帐号数量和所述第二帐号数量的比值，得到所述第k类型广告文本的第一概率分布。

在一个可选设计中，所述计算模块802，还用于对于所述文本标签集合中的第k个文本标签，统计点击第k类型广告文本的第三帐号数量；根据所述第三帐号数量与帐号总数的比值，得到所述第k个文本标签的第二概率分布。

在一个可选设计中，所述提取模块801，还用于对于所述文本标签集合对应的第k类型广告文本，统计点击第k类型广告文本的第三帐号数量；根据所述第三帐号数量与帐号总数的比值，得到所述第k类型广告文本的第二概率分布。

在一个可选设计中，所述提取模块801，还用于对所述特征向量进行分类，得到所述文本字符的位置概率；根据所述位置概率从所述广告文本中提取所述文本标签，得到所述文本标签集合；其中，所述位置概率包括第一位置概率、第二位置概率和第三位置概率中的至少一种，所述第一位置概率用于表示所述文本字符位于所述文本标签的开始位置的概率，所述第二位置概率用于表示所述文本字符位于所述文本标签的中间位置的概率，所述第三位置概率用于表示所述文本字符不属于所述文本标签的概率。

在一个可选设计中，所述推荐模块804，还用于调用召回模型，根据所述更新后的文本标签集合，对候选广告集进行筛选处理，得到筛选广告集合；调用排序模型，根据所述更新后的文本标签集合，对所述筛选广告集合进行排序处理，得到推荐广告排序列表；从所述推荐广告排序列表中获取所述推荐广告。

在一个可选设计中，所述召回模型包括p个，所述p表示所述更新后的文本标签集合的元素数量；所述推荐模块804，还用于取所述更新后的文本标签集合中的第q个文本标签，q为初始值为1的整数；调用第q个所述召回模型，对所述第q个文本标签和所述候选广告集进行编码操作，得到第q个标签特征和候选广告特征；计算所述第q个标签特征和所述候选广告特征之间的第一相似度；将所述候选广告中所述第一相似度小于第一相似度阈值的候选广告放入所述筛选广告集合；将q更新为q+1，重复上述四个步骤p次，得到所述筛选广告集合。

在一个可选设计中，所述推荐模块804，还用于调用所述排序模型，对所述更新后的文本标签集合和所述筛选广告集合进行编码操作，得到标签特征和候选广告特征；计算所述标签特征与各个所述候选广告特征之间的第二相似度；根据所述第二相似度对所述推荐广告进行排序，得到所述推荐广告排序。

图9是根据一示例性实施例示出的一种计算机设备的结构示意图。所述计算机设备900包括中央处理单元(Central Processing Unit，CPU)901、包括随机存取存储器(Random Access Memory，RAM)902和只读存储器(Read-Only Memory，ROM)903的***存储器904，以及连接***存储器904和中央处理单元901的***总线905。所述计算机设备900还包括帮助计算机设备内的各个器件之间传输信息的基本输入/输出***(Input/Output，I/O***)906，和用于存储操作***913、应用程序914和其他程序模块915的大容量存储设备907。

所述基本输入/输出***906包括有用于显示信息的显示器908和用于用户输入信息的诸如鼠标、键盘之类的输入设备909。其中所述显示器908和输入设备909都通过连接到***总线905的输入输出控制器910连接到中央处理单元901。所述基本输入/输出***906还可以包括输入输出控制器910以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入输出控制器910还提供输出到显示屏、打印机或其他类型的输出设备。

所述大容量存储设备907通过连接到***总线905的大容量存储控制器(未示出)连接到中央处理单元901。所述大容量存储设备907及其相关联的计算机设备可读介质为计算机设备900提供非易失性存储。也就是说，所述大容量存储设备907可以包括诸如硬盘或者只读光盘(Compact Disc Read-Only Memory，CD-ROM)驱动器之类的计算机设备可读介质(未示出)。

不失一般性，所述计算机设备可读介质可以包括计算机设备存储介质和通信介质。计算机设备存储介质包括以用于存储诸如计算机设备可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机设备存储介质包括RAM、ROM、可擦除可编程只读存储器(Erasable Programmable ReadOnly Memory，EPROM)、带电可擦可编程只读存储器(Electrically ErasableProgrammable Read-Only Memory，EEPROM)，CD-ROM、数字视频光盘(Digital Video Disc，DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知所述计算机设备存储介质不局限于上述几种。上述的***存储器904和大容量存储设备907可以统称为存储器。

根据本公开的各种实施例，所述计算机设备900还可以通过诸如因特网等网络连接到网络上的远程计算机设备运行。也即计算机设备900可以通过连接在所述***总线905上的网络接口单元911连接到网络912，或者说，也可以使用网络接口单元911来连接到其他类型的网络或远程计算机设备***(未示出)。

所述存储器还包括一个或者一个以上的程序，所述一个或者一个以上程序存储于存储器中，中央处理器901通过执行该一个或一个以上程序来实现上述广告推荐方法的全部或者部分步骤。

在示例性实施例中，还提供了一种计算机设备，所述计算机设备中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述各个方法实施例提供的广告推荐方法。

本申请还提供一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述方法实施例提供的广告推荐方法。

可选地，本申请还提供了一种包含指令的计算机程序产品，当其在计算机设备上运行时，使得计算机设备执行上述各方面所述的广告推荐方法。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种广告推荐方法，其特征在于，所述方法包括：

根据所述更新后的文本标签集合得到推荐广告。

2.根据权利要求1所述的方法，其特征在于，所述根据所述第一概率分布和所述第二概率分布，更新所述文本标签集合，得到更新后的文本标签集合，包括：

根据所述第一概率分布和所述第二概率分布之间的差值，计算行为分布差异，所述行为分布差异用于表示具有所述文本标签集合的帐号和所述全体帐号的点击行为差异；

去除所述文本标签集合中所述行为分布差异小于行为差异分布阈值的文本标签，得到所述更新后的文本标签集合。

3.根据权利要求2所述的方法，其特征在于，所述根据所述第一概率分布和所述第二概率分布之间的差值，计算行为分布差异，包括：

计算所述第一概率分布和所述第二概率分布的相对熵，得到所述行为分布差异；

或者，

采用卡方检验计算所述第一概率分布和所述第二概率分布之间的偏离程度，得到所述行为分布差异。

4.根据权利要求1至3任一项所述的方法，其特征在于，所述计算所述文本标签集合中各个文本标签的第一概率分布，包括：

对于所述文本标签集合对应的第k类型广告文本，统计点击所述第k类型广告文本且浏览包含第j个文本标签的文本的第一帐号数量，k，j为正整数；

统计浏览包含所述第j个文本标签的文本的第二帐号数量；

根据所述第一帐号数量和所述第二帐号数量的比值，得到所述第k类型广告文本的第一概率分布。

5.根据权利要求1至3任一项所述的方法，其特征在于，所述计算所述文本标签集合中各个文本标签的第二概率分布，包括：

对于所述文本标签集合对应的第k类型广告文本，统计点击第k类型广告文本的第三帐号数量；

根据所述第三帐号数量与帐号总数的比值，得到所述第k类型广告文本的第二概率分布。

6.根据权利要求1至3任一项所述的方法，其特征在于，所述提取广告文本对应的文本标签集合，包括：

对所述广告文本中的文本字符进行编码，得到所述文本字符对应的特征向量；

根据所述特征向量预测文本标签在所述广告文本中的位置，得到所述文本标签集合。

7.根据权利要求6所述的方法，其特征在于，所述根据所述特征向量预测文本标签的位置，得到所述文本标签集合，包括：

对所述特征向量进行分类，得到所述文本字符的位置概率；

根据所述位置概率从所述广告文本中提取所述文本标签，得到所述文本标签集合；

其中，所述位置概率包括第一位置概率、第二位置概率和第三位置概率中的至少一种，所述第一位置概率用于表示所述文本字符位于所述文本标签的开始位置的概率，所述第二位置概率用于表示所述文本字符位于所述文本标签的中间位置的概率，所述第三位置概率用于表示所述文本字符不属于所述文本标签的概率。

8.根据权利要求1至3任一项所述的方法，其特征在于，所述根据所述更新后的文本标签集合得到推荐广告，包括：

调用召回模型，根据所述更新后的文本标签集合，对候选广告集进行筛选处理，得到筛选广告集合；

调用排序模型，根据所述更新后的文本标签集合，对所述筛选广告集合进行排序处理，得到推荐广告排序列表；

从所述推荐广告排序列表中获取所述推荐广告。

9.根据权利要求8所述的方法，其特征在于，所述召回模型包括p个，所述p表示所述更新后的文本标签集合的元素数量；

所述调用召回模型，根据所述更新后的文本标签集合，对候选广告集进行筛选处理，得到筛选广告集合，包括：

取所述更新后的文本标签集合中的第q个文本标签，q为初始值为1的整数；

调用第q个所述召回模型，对所述第q个文本标签和所述候选广告集进行编码操作，得到第q个标签特征和候选广告特征；

计算所述第q个标签特征和所述候选广告特征之间的第一相似度；

将所述候选广告中所述第一相似度小于第一相似度阈值的候选广告放入所述筛选广告集合；

将q更新为q+1，重复上述四个步骤p次，得到所述筛选广告集合。

10.根据权利要求8所述的方法，其特征在于，所述调用排序模型，根据所述更新后的文本标签集合，对所述筛选广告集合进行排序处理，得到推荐广告排序列表，包括：

调用所述排序模型，对所述更新后的文本标签集合和所述筛选广告集合进行编码操作，得到标签特征和候选广告特征；

计算所述标签特征与各个所述候选广告特征之间的第二相似度；

根据所述第二相似度对所述筛选广告进行排序，得到所述推荐广告排序。

11.一种广告推荐装置，其特征在于，所述装置包括：

12.一种计算机设备，其特征在于，所述计算机设备包括：处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至10中任一项所述的广告推荐方法。

13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条程序代码，所述程序代码由处理器加载并执行以实现如权利要求1至10中任一项所述的广告推荐方法。

14.一种计算机程序产品，包括计算机程序或指令，其特征在于，该计算机程序或指令被处理器执行时实现权利要求1至10中任一项所述的广告推荐方法。