CN114493724A - 一种基于多任务学习的竞价关键词效果预估模型构建方法 - Google Patents

一种基于多任务学习的竞价关键词效果预估模型构建方法 Download PDF

Info

Publication number
CN114493724A
CN114493724A CN202210151280.0A CN202210151280A CN114493724A CN 114493724 A CN114493724 A CN 114493724A CN 202210151280 A CN202210151280 A CN 202210151280A CN 114493724 A CN114493724 A CN 114493724A
Authority
CN
China
Prior art keywords
loss
bidding
rate
advertisement
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210151280.0A
Other languages
English (en)
Inventor
陈观林
彭石元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou City University
Original Assignee
Hangzhou City University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou City University filed Critical Hangzhou City University
Priority to CN202210151280.0A priority Critical patent/CN114493724A/zh
Publication of CN114493724A publication Critical patent/CN114493724A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Accounting & Taxation (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于多任务学习的竞价关键词效果预估模型构建方法,包括步骤:收集广告和对应竞价关键词的历史数据;对广告和竞价关键词的特征向量进行预处理,得到降维后的特征向量和广告和竞价关键词的数值特征向量;将降维后的特征向量与广告和竞价关键词的数值特征向量拼接在一起,输入深度神经网络。本发明的有益效果是:构建了基于多任务学习的竞价关键词效果预估模型,该模型通过多任务学习,预估广告购买竞价关键词在未来一段时间内的展现量、点击量和转化量,并且在基于多任务学习的竞价关键词效果预估模型中显示建模任务之间的关系以增强模型的效果。相较PLE模型,本发明提出的预估模型在展示任务、点击任务和转化任务上均有所提升。

Description

一种基于多任务学习的竞价关键词效果预估模型构建方法
技术领域
本发明属于搜索广告领域,尤其涉及一种基于多任务学习的竞价关键词效果预估模型构建方法。
背景技术
作为在线广告形式中的十分重要的一种,搜索广告主要是在用户的搜索结果页进行广告投放。在搜索广告中,广告平台主要通过广告主选择的竞价关键词与用户的搜索词进行匹配,然后再进行广告的曝光。作为连接用户、广告主和广告平台的核心枢纽,竞价关键词的选择是广告主投放广告过程中最关键的环节之一。但是除了少数广告主花费大量资金聘请专业团队外,大多数广告主很难提前预知竞价关键词的广告效果,只能通过不断尝试来验证竞价关键词的广告效果,在一定程度上增加了广告主的试错成本。
作为近年来最火热的研究方向之一,多任务学习从最初简单的参数共享发展到了现在的多种的自定参数共享。目前,多任务学习已经被广告应用于各个领域,包括计算机视觉、搜索推荐等领域。
在国内学者Hongyan Tang提出PLE模型之后,很多基于PLE模型的多任务模型都取得了很好的效果。这些模型在训练中都将有关任务联合在一起学习,然后通过参数共享的方式增强模型的泛化能力。但是只是简单地将任务放在一起,并不能获得最好的效果。
专利号为CN202010270578.4的《一种针对广告主广告投放效果的风险评估方法及平台》中,公开了一种竞价关键词广告效果预估的方法;其方法包括如下步骤:收集历史数据,每个关键词包括搜索量、价格、点击量、转化量和展示量;建立模拟广告平台,采用线性插值模型预测关键词的展示量,采用概率模型预测关键词的点击量和展示量;该竞价关键词广告效果预估的方法通过使用多个模型的方式来对竞价关键词的多种广告效果进行预估,可以取得一定的效果。但是多个模型的方式增加了维护成本,也无法利用多个任务之间的联系增强预测效果。
发明内容
本发明的目的是克服现有技术中的不足,提供一种基于多任务学习的竞价关键词效果预估模型构建方法。
这种基于多任务学习的竞价关键词效果预估模型构建方法,包括以下步骤:
S1、收集广告和对应竞价关键词的历史数据;广告和对应竞价关键词的历史数据包括:<广告,竞价关键词>二元组集合的展现量、点击量、转化量、点击率和转化率;将精排点击率和转化率模型作为竞价关键词效果预估模型的教师模型,并将教师模型预估的点击率和转化率作为标签来计算竞价关键词效果预估模型的点击率和转化率损失;在竞价关键词和广告维度对点击率和转化率预估值进行求平均值处理;
S2、对广告和竞价关键词的特征向量进行预处理,得到降维后的特征向量和广告和竞价关键词的数值特征向量;将降维后的特征向量与广告和竞价关键词的数值特征向量拼接在一起,作为深度神经网络的输入;
S3、构建基于多任务学习的深度神经网络,将步骤S2所得降维后的特征向量与广告和竞价关键词的数值特征向量拼接在一起,得到d维的向量,作为深度神经网络的输入;深度神经网络输出<广告,竞价关键词>二元组集合的展现量、点击量和转化量的预估值;
S4、利用深度神经网络输出的<广告,竞价关键词>二元组集合的展现量、点击量和转化量的预估值来计算预估的点击率和预估的转化率;
预估的点击率
Figure BDA0003507790890000021
计算公式如下:
Figure BDA0003507790890000022
上式中,
Figure BDA0003507790890000023
代表深度神经网络输出的<广告,竞价关键词>二元组集合的展现量的预估值,
Figure BDA0003507790890000024
代表深度神经网络输出的<广告,竞价关键词>二元组集合的点击量的预估值;
预估的转化率
Figure BDA0003507790890000025
计算公式如下:
Figure BDA0003507790890000026
上式中,
Figure BDA0003507790890000027
代表深度神经网络输出的<广告,竞价关键词>二元组集合的点击量的预估值,
Figure BDA0003507790890000028
代表深度神经网络输出的<广告,竞价关键词>二元组集合的转化量的预估值;
S5、利用泊松损失计算展现量、点击量和转化量的损失,利用均方根损失函数计算点击率和转化率的损失;
S6、将步骤S5所得展现量、点击量和转化量的损失,以及点击率和转化率的损失加权融合,得到最终损失;按照反向传播算法对深度神经网络进行参数更新,最终得到竞价关键词效果预估模型;最终损失的计算公式为:
Loss=λ1loss12loss23loss34lossctr5losscvr
上式中,λ1和loss1分别代表展现量的权重系数和基于泊松损失得到的展现量损失,λ2和loss2分别代表点击量的权重系数和基于泊松损失得到的点击量损失,λ3和loss3分别代表转化量的权重系数和基于泊松损失得到的转化量损失,λ4和lossctr分别代表点击率的权重系数和基于均方根损失得到的点击率损失,λ5和losscvr分别代表转化率的权重系数和基于均方根损失得到的转化率损失。
作为优选,步骤S1中<广告,竞价关键词>二元组集合在广告***被展现过。
作为优选,点击率和转化率为广告***中排序模型对<广告,竞价关键词>二元组集合点击率和转化率的预估值,或者点击率和转化率由真实的统计值计算得到。
作为优选,步骤S1中在竞价关键词和广告维度对点击率和转化率预估值进行求平均值处理的具体方式为:设任意一个样本xi每次被展现时,精排点击率和转化率模型预估的点击率集合为{ctri,1,ctri,2,...,ctri,K},其中ctri,1,ctri,2,...,ctri,K表示样本xi对应的第1个至第K个点击率预估值;精排点击率和转化率模型预估的转化率集合为{cvri,1,cvri,2,...,cvri,K},其中cvri,1,cvri,2,...,cvri,K表示xi对应的第1个至第K个转化率预估值;K表示竞价关键词和广告的展现集合大小;则样本xi对应的点击率集合ctri和转化率集合cvri由下式计算得出:
Figure BDA0003507790890000031
Figure BDA0003507790890000032
作为优选,步骤S3中深度神经网络的参数共享方式为硬共享、MMOE或PLE方式。
作为优选,步骤2具体包括如下步骤:
S2.1、收集广告和竞价关键词数据集X={x1,x2,...,xN}作为总的训练样本集合,N为样本集合大小,xi∈{x1,x2,...,xN}表示第i个待处理的样本特征数据;xi,j∈{xi,1,xi,2,…,xi,M}代表第i个样本的第j个特征;样本特征数据类型分为离散特征和数值特征;其中离散型特征指特征取值之间没有大小关系的特征;数值特征指用数字直接表示的特征;
S2.2、若xi,j为数值特征向量,则将广告和竞价关键词的特征向量进行标准化,变成均值为0,方差为1的数据;标准化之后的数据使用x′表示,具体计算公式如下:
Figure BDA0003507790890000033
上式中,x表示原始数值,μ表示该特征原始数值分布的均值,σ表示该特征原始数值分布的方差;
S2.3、若xi,j是离散型特征向量,则将广告和竞价关键词的离散型特征向量进行One-hot编码,将广告和竞价关键词的离散型特征向量转化成由0和1构成的高维度的稀疏特征向量[0,1,0,…,0];将高维度的稀疏特征向量通过Embedding嵌入层进行降维,转化成低维稠密向量;Embedding嵌入层由单层神经网络组成,Embedding嵌入层的输入为One-hot编码,Embedding嵌入层的输出为指定维度的特征向量。
作为优选,步骤5具体包括如下步骤:
S5.1、在单个任务下,利用泊松损失计算展现量、点击量和转化量的损失的公式为:
Figure BDA0003507790890000041
上式中,y和
Figure BDA0003507790890000042
分别代表该任务下样本的标签集合和预估值集合,
Figure BDA0003507790890000043
和yi分别代表第i个样本的预估值和标签值,N代表样本集合大小;
S5.2、利用均方根损失函数计算点击率和转化率的损失:
Figure BDA0003507790890000044
上式中,y和
Figure BDA0003507790890000045
分别代表样本标签集合和预估值集合,
Figure BDA0003507790890000046
和yi分别代表第h个样本的预估值和标签值,N代表样本集合大小。
本发明的有益效果是:本发明构建了基于多任务学习的竞价关键词效果预估模型,该模型通过多任务学习,预估广告购买竞价关键词在未来一段时间内的展现量、点击量和转化量,并且在基于多任务学习的竞价关键词效果预估模型中显示建模任务之间的关系以增强模型的效果。相较PLE模型,本发明提出的预估模型在展示任务、点击任务和转化任务上均有所提升。
附图说明
图1为基于多任务学习的竞价关键词效果预估模型的构建及训练流程图。
具体实施方式
下面结合实施例对本发明做进一步描述。下述实施例的说明只是用于帮助理解本发明。应当指出,对于本技术领域的普通人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
实施例一
本申请实施例一提供了一种如图1所示基于多任务学习的竞价关键词效果预估模型的构建方法:
S1、收集广告和对应竞价关键词的历史数据;广告和对应竞价关键词的历史数据包括:<广告,竞价关键词>二元组集合的展现量、点击量、转化量、点击率和转化率;将精排点击率和转化率模型作为竞价关键词效果预估模型的教师模型,并将教师模型预估的点击率和转化率作为标签来计算竞价关键词效果预估模型的点击率和转化率损失;在竞价关键词和广告维度对点击率和转化率预估值进行求平均值处理;
S2、对广告和竞价关键词的特征向量进行预处理,得到降维后的特征向量和广告和竞价关键词的数值特征向量;将降维后的特征向量与广告和竞价关键词的数值特征向量拼接在一起,作为深度神经网络的输入;
S3、构建基于多任务学习的深度神经网络,将步骤S2所得降维后的特征向量与广告和竞价关键词的数值特征向量拼接在一起,得到d维的向量,作为深度神经网络的输入;深度神经网络输出<广告,竞价关键词>二元组集合的展现量、点击量和转化量的预估值;
S4、利用深度神经网络输出的<广告,竞价关键词>二元组集合的展现量、点击量和转化量的预估值来计算预估的点击率和预估的转化率;
预估的点击率
Figure BDA0003507790890000051
计算公式如下:
Figure BDA0003507790890000052
上式中,
Figure BDA0003507790890000053
代表深度神经网络输出的<广告,竞价关键词>二元组集合的展现量的预估值,
Figure BDA0003507790890000054
代表深度神经网络输出的<广告,竞价关键词>二元组集合的点击量的预估值;
预估的转化率
Figure BDA0003507790890000055
计算公式如下:
Figure BDA0003507790890000056
上式中,
Figure BDA0003507790890000057
代表深度神经网络输出的<广告,竞价关键词>二元组集合的点击量的预估值,
Figure BDA0003507790890000058
代表深度神经网络输出的<广告,竞价关键词>二元组集合的转化量的预估值;
S5、利用泊松损失计算展现量、点击量和转化量的损失,利用均方根损失函数计算点击率和转化率的损失;
S6、将步骤S5所得展现量、点击量和转化量的损失,以及点击率和转化率的损失加权融合,得到最终损失;按照反向传播算法对深度神经网络进行参数更新,最终得到竞价关键词效果预估模型;最终损失的计算公式为:
Loss=λ1loss12loss23loss34lossctr5losscvr
上式中,λ1和loss1分别代表展现量的权重系数和基于泊松损失得到的展现量损失,λ2和loss2分别代表点击量的权重系数和基于泊松损失得到的点击量损失,λ3和loss3分别代表转化量的权重系数和基于泊松损失得到的转化量损失,λ4和lossctr分别代表点击率的权重系数和基于均方根损失得到的点击率损失,λ5和losscvr分别代表转化率的权重系数和基于均方根损失得到的转化率损失。
实施例二
在实施例一的基础上,本申请实施例二提供了实施例一中方法的具体应用;本实施例以一天为投放周期为例,预估广告购买竞价关键词后在未来一天内的广告效果。本实施例基于国内学者Hongyan Tang提出PLE多任务模型,利用添加辅助损失(CTR和CVR的损失)的方式显式建模任务之间依赖关系。如图1所示,该方法主要包括以下步骤
S1、收集广告和对应竞价关键词的历史数据;广告和对应竞价关键词的历史数据包括:<广告,竞价关键词>二元组集合的展现量、点击量、转化量、点击率和转化率;在模型蒸馏的思想中,通过将教师模型的输出作为学生模型的标签,来将教师模型中学到的知识蒸馏到学生模型当中。通过借鉴这样一个思想,本发明引入直接预估点击率和转化率的模型来作为竞价关键词效果预估模型的教师模型;通常情况下,无需从头训练预估点击率和转化率的模型这两个模型;从整个广告链路出发,广告在购买关键词后需要经过召回排序等过程才能展现在用户面前;而在排序过程中,排序阶段的点击率模型和转化率模型的预估值对广告的胜出有着至关重要的作用;因此排序阶段的点击率模型和转化率模型的预估值对竞价关键词效果预估模型有着一定的指导意义;<广告,竞价关键词>二元组集合在广告***被展现过;点击率和转化率为广告***中排序模型对<广告,竞价关键词>二元组集合点击率和转化率的预估值,或者点击率和转化率由真实的统计值计算得到;直接利用样本的真实标签计算得到点击率和转化率时,由于<广告,竞价关键词>二元组的稀疏性会导致绝大部分的样本的点击数和转化数都是零,一方面会导致计算出来的点击率和转化率绝大部分都是0,另外一方面点击数为0的样本也无法计算转化率;经过实验,这样不仅无法给模型带来性能上的提升还会使得模型学习出现偏差。
广告的排序阶段通常主要分为粗排和精排两个阶段;而作为广告领域最重要的研究方向之一,精排阶段的点击率模型和转化率模型相关的工作都十分的成熟,并且相比粗排阶段更加复杂和准确;最重要的是,由于本发明所使用的训练集是有被展现过的样本,那么很容易从广告***日志中解析该样本在精排阶段中的点击率和转化率预估值;因此将精排点击率和转化率模型作为竞价关键词效果预估模型的教师模型,并将教师模型预估的点击率和转化率作为标签来计算竞价关键词效果预估模型的点击率和转化率损失;需要注意的是,广告***中的精排模型往往是针对当次流量的个性化模型;所以需要在竞价关键词和广告维度对点击率和转化率预估值进行求平均值处理;
竞价关键词和广告维度对点击率和转化率预估值进行求平均值处理的具体方式为:
设任意一个样本xi每次被展现时,精排点击率和转化率模型预估的点击率集合为{ctri,1,ctri,2,...,ctri,K},其中ctri,1,ctri,2,...,ctri,K表示样本xi对应的第1个至第K个点击率预估值;精排点击率和转化率模型预估的转化率集合为{cvri,1,cvri,2,...,cvri,K},其中cvri,1,cvri,2,...,cvri,K表示xi对应的第1个至第K个转化率预估值;K表示竞价关键词和广告的展现集合大小;则样本xi对应的点击率集合ctri和转化率集合cvri由下式计算得出:
Figure BDA0003507790890000071
Figure BDA0003507790890000072
S2、对广告和竞价关键词的特征向量进行预处理,得到降维后的特征向量(低维稠密向量)和广告和竞价关键词的数值特征向量;将降维后的特征向量与广告和竞价关键词的数值特征向量拼接在一起,作为深度神经网络的输入;
S2.1、收集广告和竞价关键词数据集X={x1,x2,...,xN}作为总的训练样本集合,N为样本集合大小,xi∈{x1,x2,...,xN}表示第i个待处理的样本特征数据;xi,j∈{xi,1,xi,2,...,xi,M}代表第i个样本的第j个特征;样本特征数据类型分为离散特征和数值特征(连续稠密特征);其中离散型特征指特征取值之间没有大小关系的特征,例如性别-男和性别-女;数值特征指用数字直接表示的特征,例如年龄;
S2.2、若xi,j为数值特征向量,则将广告和竞价关键词的特征向量进行标准化,变成均值为0,方差为1的数据;标准化之后的数据使用x′表示,具体计算公式如下:
Figure BDA0003507790890000073
上式中,x表示原始数值,μ表示该特征原始数值分布的均值,σ表示该特征原始数值分布的方差;
S2.3、若xi,j是离散型特征向量,则将广告和竞价关键词的离散型特征向量进行One-hot(独热)编码,将广告和竞价关键词的离散型特征向量转化成由0和1构成的高维度的稀疏特征向量[0,1,0,…,0](高维独热特征向量);将高维度的稀疏特征向量通过Embedding嵌入层进行降维,转化成低维稠密向量;Embedding嵌入层由单层神经网络组成,Embedding嵌入层的输入为One-hot编码,Embedding嵌入层的输出为指定维度的特征向量;
S3、构建基于多任务学习的深度神经网络,将步骤S2所得降维后的特征向量(低维稠密向量)与广告和竞价关键词的数值特征向量拼接在一起,得到d维的向量,作为深度神经网络的输入;深度神经网络输出<广告,竞价关键词>二元组集合的展现量、点击量和转化量的预估值;深度神经网络的参数共享方式为硬共享、MMOE或PLE方式;
S4、利用深度神经网络输出的<广告,竞价关键词>二元组集合的展现量、点击量和转化量的预估值来计算预估的点击率和预估的转化率;
预估的点击率
Figure BDA0003507790890000081
计算公式如下:
Figure BDA0003507790890000082
上式中,
Figure BDA0003507790890000083
代表深度神经网络输出的<广告,竞价关键词>二元组集合的展现量的预估值,
Figure BDA0003507790890000084
代表深度神经网络输出的<广告,竞价关键词>二元组集合的点击量的预估值;
预估的转化率
Figure BDA0003507790890000085
计算公式如下:
Figure BDA0003507790890000086
上式中,
Figure BDA0003507790890000087
代表深度神经网络输出的<广告,竞价关键词>二元组集合的点击量的预估值,
Figure BDA0003507790890000088
代表深度神经网络输出的<广告,竞价关键词>二元组集合的转化量的预估值;
S5、在搜索广告***中,当广告展现给用户后,用户才能对广告进行点击。并且转化行为也只能发生在点击行为之后。那么显然,点击数是不能超过展现数的,并且转化数也是不能超过点击数的。但是传统的多任务模型中,并没有对预估值进行限制。也就是可能存在点击数(转化数)的预估值超过展现数(点击数)的预估值的。如果只是简单的对模型的预估值进行上限进行阈值限制,效果并不会很明显。因此,希望通过显式的在损失函数中加入点击率和转化率的损失来对模型的预估值进行约束。这样不仅可以对模型的预估值进行限制,还可以增强多任务模型中任务之间的联动,达到提高模型效果的目的。利用泊松损失计算展现量、点击量和转化量的损失,利用均方根损失函数计算点击率和转化率的损失;
S5.1、在单个任务下,利用泊松损失计算展现量、点击量和转化量的损失的公式为:
Figure BDA0003507790890000089
上式中,y和
Figure BDA00035077908900000810
分别代表该任务下样本的标签集合和预估值集合,
Figure BDA00035077908900000811
和yi分别代表第i个样本的预估值和标签值,N代表样本集合大小;在统计学上,泊松回归(PoissonRegression)是用来为计数资料和列联表建模的一种回归分析;泊松回归假设目标变量服从于泊松分布,并假设目标变量的期望值的对数可由一组未知参数进行线性表达。基于泊松分布的特性,泊松回归常用目标变量为计数形式,例如事件发生的次数等;而竞价关键词效果预估任务本质上也是在预估展现事件、点击事件、转化事件的次数;所以泊松损失是十分适合竞价关键词效果预估任务的损失函数之一;
S5.2、利用均方根损失函数计算点击率和转化率的损失:
Figure BDA0003507790890000091
上式中,y和
Figure BDA0003507790890000092
分别代表样本标签集合和预估值集合,
Figure BDA0003507790890000093
和yi分别代表第i个样本的预估值和标签值,N代表样本集合大小;
S6、将步骤S5所得展现量、点击量和转化量的损失,以及点击率和转化率的损失加权融合,得到最终损失;按照反向传播算法对深度神经网络进行参数更新,最终得到竞价关键词效果预估模型;最终损失的计算公式为:
Loss=λ1loss12loss23loss34lossctr5losscvr
上式中,λ1和loss1分别代表展现量的权重系数和基于泊松损失得到的展现量损失,λ2和loss2分别代表点击量的权重系数和基于泊松损失得到的点击量损失,λ3和loss3分别代表转化量的权重系数和基于泊松损失得到的转化量损失,λ4和lossctr分别代表点击率的权重系数和基于均方根损失得到的点击率损失,λ5和losscvr分别代表转化率的权重系数和基于均方根损失得到的转化率损失。
实验结果
为了证明本实施例的有效性,本实施例与目前性能最优秀的多任务模型之一PLE模型在淘宝搜索广告平台的数据集上进行对比实验。该数据集中包含20亿训练样本,1亿条测试样本。
在训练过程中,所有网络均使用TensorFlow实现,激活函数采用Leaky RectifiedLinear Unit(LRelu)。所有网络都是用Adagrad优化器和随机梯度下降法进行训练。学习率设为0.002。学习轮次Epoch为3。
下表1表示本实施例所得竞价关键词效果预估模型在测试集上相对PLE模型在评估指标上的相对提升结果。其中评估指标为50%相对误差范围内的比例。结果显示,相较PLE模型,本发明提出的优化方法在展示任务、点击任务和转化任务上分别达到了8.13%、13.13%和15.76%的相对提升。
表1本实施例所得竞价关键词效果预估模型在测试集上相对PLE模型在评估指标上的相对提升结果表
Figure BDA0003507790890000101

Claims (7)

1.一种基于多任务学习的竞价关键词效果预估模型构建方法,其特征在于,包括以下步骤:
S1、收集广告和对应竞价关键词的历史数据;广告和对应竞价关键词的历史数据包括:<广告,竞价关键词>二元组集合的展现量、点击量、转化量、点击率和转化率;将精排点击率和转化率模型作为竞价关键词效果预估模型的教师模型,并将教师模型预估的点击率和转化率作为标签来计算竞价关键词效果预估模型的点击率和转化率损失;在竞价关键词和广告维度对点击率和转化率预估值进行求平均值处理;
S2、对广告和竞价关键词的特征向量进行预处理,得到降维后的特征向量和广告和竞价关键词的数值特征向量;将降维后的特征向量与广告和竞价关键词的数值特征向量拼接在一起,作为深度神经网络的输入;
S3、构建基于多任务学习的深度神经网络,将步骤S2所得降维后的特征向量与广告和竞价关键词的数值特征向量拼接在一起,得到d维的向量,作为深度神经网络的输入;深度神经网络输出<广告,竞价关键词>二元组集合的展现量、点击量和转化量的预估值;
S4、利用深度神经网络输出的<广告,竞价关键词>二元组集合的展现量、点击量和转化量的预估值来计算预估的点击率和预估的转化率;
预估的点击率
Figure FDA0003507790880000011
计算公式如下:
Figure FDA0003507790880000012
上式中,
Figure FDA0003507790880000013
代表深度神经网络输出的<广告,竞价关键词>二元组集合的展现量的预估值,
Figure FDA0003507790880000014
代表深度神经网络输出的<广告,竞价关键词>二元组集合的点击量的预估值;
预估的转化率
Figure FDA0003507790880000015
计算公式如下:
Figure FDA0003507790880000016
上式中,
Figure FDA0003507790880000017
代表深度神经网络输出的<广告,竞价关键词>二元组集合的点击量的预估值,
Figure FDA0003507790880000018
代表深度神经网络输出的<广告,竞价关键词>二元组集合的转化量的预估值;
S5、利用泊松损失计算展现量、点击量和转化量的损失,利用均方根损失函数计算点击率和转化率的损失;
S6、将步骤S5所得展现量、点击量和转化量的损失,以及点击率和转化率的损失加权融合,得到最终损失;按照反向传播算法对深度神经网络进行参数更新,最终得到竞价关键词效果预估模型;最终损失的计算公式为:
Loss=λ1loss12loss23loss34lossctr5losscvr
上式中,λ1和loss1分别代表展现量的权重系数和基于泊松损失得到的展现量损失,λ2和loss2分别代表点击量的权重系数和基于泊松损失得到的点击量损失,λ3和loss3分别代表转化量的权重系数和基于泊松损失得到的转化量损失,λ4和lossctr分别代表点击率的权重系数和基于均方根损失得到的点击率损失,λ5和losscvr分别代表转化率的权重系数和基于均方根损失得到的转化率损失。
2.根据权利要求1所述基于多任务学习的竞价关键词效果预估模型构建方法,其特征在于:步骤S1中<广告,竞价关键词>二元组集合在广告***被展现过。
3.根据权利要求2所述基于多任务学习的竞价关键词效果预估模型构建方法,其特征在于:点击率和转化率为广告***中排序模型对<广告,竞价关键词>二元组集合点击率和转化率的预估值,或者点击率和转化率由真实的统计值计算得到。
4.据权利要求1所述基于多任务学***均值处理的具体方式为:设任意一个样本xi每次被展现时,精排点击率和转化率模型预估的点击率集合为{ctri,1,ctri,2,...,ctri,K},其中ctri,1,ctri,2,...,ctri,K表示样本xi对应的第1个至第K个点击率预估值;精排点击率和转化率模型预估的转化率集合为{cvri,1,cvri,2,...,cvri,K},其中cvri,1,cvri,2,...,cvri,K表示xi对应的第1个至第K个转化率预估值;K表示竞价关键词和广告的展现集合大小;则样本xi对应的点击率集合ctri和转化率集合cvri由下式计算得出:
Figure FDA0003507790880000021
Figure FDA0003507790880000022
5.根据权利要求1所述基于多任务学习的竞价关键词效果预估模型构建方法,其特征在于:步骤S3中深度神经网络的参数共享方式为硬共享、MMOE或PLE方式。
6.根据权利要求4所述基于多任务学习的竞价关键词效果预估模型构建方法,其特征在于:步骤2具体包括如下步骤:
S2.1、收集广告和竞价关键词数据集X={x1,x2,...,xN}作为总的训练样本集合,N为样本集合大小,xi∈{x1,x2,...,xN}表示第i个待处理的样本特征数据;xi,j∈{xi,1,xi,2,...,xi,M}代表第i个样本的第j个特征;样本特征数据类型分为离散特征和数值特征;其中离散型特征指特征取值之间没有大小关系的特征;数值特征指用数字直接表示的特征;
S2.2、若xi,j为数值特征向量,则将广告和竞价关键词的特征向量进行标准化,变成均值为0,方差为1的数据;标准化之后的数据使用x′表示,具体计算公式如下:
Figure FDA0003507790880000031
上式中,x表示原始数值,μ表示该特征原始数值分布的均值,σ表示该特征原始数值分布的方差;
S2.3、若xi,j是离散型特征向量,则将广告和竞价关键词的离散型特征向量进行One-hot编码,将广告和竞价关键词的离散型特征向量转化成由0和1构成的高维度的稀疏特征向量[0,1,0,…,0];将高维度的稀疏特征向量通过Embedding嵌入层进行降维,转化成低维稠密向量;Embedding嵌入层由单层神经网络组成,Embedding嵌入层的输入为One-hot编码,Embedding嵌入层的输出为指定维度的特征向量。
7.根据权利要求6所述基于多任务学习的竞价关键词效果预估模型构建方法,其特征在于,步骤5具体包括如下步骤:
S5.1、在单个任务下,利用泊松损失计算展现量、点击量和转化量的损失的公式为:
Figure FDA0003507790880000032
上式中,y和
Figure FDA0003507790880000033
分别代表该任务下样本的标签集合和预估值集合,
Figure FDA0003507790880000034
和yi分别代表第i个样本的预估值和标签值,N代表样本集合大小;
S5.2、利用均方根损失函数计算点击率和转化率的损失:
Figure FDA0003507790880000035
上式中,y和
Figure FDA0003507790880000036
分别代表样本标签集合和预估值集合,
Figure FDA0003507790880000037
和yi分别代表第i个样本的预估值和标签值,N代表样本集合大小。
CN202210151280.0A 2022-02-17 2022-02-17 一种基于多任务学习的竞价关键词效果预估模型构建方法 Pending CN114493724A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210151280.0A CN114493724A (zh) 2022-02-17 2022-02-17 一种基于多任务学习的竞价关键词效果预估模型构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210151280.0A CN114493724A (zh) 2022-02-17 2022-02-17 一种基于多任务学习的竞价关键词效果预估模型构建方法

Publications (1)

Publication Number Publication Date
CN114493724A true CN114493724A (zh) 2022-05-13

Family

ID=81482665

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210151280.0A Pending CN114493724A (zh) 2022-02-17 2022-02-17 一种基于多任务学习的竞价关键词效果预估模型构建方法

Country Status (1)

Country Link
CN (1) CN114493724A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116485477A (zh) * 2023-06-19 2023-07-25 北京大学 一种广告估值的处理方法、装置和电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116485477A (zh) * 2023-06-19 2023-07-25 北京大学 一种广告估值的处理方法、装置和电子设备
CN116485477B (zh) * 2023-06-19 2023-11-10 北京大学 一种广告估值的处理方法、装置和电子设备

Similar Documents

Publication Publication Date Title
CN102902691B (zh) 推荐方法及***
CN111222332B (zh) 一种结合注意力网络和用户情感的商品推荐方法
CN108335137A (zh) 排序方法及装置、电子设备、计算机可读介质
CN111325579A (zh) 一种广告点击率预测方法
CN111737578B (zh) 一种推荐方法及***
CN108648023A (zh) 一种融合历史均值与提升树的商家客流量预测方法
CN112700274A (zh) 一种基于用户偏好的广告点击率预估方法
CN111340537B (zh) 一种广告点击率预估模型的建立方法
CN110619540A (zh) 一种神经网络的点击流预估方法
Wang A survey of online advertising click-through rate prediction models
CN112288471A (zh) 一种基于用户历史行为序列的广告点击率预测方法
CN112612951B (zh) 一种面向收益提升的无偏学习排序方法
Sun et al. Optimal reserve prices in weighted GSP auctions
CN114861050A (zh) 一种基于神经网络的特征融合推荐方法及***
CN116541607A (zh) 基于商品检索数据分析的智能推荐方法
CN115829683A (zh) 一种基于逆奖赏学习优化的电力积分商品推荐方法及***
CN114493724A (zh) 一种基于多任务学习的竞价关键词效果预估模型构建方法
WO2002079901A2 (en) Customer preference system
Xu et al. Repurchase prediction based on ensemble learning
CN114565408B (zh) 一种广告投放的竞价预测方法及***
CN113254775A (zh) 一种基于客户浏览行为序列的***产品推荐方法
CN117522479B (zh) 互联网广告精准投放方法及***
Seo et al. A Unified Model for Bid Landscape Forecasting in the Mixed Auction Types of Real-Time Bidding
CN118132856B (zh) 一种基于大数据的智能分析方法及***
Kubišta A simulation based analysis of price elasticity of demand

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination