CN113793175B - 基于双线性ffm和多头注意力机制的广告点击率预估方法 - Google Patents

基于双线性ffm和多头注意力机制的广告点击率预估方法 Download PDF

Info

Publication number
CN113793175B
CN113793175B CN202111044748.8A CN202111044748A CN113793175B CN 113793175 B CN113793175 B CN 113793175B CN 202111044748 A CN202111044748 A CN 202111044748A CN 113793175 B CN113793175 B CN 113793175B
Authority
CN
China
Prior art keywords
data
feature
vector
ffm
attention mechanism
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111044748.8A
Other languages
English (en)
Other versions
CN113793175A (zh
Inventor
李卫军
廖永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202111044748.8A priority Critical patent/CN113793175B/zh
Publication of CN113793175A publication Critical patent/CN113793175A/zh
Application granted granted Critical
Publication of CN113793175B publication Critical patent/CN113793175B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种基于双线性FFM和多头注意力机制的广告点击率预估方法,包括:获取广告主物品广告点击数据集并对数据集进行预处理,得到类别型特征数据并将其转化为Embedding向量;通过双线性FFM结构和多头注意力机制结构将Embedding向量处理为低阶特征组合和高阶特征组合;将低阶特征组合和高阶特征组合进行拼接并进行计算,得到特征组合数据及对应的概率;将特征组合数据根据概率大小进行降序排序,取出排序靠前的广告作为广告点击率预估的推荐结果。本发明采用双线性FFM结构,实现了在FM模型的基础上加入少量参数达到了接近FFM的效果,同时,采用多头注意力机制结构计算得到组合特征向量之间的相关性,提升了广告点击率预估的效果和可解释性。

Description

基于双线性FFM和多头注意力机制的广告点击率预估方法
技术领域
本发明涉及数据挖掘技术领域,特别是涉及一种基于双线性FFM和多头注意力机制的广告点击率预估方法。
背景技术
随着电子商务的发展,互联网广告已成为一种新媒介广告进入人们的生活。通常,广告主在投放广告之前,希望了解网站上某广告位的已投放广告的点击率,并根据了解的点击率来制定预订广告位的决策。为给广告主提供预定广告位置决策的依据,可以对某广告位置上所投放的广告的点击率进行预估,以供广告主参考。现有技术进行广告点击率预估通常采用的方法是:用待预估广告的历史数据训练出预估模型,上述历史数据包括待预估广告的特征和实际点击率,将待预估广告的特征作为预估模型的输入,将预估模型的输出结果作为待预估广告的预估点击率。其中,模型进行点击率预估的精度,即预估的准确率依赖于模型针对输入数据特征的泛化能力,即对原始特征进行隐含特征提取的能力,其中隐含特征包含原始特征的交叉组合特征和原始特征的深层特征。
互联网广告点击率预估方法根据所使用基础算法不同,主要分为基于机器学习模型的预估方法和基于深度神经网络模型的预估方法。其中,基于机器学习模型的预估方法主要利用逻辑回归,矩阵分解,GBDT等方式对互联网广告数据进行点击率预估,随着网络用户不断地增加,无法应对互联网广告数据量大的问题。
目前基于深度学习的互联网广告点击率预估方法的研究刚刚起步,其中深度学习的点击率预估模型主要分为串行结构和并行结构。串行结构主要通过深度神经网络(下称DNN)提取训练数据的高阶特征,并行结构能够融合不同的模型分别进行训练数据的低阶和高阶特征的提取,从而实现互联网广告的点击率预估,该方法提高了在复杂场景下的点击率预估精度。例如,Guo等人于2017年5月在IJCAI发表了一篇题为“DeepFM:AFactorization-Machine based Neural Network for CTRPrediction”的文章(Guo H,Tang R,Ye Y,et al.DeepFM:a factorization-machine based neural network for CTRprediction[J].arXiv preprint arXiv:1703.04247,2017.),公开了一种宽线性模型与深度神经网络模型相结合的互联网广告点击率预估方法,首先利用编码模型将稀疏的原始特征编码为因子分解模型所需的数据格式,然后利用因子分解模型对原始特征进行两两交叉组合得到交叉特征向量,并对该特征向量进行线性组合学习,得到特征的相关性,然后利用映射层将高维稀疏的类别特征映射为低维稠密的向量,与其他原始连续特征拼接,输入到多层神经网络中,输出学习到的新特征,最后将两个模型的输出进行拼接,实现点击率预估,得到互联网广告点击率预估结果。该方法完成了数据相关性学习和泛化学习,实现了与原始数据有共性的特征和具有多样性的特征的提取,但是该方法深度模块仅使用两层全连接网络,模型泛化能力不足,无法有效获取原始数据的深层特征,导致点击率预估精度降低。例如,微博张俊林等人于2018年10月提出了DeepFFM模型,该模型在DeepFM模型的基础上使用了FFM代替了FM进行低阶特征的组合。
在DeepFM和DeepFFM两个模型中,低阶特征组合部分使用了FM或FFM。FM模型训练速度快,但是效果没有FFM好。而FFM在FM的基础上引入了域,使得FFM的常数量增长,这这参数里在大规模数据在线部署的情况下显然是不能接受的,因此FFM虽然效果好,但是由于参数量太大,难以在线上部署和实现。在高阶特征组合部分都使用了DNN,但DNN使用乘积的方式进行隐式提取特征组合的方式进行高阶特征组合,导致组合所得的高阶特征可解释性差,效果一般。
发明内容
本发明为了解决以上至少一种技术缺陷,提供一种基于双线性FFM和多头注意力机制的广告点击率预估方法,有效提升广告点击率预估的效果和可解释性。
为解决上述技术问题,本发明的技术方案如下:
基于双线性FFM和多头注意力机制的广告点击率预估方法,包括以下步骤:
S1:获取广告主物品广告点击数据集并对数据集中的数值型特征和类别型特征进行数据预处理。
S2:将类别型特征数据和数值型特征映射成Embedding向量;
S3:将Embedding向量分别输入双线性FFM结构和多头注意力机制结构中,分别进行低阶特征以及高阶特征的组合,得到低阶特征组合和高阶特征组合;
S4:将低阶特征组合和高阶特征组合进行拼接,根据Sigmoid函数进行计算,得到特征组合数据及对应的概率;
S5:将特征组合数据根据广告主编号进行分组,并根据概率大小进行降序排序,针对每个广告主编号的物品取出排序靠前的广告作为广告点击率预估的推荐结果。
上述方案中采用了双线性FFM模型,实现了在FM的基础上加入少量参数达到了接近FFM的效果,其参数量约是FFM的1/38;针对高阶特征组合部分,采用了多头注意力机制结构代替DNN显式地进行高阶特征组合,通过注意力机制计算得到组合特征向量之间的相关性,提升了本方法的效果和可解释性。
其中,在步骤S1中,以Criteo数据集作为基础,随机抽取其中部分数据作为广告主物品广告点击数据集,其中,包括用于训练双线性FFM结构和多头注意力机制结构的训练集和用于验证双线性FFM结构和多头注意力机制结构训练结果的验证集。
其中,在步骤S1中,数据集包括类别型特征数据和数值型特征,对数据集处理的过程具体为:
对类别型特征数据,针对其每个特征采用众数的方法进行缺失值填充;
对数值型特征,针对其每个特征采用上一条未缺失的数据来进行填充;并对数值型特征进行标准化处理,从而降低数据集的方差。
其中,在步骤S2中,首先将类别型特征数据在双线性FFM结构中转换成独热编码向量,再通过矩阵Wembedding进行映射成低秩稠密的向量并与数值型特征向量拼接组成Embedding向量,具体表示为:
oi=onehot(data)
ei=oi·Wembedding
其中,data表示类别型特征数据;onehot()表示独热编码处理;ei表示第i个Embedding向量;Wembedding表示Embedding矩阵。
其中,在所述步骤S3中,Embedding向量ei的低阶特征组合ylow具体表示为:
其中,w0是偏置项;xi、xj分别是第i个和第j个特征向量,wi是一维特征向量ei的权重系数;si、sj分别表示特征向量xi、xj的隐向量;W为隐向量si、sj共享参数矩阵,用于表示特征向量xi、xi交互的信息。
其中,在所述步骤S3中,共享参数矩阵W的构造方法有如下三种:
1)所有类别型特征数据共享一个参数矩阵,则参数量为k×k,其中k为嵌入向量的维度;
2)将类别型特征数据划分为多个域,每个域中的类别型特征数据共享一个参数矩阵,则参数量为p×k×k,其中p为域的数量;
3)将类别型特征数据划分为多个域,每两个域的类别型特征数据共享一个参数矩阵,则参数量为p×p×k×k。
其中,在步骤S3中,高阶特征组合的步骤具体包括以下步骤:
在多头注意力机制结构中,随机初始化三个满足高斯分布的矩阵,分别为查询权重矩阵Wquery、键查询矩阵Wkey、值权重矩阵Wvalue并将这三个矩阵作为特征交叉层中注意力子空间h中的转换向量将Embedding向量ei经过的注意力子空间h的转换向量将e1,e2,…,ei分别映射成向量组K=[k1,k2,…,ki]、V=[v1,v2,…,vi]以及向量qi
计算向量qi分别与向量组k1,k2,…,ki进行相似度计算,将相似度进行归一化后得到注意力权重
将注意力权重与向量组v1,v2,…,vi进行加权求和,得到Embedding向量ei在注意力子空间h下的组合特征向量
将组合特征向量进行拼接操作,得到嵌入特征向量ei在多头自注意力机制下的组合特征向量
在多头注意力机制结构中迭加多层特征交叉层,对组合特征向量进行迭加,得到高阶特征组合yhigh
其中,在步骤S3中,在多头注意力机制结构的每个特征交叉层,均设置有残差连接层,其用于保留低阶特征,使得高阶特征组合中保留有不同阶次的特征。
其中,步骤S4中,通过Sigmoid函数进行计算的表达式具体为:
Y=sig moid(ylow+yhigh)
其中,Y表示特征组合数据及对应的概率。
其中,步骤S5中,特征组合数据的输出采用广告召回表的形式输出,其以广告主编号进行分组,并根据概率大小进行降序排序,针对每个广告主编号的物品取出排序前K个广告作为广告点击率预估的推荐结果。
上述方案中,本方案采用了采用了双线性FFM模型,双线性FFM是在FM的基础上引入了共享参数矩阵来表征特征之间交互的信息,从而实现了在FM的基础上加入少量参数达到了接近FFM的效果;针对高阶特征组合部分,采用了多头注意力机制结构代替DNN显式地进行高阶特征组合,通过注意力机制计算得到组合特征向量之间的相关性,提升了本方法的效果和可解释性,为营销人员制定广告营销策略提供了理论依据和参考基础。
与现有技术相比,本发明技术方案的有益效果是:
本发明提出了基于双线性FFM和多头注意力机制的广告点击率预估方法,采用了双线性FFM模型,实现了在FM的基础上加入少量参数达到了接近FFM的效果;针对高阶特征组合部分,采用了多头注意力机制结构代替DNN显式地进行高阶特征组合,通过注意力机制计算得到组合特征向量之间的相关性,提升了本方法的效果和可解释性。
附图说明
图1为本发明所述方法的流程示意图;
图2为本发明一实施例中基于多头自注意力机制的特征组合过程示意图;
图3为本发明一实施例中多头注意力机制网络示意图;
图4为本发明一实施例中本方法所述模型总体结构图;
图5为本发明一实施例中广告召回与排序流程图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所述,基于双线性FFM和多头注意力机制的广告点击率预估方法,包括以下步骤:
S1:获取广告主物品广告点击数据集并对数据集中的数值型特征和类别型特征进行数据预处理;
S2:将类别型特征数据和数值型特征映射成Embedding向量;
S3:将Embedding向量分别输入双线性FFM结构和多头注意力机制结构中,分别进行低阶特征以及高阶特征的组合,得到低阶特征组合和高阶特征组合;
S4:将低阶特征组合和高阶特征组合进行拼接,根据Sigmoid函数进行计算,得到特征组合数据及对应的概率;
S5:将特征组合数据根据广告主编号进行分组,并根据概率大小进行降序排序,针对每个广告主编号的物品取出排序靠前的广告作为广告点击率预估的推荐结果。
在具体实施过程中,本方法采用了双线性FFM模型,实现了在FM的基础上加入少量参数达到了接近FFM的效果,其参数量约是FFM的1/38;针对高阶特征组合部分,采用了多头注意力机制结构代替DNN显式地进行高阶特征组合,通过注意力机制计算得到组合特征向量之间的相关性,提升了本方法的效果和可解释性。
更具体的,在步骤S1中,以Criteo数据集作为基础,随机抽取其中部分数据作为广告主物品广告点击数据集,其中,包括用于训练双线性FFM结构和多头注意力机制结构的训练集和用于验证双线性FFM结构和多头注意力机制结构训练结果的验证集。
在具体实施过程中,以Criteo数据集作为本发明的数据集,该数据是点击率预估领域的工业级数据集。它包括45840617条数据,所有的数据都具有39个特征,每条数据包含标签值Label。在39个特征中,有13个为数值型特征表示,取值范围为I1~I13,另外26个为类别型特征表示为C1~C26。其中,标签值Label值表示该条广告是否被点击,1表示点击,0表示没有被点击。因为经过了脱敏和加密处理,所有的数据均为数字,且不能明显看出每个特征所表示的具体含义。
更具体的,在步骤S1中,对数据集处理的过程具体为:
类别型特征数据,针对其每个特征采用众数的方法进行缺失值填充;
对数值型特征,针对其每个特征采用上一条未缺失的数据来进行填充;并对数值型特征进行标准化处理,从而降低数据集的方差。
在具体实施过程中,先随机抽取数据集中2000万条数据作为实验对象,按8:2的比例进行划分训练集和验证集,其中1600万条数据作为训练集参与训练,400万条数据进行验证本方法的表现。接着,对数值型特征I1~I13和类别型特征C1~C26给予不同的填充方法。针对数值型特征,采用上一条未缺失的数据进行填充。针对类别型型特征,对每一个特征采用众数的方法来填充,即找到每个特征的中出现次数最多的值,如果存在几个众数的情况,则选择第一个众数。
更具体的,在步骤S2中,首先将类别型特征数据在双线性FFM结构中转换成独热编码向量,再通过矩阵Wembedding进行映射成低秩稠密的向量并与数值型特征向量拼接组成Embedding向量,具体表示为:
oi=onehot(data)
ei=oi·Wembedding
其中,data表示类别型特征数据;onehot()表示独热编码处理;ei表示第i个Embedding向量;Wenbedding表示Embedding矩阵。
更具体的,在所述步骤S3中,Embedding向量ei的低阶特征组合ylow具体表示为:
其中,w0是偏置项;xi、xj分别是第i个和第j个特征向量,wi是一维特征向量ei的权重系数;si、sj分别表示特征向量xi、xj的隐向量;W为隐向量si、sj共享参数矩阵,用于表示特征向量xi、xj交互的信息。
在具体实施过程中,双线性FFM是在FM的基础上引入了共享参数矩阵,使原来的二权项权重由sisj变为siWsi,进而可以表征特征之间交互的信息,从而实现了在FM的基础上加入少量参数达到了接近FFM的效果。
更具体的,在所述步骤S3中,共享参数矩阵W的构造方法有如下三种:
1)所有类别型特征数据共享一个参数矩阵,则参数量为k×k,其中k为嵌入向量的维度;
2)将类别型特征数据划分为多个域,每个域中的类别型特征数据共享一个参数矩阵,则参数量为p×k×k,其中p为域的数量;
3)将类别型特征数据划分为多个域,每两个域的类别型特征数据共享一个参数矩阵,则参数量为p×p×k×k。
更具体的,在步骤S3中,如图2所示,高阶特征组合的步骤具体包括以下步骤:
在多头注意力机制结构中,随机初始化三个满足高斯分布的矩阵,分别为查询权重矩阵Wquery、键查询矩阵Wkey、值权重矩阵Wvalue并将这三个矩阵作为特征交叉层中注意力子空间h中的转换向量将Embedding向量ei经过的注意力子空间h的转换向量将e1,e2,…,ei分别映射成向量组K=[k1,k2,…,ki]、V=[v1,v2,…,vi]以及向量qi
计算向量qi分别与向量组k1,k2,…,ki进行相似度计算,将相似度进行归一化后得到注意力权重
将注意力权重与向量组v1,v2,…,vi进行加权求和,得到Embedding向量ei在注意力子空间h下的组合特征向量
将组合特征向量进行拼接操作,得到嵌入特征向量ei在多头自注意力机制下的组合特征向量
在多头注意力机制结构中迭加多层特征交叉层,对组合特征向量进行迭加,得到高阶特征组合yhigh
在具体实施过程中,上述进行高阶特征组合的实施中,其数学表达形式如下:
式中,为注意力子空间h下的归一化权重分数,φ(h)(x)为可选的相似度计算函数。
在具体实施过程中,φ(h)(x)可以选择Jaccard相关系数,余弦相似度,皮尔森相关系数,欧几里德距离等方法。本发明选择向量内积的方式进行相似度计算,表达式如下:
φ(h)(qi,ki)=<qi,ki>
接着,将注意力权重与向量组v1,v2,…,vi进行加权求和,得到向量ei在注意力子空间h下的组合特征向量具体表示为:
最后,将向量进行拼接操作,得到多头自注意力机制下的组合特征向量
上述过程只是在一层交互层中产生组合特征向量的过程,要想组合高阶特征,必须通过迭代多层交互层进行连接。具体如下:
如图3所示,⑥是特征组合层,其工作过程如上述多头自注意力机制下的组合特征向量的产生过程一样。通过迭代多层Interacting Layer,即可得到高阶组合特征。更具体的,在步骤S3中,在多头注意力机制结构的每个特征交叉层,均设置有残差连接层,如图3中⑤所示,表示残差连接,其作用是保留低阶特征,使得在组合高阶特征时能够得到不同阶次的特征。
进一步地,上述过程表示如下:
li+1σ(li+b)
其中表示经过残差连接和交互层进行组合的组合特征向量,li表示第i层所组合得到的高阶特征向量组。li+1表示第i+1层所组合得到的高阶特征向量组。
在具体实施过程中,如图4所示,低阶特征组合的wide部分采用所述的双线性FFM结构,高阶特征组合的deep部分采用所述的多头自注意力机制网络结构。假设FFM结构输出的低阶特征为ylow,多头自注意力机制网络结构输出的高阶特征为yhigh。将ylow和ylow进行拼接,输入到sigmoid函数里面,得到特征组合及其概率。所述过程的数学表示如下:
Y=sig moid(ylow+yhigh)
其中,Y表示特征组合数据及对应的概率。
更具体的,步骤S5中,如图5所示,特征组合数据的输出采用广告召回表的形式输出,其以广告主编号进行分组,并根据概率大小进行降序排序,针对每个广告主编号的物品取出排序前K个广告作为广告点击率预估的推荐结果。
在具体实施过程中,本方案采用了采用了双线性FFM模型,双线性FFM是在FM的基础上引入了共享参数矩阵来表征特征之间交互的信息,得到更多有效的二阶组合特征,使得模型的“记忆能力”得到增强,从而提高广告点击率预测的准确度,实现了在FM的基础上加入少量参数达到了接近FFM的效果;针对高阶特征组合部分,采用了多头注意力机制结构代替DNN显式地进行高阶特征组合,通过注意力机制计算得到组合特征向量之间的相关性,提升了本方法的效果和可解释性,为营销人员制定广告营销策略提供了理论依据和参考基础。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (7)

1.基于双线性FFM和多头注意力机制的广告点击率预估方法,其特征在于,包括以下步骤:
S1:获取广告主物品广告点击数据集并对数据集中的数值型特征和类别型特征进行数据预处理;
S2:将类别型特征数据和数值型特征映射成Embedding向量;
S3:将Embedding向量分别输入双线性FFM结构和多头注意力机制结构中,分别进行低阶特征以及高阶特征的组合,得到低阶特征组合和高阶特征组合;
S4:将低阶特征组合和高阶特征组合进行拼接,根据Sigmoid函数进行计算,得到特征组合数据及对应的概率;
S5:将特征组合数据根据广告主编号进行分组,并根据概率大小进行降序排序,针对每个广告主编号的物品取出排序靠前的广告作为广告点击率预估的推荐结果;
在所述步骤S3中,Embedding向量ei的低阶特征组合ylow具体表示为:
其中,w0是偏置项;xi、xj分别是第i个和第j个特征向量,wi是一维特征向量xi的权重系数;si、sj分别表示特征向量xi、xj的隐向量;W为隐向量si、sj共享参数矩阵,用于表示特征向量xi、xj交互的信息;
在所述步骤S3中,共享参数矩阵W的构造方法有如下三种:
1)所有类别型特征数据共享一个参数矩阵,则参数量为k×k,其中k为嵌入向量的维度;
2)将类别型特征数据划分为多个域,每个域中的类别型特征数据共享一个参数矩阵,则参数量为p×k×k,其中p为域的数量;
3)将类别型特征数据划分为多个域,每两个域的类别型特征数据共享一个参数矩阵,则参数量为p×p×k×k;
在步骤S3中,高阶特征组合的步骤具体包括以下步骤:
在多头注意力机制结构中,随机初始化三个满足高斯分布的矩阵,分别为查询权重矩阵Wquery、键查询矩阵Wkey、值权重矩阵Wvalue并将这三个矩阵作为特征交叉层中注意力子空间h中的转换向量将Embedding向量ei经过的注意力子空间h的转换向量将e1,e2,…,ei分别映射成向量组K=[k1,k2,…,ki]、V=[v1,v2,…,vi]以及向量qi
向量qi分别与向量组k1,k2,…,ki进行相似度计算,将相似度进行归一化后得到注意力权重
将注意力权重与向量组v1,v2,…,vi进行加权求和,得到Embedding向量ei在注意力子空间h下的组合特征向量
将组合特征向量进行拼接操作,得到嵌入特征向量ei在多头自注意力机制下的组合特征向量
在多头注意力机制结构中迭加多层特征交叉层,对组合特征向量进行迭加,得到高阶特征组合yhigh。
2.根据权利要求1所述的基于双线性FFM和多头注意力机制的广告点击率预估方法,其特征在于,在步骤S1中,以Criteo数据集作为基础,随机抽取其中部分数据作为广告主物品广告点击数据集,其中,包括用于训练双线性FFM结构和多头注意力机制结构的训练集和用于验证双线性FFM结构和多头注意力机制结构训练结果的验证集。
3.根据权利要求1所述的基于双线性FFM和多头注意力机制的广告点击率预估方法,其特征在于,在步骤S1中,数据集包括类别型特征数据和数值型特征,对数据集处理的过程具体为:
对类别型特征数据,针对其每个特征采用众数的方法进行缺失值填充;
对数值型特征,针对其每个特征采用上一条未缺失的数据来进行填充;并对数值型特征进行标准化处理,从而降低数据集的方差。
4.根据权利要求1所述的基于双线性FFM和多头注意力机制的广告点击率预估方法,其特征在于,在步骤S2中,首先将类别型特征数据在双线性FFM结构中转换成独热编码向量,再通过矩阵Wembedding进行映射成低秩稠密的向量并与数值型特征向量拼接组成Embedding向量,具体表示为:
oi=onehot(data)
ei=oi·Wembedding
其中,data表示类别型特征数据;onehot()表示独热编码处理;ei表示第i个Embedding向量;Wembedding表示Embedding矩阵。
5.根据权利要求1所述的基于双线性FFM和多头注意力机制的广告点击率预估方法,其特征在于,在步骤S3中,在多头注意力机制结构的每个特征交叉层,均设置有残差连接层,其用于保留低阶特征,使得高阶特征组合中保留有不同阶次的特征。
6.根据权利要求1所述的基于双线性FFM和多头注意力机制的广告点击率预估方法,其特征在于,步骤S4中,通过Sigmoid函数进行计算的表达式具体为:
Y=sigmoid(ylow+yhigh)
其中,Y表示特征组合数据及对应的概率。
7.根据权利要求6所述的基于双线性FFM和多头注意力机制的广告点击率预估方法,其特征在于,步骤S5中,特征组合数据的输出采用广告召回表的形式输出,其以广告主编号进行分组,并根据概率大小进行降序排序,针对每个广告主编号的物品取出排序前K个广告作为广告点击率预估的推荐结果。
CN202111044748.8A 2021-09-07 2021-09-07 基于双线性ffm和多头注意力机制的广告点击率预估方法 Active CN113793175B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111044748.8A CN113793175B (zh) 2021-09-07 2021-09-07 基于双线性ffm和多头注意力机制的广告点击率预估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111044748.8A CN113793175B (zh) 2021-09-07 2021-09-07 基于双线性ffm和多头注意力机制的广告点击率预估方法

Publications (2)

Publication Number Publication Date
CN113793175A CN113793175A (zh) 2021-12-14
CN113793175B true CN113793175B (zh) 2024-06-28

Family

ID=78879776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111044748.8A Active CN113793175B (zh) 2021-09-07 2021-09-07 基于双线性ffm和多头注意力机制的广告点击率预估方法

Country Status (1)

Country Link
CN (1) CN113793175B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112365297A (zh) * 2020-12-04 2021-02-12 东华理工大学 一种广告点击率预估方法
CN113255844A (zh) * 2021-07-06 2021-08-13 中国传媒大学 基于图卷积神经网络交互的推荐方法及***

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10089576B2 (en) * 2015-07-28 2018-10-02 Microsoft Technology Licensing, Llc Representation learning using multi-task deep neural networks
CN111325579A (zh) * 2020-02-25 2020-06-23 华南师范大学 一种广告点击率预测方法
CN112381581B (zh) * 2020-11-17 2022-07-08 东华理工大学 一种基于改进Transformer的广告点击率预估方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112365297A (zh) * 2020-12-04 2021-02-12 东华理工大学 一种广告点击率预估方法
CN113255844A (zh) * 2021-07-06 2021-08-13 中国传媒大学 基于图卷积神经网络交互的推荐方法及***

Also Published As

Publication number Publication date
CN113793175A (zh) 2021-12-14

Similar Documents

Publication Publication Date Title
Li et al. Fi-gnn: Modeling feature interactions via graph neural networks for ctr prediction
Lyu et al. Deep match to rank model for personalized click-through rate prediction
CN110083770B (zh) 一种基于特征层面更深的自注意力网络的序列推荐方法
CN116204729B (zh) 一种基于超图神经网络的跨领域群组智能推荐方法
CN108205537A (zh) 一种视频推荐方法及***
Wang et al. A new approach for advertising CTR prediction based on deep neural network via attention mechanism
CN116228368A (zh) 一种基于深度多行为网络的广告点击率预测方法
CN115495654A (zh) 基于子空间投影神经网络的点击率预估方法和装置
CN113505307B (zh) 一种基于弱监督增强的社交网络用户地域识别方法
Huang et al. Broad recommender system: An efficient nonlinear collaborative filtering approach
CN113793175B (zh) 基于双线性ffm和多头注意力机制的广告点击率预估方法
CN116680456A (zh) 基于图神经网络会话推荐***的用户偏好预测方法
CN111339734A (zh) 一种基于文本生成图像的方法
Wen et al. Extended factorization machines for sequential recommendation
CN114996566A (zh) 一种面向工业互联网平台的智能推荐***及方法
Ding et al. A novel two-stage learning pipeline for deep neural networks
CN112561599A (zh) 一种融合域特征交互的基于注意力网络学习的点击率预测方法
CN114358813A (zh) 一种基于场矩阵因子分解机改进的广告投放方法及***
CN113010774A (zh) 一种基于动态深度注意力模型的点击率预测方法
Wen et al. Pairwise multi-layer nets for learning distributed representation of multi-field categorical data
CN116578769B (zh) 一种基于行为模式转换的多任务学习推荐方法
CN115618035B (zh) 一种基于图片曝光转化率预测模型的图片推荐方法
Shi et al. Recommender system for telecom packages based on the deep & cross network
CN113469450B (zh) 一种数据分类方法、装置、计算机设备及存储介质
Lian et al. FINET: Fine-grained feature interaction network for click-through rate prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant