CN112053188B - 一种基于混合深度神经网络模型的互联网广告推荐方法 - Google Patents
一种基于混合深度神经网络模型的互联网广告推荐方法 Download PDFInfo
- Publication number
- CN112053188B CN112053188B CN202010862465.3A CN202010862465A CN112053188B CN 112053188 B CN112053188 B CN 112053188B CN 202010862465 A CN202010862465 A CN 202010862465A CN 112053188 B CN112053188 B CN 112053188B
- Authority
- CN
- China
- Prior art keywords
- model
- user
- neural network
- advertisement
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003062 neural network model Methods 0.000 title claims abstract description 23
- 238000000034 method Methods 0.000 title claims abstract description 19
- 230000006399 behavior Effects 0.000 claims abstract description 16
- 230000006870 function Effects 0.000 claims description 18
- 238000013528 artificial neural network Methods 0.000 claims description 15
- 230000003993 interaction Effects 0.000 claims description 8
- 230000007613 environmental effect Effects 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 claims description 2
- 238000012546 transfer Methods 0.000 claims description 2
- 230000007704 transition Effects 0.000 claims description 2
- 238000012549 training Methods 0.000 abstract description 6
- 238000013135 deep learning Methods 0.000 abstract description 3
- 230000008685 targeting Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000013215 result calculation Methods 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
- G06Q30/0271—Personalized advertisement
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Accounting & Taxation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于混合深度神经网络模型的互联网广告推荐方法。本发明从基于深度学习用于广告点击率预估的模型出发,在DeepFM网络提供特征自动组合的基础上,利用RNN模型从用户历史点击行为记录中精准建模用户的兴趣,提高了广告点击率的预估性能;模型不需要超大规模的广告ID作为输入,降低了对现有广告***的数据要求,也降低了模型的过拟合风险。本发明在应用到对用户兴趣刻画要求严格的互联网广告投放***中,能提升广告的点击率,同时不影响模型的更新训练速度。
Description
技术领域
本发明属于面向互联网广告领域,涉及一种基于混合深度神经网络模型的互联网广告推荐方法,更具体地说是一种解决现有方法无法对用户随时间变化的兴趣进行充分挖掘的互联网广告推荐方法。
背景技术
在推荐***、互联网广告投放等个性化服务中,预估点击率具有非常重要的意义。预估点击率的任务就是计算用户在特定的上下文环境下会点击物品的概率。这个概率值表达了用户对特定物品(如一个视频,一个商品广告等)的感兴趣程度。根据预估的点击概率,不同应用可采用不同的策略,如新闻推送***可直接向用户推送预估点击率高的新闻,互联网广告***可向用户投放点击收益最高的广告。无论哪种情况,关键是要尽可能准确预估点击率。
在互联网广告中,用户从不主动表达他们的兴趣,因此设计模型捕捉用户的兴趣对提高互联网广告预估点击率准确性具有至关重要的作用。但目前大多数基于深度学习的模型关注于捕获来自不同领域的特性之间的交互,而较少关注用户兴趣对于广告推荐的影响力。用户兴趣是会随着时间的变化而变化,目前并没有人提出相关技术侧重考虑时序对用户兴趣影响,进而影响广告推荐方法。
因此,针对目前深度学习在互联网广告点击率预估中存在的问题,有必要发明一种高效建模用户随时间变化的行为序列,且能够更加精准捕捉用户点击兴趣的深度神经网络模型。
发明内容
本发明的目的在于解决现有互联网广告推荐方法无法对用户随时间变化的兴趣进行充分挖掘的问题,提出了一种基于混合深度神经网络模型的互联网广告推荐方法。
本发明采用的技术方案步骤如下:
一种基于混合深度神经网络模型的互联网广告推荐方法,在DeepFM深度神经网络进行特征自动组合的基础上,利用RNN模型从用户的随时间变化的历史点击行为记录中建模用户的点击兴趣,以提升互联网广告点击率预估性能。该模型采用以下步骤实现:
步骤(1)、获取互联网广告***中用户属性、用户历史点击行为记录、广告属性和上下文环境特征,将其转换为统一的数据格式。
步骤(2)、从广告投放点击记录数据库中抽取全量数据集,分别从用户、广告维度拼接相应的属性构成训练集。
步骤(3)、用户特征、广告特征和上下文环境特征输入到DeepFM中进行特征的自动组合,用户历史点击行为记录输入到RNN中用于捕捉用户的点击兴趣。
步骤(4)、将DeepFM的输出和RNN的输出相加,输入到sigmoid函数中,得到预测结果y,和真实结果计算误差进行反向传播,更新模型参数直至模型收敛。
步骤(5)、若预测结果y大于事先设定阈值,则该预测结果对应的广告为用户感兴趣广告。
一种基于混合深度神经网络模型的互联网广告推荐设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于混合深度神经网络模型的互联网广告推荐程序,所述基于混合深度神经网络模型的互联网广告推荐程序被所述处理器执行时实现上述基于混合深度神经网络模型的互联网广告推荐方法的步骤。
一种存储介质,存储有基于混合深度神经网络模型的互联网广告推荐程序,所述基于混合深度神经网络模型的互联网广告推荐程序被处理器执行时实现上述基于混合深度神经网络模型的互联网广告推荐方法的步骤。
本发明具有的有益效果是:
1、本发明提出一种新的混合深度神经网络模型,在DeepFM模型基础上融合RNN模型,利用RNN模型从带有时间维度的用户点击记录中提取用户随时间变化的兴趣,弥补的DeepFM无法建模时间序列的缺点。对用户兴趣的精准刻画将大幅提升互联网广告的推荐精准度。
2、本发明不需要输入超大规模的物品ID,这降低了对现有广告***的数据要求,也避免了模型训练容易过拟合的风险。这非常有利于互联网广告推荐中的模型训练、模型更新、模型上线。
附图说明
图1为本发明方法混合深度神经网络模型架构图。
具体实施方式
下面结合附图1,对本发明的具体实施方案作进一步详细描述。其中:
步骤(1)、获取互联网广告***中用户属性、用户历史点击行为记录、广告属性和上下文环境特征;
用户属性包括性别、年龄等。
用户历史点击行为记录是用户过去一段时间的点击情况,比如一个用户在此时刻之前一共有三个记录,第一次未点击,第二次点击,第三次点击,则用户历史点击行为记录L取值为[0,1,1]。
广告属性包括广告主所属行业、广告定向年龄等。
上下文环境包括用户本次请求的网络情况(WIFI、4G)、用户的设备(PC、Phone、iPad)。
步骤(2)、预处理用户属性、用户历史点击行为记录、广告属性和上下文环境特征。分别对用户属性、广告属性、上下文环境特征进行序号编码;对用户历史点击行为记录进行截断,使用户历史点击行为记录长度不超过指定值。
步骤(3)、构建DeepFM模型
3.1将用户属性、广告属性、上下文环境特征输入到DeepFM模块中,进行高阶特征的自动组合。具体的计算过程如下:
DeepFM能够同时进行低阶特征交互和高阶特征交互。DeepFM有两部分组成,FM进行一阶和二阶特征建模,全连接网络进行高阶特征建模。
3.2计算FM的输出;
其中w为d维向量,d是所有特征的个数,Vi是第i个特征的表示向量。<w,x>表示向量w和特征x做内积,用于计算一阶特征的重要性,<Vi,Vj>表示第i个特征的表示向量和第j个特征的表示向量做内积,用于计算特征的相互作用程度。
3.3计算全连接网络的输出;
前馈神经网络以特征的嵌入向量作为输入,通过多层的神经网络结构学习多阶特征交互,他的工作方法如下:
a(0)=[e1,e2,...,ed],
a(l)=σ(W(l-1)a(l-1)+b(l-1))
其中ei是第i个特征的嵌入向量,d是所有特征的个数。l为神经网络当前层深度,σ为激活函数,W(l)是第l层的权重矩阵,b(l)是第l层的偏置项。最后前馈神经网络的输出为:
yMLP=σ(Whah-1+bh)
其中h为神经网络的最大深度。
3.4计算DeepFM的输出。
yDeepFM=σ(yFM+yMLP)
其中yFM为FM的输出,yMLP为前馈神经网络的输出。
步骤4:构建RNN模型
将用户历史点击记录输入到RNN中,进行用户点击兴趣的建模。
RNN组件是一个标准的循环神经网络,它有能力处理任意长度的序列。RNN递归的为序列中的每一个输入元素的隐状态应用转换函数,被我们用来学习用户点击行为记录。
RNN通过应用转换函数为每个输入元素得到一个隐状态,在t时刻的隐状态ht以当前输入元素xt和前一时刻t-1的隐状态ht-1为输入,应用转换函数f计算得到:
ht=f(xt,ht-1)
为了得到非线性组合,激活函数f通常为:
ht=φ(Wxt+Uht-1)
其中W是输入到隐层的映射矩阵,U为状态到状态的转移矩阵,φ为非线性激活函数双曲正切函数或者logisticsigmoid函数。
通常,标准的循环神经网络使用最后一个隐状态来表示整个序列的信息,它可以被输入到下游任务中,我们将它应用到CTR预测中。计算公式如下:
yRNN=sigmoid(Vhlast+b)
其中hlast为序列最后一个元素对应的隐状态,V为一个向量,b为偏置项,yRNN即为整个RNN组件的输出。
步骤5:将DeepFM的输出和RNN的输出相加,输入到sigmoid函数中,得到预测结果,和真实结果计算误差进行反向传播,更新模型参数直至模型收敛。
y`=sigmoid(yDeepFM+yRNN)
步骤6:在互联网广告***中,给定一个用户,一个广告和当时的上下文环境特征,利用模型预测用户会点击这个广告的概率,当概率大于***指定的阈值,***向用户推送该广告。
实施例采用以下两个数据集对比了本发明模型和其他模型的效果:
1)图灵联邦数据集。图灵联邦提供了三天的用户视频点击行为数据,预测第四天用户在相应的上下文环境下会点击视频的概率。给定一个用户基本属性,一个视频基本属性和环境上下文信息,预测用户会点击这个视频的概率。
2)盘石广告数据集。浙江盘石信息技术股份有限公司是中国领先的专注于广告投放的企业。收集了一个月的广告点击记录,将前25天用于训练,后5天用于预测。在该数据集中,一条训练样本包含广告的特征(广告定向性别、广告定向行业、广告定向年龄),和媒介网站上广告位的特征(网站访问量、网站所属行业、网站用户性别比例)。
实验中使用AUC和LogLoss来评价模型的性能。
AUC:AUC是ROC曲线下的面积,被广泛应用于CTR领域性能评价。AUC衡量一个模型能够在多大程度上将用户喜欢的商品与不喜欢的商品区分出来,如果模型预测用户喜欢的商品和不喜欢的商品的AUC差别很大,则模型性能越好。
LogLoss:和AUC不同,LogLoss衡量每一个样本的预测值和真实标签的偏离程度,越小越好。
表1
实验结果表明,本发明提出的一种新的混合深度神经网络模型比其他先进模型的推荐精度提升4.3%。
Claims (3)
1.一种基于混合深度神经网络模型的互联网广告推荐方法,其特征在于该方法包括以下步骤:
步骤(1)、获取互联网广告***中用户属性、用户历史点击行为记录、广告属性和上下文环境特征;
步骤(2)、对用户属性、用户历史点击行为记录、广告属性和上下文环境特征预处理,具体是分别对用户属性、广告属性、上下文环境特征进行序号编码;对用户历史点击行为记录进行截断,使用户历史点击行为记录长度不超过指定值;
步骤(3)、构建DeepFM模型
用户属性、广告属性、上下文环境特征作为DeepFM模型的输入,由于DeepFM能够同时进行低阶特征交互和高阶特征交互,DeepFM由FM、全连接网络两部分构成:FM进行一阶和二阶特征建模,全连接网络进行高阶特征建模;
FM的输出:
其中w为d维向量,d是所有特征的个数,Vi是第i个特征的表示向量,<w,x>表示向量w和特征x做内积,用于计算一阶特征的重要性,<Vi,Vj>表示第i个特征的表示向量和第j个特征的表示向量做内积,用于计算特征的相互作用程度;
全连接网络的输出:
前馈神经网络以特征的嵌入向量作为输入,通过多层的神经网络结构学习多阶特征交互:
a(0)=[e1,e2,...,ed],
a(l)=σ(W(l-1)a(l-1)+b(l-1))
其中ei是第i个特征的嵌入向量,d是所有特征的个数,l为神经网络当前层深度,σ为激活函数,W(l)是第l层的权重矩阵,b(l)是第l层的偏置项;
前馈神经网络的输出为:
yMLP=σ(Whah-1+bh)
其中h为神经网络的最大深度;
DeepFM的输出:
yDeepFM=σ(yFM+yMLP)
其中yFM为FM的输出,yMLP为前馈神经网络的输出;
步骤(4)、构建RNN模型
用户历史点击记录作为RNN模型的输入,yRNN作为RNN模型的输出;
yRNN=sigmoid(Vhlast+b)
其中hlast为用户历史点击记录序列最后一个元素对应的隐状态,V为一个向量,b为偏置项;
RNN通过应用转换函数为每个输入元素得到一个隐状态,在t时刻的隐状态ht以当前输入元素xt和前一时刻t-1的隐状态ht-1为输入,应用转换函数f计算得到:
ht=f(xt,ht-1)
为了得到非线性组合,激活函数f通常为:
ht=φ(Wxt+Uht-1)
其中W是输入到隐层的映射矩阵,U为状态到状态的转移矩阵,φ为非线性激活函数双曲正切函数或者logisticsigmoid函数;
步骤(5)、将DeepFM模型的输出和RNN模型的输出相加,输入到sigmoid函数中,得到预测结果y;通过预测结果y和真实结果计算误差进行反向传播,更新模型参数直至模型收敛;
y`=sigmoid(yDeepFM+yRNN)
步骤(6)、若预测结果y大于事先设定阈值,则该预测结果对应的广告为用户感兴趣广告。
2.一种基于混合深度神经网络模型的互联网广告推荐设备,其特征在于包括所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于混合深度神经网络模型的互联网广告推荐程序,所述基于混合深度神经网络模型的互联网广告推荐程序被所述处理器执行时实现如权利要求1中所述的基于混合深度神经网络模型的互联网广告推荐方法的步骤。
3.一种存储介质,其特征在于,所述存储介质上存储有基于混合深度神经网络模型的互联网广告推荐程序,所述基于混合深度神经网络模型的互联网广告推荐程序被处理器执行时实现如权利要求1中所述的基于混合深度神经网络模型的互联网广告推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010862465.3A CN112053188B (zh) | 2020-08-25 | 2020-08-25 | 一种基于混合深度神经网络模型的互联网广告推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010862465.3A CN112053188B (zh) | 2020-08-25 | 2020-08-25 | 一种基于混合深度神经网络模型的互联网广告推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112053188A CN112053188A (zh) | 2020-12-08 |
CN112053188B true CN112053188B (zh) | 2024-01-16 |
Family
ID=73600794
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010862465.3A Active CN112053188B (zh) | 2020-08-25 | 2020-08-25 | 一种基于混合深度神经网络模型的互联网广告推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112053188B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112529621A (zh) * | 2020-12-10 | 2021-03-19 | 中山大学 | 一种基于异构图嵌入技术的广告受众基础属性预估方法 |
CN113204655B (zh) * | 2021-07-02 | 2021-11-23 | 北京搜狐新媒体信息技术有限公司 | 多媒体信息的推荐方法、相关装置及计算机存储介质 |
CN113570416B (zh) * | 2021-07-30 | 2022-04-01 | 北京达佳互联信息技术有限公司 | 投放内容确定方法、装置、电子设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109960759A (zh) * | 2019-03-22 | 2019-07-02 | 中山大学 | 基于深度神经网络的推荐***点击率预测方法 |
CN110457589A (zh) * | 2019-08-19 | 2019-11-15 | 上海新共赢信息科技有限公司 | 一种车辆推荐方法、装置、设备及存储介质 |
-
2020
- 2020-08-25 CN CN202010862465.3A patent/CN112053188B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109960759A (zh) * | 2019-03-22 | 2019-07-02 | 中山大学 | 基于深度神经网络的推荐***点击率预测方法 |
CN110457589A (zh) * | 2019-08-19 | 2019-11-15 | 上海新共赢信息科技有限公司 | 一种车辆推荐方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112053188A (zh) | 2020-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112053188B (zh) | 一种基于混合深度神经网络模型的互联网广告推荐方法 | |
CN111339415B (zh) | 一种基于多交互式注意力网络的点击率预测方法与装置 | |
US10783450B2 (en) | Learning user preferences using sequential user behavior data to predict user behavior and provide recommendations | |
CN111209386B (zh) | 一种基于深度学习的个性化文本推荐方法 | |
US8190537B1 (en) | Feature selection for large scale models | |
US8775416B2 (en) | Adapting a context-independent relevance function for identifying relevant search results | |
US8543445B2 (en) | System and method for direct mailing insurance solicitations utilizing hierarchical bayesian inference for prospect selection | |
US20220012614A1 (en) | Artificial intelligence and/or machine learning models trained to predict user actions based on an embedding of network locations | |
CA2941700A1 (en) | Clickstream purchase prediction using hidden markov models | |
CN112765480B (zh) | 一种信息推送方法、装置及计算机可读存储介质 | |
US20180276691A1 (en) | Metric Forecasting Employing a Similarity Determination in a Digital Medium Environment | |
CN111382361A (zh) | 信息推送方法、装置、存储介质和计算机设备 | |
US11080376B2 (en) | Anonymous cross-device, cross-channel, and cross-venue user identification using adaptive deep learning | |
CN111667024B (zh) | 内容推送方法、装置、计算机设备和存储介质 | |
CN115018552A (zh) | 产品点击率确定方法 | |
US20220358366A1 (en) | Generation and implementation of dedicated feature-based techniques to optimize inference performance in neural networks | |
CN113688306A (zh) | 一种基于强化学习的推荐策略生成方法及装置 | |
CN114595323B (zh) | 画像构建、推荐、模型训练方法、装置、设备及存储介质 | |
CN116578400A (zh) | 多任务数据处理方法和装置 | |
CN114298734A (zh) | 一种基于多任务学习的互联网在线广告精准投放方法 | |
Lee et al. | Multi Task Learning: A Survey and Future Directions | |
CN117112781A (zh) | 文本信息处理模型训练方法、装置、以及存储介质 | |
CN111178987B (zh) | 训练用户行为预测模型的方法和装置 | |
CN114841765A (zh) | 一种基于元路径邻域目标泛化的序列推荐方法 | |
CN112446738A (zh) | 广告数据处理方法、装置、介质以及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |