CN103268344A - 一种无位置偏见影响的广告与页面匹配的方法 - Google Patents

一种无位置偏见影响的广告与页面匹配的方法 Download PDF

Info

Publication number
CN103268344A
CN103268344A CN2013101977315A CN201310197731A CN103268344A CN 103268344 A CN103268344 A CN 103268344A CN 2013101977315 A CN2013101977315 A CN 2013101977315A CN 201310197731 A CN201310197731 A CN 201310197731A CN 103268344 A CN103268344 A CN 103268344A
Authority
CN
China
Prior art keywords
advertisement
page
advertisements
clicking rate
under
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013101977315A
Other languages
English (en)
Other versions
CN103268344B (zh
Inventor
贺樑
霍晓骏
向平
倪敏杰
徐晓枫
罗念
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Normal University
Original Assignee
East China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Normal University filed Critical East China Normal University
Priority to CN201310197731.5A priority Critical patent/CN103268344B/zh
Publication of CN103268344A publication Critical patent/CN103268344A/zh
Application granted granted Critical
Publication of CN103268344B publication Critical patent/CN103268344B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种无位置偏见影响的广告与页面匹配的方法,包括步骤:a.确定每个搜索页面中所有广告的展示位置、展示次数和点击次数;b.利用统计方法,能够排除广告所在页面位置对广告点击所造成的影响,计算每个页面下刊登的每个广告的固有点击率;c.根据页面与广告的固有点击率,计算页面之间关于广告的相似度关系;d.对于一个待推荐的目标页面,根据相似的其他页面,为其匹配合适的广告。本发明是根据广告展示位置来调整特定页面下特定广告的点击率;其优点是:更贴近地把握页面和广告的相关程度,更准确地为页面匹配了广告,更高效便捷。

Description

一种无位置偏见影响的广告与页面匹配的方法
技术领域
本发明涉及用于为搜索引擎页面匹配广告的领域,具体地说是一种基于协同过滤邻域模型的广告匹配选取方法。
背景技术
在用户浏览网页时,特别是搜索引擎的检索页面,页面的侧边栏会从上到下展示若干条广告,这些广告就是通过广告匹配***,计算与该页面的匹配程度,将匹配程度高的广告展示在页面侧边栏中靠上的位置。
在各种广告匹配***中,对特定页面与特定广告之间的相关程度是是否为该页面匹配该广告的一个重要指标。该指标可以借由特定页面下特定广告的点击率加以表示。
传统的点击率计算方法,通过日志找到要计算的广告在要计算的页面下的展示次数、被点击次数,只是简单地相除。忽视了广告展示位置对广告点击次数的影响。在早期的广告匹配***中,根据广告商的竞价来决定展示的位置,出价高的广告会被展示在靠上的广告位置中,而不考虑这个广告与页面是否相关。根据研究显示,展示在位置靠上的广告更容易被点击,尽管这个广告和刊登它的页面的相关程度没有位置靠下的广告和该页面的相关程度高,这是用户的浏览习惯所导致的。这样一来,即使不相关的广告也拥有大量的点击率,即被视为和该页面相关,这是不合逻辑的。因此,简单地使用传统的点击率计算方法,求得的点击率是带有位置偏见的,这样的点击率不能很好地表达特定广告与特定页面的相关程度。
发明内容
本发明的目的是针对现有技术中忽略位置偏见的技术缺陷而提供的一种排除位置偏见的广告匹配方法,该方法可根据特定位置下所有广告的点击情况,调整个别广告的点击率,并且根据相似页面的广告刊登情况,调整目标页面的广告匹配。
实现本发明目的的具体技术方案是:
一种无位置偏见影响的广告与页面匹配的方法,该方法包括如下步骤:
a)确定每个搜索页面中所有广告的展示位置、展示次数和点击次数;具体包括:
Ⅰ)确定页面总数M、广告总数N、页面能展示广告的位置总数P;
Ⅱ)计算每个页面下每个广告在每个位置的展示次数、点击次数;计算每个页面下每个位置的所有广告的展示总数、点击总数;计算每个广告在每个位置的展示总数、点击总数;计算每个位置下所有广告的展示总数、点击总数以及每个广告的展示总数、点击总数;根据得到的数据,将对应的点击次数除以展示次数,得到每个页面下每个广告在每个位置的点击率、每个页面下每个位置的所有广告的点击率、每个广告在每个位置的点击率、每个位置下所有广告的点击率以及每个广告的点击率;
b)利用统计方法,排除广告所在页面位置对广告点击所造成的影响,计算每个页面下刊登的每个广告的固有点击率;具体包括:
Ⅰ)根据全概率公式和贝叶斯公式,计算出在某个页面下某个广告被点击的条件概率,即某个广告在某个页面下的无偏见点击率,排除广告位置对广告点击率的影响;
c)根据页面与广告的固有点击率,计算页面之间关于广告的相似度关系;具体包括:
Ⅰ)将一个页面表示成一个N维向量,每一个维度上的元素对应这个页面下相应广告的无偏见点击率;总计有M个页面向量;
Ⅱ)通过调整余弦相似度计算总计M个页面向量两两之间的相似度;
d)对于一个待推荐的目标页面,根据相似的其他页面,为其匹配合适的广告;具体包括:
Ⅰ)对于一个待匹配P个广告的目标页面q,根据步骤c)中的相似度,找到与页面q最相似的K个页面,称为相似邻居;
Ⅱ)从相似邻居中,找到在相似邻居中展示、但在目标页面q下没有展示过的广告集合A;
Ⅲ)对于属于集合A中的每个广告,根据相似邻居中对应广告的无偏见点击率以及相似邻居与页面q的相似度进行加权求和,计算得到这个广告在目标页面q下预测的无偏见点击率;
Ⅳ)将集合A中所有广告按照预测的无偏见点击率从大到小排序,选择最大的P个广告推荐给目标页面q用作广告展示。 
与背景技术相比,本发明有以下优点: 
本发明在计算页面与广告的相关程度时,考虑到基础数据由于受到位置偏见的作用而影响了数据的真实性,通过概率统计与计算排除了位置偏见对数据的影响,使得广告的点击率能够真实反映该广告与页面的相关程度,更加合理地还原了数据中所蕴含的信息。
本发明在为页面匹配广告时,参考了协同推荐的思想,利用相似页面进行广告的选择和相关程度的预估计,更加准确的为页面匹配广告。
本发明不需要额外的数据支持,不需要进行文本的分析,向量的计算简化了整个计算流程,提高了***的效率。
附图说明
图1为本发明流程示意图;
图2为本发明实施例中的页面示意图。
具体实施方式
参阅图1,本发明应用于广告匹配***中,首先确定广告位置对广告的点击产生的影响,计算排除该影响后特定广告在特定页面下的无偏见点击率,然后根据页面刊登广告的情况找到相似的邻居页面,最后结合相似页面,为目标页面匹配合适的广告,其具体步骤如下:
第一步:从搜索引擎日志中获得各个广告在各个页面的各个位置上的点击、展示信息、位置总数P,计算得到带有位置偏见的点击率,包括页面                                                下广告
Figure 990282DEST_PATH_IMAGE002
在位置
Figure 2013101977315100002DEST_PATH_IMAGE003
的点击率
Figure 380681DEST_PATH_IMAGE004
、页面下位置
Figure 712623DEST_PATH_IMAGE003
的所有广告的点击率
Figure 2013101977315100002DEST_PATH_IMAGE005
、广告
Figure 663261DEST_PATH_IMAGE002
在位置
Figure 358816DEST_PATH_IMAGE003
的点击率
Figure 711300DEST_PATH_IMAGE006
、位置
Figure 653848DEST_PATH_IMAGE003
下所有广告的点击率
Figure 2013101977315100002DEST_PATH_IMAGE007
以及广告
Figure 154099DEST_PATH_IMAGE002
的点击率
Figure 574716DEST_PATH_IMAGE008
第二步:通过如下公式计算在页面
Figure 358870DEST_PATH_IMAGE001
下广告
Figure 472320DEST_PATH_IMAGE002
被点击的条件概率,即广告
Figure 397551DEST_PATH_IMAGE002
在页面
Figure 621859DEST_PATH_IMAGE001
下的无偏见点击率,
用无偏见点击率构建页面向量。
第三步:利用第二步得到的页面向量,a.利用向量计算两两页面之间的调整余弦相似度,b.存储这些向量,构建无偏见点击率数据库;
第四步:根据相似度构建页面之间的关系数据库;
    第五步:等待用户提交一个查询页面
Figure 745672DEST_PATH_IMAGE010
第六步:从第四步中得到的关系数据库中找出与页面
Figure 30023DEST_PATH_IMAGE010
相似度最大的K个页面,y=1~K,以及其与页面
Figure 317916DEST_PATH_IMAGE010
的相似度
Figure 345915DEST_PATH_IMAGE012
第七步:从无偏见数据库中找出在K个相似页面中刊登过,而在页面
Figure 527498DEST_PATH_IMAGE010
中没有刊登过的广告集合A,对于集合A中所有广告,通过如下公式计算在页面
Figure 46333DEST_PATH_IMAGE010
下广告
Figure 946156DEST_PATH_IMAGE013
被点击的条件概率,即广告在页面
Figure 876252DEST_PATH_IMAGE010
下的无偏见点击率:
Figure 236826DEST_PATH_IMAGE014
然后选择无偏见点击率最大的P个广告匹配页面
Figure 623945DEST_PATH_IMAGE010
第八步:判断是否完成了所有页面的匹配广告工作,“是”转入结束,“否”转入第五步。
通过以下实施例来更好地理解本发明。
实施例
假设搜索引擎日志中记载了三个页面及其刊登广告的点击记录,三个页面分别为:出现了三次的搜索词为“天气”的页面;出现了两次的搜索词为“下雨”的页面;出现了一次的搜索词为“春游”的页面。各个页面下每种广告被点击的情况如图2所示,其中带下划线的广告表示该广告在这个页面中被点击,不带下滑线的广告表示该广告在这个页面中没有被点击。
下面要对页面“下雨”进行广告匹配。
第一步:从搜索引擎日志中获得各个广告在各个页面的各个位置上的点击、展示信息、位置总数,计算得到带有位置偏见的点击率,包括每个页面(“天气”、“下雨”、“春游”)下每个广告(“天气研究所”、“天气预报订购”、“雨伞”、“湿度计推销”、“气温计推销”、“烧烤架出租”、“帐篷出租”)在每个位置(“位置一”、“位置二”、“位置三”)的点击率 、每个页面(“天气”、“下雨”、“春游”)下每个位置(“位置一”、“位置二”、“位置三”)的所有广告的点击率 、每个广告(“天气研究所”、“天气预报订购”、“雨伞”、“湿度计推销”、“气温计推销”、“烧烤架出租”、“帐篷出租”)在每个位置(“位置一”、“位置二”、“位置三”)的点击率、每个位置(“位置一”、“位置二”、“位置三”)下所有广告的点击率以及每个广告(“天气研究所”、“天气预报订购”、“雨伞”、“湿度计推销”、“气温计推销”、“烧烤架出租”、“帐篷出租”)的点击率 ;
第二步:通过公式计算无偏见点击率(以下仅展示不为零的点击率):
Pr(天气研究院|天气)= 3/8; Pr(天气预报订阅|天气)=5/8; 
Pr(雨伞推销|天气)=1/2; Pr(湿度计推销|天气)=1/2;
Pr(天气预报订阅|下雨)=1/4;Pr(湿度计推销|下雨))=1/3;
Pr(气温计推销|下雨)=1; 
Pr(天气研究院|春游)=1/4;Pr(烧烤架出租|天气)=1;Pr(帐篷出租|春游)=1/2
由此得到三个页面向量:天气:(3/8,5/8,1/2,1/2,0,0,0);下雨:(0,1/4,0,1/3,1,0,0);春游:(1/4,0,0,0,0,1,1/2)。根据公式计算三个页面的相似度,得到sim(天气,下雨)=0.2787,sim(下雨,春游)=0,sim(天气,春游)=0.0809;
第三步:利用第二步得到的页面向量,a.利用向量计算两两页面之间的调整余弦相似度,b.存储这些向量,构建无偏见点击率数据库; 
第四步,根据相似度构建页面之间的关系数据库;
第五步:等待用户提交查询页面“下雨”;
第六步:从第四步中得到的关系数据库中找出与页面“下雨”相似度最大的页面“天气”,以及其与页面“下雨”的相似度sim(天气,下雨);
第七步:从无偏见数据库中找出在相似页面“天气”中刊登过,而在页面“下雨”中没有刊登过的广告集合A:(广告“天气研究院”,广告“雨伞”),对于集合A中所有广告“天气研究院”和广告“雨伞”,通过公式计算在页面“下雨”下广告“天气研究院”和广告“雨伞”被点击的条件概率,即广告“天气研究院”和广告“雨伞”在页面“下雨”下的无偏见点击率:
Pr(天气研究院|下雨)=3/8,Pr(雨伞|下雨)=1/2;
然后选择无偏见点击率最大的广告“雨伞”匹配页面“下雨” ;
第八步:判断是否完成了所有页面的匹配广告工作,“是”转入结束,“否”转入第五步。

Claims (5)

1.一种无位置偏见影响的广告与页面匹配的方法,其特征在于,该方法包括如下步骤:
a)确定每个搜索页面中所有广告的展示位置、展示次数和点击次数;
b)利用统计方法,排除广告所在页面位置对广告点击所造成的影响,计算每个页面下刊登的每个广告的固有点击率;
c)根据页面与广告的固有点击率,计算页面之间关于广告的相似度关系;
d)对于一个待推荐的目标页面,根据相似的其他页面,为其匹配合适的广告。
2.根据权利要求1所述的方法,其特征在于,所述步骤 a)包括:
Ⅰ)确定页面总数M、广告总数N、页面能展示广告的位置总数P;
Ⅱ)计算每个页面下每个广告在每个位置的展示次数、点击次数;计算每个页面下每个位置的所有广告的展示总数、点击总数;计算每个广告在每个位置的展示总数、点击总数;计算每个位置下所有广告的展示总数、点击总数以及每个广告的展示总数、点击总数;根据得到的数据,将对应的点击次数除以展示次数,得到每个页面下每个广告在每个位置的点击率、每个页面下每个位置的所有广告的点击率、每个广告在每个位置的点击率、每个位置下所有广告的点击率以及每个广告的点击率。
3.根据权利要求1所述的方法,其特征在于,所述步骤b)包括:
Ⅰ)根据全概率公式和贝叶斯公式,计算出在某个页面下某个广告被点击的条件概率,即某个广告在某个页面下的无偏见点击率,排除广告位置对广告点击率的影响。
4.根据权利要求1所述的方法,其特征在于,所述步骤c)包括:
Ⅰ)将一个页面表示成一个N维向量,每一个维度上的元素对应这个页面下相应广告的无偏见点击率;总计有M个页面向量;
Ⅱ)通过调整余弦相似度计算总计M个页面向量两两之间的相似度。
5.根据权利要求1所述的方法,其特征在于,所述步骤d)包括:
Ⅰ)对于一个待匹配P个广告的目标页面q,根据步骤c)中的相似度,找到与页面q最相似的K个页面,称为相似邻居;
Ⅱ)从相似邻居中,找到在相似邻居中展示、但在目标页面q下没有展示过的广告集合A;
Ⅲ)对于属于集合A中的每个广告,根据相似邻居中对应广告的无偏见点击率以及相似邻居与页面q的相似度进行加权求和,计算得到这个广告在目标页面q下预测的无偏见点击率;
Ⅳ)将集合A中所有广告按照预测的无偏见点击率从大到小排序,选择最大的P个广告推荐给目标页面q用作广告展示。
CN201310197731.5A 2013-05-24 2013-05-24 一种无位置偏见影响的广告与页面匹配的方法 Active CN103268344B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310197731.5A CN103268344B (zh) 2013-05-24 2013-05-24 一种无位置偏见影响的广告与页面匹配的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310197731.5A CN103268344B (zh) 2013-05-24 2013-05-24 一种无位置偏见影响的广告与页面匹配的方法

Publications (2)

Publication Number Publication Date
CN103268344A true CN103268344A (zh) 2013-08-28
CN103268344B CN103268344B (zh) 2016-04-06

Family

ID=49011973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310197731.5A Active CN103268344B (zh) 2013-05-24 2013-05-24 一种无位置偏见影响的广告与页面匹配的方法

Country Status (1)

Country Link
CN (1) CN103268344B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104992348A (zh) * 2015-06-24 2015-10-21 深圳市腾讯计算机***有限公司 一种信息展示的方法和装置
CN105825400A (zh) * 2016-03-16 2016-08-03 合网络技术(北京)有限公司 一种广告素材质量衡量的方法及***
CN106537436A (zh) * 2015-04-23 2017-03-22 Sk 普兰尼特有限公司 重定向广告产品推荐用户装置和服务提供装置、包括该重定向广告产品推荐用户装置和服务提供装置的广告产品推荐***、其控制方法以及其中记录有计算机程序的记录介质
CN106875208A (zh) * 2016-12-27 2017-06-20 网易传媒科技(北京)有限公司 一种确定显著广告展示位的方法和装置
CN107516247A (zh) * 2017-08-28 2017-12-26 天脉聚源(北京)科技有限公司 一种预测广告播放数据的方法及装置
WO2020134009A1 (zh) * 2018-12-29 2020-07-02 北京字节跳动网络技术有限公司 点击率预测方法和装置,以及展位选择方法和装置
CN113038242A (zh) * 2021-05-24 2021-06-25 武汉斗鱼鱼乐网络科技有限公司 直播卡片展示位置的确定方法、装置、设备及存储介质
CN117950787A (zh) * 2024-03-22 2024-04-30 成都赛力斯科技有限公司 广告展示方法、装置、电子设备及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109753601B (zh) * 2018-11-28 2021-10-22 北京奇艺世纪科技有限公司 推荐信息点击率确定方法、装置及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005101263A1 (en) * 2004-04-17 2005-10-27 Nhn Corporation System and method for selecting search listing in an internet search engine and ordering the search listings
CN101079039A (zh) * 2006-06-30 2007-11-28 腾讯科技(深圳)有限公司 一种搜索广告排序***和方法
CN102592235A (zh) * 2011-12-28 2012-07-18 北京品友互动信息技术有限公司 一种互联网广告投放***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005101263A1 (en) * 2004-04-17 2005-10-27 Nhn Corporation System and method for selecting search listing in an internet search engine and ordering the search listings
CN101079039A (zh) * 2006-06-30 2007-11-28 腾讯科技(深圳)有限公司 一种搜索广告排序***和方法
CN102592235A (zh) * 2011-12-28 2012-07-18 北京品友互动信息技术有限公司 一种互联网广告投放***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
卫强: "网络展示广告位置对点击率CTR影响的实证研究", 《信息***学报》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106537436A (zh) * 2015-04-23 2017-03-22 Sk 普兰尼特有限公司 重定向广告产品推荐用户装置和服务提供装置、包括该重定向广告产品推荐用户装置和服务提供装置的广告产品推荐***、其控制方法以及其中记录有计算机程序的记录介质
CN104992348A (zh) * 2015-06-24 2015-10-21 深圳市腾讯计算机***有限公司 一种信息展示的方法和装置
CN104992348B (zh) * 2015-06-24 2018-07-10 深圳市腾讯计算机***有限公司 一种信息展示的方法和装置
CN105825400A (zh) * 2016-03-16 2016-08-03 合网络技术(北京)有限公司 一种广告素材质量衡量的方法及***
CN106875208A (zh) * 2016-12-27 2017-06-20 网易传媒科技(北京)有限公司 一种确定显著广告展示位的方法和装置
CN107516247A (zh) * 2017-08-28 2017-12-26 天脉聚源(北京)科技有限公司 一种预测广告播放数据的方法及装置
WO2020134009A1 (zh) * 2018-12-29 2020-07-02 北京字节跳动网络技术有限公司 点击率预测方法和装置,以及展位选择方法和装置
CN113038242A (zh) * 2021-05-24 2021-06-25 武汉斗鱼鱼乐网络科技有限公司 直播卡片展示位置的确定方法、装置、设备及存储介质
CN117950787A (zh) * 2024-03-22 2024-04-30 成都赛力斯科技有限公司 广告展示方法、装置、电子设备及存储介质
CN117950787B (zh) * 2024-03-22 2024-05-31 成都赛力斯科技有限公司 广告展示方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN103268344B (zh) 2016-04-06

Similar Documents

Publication Publication Date Title
CN103268344B (zh) 一种无位置偏见影响的广告与页面匹配的方法
CN103886048B (zh) 一种基于聚类的增量数字图书推荐方法
CN103324645A (zh) 一种网页推荐方法和装置
CN104281956A (zh) 基于时间信息的适应用户兴趣变化的动态推荐方法
CN102411754A (zh) 一种基于商品属性熵值的个性化推荐方法
CN108897750B (zh) 融合多元上下文信息的个性化地点推荐方法及设备
CN102270241A (zh) 基于稀疏非负矩阵分解的图像检索方法
CN106528812B (zh) 一种基于usdr模型的云推荐方法
CN103235822A (zh) 数据库的生成及查询方法
Majid et al. GoThere: travel suggestions using geotagged photos
CN104063555B (zh) 面向遥感信息智能分发的用户模型建模方法
CN104809144A (zh) 一种基于辅助关键词的个性化广告投放方法
CN110619552A (zh) 会员购物数据挖掘算法综合引擎
CN111445280A (zh) 模型生成方法、餐馆排序方法、***、设备和介质
Li et al. Examining winter fallow farmland from space and geography: a case study in Guizhou, China
Li et al. Spatial interpolation method of precipitation based on topographic weighting.
CN107463615A (zh) 开放网络中基于上下文和用户兴趣的实时去处推荐方法
Li Study on measurement of seasonality and its regional differences of self-driving tours market in China.
Arya et al. Community water harvesting structures' status, management and socio-economic impacts: case studies in Shivaliks foothills, Northern Himalayas, India.
Li XueFeng et al. Quantitative method for freezing-thawing environment of concrete in Qinghai-Tibet Plateau.
Jiang et al. Evolution of Crop Planting Structure in Traditional Agricultural Areas and Its Influence Factors: A Case Study in Alar Reclamation
Korbut Agricultural censuses and their role in improving statistical observation in agriculture
Duan et al. Spatial and temporal characteristics of precipitation in Chongqing from 1961 to 2014.
Gao XueLi et al. Evolution and driving forces of cultivated land quantity in Xiamen City using niche theory.
Chang CheHao et al. An evaluation framework for identifying the optimal raingauge network based on spatiotemporal variation in quantitative precipitation estimation.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant