CN107526810A - 建立点击率预估模型的方法及装置、展示方法及装置 - Google Patents

建立点击率预估模型的方法及装置、展示方法及装置 Download PDF

Info

Publication number
CN107526810A
CN107526810A CN201710729982.1A CN201710729982A CN107526810A CN 107526810 A CN107526810 A CN 107526810A CN 201710729982 A CN201710729982 A CN 201710729982A CN 107526810 A CN107526810 A CN 107526810A
Authority
CN
China
Prior art keywords
mrow
event
clicking rate
msub
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710729982.1A
Other languages
English (en)
Other versions
CN107526810B (zh
Inventor
潘岸腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Guangzhou Youshi Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Youshi Network Technology Co Ltd filed Critical Guangzhou Youshi Network Technology Co Ltd
Priority to CN201710729982.1A priority Critical patent/CN107526810B/zh
Publication of CN107526810A publication Critical patent/CN107526810A/zh
Application granted granted Critical
Publication of CN107526810B publication Critical patent/CN107526810B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0263Targeted advertisements based upon Internet or website rating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例公开了一种建立点击率预估模型的方法及装置、展示方法及装置、终端及存储介质,其中,所述方法包括:基于获取的每个展示事件的类型和该展示事件的点击率预估值建立误差函数,其中,所述展示事件的类型的取值根据用户的实际点击情况确定,所述展示事件的点击率预估值基于构建的点击率预估模型计算得到;基于所述误差函数建立所述点击率预估模型的误差损失函数;基于所述误差损失函数以及每个展示事件的类型的取值,求解所述点击率预估模型中每个特征集合的特征的权重的值;根据求解得到的每个权重的值确定点击率预估模型。

Description

建立点击率预估模型的方法及装置、展示方法及装置
技术领域
本申请涉及网络技术领域,特别涉及一种建立点击率预估模型的方法及装置、展示方法及装置。
背景技术
网络技术发展到今天,越来越多的事件,如新闻资讯,文章,音乐,图片等等需要展示给用户,而这种展示要获得好的效果,就需要为不同的展示事件有针对性地找到用户,进行个性化展示,个性化展示的核心技术难点就是如何准确地确定待展示事件。
发明内容
鉴于上述问题,本申请的目的在于提供了一种建立点击率预估模型的方法及装置、一种展示方法及装置、终端及存储介质,提高了向用户展示事件的准确性。
一方面,本申请提供一种建立点击率预估模型的方法,包括:
基于获取的每个展示事件的类型和该展示事件的点击率预估值建立误差函数,其中,所述展示事件的类型的取值根据用户的实际点击情况确定,所述展示事件的点击率预估值基于构建的点击率预估模型计算得到;
基于所述误差函数建立所述点击率预估模型的误差损失函数;
基于所述误差损失函数以及每个展示事件的类型的取值,求解所述点击率预估模型中每个特征集合的特征的权重的值;
根据求解得到的每个权重的值确定点击率预估模型。
可选地,所述点击率预估模型通过如下步骤构建:
采集展示事件的用户的特征;
将所述用户的特征进行归类,将每类特征划分为多个特征集合,统计每个特征集合中的特征对每个展示事件的标准化值,并为每个特征集合的特征设置权重;
基于每个特征集合的特征对每个展示事件的标准化值和每个特征集合的特征的权重构建每个展示事件的点击率预估模型。
可选地,所述方法还包括:
基于所述点击率预估模型计算待展示事件的点击率预估值。
可选地,基于所述点击率预估模型计算待展示事件的点击率预估值之后,还包括:
基于计算得到的所述待展示事件的点击率预估值,计算所述待展示事件的预期收益;
对多个待展示事件的预期收益进行排序;
将预期收益位于预设区域内的待展示事件展示给用户。
可选地,所述基于所述点击率预估模型计算待展示事件的点击率预估值包括:
将特征集合的特征对所述待展示事件的标准化值和每个特征集合的特征的权重代入所述点击率预估模型进行计算得到所述待展示事件的点击率预估值。
可选地,基于所述误差损失函数以及每个展示事件的类型的取值,求解每个权重的值包括:
为每个权重设置初始值;
以所述误差损失函数的损失最小为目标对所述误差损失函数进行迭代计算;
当所述误差损失函数的变化率小于预设阈值时停止所述迭代计算并以此时每个权重的取值作为所述权重的值。
可选地,所述点击率预估模型为:
所述误差损失函数为:
其中,j表示展示事件,i表示特征,θi表示特征i的权重,n表示特征总数,m表示展示事件总数,flagj表示第j个展示事件的类型,0为负展示事件,1为正展示事件,若第j个展示事件被用户点击则是正展示事件,未被用户点击则为负展示事件,pi,j表示第i特征在第j个展示事件的取值的标准化值,计算公式如下:
其中,fi,j表示第i个特征在第j个展示事件的取值,click(fi,j)表示特征fi,j的点击数,show(fi,j)表示特征fi,j的展示数,pctr(fi,j)表示特征fi,j的点击率。
另一方面,本申请还提供一种展示方法,包括:
获取待展示事件的点击率预估值;
基于所述点击率预估值计算点击所述待展示事件获得的预期收益;
对多个待展示事件的预期收益进行排序;
将预期收益位于预设区域内的待展示事件展示给用户。
可选地,所述基于所述点击率预估值计算点击所述待展示事件获得的预期收益包括:
以所述点击率预估值与预设的点击单价相乘获得预期收益。
另一方面,本申请还提供一种建立点击率预估模型的装置,包括:
获取模块,用于基于获取的每个展示事件的类型和该展示事件的点击率预估值建立误差函数,其中,所述展示事件的点击率预估值基于构建的点击率预估模型计算得到,所述展示事件的类型的取值根据用户的实际点击情况确定;
建立模块,用于基于所述误差函数建立所述点击率预估模型的误差损失函数;
求解模块,用于基于所述误差损失函数以及每个展示事件的类型的取值,求解所述点击率预估模型中每个特征集合的特征的权重的值;
确定模块,用于根据求解得到的每个权重的值确定点击率预估模型。
可选地,所述点击率预估模型通过如下模块构建:
采集模块,用于采集展示事件的用户的特征;
统计模块,用于将所述用户的特征进行归类,将每类特征划分为多个特征集合,统计每个特征集合中的特征对每个展示事件的标准化值,并为每个特征集合的特征设置权重;
构建模块,用于基于每个特征集合的特征对每个展示事件的标准化值和每个特征集合的特征的权重构建每个展示事件的点击率预估模型。
可选地,所述装置还包括:
第一计算模块,用于基于所述点击率预估模型计算待展示事件的点击率预估值。
可选地,所述第一计算模块还包括:
第二计算模块,用于基于计算得到的所述待展示事件的点击率预估值,计算所述待展示事件的预期收益;
排序模块,用于对多个待展示事件的预期收益进行排序;
展示模块,用于将预期收益位于预设区域内的待展示事件展示给用户。
可选地,所述第一计算模块具体用于将特征集合的特征对所述待展示事件的标准化值和每个特征集合的特征的权重代入所述点击率预估模型进行计算得到所述待展示事件的点击率预估值。
可选地,所述求解模块包括:
初始化模块,用于为每个权重设置初始值;
迭代计算模块,用于以所述误差损失函数的损失最小为目标对所述误差损失函数进行迭代计算,当所述误差损失函数的变化率小于预设阈值时停止所述迭代计算并以此时每个权重的取值作为所述权重的值。
可选地,所述点击率预估模型为:
所述误差损失函数为:
其中,j表示展示事件,i表示特征,θi表示特征i的权重,n表示特征总数,m表示展示事件总数,flagj表示第j个展示事件的类型,0为负展示事件,1为正展示事件,若第j个展示事件被用户点击则是正展示事件,未被用户点击则为负展示事件,pi,j表示第i特征在第j个展示事件的取值的标准化值,计算公式如下:
其中,fi,j表示第i个特征在第j个展示事件的取值,click(fi,j)表示特征fi,j的点击数,show(fi,j)表示特征fi,j的展示数,pctr(fi,j)表示特征fi,j的点击率。
另一方面,本申请还提供一种展示装置,包括:
预估值获取模块,用于获取待展示事件的点击率预估值;
收益计算模块,用于基于所述点击率预估值计算点击所述待展示事件获得的预期收益;
收益排序模块,用于对多个待展示事件的预期收益进行排序;
事件展示模块,用于将预期收益位于预设区域内的待展示事件展示给用户。
可选地,所述收益计算模块具体用于以所述点击率预估值与预设的点击单价相乘获得预期收益。
另一方面,本申请还提供一种终端,包括:处理器、以及存储有计算机指令的存储器;
所述处理器读取所述计算机指令,并执行如前所述的一种建立点击率预估模型的方法。
另一方面,本申请还提供一种终端,包括:处理器、以及存储有计算机指令的存储器;
所述处理器读取所述计算机指令,并执行如前所述的一种展示方法。
另一方面,本申请还提供一种存储介质,存储有计算机指令,所述计算机指令被执行时实现如前所述的建立点击率预估模型的方法。
另一方面,本申请还提供一种存储介质,存储有计算机指令,所述计算机指令被执行时实现如前所述的展示方法。
本申请实施例提供的一种建立点击率预估模型的方法及装置、一种展示方法及装置、终端、存储介质,以多个展示事件的用户的点击行为为基础,将特征进一步划分为多个特征集合,统计每个特征集合的特征的标准化值,并为每个特征集合中的特征配置权重,以每个特征的权重为参数建立点击率预估模型。当各个权重确定后,所述点击率预估模型就确定了。可以利用所述确定的点击率预估模型计算任意展示事件的点击率预估值,从而可以将点击率预估值高的事件展示给用户,提高对用户展示事件的准确度。
附图说明
根据下述参照附图进行的详细描述,本申请的上述和其他目的、特征和优点将变得显而易见。在附图中:
图1为本申请一实施例提供的建立点击率预估模型的方法的流程图;
图2为本申请一实施例提供的建立点击率预估模型的方法的流程图;
图3为本申请一实施例提供的建立点击率预估模型的方法的流程图;
图4为本申请一实施例提供的建立点击率预估模型的方法的流程图;
图5为本申请一实施例提供的展示广告应用点击率预估模型的场景示意图;
图6为本申请一实施例提供的展示方法的流程图;
图7本申请一实施例提供的建立点击率预估模型的装置的结构示意图;
图8为本申请一实施例提供的展示装置的结构示意图。
具体实施方式
下面描述本申请的各个方面。本文的教导可以以多种多样形式具体体现,并且在本文中公开的任何具体结构、功能或两种仅仅是代表性的。基于本文的教导,本领域技术人员应该明白的是,本文所公开的一个方面可以独立于任何其他方面实现,并且这些方面中的两个或多个方面可以按照各种方式组合。例如,可以使用本文所阐述的任何数目的方面,实现装置或实践方法。另外,可以使用其他机构、功能、或除了本文所阐述的一个或多个方面之外或不是本文所阐述的一个或多个方面的结构和功能,实现这种装置或实践这种方法。此外,本文所描述的任何方面可以包括权利要求的至少一个元素。
在本申请中,提供了一种建立点击率预估模型的方法及装置、终端、存储介质。下面结合附图对本申请的具体实施方式进行描述。
参见图1,本申请一实施例提供的建立点击率预估模型的方法,包括步骤101至104。
步骤101:基于获取的每个展示事件的类型和该展示事件的点击率预估值建立误差函数,其中,所述展示事件的点击率预估值基于构建的点击率预估模型计算得到,所述展示事件的类型的取值根据用户的实际点击情况确定。
本申请实施例中,所述展示事件可以是各种展示给用户并且希望用户进行点击操作的事件,如可以是展示广告、展示文章、展示应用、展示音乐或者展示图片、展示电影等。
获取每个展示事件的类型,以展示广告为例,给某个用户展示广告,若该用户点击查看了该展示广告,那么该展示广告的类型就是正样本,可以用数字1表示;若该用户没有点击查看该展示广告,那么该条展示广告的类型就是负样本,可以用数字0表示。
参见图2,本申请一实施例中,所述点击率预估模型通过步骤1011至步骤1013构建。
步骤1011:采集展示事件的用户的特征。
本申请实施例中,所述用户的特征可以包括自身属性类特征,如年龄、学历、所在城市、职业、收入或用户喜欢的手机应用类型等;还可以包括手机应用类特征,如手机应用的类型、手机应用点击率等。
还以展示广告为例,某广告展示给了多个用户,通过采集所述多个用户的特征即可获得该广告展示过的用户的特征。
本申请实施例中,所述每个用户可以看作是一个特征集合,例如用户A为具有95后、男性、网络游戏等特征的特征集合A,用户B为具有95后、女性、网络游戏等特征的特征集合B,用户C为具有90后、男性、网络游戏等特征的特征集合C,采集特征集合A、特征集合B和特征集合C的所有特征,然后按照年龄特征分类,即具有95后特征的分在一个集合中,具有90后特征的分在一个集合中,具有网络游戏特征的分在一个集合中,也可以按照性别特征分类,即具有男性特征的分在一个集合中,具有女性特征的分在一个集合中。
步骤1012:将所述用户的特征进行归类,将每类特征划分为多个特征集合,统计每个特征集合中的特征对每个展示事件的标准化值,并为每个特征集合的特征设置权重。
本申请实施例中,对于所述用户的每类特征,都可以以某种方式,划分成多个不同的特征集合。以年龄为例,如可以划分为“儿童”、“少年”、“青年”、“中年”、“老年”等,也可以划分为“70后”、“80后”、“90后”、“95后”、“00后”等。
每类特征的划分方式可以根据实际需要确定,本申请不作限定。
步骤1013:基于每个特征集合的特征对每个展示事件的标准化值和每个特征集合的特征的权重构建每个展示事件的点击率预估模型。
本申请实施例中,每个特征集合的特征对每个展示事件的标准化值是由每个特征集合的特征对每个展示事件的实际点击数和向每个特征集合的特征展示所述事件的实际展示数提前计算得到。
本申请实施例中,每个特征集合的特征的权重表示该特征集合的特征对展示事件的可信程度。
本申请一实施例中,所述点击率预估模型可以是:
其中,j表示展示事件,i表示特征,θi表示特征i的权重,n表示特征总数,pi,j表示第i特征在第j个展示事件的取值的标准化值。
通过该点击率预估模型,可以知道,某个展示事件的点击率是通过每个特征集合中的特征对展示事件的标准化值和每个特征集合中的特征的权重共同确定的,每个特征集合中的特征对展示事件的标准化值可以根据每个特征集合中的特征对展示事件的实际点击数和向每个特征集合的特征展示所述事件的实际展示数提前计算得到。
步骤102:基于所述误差函数建立所述点击率预估模型的误差损失函数。
步骤103:基于所述误差损失函数以及每个展示事件的类型的取值,求解所述点击率预估模型中每个特征集合的特征的权重的值。
本申请一实施例中,基于所述误差损失函数以及每个展示事件的类型的取值,求解每个权重的值可以包括:
为每个权重设置初始值;
以所述误差损失函数的损失最小为目标对所述误差损失函数进行迭代计算;
当所述误差损失函数的变化率小于预设阈值时停止所述迭代计算并以此时每个权重的取值作为所述权重的值。
本申请实施例中,是根据用户对展示事件的真实点击情况和点击率预估值来确定每个特征对该展示事件的权重的。
本申请一实施例中,若点击率预估模型如式1所示,那么对应的误差函数为:
误差损失函数为:
其中,j表示展示事件,i表示特征,θi表示特征i的权重,n表示特征总数,m表示展示事件总数,pi,j表示第i特征在第j个展示事件的取值的标准化值,flagj表示第j个展示事件的类型,0为负展示事件,1为正展示事件,若第j个展示事件被用户点击则是正展示事件,未被用户点击则为负展示事件。
若用户点击了展示事件j,则flagj=1,否则flagj=0。
其中,pi,j的计算公式如下:
其中,fi,j表示第i个特征在第j个展示事件的取值,click(fi,j)表示特征fi,j的点击数,show(fi,j)表示特征fi,j的展示数,pctr(fi,j)表示特征fi,j的点击率。
仍然以展示广告为例,所述展示广告给具有“95后”特征的用户展示100次,其中产生的点击行为次数为10次,那么“95后”特征对所述展示广告的标准化值则为:若展示广告的特征集合中的特征的权重是确定的,那么即可以根据每个特征对所述展示广告的权重估算出所述展示广告的点击率。
根据式3可以知道,本申请实施例可以根据提前计算好的pi,j以及用户对展示事件的类型的实际取值,求解每个特征对应的权重的值。
本申请实施例中,可以采用梯度下降法,基于展示事件的用户的实际点击值,求解式1的{θi|0≤i≤n,i∈Z}的最佳值,即求解各个特征对展示事件的权重。该求解方法可以包括如下步骤:
第一步:随机给定一组0-1之间的数{θi|0≤i≤n,i∈Z},设为θ(0),初始化迭代步数k=0;
第二步:迭代计算
其中α为迭代的步长,取0.001;
第三步:判断所述误差损失函数是否收敛
Δg(θ(k+1))=|g(θ(k+1))-g(θ(k))|
如果|Δg(θ(k+1))-Δg(θ(k)|<β,那么就返回θ(k+1),θ(k+1)即为估计的模型的参数,否则回到第二步继续计算,其中β是一个很小的值,可以取β=0.01·α。
步骤104:根据求解得到的每个权重的值确定点击率预估模型。
本申请实施例中,通过上述步骤计算确定了各个特征对展示事件的权重的值,从而展示事件的点击率预估模型就建立了。
本申请实施例中,可以基于所述点击率预估模型计算待展示事件的点击率预估值。
本申请实施例提供的一种建立点击率预估模型的方法,以多个展示事件的用户的点击行为为基础,将特征进一步划分为多个特征集合,统计每个特征集合的特征的标准化值,并为每个特征集合中的特征配置权重,以每个特征的权重为参数建立点击率预估模型。当各个权重确定后,所述点击率预估模型就确定了。可以利用所述确定的点击率预估模型计算任意展示事件的点击率预估值,从而可以选择点击率预估值高的展示事件,提高对用户展示事件的准确度。
参见图3,在本申请的一个实施例中,待展示事件基于所述点击率预估模型的实际应用,包括步骤301至步骤304。
步骤301:基于所述点击率预估模型计算待展示事件的点击率预估值。
步骤302:基于计算得到的所述待展示事件的点击率预估值,计算所述待展示事件的预期收益。
本申请实施例中,基于计算得到的所述待展示事件的点击率预估值包括:将特征集合的特征对所述待展示事件的标准化值和每个特征集合的特征的权重代入所述点击率预估模型进行计算得到所述待展示事件的点击率预估值。
步骤303:对多个待展示事件的预期收益进行排序。
本申请实施例中,按照预期收益对多个待展示事件进行排序,可以将预期收益高的待展示事件放在优先的位置,将预期收益低的待展示事件放在靠后的位置。
步骤304:将预期收益位于预设区域内的待展示事件展示给用户。
例如,预设区域内可以放置预期收益为前90的待展示事件,则按照预期收益的高低将预期收益名次位于前90的待展示事件放置在预设区域内,然后将位于该预设区域内的90个待展示事件展示给用户。
本申请实施例中,基于所述点击率预估模型计算待展示事件的点击率预估值,将待展示事件按照点击率预估值进行排序,给用户展示点击率预估值最高的事件,可以极大的提高用户对展示事件的点击查看兴趣,提升用户体验。
参见图4,在本申请的一个实施例中,以展示事件A为展示广告为例,说明本申请所提供的点击率预估模型的建立方法,包括步骤401至步骤407。
步骤401:采集展示广告的用户的特征。
通过采集展示广告的多个用户的特征来建立所述展示广告的点击率预估模型。所述展示广告的用户可以是多个,每个用户的特征也可以是多个。
步骤402:将所述用户的特征进行归类,将每类特征划分为多个特征集合,统计每个特征集合中的特征对所述展示广告的标准化值,并为每个特征集合的特征设置权重。
本申请实施例中,可以从多个维度来采集刻画所述展示广告的用户的特征集合。
维度1:通过用户的对所述展示广告的偏好刻画,例如喜欢购物的用户刻画“购物迷”。
维度2:通过用户的地域属性刻画,例如北京、天津、上海。
维度3:通过用户自然属性刻画,例如年龄、性别等。
维度4:通过用户的社会属性刻画,例如文化水平、职业、地域等。
实际应用中,根据对象的不同,所选择的维度也可以不同。本申请对此不作限定。
对每类特征,都可以进一步划分为不同的特征集合。
步骤403:基于每个特征集合的特征对所述展示广告的标准化值和每个特征集合的特征的权重构建所述点击率预估模型。
本申请实施例中,每个特征集合的特征对所述展示广告的标准化值是由每个特征集合的特征对所述展示广告的实际点击数和向每个特征集合的特征展示所述广告的实际展示数计算得到。
本申请实施例中,每个特征集合的特征的权重表示每个特征集合的特征对所述展示广告的不同可靠度。
以年龄为例,若年龄这个类型的特征进一步包括“90后”、“95后”、“00后”3个特征集合,那么每个特征集合中的特征对同一个展示广告这一展示事件具有相同的权重。例如,26岁和24岁的用户均属于“90后”这个特征集合,那么26岁的用户和24岁的用户的年龄这个特征对同一个展示广告这一展示事件的权重的值相同。
本申请实施例中建立的所述展示广告的点击率预估模型如式5所示:
其中,A表示展示广告这一展示事件,i表示特征,θi表示特征i的权重,θ0表示常量,n表示特征总数,pi,A表示第i特征在所述展示广告的取值的标准化值,计算公式如下:
其中,fi,A表示第i个特征在展示广告的取值,click(fi,A)表示特征fi,A的点击数,show(fi,A)表示特征fi,A的展示数,pctr(fi,A)表示特征fi,A的点击率。
例如:所述展示广告给具有“95后”特征的用户展示100次,其中产生的点击行为次数为10次,那么“95后”特征对所述展示广告的标准化值则为:
步骤404:获取所述展示广告的类型和基于构建的点击率预估模型计算的所述展示广告的点击率预估值,所述展示广告的取值根据用户的实际点击率确定。
本申请实施例中,若用户点击查看了所述展示广告,那么所述展示广告的类型就是正样本,可以用数字1表示;若用户没有点击查看所述展示广告,那么所述展示广告的类型就是负样本,可以用数字0表示。
步骤405:建立所述展示广告的类型与所述点击率预估值的误差函数,基于所述误差函数建立所述点击率预估模型的误差损失函数。
本申请实施例中的误差函数如式7所示。
所述误差损失函数如式8所示。
其中,A表示展示广告这一展示事件,i表示特征,θi表示特征i的权重,n表示特征总数,m表示展示广告总数,pi,A表示第i特征在所述展示广告的取值的标准化值,flagA表示所述展示广告的类型,0为负展示事件,1为正展示事件,若所述展示广告被用户点击则是正展示事件,未被用户点击则为负展示事件。
若用户点击了所述展示广告,则flagA=1,否则flagA=0。
步骤406:基于所述误差损失函数以及所述展示广告的类型的取值,求解每个权重的值。
根据式8可以看出,本申请实施例是基于所述误差损失函数以及所述展示广告的类型的取值即实际点击值,求解每个特征集合的特征对所述展示广告的权重的值。
本申请实施例中,可以采用梯度下降法,基于所述展示广告的用户的实际点击值,求解各个特征对展示事件的权重。该求解方法可以包括如下步骤:
第一步:随机给定一组0-1之间的数{θi|0≤i≤n,i∈Z},设为θ(0),初始化迭代步数k=0;
第二步:迭代计算
其中α为迭代的步长,取0.001;
第三步:判断所述误差损失函数是否收敛
Δg(θ(k+1))=|g(θ(k+1))-g(θ(k))|
如果|Δg(θ(k+1))-Δg(θ(k))|<β,那么就返回θ(k+1),θ(k+1)即为估计的模型的参数,否则回到第二步继续计算,其中β是一个很小的值,可以取β=0.01·α。
步骤407:根据求解得到的每个权重的值确定点击率预估模型。
本申请实施例中,通过上述步骤计算确定了各个特征对所述展示广告的权重的值,从而所述展示广告的点击率预估模型就建立了。
图5是对所述展示广告点击率预估模型的应用场景示意图。对于一个未展示过所述广告的用户I,用户I包括3个特征,分别为i1、i2、i3;首先采集所述展示广告的多个用户的特征,然后将所述多个用户的特征进行归类,将每类特征划分为多个特征集合,统计每个特征集合中的特征对所述展示广告的标准化值,即其中,i1、i2、i3对应的权重的值分别为θ1、θ2、θ3,所述i1、i2、i3对应的权重的值已经通过上述建模过程确定。则用户I对所述展示广告的点击率预估值为:ctrA=θ0+p1,Aθ1+p2,Aθ2+p3,Aθ3
通过基于所述展示广告的每个特征集合的特征对所述展示广告的标准化值和每个特征集合的特征的权重建立所述展示广告的点击率预估模型,并可以利用该点击率预估模型计算出其它展示广告的点击率预估值,然后从中选出点击率预估值高的广告展示给用户,可以极大地提高对用户展示广告的投放准确度,避免低点击率的广告展示,节约了展示广告投放成本,提高了展示广告的经济效益。
参见图6,本申请一实施例提供的展示方法,包括步骤601至步骤604。
步骤601:获取待展示事件的点击率预估值。
本申请实施例中,根据式1中的点击率预估模型的公式,计算用户对不同待展示事件的点击率预估值。
步骤602:基于所述点击率预估值计算点击所述待展示事件获得的预期收益。
本申请实施例中,将每个特征集合的特征对所述待展示事件的标准化值和每个特征集合的特征的权重代入所述点击率预估模型进行计算得到所述待展示事件的点击率预估值,以所述点击率预估值与预设的点击单价相乘即可以获得所述待展示事件的预期收益。
步骤603:对多个待展示事件的预期收益进行排序。
本申请实施例中,可以将多个待展示事件的预期收益全部算出之后,按照预期收益由高到低进行依次排序,也可以按照特定的顺序对多个待展示事件进行排序。
步骤604:将预期收益位于预设区域内的待展示事件展示给用户。
例如,预设资源库的所有待展示事件集合为A,由上述步骤可以预估出用户u点击集合A中任意一个待展示事件b的概率Pu(xb),设xb的点击单价为priceb,该值有待展示事件的供应者提供,那么待展示事件b给用户u的预期收益为earnb=ctrj·priceb,根据该值对集合A做降序,将预期收益位于预设区域内的待展示事件展示给用户即截取top100的待展示事件展示给用户u。
本申请实施例中,基于所述点击率预估模型计算待展示事件的点击率预估值,将待展示事件按照点击率预估值进行排序,将预期收益高的待展示事件放在优质的位置优先展示给用户,可以实现利润最大化。
将本申请提供的点击率预估模型应用在展示音乐上,包括第一步至第四步。
第一步:获取待展示音乐的点击率预估值。
本申请实施例中,根据式1中的点击率预估模型的公式,计算用户对不同的待展示音乐的点击率预估值。
第二步:基于所述点击率预估值计算点击所述待展示音乐获得的预期收益。
本申请实施例中,将每个特征集合的特征对所述展示音乐的标准化值和每个特征集合的特征的权重代入上述点击率预估模型进行计算得到所述待展示音乐的点击率预估值,以所述点击率预估值与预设的待展示音乐的点击单价相乘即可以获得所述待展示音乐的预期收益。
第三步:对多个待展示音乐的预期收益进行排序。
本申请实施例中,可以将多个待展示音乐的预期收益全部算出之后,按照预期收益由高到低进行依次排序。
第四步:将预期收益位于预设区域内的待展示音乐展示给用户。
例如:预设区域内可以放置预期收益为top80的待展示音乐,则按照预期收益的高低将预期收益名次位于top80的待展示音乐放置在预设区域内,然后将位于该预设区域内的80首待展示音乐展示给用户。
本申请实施例中,基于所述点击率预估模型计算待展示音乐的点击率预估值,将待展示音乐按照点击率预估值进行排序,将预期收益高的待展示音乐放在优质的位置优先展示给用户,在进行展示音乐的过程中,实现在有限的资源里面做到利润的最大化,也最大程度的提高用户使用效果。
本申请的建立点击率预估模型的方法,阶段一:首先收集样本数据,并提取特征,然后对特征进行基于ctr的标准化,最后建立标准化特征的ctr预估线性模型,并通过梯度下降法求得模型参数。阶段二:根据阶段一建立的模型,计算用户对不同展示事件的点击概率,把用户点击概率高的事件展示给用户。
将本申请建立的点击率预估模型应用在商业应用推广(相当于展示广告这一展示事件)中,商业应用推广是应用商店的主要收入来源。在商业应用推广过程中,主要目标是如何在有限的资源里面(包含用户资源、应用展示位资源)实现利润最大化。如何实现利润最大化,核心的问题是需要预测用户对展示的商业应用(即展示事件,如展示广告这一展示事件)的点击概率,只要算出点击概率,用点击概率乘以商业应用单价,即可得到展示这款商业应用的预期收益,将收益高的商业应用放在优质的位置优先展示即可实现利润最大化的目标。
图7为本申请实施例提供的一种建立点击率预估模型的装置的结构示意图。由于装置实施例基本相似于方法实施例,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
本申请提供的建立点击率预估模型的装置包括:
获取模块701,用于基于获取的每个展示事件的类型和该展示事件的点击率预估值建立误差函数,其中,所述展示事件的类型的取值根据用户的实际点击情况确定,所述展示事件的点击率预估值基于构建的点击率预估模型计算得到;
建立模块702,用于基于所述误差函数建立所述点击率预估模型的误差损失函数;
求解模块703,用于基于所述误差损失函数以及每个展示事件的类型的取值,求解所述点击率预估模型中每个特征集合的特征的权重的值;
确定模块704,用于根据求解得到的每个权重的值确定点击率预估模型。
本申请一实施例中,所述点击率预估模型通过如下模块构建:
采集模块,用于采集展示事件的用户的特征;
统计模块,用于将所述用户的特征进行归类,将每类特征划分为多个特征集合,统计每个特征集合中的特征对每个展示事件的标准化值,并为每个特征集合的特征设置权重;
构建模块,用于基于每个特征集合的特征对每个展示事件的标准化值和每个特征集合的特征的权重构建每个展示事件的点击率预估模型。
本申请一实施例中,所述装置还包括:
第一计算模块,用于基于所述点击率预估模型计算待展示事件的点击率预估值。
本申请一实施例中,所述第一计算模块还包括:
第二计算模块,用于基于计算得到的所述待展示事件的点击率预估值,计算所述待展示事件的预期收益;
排序模块,用于对多个待展示事件的预期收益进行排序;
展示模块,用于将预期收益位于预设区域内的待展示事件展示给用户。
本申请一实施例中,所述第一计算模块具体用于将特征集合的特征对所述待展示事件的标准化值和每个特征集合的特征的权重代入所述点击率预估模型进行计算得到所述待展示事件的点击率预估值。
本申请一实施例中,所述求解模块703包括:
初始化模块,用于为每个权重设置初始值;
迭代计算模块,用于以所述误差损失函数的损失最小为目标对所述误差损失函数进行迭代计算,当所述误差损失函数的变化率小于预设阈值时停止所述迭代计算并以此时每个权重的取值作为所述权重的值。
本申请一实施例中,所述点击率预估模型为:
所述误差损失函数为:
其中,j表示展示事件,i表示特征,θi表示特征i的权重,n表示特征总数,m表示展示事件总数,flagj表示第j个展示事件的类型,0为负展示事件,1为正展示事件,若第j个展示事件被用户点击则是正展示事件,未被用户点击则为负展示事件,pi,j表示第i特征在第j个展示事件的取值的标准化值,计算公式如下:
其中,fi,j表示第i个特征在第j个展示事件的取值,click(fi,j)表示特征fi,j的点击数,show(fi,j)表示特征fi,j的展示数,pctr(fi,j)表示特征fi,j的点击率。
本申请实施例提供的一种建立点击率预估模型的装置,以多个展示事件的用户的点击行为为基础,将特征进一步划分为多个特征集合,统计每个特征集合的特征的标准化值,并为每个特征集合中的特征配置权重,以每个特征的权重为参数建立点击率预估模型。当各个权重确定后,所述点击率预估模型就确定了。可以利用所述确定的点击率预估模型计算任意展示事件的点击率预估值,从而可以将点击率预估值高的事件展示给用户,提高对用户展示事件的准确度。
本申请还提供一种终端,包括:处理器、以及存储有计算机指令的存储器;
所述处理器读取所述计算机指令,并执行如上所述的一种建立点击率预估模型的方法。
本申请还提供一种存储介质,存储有计算机指令,所述计算机指令被执行时实现如上所述的建立点击率预估模型的方法。
图8为本申请实施例提供的一种展示装置的结构示意图。由于装置实施例基本相似于方法实施例,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
本申请提供的一种展示装置包括:
预估值获取模块801,用于获取待展示事件的点击率预估值;
收益计算模块802,用于基于所述点击率预估值计算点击所述待展示事件获得的预期收益;
收益排序模块803,用于对多个待展示事件的预期收益进行排序;
事件展示模块804,用于将预期收益位于预设区域内的待展示事件展示给用户。
本申请一实施例中,所述收益计算模块802具体用于以所述点击率预估值与预设的点击单价相乘获得预期收益。
本申请实施例中,基于所述点击率预估模型计算待展示事件的点击率预估值,将待展示事件按照点击率预估值进行排序,给用户展示点击率预估值最高的展示事件,可以极大的提高用户对展示事件的点击查看兴趣,提升用户体验。
本申请还提供一种终端,包括:处理器、以及存储有计算机指令的存储器;
所述处理器读取所述计算机指令,并执行如上所述的一种展示方法。
本申请还提供一种存储介质,存储有计算机指令,所述计算机指令被执行时实现如上所述的展示方法。
需要说明的是,所述建立点击率预估模型装置如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被计算机执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、展示事件代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该申请仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本申请的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。
上面结合附图对本申请优选的具体实施方式和实施例作了详细说明,但是申请并不限于上述实施方式和实施例,在本领域技术人员所具备的知识范围内,还可以在不脱离本申请构思的前提下做出各种变化。

Claims (22)

1.一种建立点击率预估模型的方法,其特征在于,包括:
基于获取的每个展示事件的类型和该展示事件的点击率预估值建立误差函数,其中,所述展示事件的类型的取值根据用户的实际点击情况确定,所述展示事件的点击率预估值基于构建的点击率预估模型计算得到;
基于所述误差函数建立所述点击率预估模型的误差损失函数;
基于所述误差损失函数以及每个展示事件的类型的取值,求解所述点击率预估模型中每个特征集合的特征的权重的值;
根据求解得到的每个权重的值确定点击率预估模型。
2.根据权利要求1所述的方法,其特征在于,所述点击率预估模型通过如下步骤构建:
采集展示事件的用户的特征;
将所述用户的特征进行归类,将每类特征划分为多个特征集合,统计每个特征集合中的特征对每个展示事件的标准化值,并为每个特征集合的特征设置权重;
基于每个特征集合的特征对每个展示事件的标准化值和每个特征集合的特征的权重构建每个展示事件的点击率预估模型。
3.根据权利要求1所述的方法,其特征在于,还包括:
基于所述点击率预估模型计算待展示事件的点击率预估值。
4.根据权利要求3所述的方法,其特征在于,基于所述点击率预估模型计算待展示事件的点击率预估值之后,还包括:
基于计算得到的所述待展示事件的点击率预估值,计算所述待展示事件的预期收益;
对多个待展示事件的预期收益进行排序;
将预期收益位于预设区域内的待展示事件展示给用户。
5.根据权利要求3所述的方法,其特征在于,所述基于所述点击率预估模型计算待展示事件的点击率预估值包括:
将特征集合的特征对所述待展示事件的标准化值和每个特征集合的特征的权重代入所述点击率预估模型进行计算得到所述待展示事件的点击率预估值。
6.根据权利要求1所述的方法,其特征在于,基于所述误差损失函数以及每个展示事件的类型的取值,求解每个权重的值包括:
为每个权重设置初始值;
以所述误差损失函数的损失最小为目标对所述误差损失函数进行迭代计算;
当所述误差损失函数的变化率小于预设阈值时停止所述迭代计算并以此时每个权重的取值作为所述权重的值。
7.根据权利要求6所述的方法,其特征在于,所述点击率预估模型为:
<mrow> <msub> <mi>ctr</mi> <mi>j</mi> </msub> <mo>=</mo> <msub> <mi>&amp;theta;</mi> <mn>0</mn> </msub> <mo>+</mo> <munderover> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>p</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <msub> <mi>&amp;theta;</mi> <mi>i</mi> </msub> </mrow>
所述误差损失函数为:
<mrow> <mi>g</mi> <mrow> <mo>(</mo> <mi>&amp;theta;</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <msup> <mrow> <mo>(</mo> <msub> <mi>flag</mi> <mi>j</mi> </msub> <mo>-</mo> <msub> <mi>ctr</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <msup> <mrow> <mo>(</mo> <msub> <mi>flag</mi> <mi>j</mi> </msub> <mo>-</mo> <msub> <mi>&amp;theta;</mi> <mn>0</mn> </msub> <mo>-</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>p</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <msub> <mi>&amp;theta;</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow>
其中,j表示展示事件,i表示特征,θi表示特征i的权重,n表示特征总数,m表示展示事件总数,flagj表示第j个展示事件的类型,0为负展示事件,1为正展示事件,若第j个展示事件被用户点击则是正展示事件,未被用户点击则为负展示事件,pi,j表示第i特征在第j个展示事件的取值的标准化值,计算公式如下:
<mrow> <msub> <mi>p</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mi>p</mi> <mi>c</mi> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>c</mi> <mi>l</mi> <mi>i</mi> <mi>c</mi> <mi>k</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <mi>s</mi> <mi>h</mi> <mi>o</mi> <mi>w</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>
其中,fi,j表示第i个特征在第j个展示事件的取值,click(fi,j)表示特征fi,j的点击数,show(fi,j)表示特征fi,j的展示数,pctr(fi,j)表示特征fi,j的点击率。
8.一种展示方法,其特征在于,包括:
获取待展示事件的点击率预估值;
基于所述点击率预估值计算点击所述待展示事件获得的预期收益;
对多个待展示事件的预期收益进行排序;
将预期收益位于预设区域内的待展示事件展示给用户。
9.根据权利要求8所述的方法,其特征在于,所述基于所述点击率预估值计算点击所述待展示事件获得的预期收益包括:
以所述点击率预估值与预设的点击单价相乘获得预期收益。
10.一种建立点击率预估模型的装置,其特征在于,包括:
获取模块,用于基于获取的每个展示事件的类型和该展示事件的点击率预估值建立误差函数,其中,所述展示事件的点击率预估值基于构建的点击率预估模型计算得到,所述展示事件的类型的取值根据用户的实际点击情况确定;
建立模块,用于基于所述误差函数建立所述点击率预估模型的误差损失函数;
求解模块,用于基于所述误差损失函数以及每个展示事件的类型的取值,求解所述点击率预估模型中每个特征集合的特征的权重的值;
确定模块,用于根据求解得到的每个权重的值确定点击率预估模型。
11.根据权利要求10所述的装置,其特征在于,所述点击率预估模型通过如下模块构建:
采集模块,用于采集展示事件的用户的特征;
统计模块,用于将所述用户的特征进行归类,将每类特征划分为多个特征集合,统计每个特征集合中的特征对每个展示事件的标准化值,并为每个特征集合的特征设置权重;
构建模块,用于基于每个特征集合的特征对每个展示事件的标准化值和每个特征集合的特征的权重构建每个展示事件的点击率预估模型。
12.根据权利要求10所述的装置,其特征在于,还包括:
第一计算模块,用于基于所述点击率预估模型计算待展示事件的点击率预估值。
13.根据权利要求12所述的装置,其特征在于,所述第一计算模块还包括:
第二计算模块,用于基于计算得到的所述待展示事件的点击率预估值,计算所述待展示事件的预期收益;
排序模块,用于对多个待展示事件的预期收益进行排序;
展示模块,用于将预期收益位于预设区域内的待展示事件展示给用户。
14.根据权利要求12所述的装置,其特征在于,所述第一计算模块具体用于将特征集合的特征对所述待展示事件的标准化值和每个特征集合的特征的权重代入所述点击率预估模型进行计算得到所述待展示事件的点击率预估值。
15.根据权利要求10所述的装置,其特征在于,所述求解模块包括:
初始化模块,用于为每个权重设置初始值;
迭代计算模块,用于以所述误差损失函数的损失最小为目标对所述误差损失函数进行迭代计算,当所述误差损失函数的变化率小于预设阈值时停止所述迭代计算并以此时每个权重的取值作为所述权重的值。
16.根据权利要求15所述的装置,其特征在于,所述点击率预估模型为:
<mrow> <msub> <mi>ctr</mi> <mi>j</mi> </msub> <mo>=</mo> <msub> <mi>&amp;theta;</mi> <mn>0</mn> </msub> <mo>+</mo> <munderover> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>p</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <msub> <mi>&amp;theta;</mi> <mi>i</mi> </msub> </mrow>
所述误差损失函数为:
<mrow> <mi>g</mi> <mrow> <mo>(</mo> <mi>&amp;theta;</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <msup> <mrow> <mo>(</mo> <msub> <mi>flag</mi> <mi>j</mi> </msub> <mo>-</mo> <msub> <mi>ctr</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <msup> <mrow> <mo>(</mo> <msub> <mi>flag</mi> <mi>j</mi> </msub> <mo>-</mo> <msub> <mi>&amp;theta;</mi> <mn>0</mn> </msub> <mo>-</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>p</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <msub> <mi>&amp;theta;</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow>
其中,j表示展示事件,i表示特征,θi表示特征i的权重,n表示特征总数,m表示展示事件总数,flagj表示第j个展示事件的类型,0为负展示事件,1为正展示事件,若第j个展示事件被用户点击则是正展示事件,未被用户点击则为负展示事件,pi,j表示第i特征在第j个展示事件的取值的标准化值,计算公式如下:
<mrow> <msub> <mi>p</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mi>p</mi> <mi>c</mi> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>c</mi> <mi>l</mi> <mi>i</mi> <mi>c</mi> <mi>k</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <mi>s</mi> <mi>h</mi> <mi>o</mi> <mi>w</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>
其中,fi,j表示第i个特征在第j个展示事件的取值,click(fi,j)表示特征fi,j的点击数,show(fi,j)表示特征fi,j的展示数,pctr(fi,j)表示特征fi,j的点击率。
17.一种展示装置,其特征在于,包括:
预估值获取模块,用于获取待展示事件的点击率预估值;
收益计算模块,用于基于所述点击率预估值计算点击所述待展示事件获得的预期收益;
收益排序模块,用于对多个待展示事件的预期收益进行排序;
事件展示模块,用于将预期收益位于预设区域内的待展示事件展示给用户。
18.根据权利要求17所述的装置,其特征在于,所述收益计算模块具体用于以所述点击率预估值与预设的点击单价相乘获得预期收益。
19.一种终端,其特征在于,包括:处理器、以及存储有计算机指令的存储器;
所述处理器读取所述计算机指令,并执行如权利要求1-7任一项所述的一种建立点击率预估模型的方法。
20.一种终端,其特征在于,包括:处理器、以及存储有计算机指令的存储器;
所述处理器读取所述计算机指令,并执行如权利要求8或9所述的一种展示方法。
21.一种存储介质,其特征在于,存储有计算机指令,所述计算机指令被执行时实现如权利要求1-7任一项所述的建立点击率预估模型的方法。
22.一种存储介质,其特征在于,存储有计算机指令,所述计算机指令被执行时实现如权利要求8或9所述的一种展示方法。
CN201710729982.1A 2017-08-23 2017-08-23 建立点击率预估模型的方法及装置、展示方法及装置 Active CN107526810B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710729982.1A CN107526810B (zh) 2017-08-23 2017-08-23 建立点击率预估模型的方法及装置、展示方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710729982.1A CN107526810B (zh) 2017-08-23 2017-08-23 建立点击率预估模型的方法及装置、展示方法及装置

Publications (2)

Publication Number Publication Date
CN107526810A true CN107526810A (zh) 2017-12-29
CN107526810B CN107526810B (zh) 2021-01-26

Family

ID=60682193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710729982.1A Active CN107526810B (zh) 2017-08-23 2017-08-23 建立点击率预估模型的方法及装置、展示方法及装置

Country Status (1)

Country Link
CN (1) CN107526810B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109389424A (zh) * 2018-09-20 2019-02-26 北京达佳互联信息技术有限公司 流量分配方法、装置、电子设备及存储介质
WO2019144892A1 (zh) * 2018-01-25 2019-08-01 腾讯科技(深圳)有限公司 数据处理方法、装置、存储介质和电子装置
CN110263959A (zh) * 2018-05-21 2019-09-20 腾讯科技(深圳)有限公司 点击率预估方法、装置、机器设备和计算机可读存储介质
CN110401855A (zh) * 2018-04-25 2019-11-01 腾讯科技(深圳)有限公司 信息展示方法、装置、处理平台、计算设备及存储介质
CN111126649A (zh) * 2018-10-31 2020-05-08 北京字节跳动网络技术有限公司 用于生成信息的方法和装置
CN112150182A (zh) * 2019-06-28 2020-12-29 腾讯科技(深圳)有限公司 多媒体文件推送方法和装置、存储介质及电子装置
CN112214665A (zh) * 2019-07-12 2021-01-12 北京字节跳动网络技术有限公司 内容展示方法、装置、电子设备及计算机可读存储介质
CN112612951A (zh) * 2020-12-17 2021-04-06 上海交通大学 一种面向收益提升的无偏学习排序方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060242139A1 (en) * 2005-04-21 2006-10-26 Yahoo! Inc. Interestingness ranking of media objects
CN104951965A (zh) * 2015-06-26 2015-09-30 深圳市腾讯计算机***有限公司 广告投放方法及装置
CN105809487A (zh) * 2016-03-17 2016-07-27 广州筷子信息科技有限公司 基于广告元素的广告投放方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060242139A1 (en) * 2005-04-21 2006-10-26 Yahoo! Inc. Interestingness ranking of media objects
CN104951965A (zh) * 2015-06-26 2015-09-30 深圳市腾讯计算机***有限公司 广告投放方法及装置
CN105809487A (zh) * 2016-03-17 2016-07-27 广州筷子信息科技有限公司 基于广告元素的广告投放方法和装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019144892A1 (zh) * 2018-01-25 2019-08-01 腾讯科技(深圳)有限公司 数据处理方法、装置、存储介质和电子装置
CN110401855A (zh) * 2018-04-25 2019-11-01 腾讯科技(深圳)有限公司 信息展示方法、装置、处理平台、计算设备及存储介质
CN110263959A (zh) * 2018-05-21 2019-09-20 腾讯科技(深圳)有限公司 点击率预估方法、装置、机器设备和计算机可读存储介质
CN110263959B (zh) * 2018-05-21 2024-01-09 腾讯科技(深圳)有限公司 点击率预估方法、装置、机器设备和计算机可读存储介质
CN109389424A (zh) * 2018-09-20 2019-02-26 北京达佳互联信息技术有限公司 流量分配方法、装置、电子设备及存储介质
CN109389424B (zh) * 2018-09-20 2021-08-06 北京达佳互联信息技术有限公司 流量分配方法、装置、电子设备及存储介质
CN111126649B (zh) * 2018-10-31 2023-08-11 北京字节跳动网络技术有限公司 用于生成信息的方法和装置
CN111126649A (zh) * 2018-10-31 2020-05-08 北京字节跳动网络技术有限公司 用于生成信息的方法和装置
CN112150182A (zh) * 2019-06-28 2020-12-29 腾讯科技(深圳)有限公司 多媒体文件推送方法和装置、存储介质及电子装置
CN112150182B (zh) * 2019-06-28 2023-08-29 腾讯科技(深圳)有限公司 多媒体文件推送方法和装置、存储介质及电子装置
CN112214665A (zh) * 2019-07-12 2021-01-12 北京字节跳动网络技术有限公司 内容展示方法、装置、电子设备及计算机可读存储介质
CN112612951B (zh) * 2020-12-17 2022-07-01 上海交通大学 一种面向收益提升的无偏学习排序方法
CN112612951A (zh) * 2020-12-17 2021-04-06 上海交通大学 一种面向收益提升的无偏学习排序方法

Also Published As

Publication number Publication date
CN107526810B (zh) 2021-01-26

Similar Documents

Publication Publication Date Title
CN107526810A (zh) 建立点击率预估模型的方法及装置、展示方法及装置
US11659050B2 (en) Discovering signature of electronic social networks
CN106372249B (zh) 一种点击率预估方法、装置及电子设备
CN103353920B (zh) 基于社交网络推荐游戏的方法和装置
CN110097066A (zh) 一种用户分类方法、装置及电子设备
CN107301247A (zh) 建立点击率预估模型的方法及装置、终端、存储介质
CN108256568A (zh) 一种植物种类识别方法以及装置
CN108230010A (zh) 一种预估广告转化率的方法及服务器
CN108415913A (zh) 基于不确定邻居的人群定向方法
CN109409928A (zh) 一种素材推荐方法、装置、存储介质、终端
CN103353880B (zh) 一种利用相异度聚类和关联的数据挖掘方法
CN108629608A (zh) 用户数据处理方法及装置
CN104185041B (zh) 视频交互广告的自动生成方法和***
CN106776859A (zh) 基于用户偏好的移动应用App推荐***
CN106951471A (zh) 一种基于svm的标签发展趋势预测模型的构建方法
CN108647818A (zh) 一种预测企业涉税风险的方法及装置
CN110070134A (zh) 一种基于用户兴趣感知的推荐方法及装置
CN108596276A (zh) 基于特征加权的朴素贝叶斯微博用户分类方法
US20110251889A1 (en) Inventory clustering
CN106327211A (zh) 一种基于社交媒体的scrm***及其开发方法
CN112132634A (zh) 虚拟馈赠资源发放方法、装置、计算机设备和存储介质
Zhang et al. Mining target users for mobile advertising based on telecom big data
CN109785002A (zh) 一种用户游戏内付费预测方法
CN111626767A (zh) 资源数据的发放方法、装置及设备
CN107104875A (zh) 信息推送的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200526

Address after: 310051 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 510627 unit 02, floor 15, Tower B, Pingyun Plaza, radio and television, No. 163, xipingyun Road, Huangpu Avenue, Tianhe District, Guangzhou City, Guangdong Province (for office use only)

Applicant before: GUANGZHOU UC NETWORK TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant