CN115204943A - 一种广告召回方法、装置、设备以及存储介质 - Google Patents

一种广告召回方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN115204943A
CN115204943A CN202210750803.3A CN202210750803A CN115204943A CN 115204943 A CN115204943 A CN 115204943A CN 202210750803 A CN202210750803 A CN 202210750803A CN 115204943 A CN115204943 A CN 115204943A
Authority
CN
China
Prior art keywords
advertisement
generalized
user
identification information
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210750803.3A
Other languages
English (en)
Inventor
郭梦霖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN202210750803.3A priority Critical patent/CN115204943A/zh
Publication of CN115204943A publication Critical patent/CN115204943A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0263Targeted advertisements based upon Internet or website rating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实例提供了一种广告召回方法、装置、设备以及存储介质,涉及数据处理技术、互联网搜索和竞价广告领域,所述方法包括:获得各候选广告所属广义广告的第一标识信息和目标用户所属广义用户的第二标识信息;根据所述第一标识信息和第二标识信息,确定目标用户对各候选广告的评分值;根据所确定的评分值,从候选广告集合中选择待召回的广告集合。应用本发明实施例提供的方案进行广告召回,能够提升广告投放效果从而提升变现效率。

Description

一种广告召回方法、装置、设备以及存储介质
技术领域
本发明涉及数据处理技术、互联网搜索和竞价广告领域,特别是涉及一种广告召回方法、装置、设备以及存储介质。
背景技术
音视频等各种信息平台除了按照信息平台的功能向用户提供信息外,还希望扩大平台收益,承接广告等,进而在按照信息平台的功能向用户提供信息之外,还会向用户推送广告,其中,从信息平台的广告集合中初步筛选出拟向用户推送的广告集合的过程称为广告召回。
常用广告召回方法包括U2U(User to User,用户与用户),I2I(Item to Item,物品与物品)等协同过滤方法。因为用户广告行为稀疏且不直接反映用户偏好,故基于U2I(User to Item,用户与物品)协同过滤这种计算复杂度高但效果好的的召回方法很少被用于广告召回。
然而,实际应用中信息平台的用户和待召回的广告的规模和数量都很庞大,这样信息平台为众多用户选择待召回的广告时,计算复杂度高,速度慢。同时目前业内广告召回领域的评分设计方法不多,本发明也提供了一种广告召回的评分设计思路。
发明内容
本发明实施例的目的在于提供一种广告召回方法、装置、设备以及存储介质,以实现降低基于U2I协同过滤的广告召回的计算复杂度。具体技术方案如下:
在本发明实施的第一方面,首先提供了一种广告召回方法,所述方法包括:
获得各候选广告所属广义广告的第一标识信息和目标用户所属广义用户的第二标识信息;
根据所述第一标识信息和第二标识信息,确定目标用户对各候选广告的评分值;
根据所确定的评分值,从候选广告集合中选择待召回的广告集合。
在本发明实施的第二方面,还提供了一种广告召回装置,所述装置包括:
标识信息获得模块,用于获得各候选广告所属广义广告的第一标识信息和目标用户所属广义用户的第二标识信息;
评分值确定模块,用于根据所述第一标识信息和第二标识信息,确定目标用户对各候选广告的评分值;
广告选择模块,用于根据所确定的评分值,从候选广告集合中选择待召回的广告集合;
在本发明实施的第三方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述所述的广告召回方法步骤。
在本发明实的第四方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述所述的广告召回方法步骤。
在本发明实施的第五方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述所述的广告召回方法步骤。
本发明实施例提供的方案中,根据各候选广告所属广义广告的第一标识信息和目标用户所属广义用户的第二标识信息,确定目标用户对各候选广告的评分值,并根据所确定的评分值选择待召回的广告,无需生成海量用户和广告的标识信息并使用所有用户和广告的标识信息选择待召回的广告,降低了计算复杂度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的一种广告召回***的结构示意图。
图2为本发明实施例提供的一种广告召回方法的流程示意图;
图3为本发明实施例提供的第一种标识信息生成方法的流程示意图;
图4为本发明实施例提供的第二种标识信息生成方法的流程示意图;
图5为本发明实施例提供的一种平滑系数的曲线图;
图6为本发明实施例提供的一种广告召回方法的泳道图;
图7为本发明实施例提供的一种广告召回装置的结构示意图;
图8为本发明实施例提供的第一种标识信息生成装置的结构示意图;
图9为本发明实施例提供的第二种标识信息生成装置的结构示意图;
图10为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
本发明的一个实施例中,提供了一种广告召回方法,上述方法包括:
获得各候选广告所属广义广告的第一标识信息和目标用户所属广义用户的第二标识信息;
根据所述第一标识信息和第二标识信息,确定目标用户对各候选广告的评分值;
根据所确定的评分,从候选广告集合中选择待召回的广告集合。
本发明实施例提供的方案中,根据各候选广告所属广义广告的第一标识信息和目标用户所属广义用户的第二标识信息,确定表征目标用户对各候选广告的评分值,并根据所确定的评分值选择待召回的广告,无需生成海量用户和广告的标识信息并使用所有用户和广告的标识信息选择待召回的广告,降低了计算复杂度。
下面先结合图1所示的***结构示意图,对本发明实施例的应用场景以及本发明实施例提供的广告召回方案进行整体说明。
图1所示为信息平台使用的一种向用户推送广告的广告召回***。该广告召回***包括展示层、在线服务层、数据层以及模型层。
展示层可以将待推送的广告显示给用户,使得用户能够接收到待推送的广告,并且在此过程中,展示层可以确定显示广告时占用广告位的类型,例如广告位的类型可以是图中所示的Web广告位、移动广告位、TV端广告位等。
数据层可以存储广告信息和用户信息。其中,广告信息可以是如图所示的广告行为日志、广告订单,用户信息可以是如图所示的用户画像。上述广告行为日志中可以记录各用户对已曝光的广告产生的历史广告行为数据。广告信息和用户信息可以通过如图所示的MYSQL数据库、KAFKA***,以及HDFS(Hadoop Distributed File System,Hadoop分布式文件***)进行存储。图中展示的广告信息和用户信息的存储方式仅为一种可能的存储方式,并不表示所有可能的存储方式。
模型层可以对数据层中上述历史广告行为数据进行数据处理。其中,图中所示特征工程模块可以从数据层中提取各个广告和各个用户的特征,召回模型可以接受特征工程模块提取的广告和用户的特征作为输入,输出表示待召回广告所属的广义广告的标识信息和各用户所属的广义用户的标识信息,所生成的标识信息可以提供给在线服务层,并用于广告召回;精细排序模型用于对广告召回方法召回的广告进行再次排序,选出最终要展示给用户的广告。
在线服务层接收来自模型层的召回模型和精细排序模型的处理结果。本实施例中,模型层会给在线服务层提供广义用户的标识信息和广义广告的标识信息用于确定待召回的广告。同时,在线服务层会将所确定的待召回广告集合提供给精细排序模块,该模块调用精细排序模型,并最终选出要提供给展示层的广告,最后由展示层向用户展示。在此过程中,在线服务层的多通道召回模块会通过通道1……通道n以及图中所示U2I(User toItem,向用户推荐物品)协同过滤通道选择待召回的广告。不同的通道采用不同的召回方法,其中,上述U2I协同过滤通道从模型层提供的标识信息中,选择候选广告所属广义广告的标识信息和目标用户所属的广义用户的标识信息,并根据所选择的广义广告的标识信息和广义用户的标识信息间的关系,从候选广告中选择待召回的广告,将所选择的广告推送至精细排序模块,最终由精细排序模块选出的广告被推送至展示层,从而向用户展示。
本发明的一个实施例中,参见图2,提供了一种广告召回方法的流程示意图,该方法包括以下步骤S201-S203。
步骤S201:获得各候选广告所属广义广告的第一标识信息和目标用户所属广义用户的第二标识信息。
信息平台可以为大量用户召回广告,为了便于对用户和广告进行管理,可以根据选定的用户特征对用户进行分类,基于同类用户的特征编码形成广义用户唯一标识,类似的,可以根据选定的广告特征对广告进行分类,基于同类的广告特征编码形成广义广告唯一标识。这样就可以以广义用户和广义广告为单位对用户和广告进行管理。
上述候选广告可以是信息平台的全部广告,用于从中选择需要向用户召回的广告。
一个广义广告为一类具有相同特征的广告的集合,其中可以包含多个广告,这些广告在预先选定的特征集合中具有的每一特征的特征值相同。选定的特征集合中的特征可以是广告所属的广告主,或者是广告所属的行业,例如游戏行业。上述特征值相同的广告特征可以称为该广义广告的特征。
在确定广告所属的广义广告之后,可以为该广告增加所属广义广告的属性。基于此,一种实现方式中,可以依据为各个候选广告添加的广义广告的属性的取值,获得各个候选广告所属的广义广告。
一个广义用户为一类具有相同特征的用户的集合,其中可以包含多个用户。这些用户在特定方面具有相同的用户特征。上述相同的用户特征可以称为该广义用户的特征。
例如广义用户D包含的用户在性别方面具有相同的用户特征,相同的用户特征为:男性;广义用户E包含的用户在年龄方面具有相同的用户特征,相同的用户特征为:年龄小于30岁。
广义用户包含多个的用户也可以在多个方面具有相同的用户特征,例如广义用户F包含的用户在地域和性别方面分别具有相同的用户特征,等等。
在确定用户所属的广义用户之后,可以为该用户增加所属广义用户的属性。基于此,一种实现方式中,可以依据为目标用户添加的广义用户的属性,获得目标用户所属的广义用户。
为了便于查找和存储各候选广告所属的广义广告的第一标识信息和各用户所属的广义用户的第二标识信息,需要分别对各候选广告所属的广义广告和各用户所属的广义用户生成唯一ID(Identification,标识)。各候选广告所属的广义广告的ID可以根据各候选广告所属广义广告的特征生成;各用户所属的广义用户的ID可以根据各用户所属广义用户的特征生成。本发明的一个实施例中,可以将表示特征的字符串进行拼接,并对拼接后的字符串进行哈希运算得到ID。
第一标识信息和第二标识信息生成的具体方式参见下述步骤S301-S305,此处暂不详述。
步骤S202:根据第一标识信息和第二标识信息,确定目标用户对各候选广告的评分值。
其中,针对每一候选广告,目标用户对该候选广告的评分值可以表征:目标用户对该候选广告的偏好程度,以及针对该目标用户,该候选广告的潜在变现价值。
一个用户在观看到一个广告后,可能会对广告所展示的内容感兴趣,从而对该广告做出响应,也可能对广告所展示的内容不感兴趣,而对广告不做出响应。另外,在用户对广告做出响应的情况下,所做出响应的程度也可能会因为偏好程度的不同而有所不同,也就是响应程度不同。
具体的,用户对广告做出的响应可以是用户购买了广告推荐的商品,也可以是用户点击展示广告的网页,等等。
本发明的一个实施例中,表征目标用户对各候选广告的响应程度的评分值可以是表示响应程度大小的数值,在此种情况下,通过目标用户对各候选广告的评分值对应的数值高低,可以确定目标用户对各候选广告的响应程度的大小。
由于上述评分值表征的是目标用户对候选广告的偏好程度以及候选广告的潜在变现价值,若评分值高,则反映了目标用户对该候选广告感兴趣的概率较高、该候选广告的潜在变现价值较高,反之,评分值低,则反映了目标用户对该候选广告感兴趣的概率较低、该候选广告的潜在变现价值较低。在此基础上,根据所确定的评分值选择待召回的广告,能够提高所选择的待召回广告与目标用户匹配的概率,使得待召回广告更有可能被目标用户积极响应,从而提高了广告投放效果和变现效率。
下面对上述评分值确定方式进行说明。
一种实现方式中,第一标识信息和第二标识信息均可以以特征向量的形式表示,这种情况下可以计算表示第一标识信息的特征向量与表示第二标识信息的特征向量的内积,作为表征所述目标用户对各候选广告对应的广义广告响应程度的评分值。此种情况下,目标用户对广义广告的评分值可以作为目标用户对广义广告中包含的各候选广告的评分值。
在此情况下,可以预先得到已有的广义用户对广义广告的评分值,根据评分值形成评分值矩阵。在评分值矩阵中,若广义用户A对广义广告B的评分值不存在,则在对应该评分值的位置上填充0,否则填充评分值。在此情况下可以预先得到较为稀疏的评分值矩阵,简称为原稀疏矩阵r。
对该评分值矩阵使用最小二乘法进行矩阵分解,可以得到包含第一标识信息的广告矩阵和包含第二标识信息的用户矩阵。从广告矩阵中可以得到第一标识信息,从用户矩阵中可以得到第二标识信息。
并且,根据最小二乘法的特性可知,可以使用所得广告矩阵和所得用户矩阵,得到新的评分值矩阵,此矩阵中的广义用户对广义广告的评分值拟合之前用于矩阵分解的评分值矩阵,并且稀疏度减小,即部分原先被0填充的位置上产生非0的评分值,相当于通过最小二乘法,预测部分原先不存在的广义用户对广义广告的评分值。
由于存储新的评分值矩阵会占用较多的存储空间,因此可以存储广告矩阵和用户矩阵,并在需要获得特定广义用户对特定广义广告评分时,将用户矩阵中对应该广义用户位置的第二标识信息和广告矩阵中对应该广义广告位置的第一标识信息做内积,得到评分值,并可以根据评分值选择符合广义用户中包含的用户的偏好程度的广告。
此种基于广义用户的标识信息和广义广告的标识信息选择广告的方法即为基于U2I协同过滤的广告召回方法的一种实现方式。
具体地,获得第一标识信息和第二标识信息的方式可以参考下述图2所示实施例中的步骤。
步骤S203:根据所确定的评分值,从候选广告集合中选择待召回的广告集合。
其中,候选广告集合包括所有的候选广告。
在本发明的一个实施例中,可以根据目标用户对各候选广告响应程度的第一评分值的大小选择待召回的广告。具体的,可以按照约定的召回数目选择待召回广告,并且在选择待召回的广告时,优先采用高评分值对应的候选广告所属的广义广告,例如约定的召回数目为20,广义广告A中包含候选广告数目为10,广义广告B中包含的候选广告数目为20,广义广告A中的广告对应的评分值大于广义广告B中的广告对应的评分值,此时,优先选择广义广告A中的候选广告;由于选择的候选广告数目尚未达到约定的召回数目,再从广义广告B中选择10条候选广告,选择方式可以是:按照广义广告B中的每一广告预设的重要性进行选择。所选择的候选广告组成的集合即为待召回的广告集合。
由上可见,本发明实施例提供的方案中,根据各候选广告所属广义广告的第一标识信息和目标用户所属广义用户的第二标识信息,确定目标用户对各候选广告的评分值,并根据所确定的评分值选择待召回的广告,无需生成海量用户和广告的标识信息并使用所有用户和广告的标识信息选择待召回的广告,降低了计算复杂度。
下面对上述图2实施例中广义广告的标识信息和各广义用户的标识信息的生成方式进行说明。
本发明的一个实施例中,参加图3,提供了第一种标识信息生成方法的流程示意图,该方法包括以下步骤S301-S304。
步骤S301:根据各用户的用户特征,对用户进行聚合,得到不同的广义用户。
其中,广义用户可以包含多个用户。广义用户的特征的具体内容可以参见上述步骤S201,此处不再详述。
以下对聚合用户得到广义用户的方式进行说明。
本发明的一个实施例中,可以从各用户的用户信息中提取各用户的用户特征,并根据用户特征进行匹配,将具有相同用户特征的所有用户置于同一类中,形成该相同用户特征对应的广义用户,相当于聚合了所有具有该相同用户特征的用户群体,得到广义用户。
不同用户之间可能具有多个相同的用户特征,可以基于多种用户特征共同对用户进行聚合,得到聚合类。例如,可以按照上述步骤将共同具有用户特征M和用户特征N的用户聚合到同一个广义用户中。
一种实现方式中,对各用户的用户特征进行匹配,可以是比对表示各用户特征的字符串,若字符串表示的用户特征一致,则确定字符串对应的用户具有相同的用户特征,可以被聚类至同一广义用户。
其中,每一条用户特征可以与该用户的标识作为一组数据,共同存储于数据库中,则基于用户的标识可以查找到该用户的用户特征。具体的,可以对表示用户特征的字符串进行拼接,再计算拼接结果的哈希值,将上述哈希值作为用户的标识。上述数据库可以为Couchbase数据库。
步骤S302:根据各广告的广告特征,对广告进行聚合,得到不同的广义广告。
聚合广告得到广义广告的方式与上述S302中完全类似,区别仅在于广告和用户、广义广告和广义用户等概念名称上的替换,因此,此处不再详述。
另外,本步骤中得到广义广告的过程与步骤S302中得到广义用户的过程的执行顺序不受限定,并且得到广义广告的过程与得到广义用户的过程可以一同进行。
其中,每一条广告特征可以与该广告的标识作为一组数据,共同存储于数据库中,则基于广告的标识可以查找到该广告的广告特征。具体的,可以对表示广告特征的字符串进行拼接,再计算拼接结果的哈希值,将上述哈希值作为广告的标识。上述数据库可以为Couchbase数据库。
步骤S303:根据各用户对已曝光的广告产生的历史广告行为数据,生成各用户所属的广义用户对各广告所属的广义广告的评分值。
其中,广义用户对广义广告的评分值表征:广义用户包括的用户对广义广告包括的广告的偏好程度、以及针对该广义用户的情况下广义广告包括的广告的潜在变现价值。
上述历史广告行为数据用于记录各用户对已曝光的广告曾经产生的响应,例如点击行为、转化行为等。可以对历史广告行为数据中记录的响应进行统计,根据统计结果中用户产生不同响应的比率计算该用户针对已曝光的广告第一评分值。
具体的,通过以下举例说明如何统计用户产生不同响应的比率,以下方式可以用于统计任一用户对任一已召回过的广告产生的响应。
例如,当响应为点击行为时,可以计算统计结果中用户对广告进行点击的次数和该广告对该用户的曝光次数之商,作为点击行为对应的点击率。
又例如,当响应为转化行为时,可以计算统计结果中用户对广告产生的转化行为的次数和该用户对该广告进行点击的次数之商,作为转化行为对应的转化率。其中,上述转化行为可以为用户根据已曝光的广告做出的产生不同程度收益的响应,例如转化行为可以是根据广告购买广告信息中展示的商品,产生的收益是用户购买行为中的付款数额,或者根据广告注册广告展示的网站的会员,产生的收益是网站的会员数增加。
另外,用户还可以对广告产生其他类型的响应,本发明实施例并不对此进行限定。
具体生成广义用户对广义广告的评分值的方式参见下述图4实施例的步骤,此处暂不详述。
步骤S304:根据所生成的评分值,生成各广义广告的第一标识信息和各广义用户的第二标识信息。
本发明的一个实施例中,可以根据所获得的评分值生成的各广义用户对各广义广告的评分值矩阵,并采用最小二乘法,得到评分值矩阵中的评分值对应的各广义广告的标识信息,作为第一标识信息,并得到各广义用户的标识信息,作为第二标识信息。且在该方法中,各广义广告的标识信息和各广义用户的标识信息可以用交替最小二乘法计算得出的对应各广义广告的广告矩阵和对应各广义用户的用户矩阵表示。
具体的,可以基于如下优化目标函数生成广告矩阵和用户矩阵:
Figure BDA0003721041000000111
其中,rij为表征广义用户i对广义广告j的评分值。xi为表示广义用户i的特征的向量,
Figure BDA0003721041000000112
为表示广义用户i的特征的向量的转置向量,yj为表示广义广告j的特征的向量。
求和符号Σ(i,j)表示对每一广义用户i和每一广义广告j,都计算
Figure BDA0003721041000000113
差值的平方结果。
λ表示预设的正则项。||xi||2为表示广义用户i的特征的向量的二范数;对m个广义用户,分别计算其特征的向量的二范数,并从i=1到i=m求和。m表示所有广义用户的数量。
||yj||2为表示广义广告j的特征的向量的二范数,对n个广义广告,分别计算其特征的向量的二范数,并从j=1到j=n求和。n表示所有广义广告的数量。
最左侧的最小值min函数中的X*与Y*表示此目标优化函数的解,也就是说当各广义用户向量组成的用户矩阵X=X*且各广义广告向量组成的广告矩阵Y=Y*时,括号内的优化目标函数可以取到最小值,此时X*Y*对原稀疏矩阵r拟合效果的最好。上述广义用户向量为表示广义用户的特征的向量,上述广义广告向量为表示广义广告的特征的向量。在此情况下确定的矩阵X*的第i个向量表示广义用户i的特征的向量x*i,即可以作为生成的广义用户i的特征;不失一般性的,广义用户i可以是所有广义用户中的任一广义用户。在此情况确定的矩阵Y*的第j个向量表示广义广告j的特征的向量y*j,即可以作为生成的广义广告j的特征;不失一般性的,广义广告j可以是所有广义广告中的任一广义广告。具体的,Y*和X*可以通过如下方法求得:
yj=(XTX+λI)-1XTrj
上述公式可以通过在前述向量生成公式中,采用最小值函数括号内的整个子函数对yj求偏导数,并为所求偏导数赋值为0得到。
其中,X为表示各广义用户的用户矩阵,λ为预设的正则项,与前述向量生成公式保持一致,I表示单位矩阵,rj表示对于每一广义用户所得到的该广义用户对广义广告j的评分值形成的向量。
类似的有:
xi=(YTY+λ/)-1YTri
该公式的计算方式与前述yj的计算公式完全一致,区别仅在于求偏导数的对象是xi
其中,Y为表示各广义广告的广告矩阵,入为预设的正则项,与前述向量生成公式保持一致,I表示单位矩阵,ri表示对于每一广义广告所得到的广义用户i对该广义广告的评分值形成的向量。
本发明的一个实施例中,可以通过上述公式计算xi,使用计算得到的xi形成矩阵X,并代入计算yj的公式中计算yj,再根据所得yj形成矩阵Y,代入计算xi的公式中再次计算xi,并形成新的矩阵X;通过上述方式交替地计算xi和yj,直到所求得的X和Y使得优化目标函数取得最小值或收敛(即继续迭代,该优化目标函数的值也不再变小),则此时X和Y即为优化目标函数的最优解X*和Y*。在此情况下由X*矩阵所得的表示各广义用户的特征的向量作为各广义用户的标识信息,将由Y*矩阵所得的表示各广义广告的特征的向量作为各广义广告的标识信息。
本发明的一个实施例中,可以将所生成的各广义广告的标识信息和各广义用户的标识信息存储于数据库中,便于后续根据所生成的各广义广告的特征和各广义用户的特征进行广告召回,例如,所使用的数据库可以是Couchbase数据库、MYSQL数据库等。
在此情况下,每一次选择待召回的广告时,都可以将广义广告和广义用户作为基准进行广告选择。当存在对多个用户进行多次广告召回的需求时,若多个用户属于同一广义用户,则每次进行广告召回时,均可以采用已存储的该广义用户的第二标识信息计算上述评分值,而不需要重新确定该广义用户的新的标识信息,也就是同一广义用户的目标用户对应的第二标识信息可以复用,广义广告的第一标识信息同理也可以复用,这降低了标识信息的存储压力,也降低了在线计算复杂度,提高广告召回的速度。
下面对上述步骤S303中生成评分值的具体方式进行说明。
本发明的一个实施例中,参见图4,提供了第二种标识信息生成方法的流程示意图,该方法包括以下步骤S401-S406:
步骤S401:根据各用户的用户特征,对用户进行聚合,得到不同的广义用户。
步骤S402:根据各广告的广告特征,对广告进行聚合,得到不同的广义广告。
上述步骤S401-S402与前述步骤S301-S302相同,在此不再详述。
步骤S403:根据各用户对已曝光的广告产生的历史广告行为数据,获得表征各广义用户对各广义广告偏好程度的第一表示值。
本发明的一个实施例中,可以从上述历史广告行为数据中统计体现各广义用户对各广义广告兴趣的响应的产生次数,并根据所得响应的产生次数计算第一表示值。
体现广义用户对广义广告兴趣的响应,可以根据广义用户中包含的用户对广义中包含的广告产生的行为得到,产生的行为可以是用户点击广告的点击行为,或者用户根据广告进行的转化行为等。转化行为的具体形式可以参考步骤S303,此处不再详述。
一种实现方式中,可以对历史广告行为数据中记录的响应进行统计,根据统计结果中不同响应生成的比率计算广义用户对广义广告的第一表示值,例如,比率为点击率和转化率的情况下,针对每一广义用户和每一广义广告,可以根据各用户对已曝光的广告产生的历史广告行为数据,获得该广义用户中包含的用户对该广义广告中包含的广告产生的点击行为数量总和与该广义广告中包含的广告对该广义用户中包含的用户的曝光次数总和,计算所得点击行为数量总和与曝光次数总和的商,作为该广义用户对该广义广告的点击率;并计算该广义用户中包含的用户对该广义广告中包含的广告产生的转化行为数量总和与点击行为数量总和的商,作为该广义用户对该广义广告的转化率。此种情况下,可以计算该广义用户对该广义广告的点击率和转化率的乘积,作为表征该广义用户对该广义广告偏好程度的第一表示值。
由上可见,本发明实施例提供的方案中,第一表示值可以基于统计历史广告行为数据中不同产生响应的比率获得。不同广义用户对广义广告的响应次数的差异可能较大,而产生响应的比率的数值稳定在固定的数据区间内。与使用响应次数计算第一表示值相比,本发明实施例中采用波动较小的比率数据计算得到的第一表示值受到数值波动的影响较小,能够更为准确地表征各广义用户对各广义广告的偏好程度。
步骤S404:根据各用户对已曝光的广告产生的历史广告行为数据,获得表征各广义用户下各广义广告的潜在变现价值的第二表示值。
其中,各广告对信息平台的潜在变现价值可以表示各广告给信息平台带来的收益。对于每一用户而言,该用户接受各广告时产生的转化行为不同,广告主对转化的出价不同,转化行为为信息平台带来的就收益不同,对信息平台所产生的价值也不同。分别针对每一用户,可以计算各广告被该用户接受的情况下对信息平台产生的价值的第二表示值,所得到的所有第二表示值即为上述表征各用户下各广告对信息平台所产生价值的第二表示值。
本发明的一个实施例中,可以从上述历史广告行为数据中统计各广义用户中包含的用户响应各广义广告中包含的广告的的产生次数,并根据所得的响应的产生次数以及受到响应的广告的价值,计算第二表示值。
在上述步骤S303生成评分值后,同一广义广告下的各候选广告的评分值相同,此时在保证按照当前评分值优先排序的同时,可自行确定次优先的排序依据,采用广告被所有用户响应产生的上述第二表示值作为次优先排序的依据。
具体的计算第二表示值的方式可以参见下文所示的实施例,此处不再详述。
步骤S405:根据表征各广义用户对各广义广告偏好程度的第一表示值和表征各广义用户下各广义广告的潜在变现价值的第二表示值,生成各广义用户针对各广义广告的评分值。
本发明的一个实施例中,可以为每一广义用户对每一广义广告的第一表示值和第二表示值赋予表示权重的系数,并使用权重系数计算第一表示值加权后结果和第二表示值加权后结果的和值,将所得和值作为每一广义用户针对每一广义广告的评分值。
一种实现方式中,广义用户针对广义广告的评分值可以按照如下方式进行计算:
rij=CTCVRij*wCTCVR+eCPMij*weCPM+deep_eCPMij*wdeep_eCPM
其中,rij为广义用户i针对广义广告j的评分值,CTCVRij为广义用户i对广义广告j的第一表示值,eCPMij为一种广义用户i对广义广告j的第二表示值,deep_eCPMij为另一种广义用户i对广义广告j的第二表示值,具体获得方式可以参见下述步骤,此处暂不详述。
另外,wCTCVR、weCPM、wdeep_eCPM均为预设的权重系数。
步骤S406:根据所生成的评分值,生成各广义广告的第一标识信息和各广义用户的第二标识信息。
上述步骤S406与前述步骤S304相同,在此不再详述。
由上可见,本发明实施例提供的方案中,各广义用户针对各广义广告的评分值根据第一表示值和第二表示值生成,使得生成的评分值能够反映各广义用户对各广义广告的偏好程度的情况下,也能够反映各广义用户下各广义广告对信息平台所产生的价值,提高了评分值的准确性。
下面对步骤S404中两种第二表示值的获得方式进行说明。
一种获得方式中,可以根据各用户对已曝光的广告产生的历史广告行为数据,获得各广义用户对各广义广告的点击率和转化率;并结合广义广告的出价方式,从各广义用户对各广义广告的点击率、转化率和第一出价中确定的信息,获得表征各广义用户下各广义广告对信息平台所产生价值的第二表示值,其中,上述第一出价为:广告主为各广义广告设置的与前置转化目标对应的出价;
其中,出价可以理解为广告主为广告在信息平台的一次前置转化目标所预支付的费用。广义广告的出价可以是广义广告包括的所有广告的出价。
信息平台可以预先记录广告主对各广告的出价方式,形成记录信息,并保存该记录信息。在此种情况下,在计算第二表示值时,可以根据所形成的记录信息,可以得到广告主对各广告的出价方式。
在步骤S302中聚类形成广义广告时,可以设置广义广告对应一种出价方式,并设置广义广告对应一种前置转化目标。
各用户对各广告的前置转化可以是发生各用户对各广告产生的具有初步收益的转化行为。例如,前置转化目标可以是用户被曝光了广告、点击了广告、浏览了广告相关网页、下载了广告推荐的APP(Application,应用程序)等。
具体的,上述获得第二表示值的方式可以参照如下公式:
Figure BDA0003721041000000161
其中,eCPM表示第二表示值,且所得第二表示值按照上述公式,分三种出价方式进行计算。三种出价方式分别为:
oCPX ad,表示该广告的预设目标是转化行为的次数,但按点击次数计费,即广告被点击时平台向广告主收费,但同时考核转化次数,广告主会为一次转化预设出价。
CPC ad,表示该广告的预设目标是点击行为的次数,该广告按点击计费,即广告被点击时平台向广告主收费,广告主会为一次点击预设出价。
CPM ad,表示该广告的预设目标是被曝光的次数,该广告按曝光计费,即广告被曝光时平台向广告主收费,广告主会为一次曝光预设出价。
上述三种出价方式能够体现不同的广告的投放效果。其中,广告的投放效果指的是广告被用户接受的情况,例如,被用户接受的情况可以以广告在用户浏览的网页上被用户点击的比率表示,上述比率可以为该用户点击该广告的次数与该用户在平台浏览到该广告次数之间的商。
在根据不同的出价方式计算第二表示值的具体计算方式中,CTR表示点击率,CVR表示转化率,Bid表示第一出价。
另一种获得方式中,可以根据各用户对已曝光的广告产生的历史广告行为数据,获得各广义用户下各广义广告的前置转化目标对应的前置转化数和后置转化目标对应的后置转化数,采用各广义用户对各广义广告的点击率、转化率、第二出价和深层转化率,获得表征各广义用户下各广义广告对信息平台所产生价值的第二表示值,其中,上述第二出价为:广告主为各广义广告设置的与后置转化目标对应的出价,每一广义用户对每一广义广告的深层转化率为:该广义用户下该广义广告对应的后置转化数与前置转化数之商。
其中,上述前置转化数为前置转化目标对应的转化行为的数量,上述后置转化数为后置转化目标对应的转化行为的数量。在步骤S302中聚类形成广义广告时,可以设置广义广告对应一种后置转化目标。
各用户对各广告的后置转化目标可以是发生为广告主带来进一步收益的转化行为。例如,后置转化目标可以是用户下载广告推荐的APP(前置转化目标)后购买APP中的商品(后置转化目标),或者用户注册广告推荐的APP后(前置转化目标)次日在该APP中留存(后置转化目标)等。
具体的,上述获得第二表示值的方式可以参照如下公式:
deep_eCPM=CTR*CVR*deep_CVR*deep_Bid
其中,deep_eCPM表示第二表示值,CTR表示点击率,CVR表示转化率,deep_CVR表示深层转化率,deep_Bid表示第二出价价值。
由上可见,本发明实施例提供的方案中,根据用户的历史广告行为数据得到的第二表示值可以基于多种数据获得,并且第二表示值可以根据转化目标的不同设置不同的计算方式,提高了第二表示值反映广告出价价值的准确性。
本发明的一个实施例中,按照以下方式对平滑对象进行平滑处理,其中,上述平滑对象为:各广义用户对各广义广告的点击率、转化率或深层转化率。
根据用户对广告产生的历史广告行为数据,统计用于计算平滑对象的行为数量;根据行为数量和平滑对象对应的预设参数,计算平滑系数;采用平滑系数对平滑对象进行平滑处理。
其中,上述平滑处理用于提高上述平滑对象的置信度,相当于使得上述平滑对象能够更为准确地反应实际的各用户对各广告的行为。
可以对前述步骤S403和前述步骤S404中使用的、用于生成第一表示值和第二表示值的点击率、转化率、深层转化率等平滑对象进行上述平滑处理。在此情况下,可以使用平滑处理后的平滑对象执行步骤S403和步骤S404,生成第一表示值和第二表示值。
具体的,平滑处理可以按照如下公式进行:
Figure BDA0003721041000000181
其中,tanh(α,x)为平滑系数,得到平滑系数后,将平滑系数与对应的平滑对象相乘,可以得到处理后的平滑对象。公式中,α是预设参数,x为平滑对象的行为数量。
从上述公式中可以看出,平滑对象的行为数量越大,平滑系数越大。因为上述平滑对象均为比率类型的对象,按照比率的统计特性可知,用户计算平滑对象的行为数量越大,所得的平滑对象对应的比率越准确,如图5所示,图5为本发明实施例提供的一种平滑系数的曲线图。图中,横轴表示上述公式中的x的行为数量,纵轴为平滑系数。
可见,当x超过20之后,平滑系数稳定在0.8-1.0区间,此时可以认为平滑对象对应的比率较为准确,且平滑对象的行为数量越大,平滑系数值越大,比率越准确。
因此,所得平滑系数能够反映平滑对象的准确性。
由上可见,本发明实施例提供的方案中,通过使用平滑系数对平滑对象进行了平滑处理,使得平滑处理后,平滑系数较小的平滑对象的数值较小,使用平滑处理后的平滑对象进行广告召回时,平滑系数较小的平滑对象对计算结果的影响较小。另外,平滑对象的平滑系数能够反映平滑对象的准确度,平滑系数越小平滑对象的准确性越低,因此,本方案通过上述平滑处理减小了异常比率对象对评分值矩阵的稳定性和可靠性的不利影响,提高了广告召回的准确性。
本发明的一个实施例中,按照以下方式对缩放对象进行缩放处理,其中,上述缩放对象为:各广义用户对各广义广告的点击率、转化率或深层转化率:
在缩放对象的取值大于缩放对象对应的预设缩放阈值时,根据预设缩放阈值、预设的缩放区间长度和最大缩放对象,对缩放对象进行缩放处理。
其中,上述缩放处理用于减小上述缩放对象的极端值造成的影响。
可以对前述步骤S403和前述步骤S404中使用的、用于生成第一表示值和第二表示值的点击率、转化率、深层转化率等缩放对象进行上述缩放处理。在此情况下,可以使用缩放处理后的缩放对象执行步骤S403和步骤S404,生成第一表示值和第二表示值。
具体的,上述缩放处理可以按照如下公式进行:
Figure BDA0003721041000000191
其中,scale(cvr)为缩放后的缩放对象的取值,在本实施例中,以cvr为缩放对象,cvr表示转化率。当缩放对象为点击率和深层转化率时也可以按照如上公式进行缩放处理,处理方式类似,区别仅在于将公式中所有cvr替换为点击率和深层转化率,在此不再详述。
在公式中,cvrfloor为缩放对象对应的预设缩放阈值,公式中的if条件表示,若缩放对象的取值不大于预设缩放阈值,则不对缩放对象进行缩放。公式中的else条件表示,当缩放对象的取值大于预设缩放阈值的情况下,进行对应的缩放处理。其中,Cvrmax表示所有缩放对象中取值最大的缩放对象的取值。
由上可见,本发明实施例提供的方案中,在缩放对象的取值大于缩放对象对应的预设缩放阈值时,对缩放对象进行缩放处理,能够通过降低具有极端值的缩放对象的数值大小,减小该缩放对象对评分值矩阵的稳定性和可靠性不利的影响,提高了评分值矩阵的鲁棒性,进而提高了广告召回的准确性。
本发明的一个实施例中,参见步骤S405中计算广义用户针对广义广告的评分值的公式,各广义用户对各广义广告的点击率和转化率经过上述平滑处理和/或缩放处理后,可以生成新的第一表示值,并替换步骤S405中公式的CTCVRij,参与第一评分值的计算。
另外,上述计算eCPM的公式中,可以对用户i和广告j对应的CTR、CVR进行平滑处理和/或缩放处理,得到新的eCPM第二表示值,并采用新的eCPM第二表示值替换步骤S405计算广义用户针对广义广告的评分值的公式中的eCPMij,参与评分值的计算。
再有,上述计算deep_eCPM的公式中,可以对用户i和广告j对应的CTR、CVR和deep_CVR进行平滑处理和/或缩放处理,得到新的deep_eCPM第二表示值,并采用新的deep_eCPM第二表示值替换步骤S405计算广义用户针对广义广告的公式中的deep_eCPMij,参与评分值的计算。
下面通过图6对应用本发明实施例提供的广告召回方法的整体实施方式进行说明,图6为本发明实施例提供的一种广告召回方法的泳道图。
如图6预处理部分所示,本发明实施例按照如下方式实现预处理:
其中,特征工程用于提取各个广告和各个用户的特征,根据所得特征进行聚合,得到广义用户和广义广告,参见前述步骤S301-S302,此处不再详述;指标统计根据前述历史广告行为数据,得到用于计算各广义用户对各广义广告的评分值的指标,所得指标即前述实施例中的第一表示值,第二表示值,如图,第一表示值可以包括CTCVR,对应前述步骤S405中实施例公式中CTCVRij,即各广义用户对各广义广告的第一表示值;类似的,如图第二表示值可以包括eCPM,deep_eCPM,分别对应步骤S405中公式的eCPMij、deep_eCPMij
图中生成评分矩阵表示根据上述第一表示值、第二表示值形成评分值矩阵,即前述实施例中的原稀疏矩阵r。
如图6模型部分所示,图中执行流程的模型可以是前述图1所示广告召回***中模型层包含的召回模型。
上述模型能够根据预处理部分得到的评分矩阵进行ALS(Alternating LeastSquares,交替最小二乘法)矩阵分解,即前述步骤中对评分值矩阵使用最小二乘法进行矩阵分解,得到包含第一标识信息的广告矩阵和包含第二标识信息的用户矩阵。导出向量表示导出广告矩阵中包含的每一第一标识信息、用户矩阵中包含的每一第二标识信息对应的特征向量,在线召回部分的后续步骤中,所导出的第一标识信息和第二标识信息可以用于广告召回。
图中,离线参数调优用于确定进行ALS矩阵分解时所采用的模型的超参数。超参数可以包括前述实施例计算各表示值所采用的权重系数、计算平滑系数的预设参数等。
具体的,在线召回部分,按照以下方式进行广告召回:
可投订单过滤表示从平台所接收的各广告的订单中确定选择待召回广告时所采用的候选广告集合;向量在线推理表示根据候选广告集合中各候选广告的第一标识信息和目标用户的第二标识信息,确定目标用户对各候选广告的评分值,得到评分值后,可以执行如图排序的步骤,根据评分值大小对待召回的广告进行排序,排序后,按照排好的顺序选出顺位靠前的k个广告,即图中Topk广告,再进行后续模块和展示部分的步骤,包括在后续排序模块中,采用前述实施例提及的精细排序模型选出最终要展示给用户的广告,并向用户进行展示。
向用户展示广告后,用户对广告产生的新的广告行为数据可以记录在日志中,在此情况下,通过曝光日志,可以采用日志中记录的新的广告行为数据更新历史广告行为数据,并再次执行上述流程,再次执行上述流程时,更新后的历史广告行为数据可以用于得到更为准确的评分值。
本发明的一个实施例中,参见图7,提供了一种广告召回装置的结构示意图,包括:
标识信息获得模块701,用于获得各候选广告所属广义广告的第一标识信息和目标用户所属广义用户的第二标识信息;
评分值确定模块702,用于根据所述第一标识信息和第二标识信息,确定目标用户对各候选广告的评分值;
广告选择模块703,用于根据所确定的评分值,从候选广告集合中选择待召回的广告集合;
本发明实施例提供的方案中,根据各候选广告所属广义广告的第一标识信息和目标用户所属广义用户的第二标识信息,确定目标用户对各候选广告的评分值,并根据所确定的评分值选择待召回的广告,无需生成海量用户和广告的标识信息并使用所有用户和广告的标识信息选择待召回的广告,降低了计算复杂度。
本发明的一个实施例中,参见图8,提供了第一种标识信息生成装置的结构示意图,包括:
广义用户获得模块801,用于根据各用户的用户特征,对用户进行聚合,得到不同的广义用户;
广义广告获得模块802,用于根据各广告的广告特征,对广告进行聚合,得到不同的广义广告;
评分值生成模块803,用于根据各用户对已曝光的广告产生的历史广告行为数据,生成各用户所属的广义用户对各广告所属的广义广告的评分值;
标识信息生成模块804,用于根据所生成的评分值,生成各广义广告的第一标识信息和各广义用户的第二标识信息。
在此情况下,每一次选择待召回的广告时,都可以将广义广告和广义用户作为基准进行广告选择。当存在对多个用户进行多次广告召回的需求时,若多个用户属于同一广义用户,则每次进行广告召回时,均可以采用已存储的该广义用户的第二标识信息计算上述评分值,而不需要重新确定该广义用户的新的标识信息,也就是同一广义用户的目标用户对应的第二标识信息可以复用,广义广告的第一标识信息同理也可以复用,这降低了标识信息的存储压力,也降低了在线计算复杂度,提高广告召回的速度。
本发明的一个实施例中,参见图9,提供了第二种标识信息生成装置的结构示意图,包括:
广义用户获得模块901,用于根据各用户的用户特征,对用户进行聚合,得到不同的广义用户;
广义广告获得模块902,用于根据各广告的广告特征,对广告进行聚合,得到不同的广义广告;
第一表示值获得单元903,用于根据各用户对已曝光的广告产生的历史广告行为数据,获得表征各广义用户对各广义广告偏好程度的第一表示值;
第二表示值获得单元904,用于根据各用户对已曝光的广告产生的历史广告行为数据,获得表征各广义用户下各广义广告的潜在变现价值的第二表示值;
评分值生成单元905,用于根据表征各广义用户对各广义广告偏好程度的第一表示值和表征各广义用户下各广义广告的潜在变现价值的第二表示值,生成各广义用户针对各广义广告的评分值。
标识信息生成模块906,用于根据所获得的评分值,生成各广义广告的第一标识信息和各广义用户的第二标识信息。
由上可见,本发明实施例提供的方案中,各广义用户针对各广义广告的评分值根据第一表示值和第二表示值生成,使得生成的评分值能够反映各广义用户对各广义广告的偏好程度的情况下,也能够反映各广义用户下各广义广告对信息平台所产生的价值,提高了评分值的准确性。
本发明的一个实施例中,所述第一表示值获得单元903,具体用于根据各用户对已曝光的广告产生的历史广告行为数据,获得各广义用户对各广义广告的点击率和转化率;计算各广义用户对各广义广告的点击率和转化率的乘积,作为表征各广义用户对各广义广告偏好程度的第一表示值。
由上可见,本发明实施例提供的方案中,第一表示值可以基于统计历史广告行为数据中不同产生响应的比率获得。不同广义用户对广义广告的响应次数的差异可能较大,而产生响应的比率的数值稳定在固定的数据区间内。与使用响应次数计算第一表示值相比,本发明实施例中采用波动较小的比率数据计算得到的第一表示值受到数值波动的影响较小,能够更为准确地表征各广义用户对各广义广告的偏好程度。
本发明的一个实施例中,所述第二表示值获得单元904,具体用于根据各用户对已曝光的广告产生的历史广告行为数据,获得各广义用户对各广义广告的点击率和转化率,并结合广义广告的出价方式从各广义用户对各广义广告的点击率、转化率和第一出价中确定的信息,获得表征各广义用户下各广义广告对信息平台所产生价值的第二表示值,其中,所述第一出价为:广告主为各广义广告设置的与前置转化目标对应的出价;和/或根据各用户对已曝光的广告产生的历史广告行为数据,获得各广义用户下各广义广告的所述前置转化目标对应的前置转化数和后置转化目标对应的后置转化数,采用各广义用户对各广义广告的点击率、转化率、第二出价和深层转化率,获得表征各广义用户下各广义广告对信息平台所产生价值的第二表示值,其中,所述第二出价为:广告主为各广义广告设置的与所述后置转化目标对应的出价,每一广义用户对每一广义广告的深层转化率为:该广义用户下该广义广告对应的后置转化数与前置转化数之商。
由上可见,本发明实施例提供的方案中,根据用户的历史广告行为数据得到的第二表示值可以基于多种数据获得,并且第二表示值可以根据转化目标的不同设置不同的计算方式,提高了第二表示值反映广告出价价值的准确性。
本发明的一个实施例中,所述装置还包括:
平滑处理模块,用于按照以下方式对平滑对象进行平滑处理,其中,所述平滑对象为:各广义用户对各广义广告的点击率、转化率或深层转化率:
根据用户对广告产生的历史广告行为数据,统计用于计算所述平滑对象的行为数量;根据所述行为数量和所述平滑对象对应的预设参数,计算平滑系数;采用所述平滑系数对所述平滑对象进行平滑处理。
由上可见,本发明实施例提供的方案中,通过使用平滑系数对平滑对象进行了平滑处理,使得平滑处理后,平滑系数较小的平滑对象的数值较小,使用平滑处理后的平滑对象进行广告召回时,平滑系数较小的平滑对象对计算结果的影响较小。另外,平滑对象的平滑系数能够反映平滑对象的准确度,平滑系数越小平滑对象的准确性越低,因此,本方案通过上述平滑处理减小了异常比率对象对评分值矩阵的稳定性和可靠性的不利影响,提高了广告召回的准确性。
本发明的一个实施例中,所述装置还包括:
缩放处理模块,用于按照以下方式对缩放对象进行缩放处理,其中,所述缩放对象为:各广义用户对各广义广告的点击率、转化率或深层转化率:
在所述缩放对象的取值大于所述缩放对象对应的预设缩放阈值时,根据所述预设缩放阈值、预设的缩放区间长度和最大缩放对象,对所述缩放对象进行缩放处理。
由上可见,本发明实施例提供的方案中,在缩放对象的取值大于缩放对象对应的预设缩放阈值时,对缩放对象进行缩放处理,能够通过降低具有极端值的缩放对象的数值大小,减小该缩放对象对评分值矩阵的稳定性和可靠性不利的影响,提高了评分值矩阵的鲁棒性,进而提高了广告召回的准确性。
本发明的一个实施例中,所述评分值确定模块702,具体用于计算所述第一标识信息对应的向量与所述第二标识信息对应的向量的内积,作为表征所述目标用户对各候选广告对应的广义广告响应程度的评分值。
将用户矩阵中对应该广义用户位置的第二标识信息和广告矩阵中对应该广义广告位置的第一标识信息做内积,得到评分值,并可以根据评分值选择符合广义用户中包含的用户的偏好程度的广告。
本发明实施例还提供了一种电子设备,如图10所示,包括处理器1001、通信接口1002、存储器1003和通信总线1004,其中,处理器1001,通信接口1002,存储器1003通过通信总线1004完成相互间的通信,
存储器1003,用于存放计算机程序;
处理器1001,用于执行存储器1003上所存放的程序时,实现上述任一所述的广告召回方法步骤:
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例中任一所述的广告召回方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的广告召回方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质以及计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (11)

1.一种广告召回方法,其特征在于,所述方法包括:
获得各候选广告所属广义广告的第一标识信息和目标用户所属广义用户的第二标识信息;
根据所述第一标识信息和第二标识信息,确定目标用户对各候选广告的评分值;
根据所确定的评分值,从候选广告集合中选择待召回的广告集合。
2.根据权利要求1所述的方法,其特征在于,按照以下方式生成各广义广告的第一标识信息和各广义用户的第二标识信息:
根据各用户的用户特征,对用户进行聚合,得到不同的广义用户;
根据各广告的广告特征,对广告进行聚合,得到不同的广义广告;
根据各用户对已曝光的广告产生的历史广告行为数据,生成各用户所属的广义用户对各广告所属的广义广告的评分值;
根据所生成的评分值,生成各广义广告的第一标识信息和各广义用户的第二标识信息。
3.根据权利要求2所述的方法,其特征在于,所述根据各用户对已曝光的广告产生的历史广告行为数据,生成各用户所属的广义用户对各广告所属的广义广告的评分值,包括:
根据各用户对已曝光的广告产生的历史广告行为数据,获得表征各广义用户对各广义广告偏好程度的第一表示值;
根据各用户对已曝光的广告产生的历史广告行为数据,获得表征各广义用户下各广义广告的潜在变现价值的第二表示值;
根据表征各广义用户对各广义广告偏好程度的第一表示值和表征各广义用户下各广义广告的潜在变现价值的第二表示值,生成各广义用户针对各广义广告的评分值。
4.根据权利要求3所述的方法,其特征在于,所述根据用户对已曝光的广告产生的历史广告行为数据,获得表征各广义用户对各广义广告偏好程度的第一表示值,包括:
根据各用户对已曝光的广告产生的历史广告行为数据,获得各广义用户对各广义广告的点击率和转化率;
计算各广义用户对各广义广告的点击率和转化率的乘积,作为表征各广义用户对各广义广告偏好程度的第一表示值。
5.根据权利要求3所述的方法,其特征在于,所述根据各用户对已曝光的广告产生的历史广告行为数据,获得表征各广义用户下各广义广告的潜在变现价值的第二表示值,包括:
根据各用户对已曝光的广告产生的历史广告行为数据,获得各广义用户对各广义广告的点击率和转化率,并结合广义广告的出价方式从各广义用户对各广义广告的点击率、转化率和第一出价中确定的信息,获得表征各广义用户下各广义广告对信息平台所产生价值的第二表示值,其中,所述第一出价为:广告主为各广义广告设置的与前置转化目标对应的出价;
和/或
根据各用户对已曝光的广告产生的历史广告行为数据,获得各广义用户下各广义广告的所述前置转化目标对应的前置转化数和后置转化目标对应的后置转化数,采用各广义用户对各广义广告的点击率、转化率、第二出价和深层转化率,获得表征各广义用户下各广义广告对信息平台所产生价值的第二表示值,其中,所述第二出价为:广告主为各广义广告设置的与所述后置转化目标对应的出价,每一广义用户对每一广义广告的深层转化率为:该广义用户下该广义广告对应的后置转化数与前置转化数之商。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
按照以下方式对平滑对象进行平滑处理,其中,所述平滑对象为:各广义用户对各广义广告的点击率、转化率或深层转化率:
根据用户对广告产生的历史广告行为数据,统计用于计算所述平滑对象的行为数量;
根据所述行为数量和所述平滑对象对应的预设参数,计算平滑系数;
采用所述平滑系数对所述平滑对象进行平滑处理。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
按照以下方式对缩放对象进行缩放处理,其中,所述缩放对象为:各广义用户对各广义广告的点击率、转化率或深层转化率:
在所述缩放对象的取值大于所述缩放对象对应的预设缩放阈值时,根据所述预设缩放阈值、预设的缩放区间长度和最大缩放对象,对所述缩放对象进行缩放处理。
8.根据权利要求1-7中任一项所述的方法,其特征在于,所述根据所述第一标识信息和第二标识信息,确定目标用户对各候选广告的评分值,包括:
计算所述第一标识信息对应的向量与所述第二标识信息对应的向量的内积,作为表征所述目标用户对各候选广告对应的广义广告响应程度的评分值。
9.一种广告召回装置,其特征在于,所述装置包括:
标识信息获得模块,用于获得各候选广告所属广义广告的第一标识信息和目标用户所属广义用户的第二标识信息;
评分值确定模块,用于根据所述第一标识信息和第二标识信息,确定目标用户对各候选广告的评分值;
广告选择模块,用于根据所确定的评分值,从候选广告集合中选择待召回的广告集合。
10.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-8任一所述的方法步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-8任一所述的方法步骤。
CN202210750803.3A 2022-06-29 2022-06-29 一种广告召回方法、装置、设备以及存储介质 Pending CN115204943A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210750803.3A CN115204943A (zh) 2022-06-29 2022-06-29 一种广告召回方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210750803.3A CN115204943A (zh) 2022-06-29 2022-06-29 一种广告召回方法、装置、设备以及存储介质

Publications (1)

Publication Number Publication Date
CN115204943A true CN115204943A (zh) 2022-10-18

Family

ID=83579000

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210750803.3A Pending CN115204943A (zh) 2022-06-29 2022-06-29 一种广告召回方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN115204943A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115618121A (zh) * 2022-12-20 2023-01-17 云数互联(武汉)信息技术有限公司 个性化资讯推荐方法、装置、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115618121A (zh) * 2022-12-20 2023-01-17 云数互联(武汉)信息技术有限公司 个性化资讯推荐方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
EP3862893A1 (en) Recommendation model training method, recommendation method, device, and computer-readable medium
US8732015B1 (en) Social media pricing engine
US8543518B2 (en) Deducing shadow user profiles for ad campaigns
JP5974186B2 (ja) トラフィックソースのための広告の選択
US20120150626A1 (en) System and Method for Automated Recommendation of Advertisement Targeting Attributes
US20160132935A1 (en) Systems, methods, and apparatus for flexible extension of an audience segment
US20190197398A1 (en) Embedded learning for response prediction
CN111798280B (zh) 多媒体信息推荐方法、装置和设备及存储介质
CN104951460B (zh) 基于关键词聚类的排名参量值确定方法及装置
JP5507607B2 (ja) コンテンツ提供装置、低ランク近似行列生成装置、コンテンツ提供方法、低ランク近似行列生成方法およびプログラム
CN113744016B (zh) 一种对象推荐方法及装置、设备、存储介质
CN112508256B (zh) 一种基于众包的用户需求主动预测方法及***
US20190034783A1 (en) Deep neural networks for network embedding
WO2022081267A1 (en) Product evaluation system and method of use
EP3362919A1 (en) Apparatus and method for generating dynamic similarity audiences
CN112288471A (zh) 一种基于用户历史行为序列的广告点击率预测方法
CN113761348A (zh) 一种信息推荐方法、装置、电子设备和存储介质
CN111429214B (zh) 一种基于交易数据的买卖双方匹配方法及装置
Wang et al. Probabilistic models for ad viewability prediction on the web
US20150302467A1 (en) System and method for real time selection of an optimal offer out of several competitive offers based on context
CN115204943A (zh) 一种广告召回方法、装置、设备以及存储介质
CN108537599B (zh) 基于关键词聚合的查询反馈方法、装置以及存储介质
KR102585895B1 (ko) 오픈마켓에서의 키워드 마케팅 효율 증가를 위한 방법 및 시스템
CN113822698A (zh) 内容推送方法、装置、计算机设备和存储介质
US10275795B1 (en) System and method for ranking, allocation and pricing of content recommendations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination