CN112633931A - 点击率预测方法、装置、电子设备及介质 - Google Patents

点击率预测方法、装置、电子设备及介质 Download PDF

Info

Publication number
CN112633931A
CN112633931A CN202011576756.2A CN202011576756A CN112633931A CN 112633931 A CN112633931 A CN 112633931A CN 202011576756 A CN202011576756 A CN 202011576756A CN 112633931 A CN112633931 A CN 112633931A
Authority
CN
China
Prior art keywords
sample data
advertisement
feature
features
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011576756.2A
Other languages
English (en)
Inventor
练质彬
陈健生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Boguan Information Technology Co Ltd
Original Assignee
Guangzhou Boguan Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Boguan Information Technology Co Ltd filed Critical Guangzhou Boguan Information Technology Co Ltd
Priority to CN202011576756.2A priority Critical patent/CN112633931A/zh
Publication of CN112633931A publication Critical patent/CN112633931A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开实施例提供了一种点击率预测方法、点击率预测装置、电子设备及计算机可读介质;涉及大数据处理技术领域。该点击率预测方法包括:采集广告曝光数据作为样本数据,根据所述广告曝光数据中包含的点击字段确定所述样本数据的标签;提取所述样本数据的显式交互特征以及隐式交互特征,基于所述样本数据的标签,结合所述显式交互特征以及隐式交互特征获取点击率预测模型;通过所述点击率预测模型预测待投放广告的点击率,并根据所述点击率将所述待投放广告进行投放。本公开实施例的技术方案能够从不同的角度获得广告曝光数据中更丰富的特征,从而提高点击率预测模型的精确性。

Description

点击率预测方法、装置、电子设备及介质
技术领域
本公开涉及大数据处理技术领域,具体而言,涉及一种点击率预测方法、点击率预测装置、电子设备和计算机可读介质。
背景技术
在线广告的出现使得传统的电视、报纸等广告行业向着直播、短视频等新兴互联网形式发展,因此积累了大量的行为数据,使得从数据中挖掘细致的用户兴趣成为可能。面对众多的用户和广告,如何将某个在线广告推送到合适的用户面前,以实现点击次数的最大化是在线广告需要研究的核心问题。
广告点击率预估技术可以预测用户对广告可能点击的概率,一方面可以为用户推送感兴趣的广告,为用户减少搜索的时间;另一方面也可以为广告主提供有价值的参考信息,提高广告的效果。特征在广告预测中起着核心作用,输入特征通常是稀疏和高维的,由于使用原始特征很少能够获取最佳结果,有效的预测通常依赖于高阶组合特征,例如,年轻的职场女性会对化妆品类的广告更感兴趣,在校男生会对体育类广告更有兴趣等等。因此数据科学家会花费大量时间和精力对原始特征进行手工交互,以便获得最佳的预测结果。传统的手工特征的生成成本较大,需要数据科学家拥有丰富的经验,而且交互特在并未包括一些隐含的、看不见的特征,导致有效的交互特征没有被充分提取。近年来,机器学习和深度学习在自然语言处理、图像处理等各个领域取得了惊人的成就,使得业界开始研究和探索如何将机器学习和深度学习技术应用在广告点击率预估场景。
当前众多的模型将因子分解机作为嵌入特征的生成,而因子分解机只为每个特征域维持一个特征向量,会损失过多信息,不能充分表达特征,例如,男性与广告品类进行交互时、男性与年龄进行交互时所代表的含义是不同的,但因子分解机却当作是一样的,从而影响模型的预测精度。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开实施例的目的在于提供一种点击率预测方法、一种点击率预测装置、电子设备和计算机可读介质,通过提取显式交互特征以及隐式交互特征,能够从不同的角度获得广告曝光数据中更丰富的特征,从而提高点击率预测模型的精确性。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开实施例的第一方面,提供了一种点击率预测方法,包括:采集广告曝光数据作为样本数据,将所述广告曝光数据中包含的目标特征作为所述样本数据的标签;其中,所述广告曝光数据包括与广告对应的多个特征,所述目标特征为所述多个特征中的其中一个;所述标签用于表征所述广告是否被点击;对所述样本数据中的多个特征进行显式的特征交互,以获得显示交互特征,并对所述样本数据中的多个特征进行隐式的特征交互,以获得隐式交互特征;基于所述样本数据的标签,结合所述显式交互特征以及隐式交互特征获取点击率预测模型;其中,所述点击率预测模型用于预测待投放广告的点击率,所述点击率用于确定是否对所述待投放广告进行投放。
在本公开的示例性实施方式中,所述对所述样本数据中的多个特征进行显式的特征交互,以获得显示交互特征,并对所述样本数据中的多个特征进行隐式的特征交互,以获得隐式交互特征包括:生成所述样本数据多个特征域的嵌入向量;对不同特征域的所述嵌入向量进行外积运算,获取显式交互特征;对不同特征域的所述嵌入向量进行点积运算,获得隐式交互特征。
在本公开的示例性实施方式中,所述嵌入向量包括第一嵌入向量以及第二嵌入向量;所述生成所述样本数据多个特征域的嵌入向量包括:通过因子分解机生成所述样本数据多个特征域的第一嵌入向量;通过场感知分解机获得所述样本数据多个特征域的第二嵌入向量。
在本公开的示例性实施方式中,所述结合所述显式交互特征以及隐式交互特征获取点击率预测模型包括:通过注意力机制确定所述显式交互特征的第一有效权重以及隐式交互特征的第二有效权重;将所述显示交互特征、隐式交互特征以及所述第一有效权重和所述第二有效权重输入所述点击率预测模型的输出层,其中,所述输出层取值范围为0到1。
在本公开的示例性实施方式中,所述采集广告曝光数据作为样本数据之后,还包括:对所述样本数据进行编码,以将所述样本数据转化为稀疏特征向量,将所述稀疏特征向量作为所述样本数据的嵌入向量。
在本公开的示例性实施方式中,所述采集广告曝光数据作为样本数据包括:根据所述广告曝光数据的时间戳提取样本数据,以及测试数据,其中,所述样本数据的时间戳在所述测试数据之前;所述测试数据用于在获得点击率预测模型之后对所述点击率预测模型进行测试。
在本公开的示例性实施方式中,所述点击率用于确定是否对所述待投放广告进行投放包括:若所述点击率预测模型对所述待投放广告输出的点击率超过预设阈值,则对所述待投放广告进行投放,其中,所述预设阈值的取值范围为0到1。
根据本公开实施例的第二方面,提供了一种点击率预测装置,该装置可以包括数据获取模块、模型获取模块以及广告预测模块。
其中,数据获取模块,用于采集广告曝光数据作为样本数据,将所述广告曝光数据中包含的目标特征作为所述样本数据的标签;其中,所述广告曝光数据包括与广告对应的多个特征,所述目标特征为所述多个特征中的其中一个;所述标签用于表征所述广告是否被点击;特征提取模块,用于对所述样本数据中的多个特征进行显式的特征交互,以获得显示交互特征,并对所述样本数据中的多个特征进行隐式的特征交互,以获得隐式交互特征;模型获取模块,用于基于所述样本数据的标签,结合所述显式交互特征以及隐式交互特征获取点击率预测模型;其中,所述点击率预测模型用于预测待投放广告的点击率,所述点击率用于确定是否对所述待投放广告进行投放。
在本公开的示例性实施方式中,所述特征提取模块可以包括嵌入向量生成单元、显式交互特征获取单元、隐式交互特征获取单元。
其中,嵌入向量生成单元,用于生成所述样本数据多个特征域的嵌入向量;显式交互特征获取单元,用于对不同特征域的所述嵌入向量进行外积运算,获取显式交互特征;隐式交互特征获取单元,用于对不同特征域的所述嵌入向量进行点积运算,获得隐式交互特征。
在本公开的示例性实施方式中,嵌入向量生成单元可以被配置为:通过因子分解机生成所述样本数据多个特征域的第一嵌入向量;通过场感知分解机获得所述样本数据多个特征域的第二嵌入向量,所述嵌入向量包括第一嵌入向量以及第二嵌入向量。
在本公开的示例性实施方式中,所述模型获取模块可以包括注意力机制单元,以及输出层单元。
其中,注意力机制单元,用于通过注意力机制确定所述显式交互特征的第一有效权重以及隐式交互特征的第二有效权重;输出层单元,用于将所述显示交互特征、隐式交互特征以及所述第一有效权重和所述第二有效权重输入所述点击率预测模型的输出层,其中,所述输出层的取值范围为0到1。
在本公开的示例性实施方式中,该点击率预测装置还包括样本编码模块,用于对所述样本数据进行编码,以将所述样本数据转化为稀疏特征向量,将所述稀疏特征向量作为所述样本数据的嵌入向量。
在本公开的示例性实施方式中,数据获取模块可以被配置为:根据所述广告曝光数据的时间戳提取样本数据,以及测试数据,其中,所述样本数据的时间戳在所述测试数据之前;通过所述测试数据对所述点击率预测模型进行测试。
在本公开的示例性实施方式中,数据获取模块可以被配置为:若所述点击率预测模型对所述待投放广告输出的点击率超过预设阈值,则对所述待投放广告进行投放,其中,所述预设阈值的取值范围为0到1。
根据本公开实施例的第三方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中第一方面所述的点击率预测方法。
根据本公开实施例的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中第一方面所述的点击率预测方法。
在本公开实施例所提供的点击率预测方法、点击率预测装置、电子设备和计算机可读介质,通过广告曝光数据中包含的目标特征作为样本数据的标签,可以避免人工标注,节省人力时间成本;并且提取样本数据的显示交互特征以及隐式交互特征,通过显式和隐式相结合的方法可以充分地考虑到特征之间的关系,从而获得更加有效的特征,提高模型的精确性;此外,无需人工提取交互特征,可以提高特征组合的维度和粒度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示意性示出了应用于本公开实施例的点击率预测方法或点击率预测装置的示例性***架构示意图;
图2示意性示出了根据本公开的一实施例的点击率预测方法的流程图;
图3示意性示出了根据本公开的一实施例中的点击率预测模型的结构示意图;
图4示意性示出了根据本公开的另一实施例中点击率预测方法的流程图;
图5示意性示出了根据本公开的一实施例的点击率预测装置的框图;
图6示出了适于用来实现本公开实施例的电子设备的计算机***的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
本说明书中,用语“一个”、“一”、“该”、“所述”和“至少一个”用以表示存在一个或多个要素/组成部分/等;用语“包含”、“包括”和“具有”用以表示开放式的包括在内的意思,并且是指除了列出的要素/组成部分/等之外还可存在另外的要素/组成部分/等;用语“第一”、“第二”、“第三”等仅作为标记使用,不是对其对象的数量限制。
下面结合附图对本公开示例实施方式进行详细说明。
图1示出了可以应用于本公开实施例的点击率预测方法或点击率预测装置的示例性应用环境的***架构的示意图。
如图1所示,***架构100可以包括终端设备101、102、103中的一个或多个,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。其中,终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于台式计算机、便携式计算机、智能手机和平板电脑、可穿戴设备、虚拟现实设备、智能家居等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所进行操作的装置提供支持的后台管理服务器。后台管理服务器可以对接收到的请求等数据进行分析等处理,并将处理结果反馈给终端设备。
举例而言,服务器105可例如采集广告曝光数据作为样本数据,根据所述广告曝光数据中包含的目标特征确定所述样本数据的标签;服务器105可例如对所述样本数据中的多个特征进行显式的特征交互,以获得显示交互特征,并对所述样本数据中的多个特征进行隐式的特征交互,以获得隐式交互特征,结合显式交互特征以及隐式交互特征获取点击率预测模型;获取待投放广告,通过点击率预测模型预测待投放广告的点击率,并根据点击率将待投放广告投放至客户端101。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
本公开实施例所提供的点击率预测方法一般由服务器105执行,相应地,点击率预测装置一般设置于服务器105中。但本领域技术人员容易理解的是,本公开实施例所提供的点击率预测方法也可以由终端设备101、102、103执行,相应的,点击率预测装置也可以设置于终端设备101、102、103中,本示例性实施例中对此不做特殊限定。
基于此,本公开实施例提供一种点击率预测方法的技术方案,可以从广告曝光数据中提取显式交互特征以及隐式交互特征,从而获得更加丰富有效的组合特征,提高点击率预测模型的精确性。
如图2所示,本公开实施例提供的一种点击率预测方法可以包括步骤S21、步骤S22以及步骤S23,其中,步骤S21、S22以及S23的执行主体可以是服务器105或者终端101、102、103,并且各个步骤可以由相同的执行主体来执行,也可以分别由不同的执行主体来执行。
在步骤S21中,采集广告曝光数据作为样本数据,将所述广告曝光数据中包含的目标特征作为所述样本数据的标签;其中,所述广告曝光数据包括与广告对应的多个特征,所述目标特征为所述多个特征中的其中一个;所述标签用于表征所述广告是否被点击。
通过采集客户端的日志记录可以获取广告曝光数据,日志记录不仅能够对客户端展示的广告以及用户对广告的点击操作进行记录,还可以精确地记录广告展示的时间戳。因此,广告曝光数据中可以包括用户的信息以及广告的信息,例如用户id、广告id等。并且,利用获取到的用户信息以及广告的信息可以进一步从数据库中查询其他信息,例如用户的性别、年龄、职业、用户注册时间等;再例如、广告大小、广告类型、广告主、广告对应的投放群体等等。广告曝光数据中还可以包括广告位的信息和时间戳,例如广告展示的APP等。此外,广告曝光数据中还可以包括其他字段,例如展示广告所用的网络类型、客户端的信息等等,本实施方式对此不做特殊限定。
广告曝光数据中可以包括用于表征用户是否点击广告的点击字段,该点击字段可以作为目标特征,通过该点击字段的值可以区分用户是否点击广告。例如,当一条广告曝光给用户时在用户对应的客户端即会记录一条广告曝光数据,如果用户点击了该广告,则该广告曝光数据的点击字段可以为1,如果用户没有点击该广告,则广告曝光数据的点击字段可以为0。利用广告曝光数据中的该点击字段可以确定每一条广告曝光数据的标签,例如,点击字段的值为1,则该广告曝光数据的标签为1,点击字段的值为2,则该广告曝光数据的标签为2。
采集各个客户端上的广告曝光数据可以作为样本数据,用于对点击率预测模型进行训练。并且,获取到样本数据后,还可以对原始的样本数据进行数据处理。举例而言,可以对数据进行清洗,消除无用的数据,例如,去除异常值,如去除用户年龄大于150岁的数据等;对缺失值进行填充,如用户性别缺失的按照平均值仅进行填充,或者统一用特殊值填充缺失的字段等等;将数据值归一化到0和1之间,保持样本数据中各个字段的权重一致等。
在示例性实施方式中,对原始的样本数据可以进行编码,从而将样本数据转化为向量。例如,对于样本数据中的“性别”字段,可以分为男、女两种情况,若字段的值为男,则其可以对应编码为“10”,若为女,则可以对应编码为“01”。示例性的,编码方式可以为独热编码(one-hot编码)。稀疏特征向量是向量的稀疏表示,但特征域较大时,采用向量的稀疏表示可以大大节省空间。例如,对于特征v=[0,0,0,0,1,0,3,0,0,0],其稀疏表示为(10,[4,6],[1,3])。
示例性实施方式中,根据广告曝光数据的时间戳可以将采集的广告曝光数据划分为样本数据以及测试数据。为了模拟实际的广告投放场景,可以将广告曝光数据按照时间戳的时间顺序进行排序,进而提取一定比例的时间靠前的数据作为样本数据。与样本数据相比,测试数据的时间戳较靠后,也就是说,测试数据的时间戳比样本数据更接近于当前时间。举例来说,将所有的广告曝光数据按照时间排序后,时间戳的时间范围为2000年1月1号至2000年10月10号,则可以从2000年9月1号进行划分,在2000年9月1号之前的数据作为样本数据,之后的数据作为测试数据,从而与实际的预测情况保持一致。示例性的,样本数据与测试数据可以按照一定的比例划分,例如该比例可以为9:1,也可以为8:1、7.6:1等等,本实施方式不限于此。
其中,测试数据可以在获得点击率预测模型之后,对点击率预测模型进行测试。举例来说,在得到点击率预测模型之后,可以将测试数据作为输入,通过点击率预测模型确定测试数据对应的预测结果,然后通过测试数据的标签判断模型预测结果是否正确。如果模型对测试数据的预测结果与测试数据的标签相同,则模型预测正确;如果预测结果与标签不同,则可以确定模型预测错误。进而,通过测试数据可以计算点击率预测模型的预测准确率;或者利用预测结果与标签不一致的测试数据来对点击率预测模型进行进一步的优化等。
在步骤S22中,对所述样本数据中的多个特征进行显式的特征交互,以获得显示交互特征,并对所述样本数据中的多个特征进行隐式的特征交互,以获得隐式交互特征。
根据样本数据的标签可以确定正样本和负样本,例如标签为1时表征用户点击了广告,则样本数据可以作为正样本,标签为0时表征用户没有点击广告,则样本数据可以作为负样本。通过样本数据的不同标签可以确定每一类标签对应的特征,标签可以作为点击率预测模型的输出,而样本数据则作为输入,从而使得点击率预测模型学习输入与输出、标签与特征之间的映射关系,确定模型的各个参数。该点击率预测模型可以包括显式交互特征部分以及隐式交互特征部分。显式交互特征部分可以显式的对样本数据进行特征间交互,而隐式交互特征部分则负责隐式的对样本数据进行隐式的特征交互。其中,显式交互特征以及隐式交互特征指的是通过不同特征域的特征互相交叉组合而得到的特征。例如,样本数据有三个特征域,分别为:性别、年龄、职业,则互相组合可以得到性格年龄特征、性格职业特征、年龄职业特征。其中,特征域可以理解为数据类型相同的特征的集合,例如年龄特征域中是正整数集合、性别域中是“男”、“女”字符的集合等等。具体的,提取显式交互特征以及隐式交互特征的方法可以包括:生成样本数据多个特征域的嵌入向量;对嵌入向量进行外积运算获得显式交互特征;对嵌入向量进行点积运算获得隐式交互特征。
首先需要生成样本数据的嵌入向量,以便于对样本数据的特征进行交互。将样本数据编码之后的稀疏特征向量可以直接作为嵌入向量。或者将样本数据转换为稀疏特征向量之后,可以通过FM(Factorization Machine,因子分解机)可以来生成嵌入向量,FM可以为每个特征生成一维的嵌入向量,则特征域的数量与生成的嵌入向量的总数相同;也可以通过FFM(场感知分解机)来为每个特征域生成多维的嵌入向量。本实施方式中,样本数据在通过输入层转化为向量之后,可以分别通过FM生成第一嵌入向量,通过FFM生成第二嵌入向量,将第一嵌入向量以及第二嵌入向量共同作为嵌入向量。
然后对嵌入向量进行外积运算,可以获得显式交互特征。例如,有一个特征域的嵌入向量为(a1,b1,c1)、另一特征域的嵌入向量为(a2,b2,c2),则交互的形式为(w*(a1*a2,b1*b2,c1*c2)),其中w为点击率预测模型可学习的参数。对于隐式交互特征而言,以生成的嵌入向量为基础,使得嵌入向量以隐式的方式进行不同特征域特征之间的两两交互,所以特征间采用点积运算的方式进行交叉。点积运算指的是以向量中的各个点为单位,在点的维度上进行特征提取,也就是说,通过参数学习向量中每个点的特征,例如,有两个嵌入向量分别为(a1,b1,c1)、(a2,b2,c2),则交互的形式为(w1*a1*a2,w2*b1*b2,w3*c1*c2),其中,w1、w2、w3为点击预测模型可学习的参数。因此,显式交互特征对于点击率预测模型而言,具有良好的可解释性,而隐式交互特征则能够提取数据背后隐含的信息,从而可以提高点击率预测模型的精确性。
在步骤S23中,基于所述样本数据的标签,结合所述显式交互特征以及隐式交互特征获取点击率预测模型;其中,所述点击率预测模型用于预测待投放广告的点击率,所述点击率用于确定是否对所述待投放广告进行投放。
在示例性实施方式中,该点击率预测模型的结构可以如图3所示,则生成显式交互特征以及隐式交互特征的过程如下:
参考图3所示,样本数据通过输入层310转化为特征向量之后,可以同时输出到FM320以及FFM 330中,利用320的FM结构将特征向量转化为第一嵌入向量,利用330的FFM结构将特征向量转化为第二嵌入向量。由于生成嵌入向量FM和FFM都带有一阶线性部分,为了避免冗余,可以将一阶线性部分独立出来,以对模型进行优化。通过线性部分370来统一提取特征向量中的线性部分。线性部分的公式可以为:
Figure BDA0002864400980000111
其中,m为一条样本数据对应的特征域数量,wi表示输入xi对应的参数,b为偏置参数。
然后,利用显式交互特征部分340与FM 320相结合可以生成显式交互特征。具体的,显式交互特征部分可以为CIN结构,以FM生成的第一嵌入向量为基础,作为CIN的输入,CIN结构中包括多个卷积层,每一层都可以与输入的第一嵌入向量进行交互。例如,FM生成的第一嵌入向量表示为X0,则X0∈Rm*k,其中,m为特征域数量,k为嵌入向量维度。获取到原始输入的X0后,将CIN结构生成的中间层与X0进行向量级别的外积操作,公式如下:
Figure BDA0002864400980000121
其中,
Figure BDA0002864400980000122
表示Xi中第j个维度为k的嵌入向量,
Figure BDA0002864400980000123
为原始特征X0中的第l个维度为k的嵌入向量,·表示为外积。由此可以生成一个三维的特征图,在此特征图上通过多个一维卷积核可以提取多个角度的丰富的显式交互特征,如下式所示:
Figure BDA0002864400980000124
其中,Hi表示第i层的卷积核数量,W表示卷积核的参数,
Figure BDA0002864400980000125
表示第i层对应的第j维嵌入向量,
Figure BDA0002864400980000126
表示原始特征对应的第l维嵌入向量。再进行sum pooling最大池化操作将向量压缩为一维向量,如下式所示:
Figure BDA0002864400980000127
其中,k表示嵌入向量的交互维度,i+1表示CIN结构的第i+1层,j表示第j个卷积核生成的输出。最后将每层生成的一维向量拼接起来作为显式交互特征部分的输出,显式交互特征部分的输出表示为P。
利用FFM 330提取的第二嵌入向量输入到隐式交互特征部分350中,隐式交互特征部分350可以为DNN结构。通过DNN结构350对输入的第二嵌入向量进行处理生成隐式交互特征。示例性的,将FFM生成的二维嵌入向量输出至DNN结构中进行特征间更高阶的交互,DNN可以采用三层全连接层,激活函数可以为线性整流函数relu,公式如下:
l=f(W3f(W2f(W1I+b1)+b2)+b3),
其中,f表示relu激活函数,W1,W2,W3表示全连接权重,b1,b2,b3为偏置参数。
由于通过CIN以及DNN部分提取了嵌入向量的显式交互特征以及隐式交互特征,获得了丰富的组合特征,但并未对生成的高阶的组合特征进行有效的选择,而且不同的特征其重要程度也不相同,例如,性别特征与年龄特征的交叉,与性别特征与物品品类特征之间的交叉,则性别特征与商品品类特征之间的交叉更为重要。因此,本实施方式提供的点击率预测模型还可以包括注意力机制部分,该注意力机制部分可以分别与隐式交互特征部分以及显式交互特征部分进行连接,从而对输出的隐式交互特征以及显式交互特征进行特征选择,提取有用的特征。例如,通过SENET结构使得模型可自动学习不同交互特征之间的重要程度,提高重要特征的权重,减小无用特征的权重,从而使得模型更加符合点击率预测的场景。本实施方式中,通过注意力机制可以确定显示交互特征的第一有效权重,以及隐式交互特征的第二有效权重。
注意力机制部分360可以分为三个步骤,第一步对特征进行压缩得到全局特征,第二步学习特征的重要程度,第三步对原始的特征进行重标定。具体的,对于显式交互特征部分,340的输出Xi,先利用公式:
Figure BDA0002864400980000131
进行压缩,在此基础上利用excitation操作来获取特征间的重要程度,公式为:exi=sigmoid(W2relu(W1sqi)),其中,relu、sigmoid为激活函数,W1,W2为全连接参数。最后再执行scale操作,为每个原始输出的特征Xi乘以一个第一有效权重,来表征这个特征的重要程度,表示为:Xi=exi*Xi。同理的,对于隐式交互特征部分,将FFM生成的二阶交互特征也进行SENET结构的重标定,筛选重要的交叉特征。具体而言,对于squeeze操作,公式表示为
Figure BDA0002864400980000132
得到一维向量表示为sq,接着执行excitation步骤,公式为ex=sigmoid(W2relu(W1sq)),其中,relu、sigmoid为激活函数,W1,W2为全连接参数,该全连接参数与显式交互特征部分的全连接参数可以不同,最后再执行scale操作,为隐式交互特征确定第二有效权重如下式所示:I=I*ex,从而利用SENET模块引入模型起到筛选重要特征的作用。
示例性实施方式中,得到提取的显式交互特征以及隐式交互特征后,可以将所有得到的特征通过输出层380确定最终的预测结果。该点击率预测模型的输出层380可以采用sigmoid激活函数,该激活函数的值域为0到1,值越接近1则说明样本数据被点击的概率越大。输出层的公式可以为:
Figure BDA0002864400980000141
其中,
Figure BDA0002864400980000142
为线性部分,l、wl为隐式交互特征部分的输出和对应的参数,P、WP为显式交互特征部分的输出和对应的参数。由于样本数据对应的标签为输出层y的值,则利用y的值以及从样本数据提取的线性部分、显式交互特征部分、隐式交互特征部分来学习确定各个部分未知的参数,从而完成模型的训练,得到点击率预测模型。
需要理解的是,点击率预测模型中的每一层均有对应的激活函数。激活函数可以理解为输入和输出之间映射关系的函数表达式。在本公开的其他实施方式中,点击率预测模型可以通过其他激活函数来构建,例如自定义的函数等,这同样属于本公开的保护范围。得到训练完成的点击率预测模型之后,可以获取待投放广告的信息,例如待投放广告的广告大小、广告类型、广告主、广告投放的目标群体类型等等;以及获取客户端用户的信息,例如用户的性别、年龄、职业等等。将获取的待投放广告的信息以及用户的信息作为点击率预测模型的输入,从而可以确定待投放广告预测的点击率,即该待投放广告被用户点击的概率。若该点击率较大则可以将该待投放广告推送给用户,能够最大程度的保证待投放广告的投放效果。示例性的,判断点击率是否超过预设值,若点击率超过该预设值则对待投放广告进行投放,如果没有超过预设值则可以不对待投放广告进行投放,从而更精确的控制投放广告的成本,以及投放广告的效果。该预设值可以为0.5、0.6等,也可以根据实际需求设置其他值,本实施方式对此不做特殊限定。
在示例性实施方式中,上述点击率预测方法可以包括步骤S41至步骤S46,如图4所示。
在步骤S41中,采集广告日志,以获取广告曝光数据。在步骤S42中,对广告曝光数据进行数据清洗、以及归一化处理。在步骤S43中,将处理后的广告曝光数据按照时间戳划分为训练集和测试集;具体的,将时间戳靠前的数据可以为训练集,而时间戳在训练集之后的数据则可以划分到测试集中。在步骤S44中,构建点击率预测模型,利用训练集训练该模型;将训练集中包含的数据作为样本数据,用来对点击率预测模型进行训练。在步骤S45中,通过测试集对训练后的点击率预测模型进行测试;将测试集中的每条广告曝光数据作为输入,确定点击率预测模型的预测结果,并利用广告曝光数据的标签确定点击率模型预测的准确性;若测试该点击率预测模型的准确率不满足要求,则可以再次获取更多的广告曝光数据更新训练集,再次对该点击率预测模型进行训练。在步骤S46中,利用训练后的点击率预测模型对给用户新曝光的待投放广告进行预测,确定预测的该待投放广告的点击率。预测的点击率越大则说明用户点击该广告的概率越大,依据预测的点击率可以确定是否需要对该用户进行广告曝光。
以下介绍本公开的装置实施例,可以用于执行本公开上述的点击率预测方法。参考图5,本公开实施例提供的点击率预测装置50可以包括:数据获取模块51、模型获取模块52以及广告预测模块53。
其中,数据获取模块51,用于采集广告曝光数据作为样本数据,将所述广告曝光数据中包含的目标特征作为所述样本数据的标签;其中,所述广告曝光数据包括与广告对应的多个特征,所述目标特征为所述多个特征中的其中一个;所述标签用于表征所述广告是否被点击。
模型获取模块52,用于对所述样本数据中的多个特征进行显式的特征交互,以获得显示交互特征,并对所述样本数据中的多个特征进行隐式的特征交互,以获得隐式交互特征。
广告预测模块53,用于基于所述样本数据的标签,结合所述显式交互特征以及隐式交互特征获取点击率预测模型;其中,所述点击率预测模型用于预测待投放广告的点击率,所述点击率用于确定是否对所述待投放广告进行投放。
在本公开的示例性实施方式中,所述特征提取模块52可以包括嵌入向量生成单元、显式交互特征获取单元、隐式交互特征获取单元。
其中,嵌入向量生成单元,用于生成所述样本数据多个特征域的嵌入向量;显式交互特征获取单元,用于对不同特征域的所述嵌入向量进行外积运算,获取显式交互特征;隐式交互特征获取单元,用于对不同特征域的所述嵌入向量进行点积运算,获得隐式交互特征。
在本公开的示例性实施方式中,嵌入向量生成单元可以被配置为:通过因子分解机生成所述样本数据多个特征域的第一嵌入向量;通过场感知分解机获得所述样本数据多个特征域的第二嵌入向量,所述嵌入向量包括第一嵌入向量以及第二嵌入向量。
在本公开的示例性实施方式中,所述模型获取模块53可以包括注意力机制单元,以及输出层单元。
其中,注意力机制单元,用于通过注意力机制确定所述显式交互特征的第一有效权重以及隐式交互特征的第二有效权重;输出层单元,用于将所述显示交互特征、隐式交互特征以及所述第一有效权重和所述第二有效权重输入所述点击率预测模型的输出层,其中,所述输出层的激活函数取值范围为0到1。
在本公开的示例性实施方式中,该点击率预测装置还包括样本编码模块,用于对所述样本数据进行编码,以将所述样本数据转化为稀疏特征向量,将所述稀疏特征向量作为所述样本数据的嵌入向量。
在本公开的示例性实施方式中,数据获取模块51可以被配置为:根据所述广告曝光数据的时间戳提取样本数据,以及测试数据,其中,所述样本数据的时间戳在所述测试数据之前;通过所述测试数据对所述点击率预测模型进行测试。
在本公开的示例性实施方式中,数据获取模块51可以被配置为:若所述点击率预测模型对所述待投放广告输出的点击率超过预设阈值,则对所述待投放广告进行投放,其中,所述预设阈值的取值范围为0到1。
由于本公开的示例实施例的点击率预测装置的各个功能模块与上述点击率预测方法的示例实施例的步骤对应,因此对于本公开装置实施例中未披露的细节,请参照本公开上述的点击率预测方法的实施例。
下面参考图6,其示出了适于用来实现本公开实施例的电子设备的计算机***600的结构示意图。图6示出的电子设备的计算机***600仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,计算机***600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有***操作所需的各种程序和数据。CPU1201、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的***中限定的上述功能。
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中所述的点击率预测方法。
例如,所述的电子设备可以实现如图2中所示的:步骤S21,采集广告曝光数据作为样本数据,将所述广告曝光数据中包含的目标特征作为所述样本数据的标签;其中,所述广告曝光数据包括与广告对应的多个特征,所述目标特征为所述多个特征中的其中一个;所述标签用于表征所述广告是否被点击;步骤S22,对所述样本数据中的多个特征进行显式的特征交互,以获得显示交互特征,并对所述样本数据中的多个特征进行隐式的特征交互,以获得隐式交互特征;步骤S23,基于所述样本数据的标签,结合所述显式交互特征以及隐式交互特征获取点击率预测模型;其中,所述点击率预测模型用于预测待投放广告的点击率,所述点击率用于确定是否对所述待投放广告进行投放。
又如,所述的电子设备可以实现如图4所示的各个步骤。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种点击率预测方法,其特征在于,包括:
采集广告曝光数据作为样本数据,将所述广告曝光数据中包含的目标特征作为所述样本数据的标签;其中,所述广告曝光数据包括与广告对应的多个特征,所述目标特征为所述多个特征中的其中一个;所述标签用于表征所述广告是否被点击;
对所述样本数据中的多个特征进行显式的特征交互,以获得显示交互特征,并对所述样本数据中的多个特征进行隐式的特征交互,以获得隐式交互特征;
基于所述样本数据的标签,结合所述显式交互特征以及隐式交互特征获取点击率预测模型;其中,所述点击率预测模型用于预测待投放广告的点击率,所述点击率用于确定是否对所述待投放广告进行投放。
2.根据权利要求1所述的方法,其特征在于,所述对所述样本数据中的多个特征进行显式的特征交互,以获得显示交互特征,并对所述样本数据中的多个特征进行隐式的特征交互,以获得隐式交互特征包括:
生成所述样本数据多个特征域的嵌入向量;
对不同特征域的所述嵌入向量进行外积运算,获取显式交互特征;
对不同特征域的所述嵌入向量进行点积运算,获得隐式交互特征。
3.根据权利要求2所述的方法,其特征在于,所述嵌入向量包括第一嵌入向量以及第二嵌入向量;所述生成所述样本数据多个特征域的嵌入向量包括:
通过因子分解机生成所述样本数据多个特征域的第一嵌入向量;
通过场感知分解机获得所述样本数据多个特征域的第二嵌入向量。
4.根据权利要求1所述的方法,其特征在于,所述结合所述显式交互特征以及隐式交互特征获取点击率预测模型包括:
通过注意力机制确定所述显式交互特征的第一有效权重以及隐式交互特征的第二有效权重;
将所述显示交互特征、隐式交互特征以及所述第一有效权重和所述第二有效权重输入所述点击率预测模型的输出层,其中,所述输出层的取值范围为0到1。
5.根据权利要求2所述的方法,其特征在于,所述采集广告曝光数据作为样本数据之后,还包括:
对所述样本数据进行编码,以将所述样本数据转化为稀疏特征向量,将所述稀疏特征向量作为所述样本数据的嵌入向量。
6.根据权利要求1所述的方法,其特征在于,所述采集广告曝光数据作为样本数据包括:
根据所述广告曝光数据的时间戳提取样本数据,以及测试数据,其中,所述样本数据的时间戳在所述测试数据之前;
所述测试数据用于在获得点击率预测模型之后对所述点击率预测模型进行测试。
7.根据权利要求4所述的方法,其特征在于,所述点击率用于确定是否对所述待投放广告进行投放包括:
若所述点击率预测模型对所述待投放广告输出的点击率超过预设阈值,则对所述待投放广告进行投放,其中,所述预设阈值的取值范围为0到1。
8.一种点击率预测装置,其特征在于,包括:
数据获取模块,用于采集广告曝光数据作为样本数据,将所述广告曝光数据中包含的目标特征作为所述样本数据的标签;其中,所述广告曝光数据包括与广告对应的多个特征,所述目标特征为所述多个特征中的其中一个;所述标签用于表征所述广告是否被点击;
特征提取模块,用于对所述样本数据中的多个特征进行显式的特征交互,以获得显示交互特征,并对所述样本数据中的多个特征进行隐式的特征交互,以获得隐式交互特征;
模型获取模块,用于基于所述样本数据的标签,结合所述显式交互特征以及隐式交互特征获取点击率预测模型;其中,所述点击率预测模型用于预测待投放广告的点击率,所述点击率用于确定是否对所述待投放广告进行投放。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至7中任一项所述的点击率预测方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至7中任一项所述的点击率预测方法。
CN202011576756.2A 2020-12-28 2020-12-28 点击率预测方法、装置、电子设备及介质 Pending CN112633931A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011576756.2A CN112633931A (zh) 2020-12-28 2020-12-28 点击率预测方法、装置、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011576756.2A CN112633931A (zh) 2020-12-28 2020-12-28 点击率预测方法、装置、电子设备及介质

Publications (1)

Publication Number Publication Date
CN112633931A true CN112633931A (zh) 2021-04-09

Family

ID=75326010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011576756.2A Pending CN112633931A (zh) 2020-12-28 2020-12-28 点击率预测方法、装置、电子设备及介质

Country Status (1)

Country Link
CN (1) CN112633931A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113407579A (zh) * 2021-07-15 2021-09-17 北京百度网讯科技有限公司 群组查询方法、装置、电子设备及可读存储介质
CN113763031A (zh) * 2021-07-27 2021-12-07 清华大学 一种商品推荐方法、装置、电子设备及存储介质
CN114529309A (zh) * 2022-02-09 2022-05-24 北京沃东天骏信息技术有限公司 一种信息审核方法、装置、电子设备及计算机可读介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180137143A1 (en) * 2016-11-15 2018-05-17 Sentient Technologies (Barbados) Limited Data Object Creation and Recommendation Using Machine Learning Based Offline Evolution
US20190205465A1 (en) * 2017-12-28 2019-07-04 Salesforce.Com, Inc. Determining document snippets for search results based on implicit user interactions
CN110162703A (zh) * 2019-05-13 2019-08-23 腾讯科技(深圳)有限公司 内容推荐方法、训练方法、装置、设备及存储介质
CN111541570A (zh) * 2020-04-22 2020-08-14 北京交通大学 基于多源特征学习的云服务QoS预测方法
CN111538761A (zh) * 2020-04-21 2020-08-14 中南大学 基于注意力机制的点击率预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180137143A1 (en) * 2016-11-15 2018-05-17 Sentient Technologies (Barbados) Limited Data Object Creation and Recommendation Using Machine Learning Based Offline Evolution
US20190205465A1 (en) * 2017-12-28 2019-07-04 Salesforce.Com, Inc. Determining document snippets for search results based on implicit user interactions
CN110162703A (zh) * 2019-05-13 2019-08-23 腾讯科技(深圳)有限公司 内容推荐方法、训练方法、装置、设备及存储介质
CN111538761A (zh) * 2020-04-21 2020-08-14 中南大学 基于注意力机制的点击率预测方法
CN111541570A (zh) * 2020-04-22 2020-08-14 北京交通大学 基于多源特征学习的云服务QoS预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JIANXUN LIAN 等: ""xDeepFM: Combining Explicit and Implicit Feature Interactions for Recommender Systems "", 《KNOWLEDGE DISCOVERY & DATA MINING》, 23 August 2018 (2018-08-23), pages 1755 - 1759 *
杨桥桥;孙益楠;龚强;: "基于电力数据的企业复产指数研究", 财富时代, no. 04, 25 April 2020 (2020-04-25), pages 41 *
陶竹林;宋格格;黄祥林;: "点击预测的关键技术研究", 中国传媒大学学报(自然科学版), no. 06, 25 December 2019 (2019-12-25), pages 72 - 75 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113407579A (zh) * 2021-07-15 2021-09-17 北京百度网讯科技有限公司 群组查询方法、装置、电子设备及可读存储介质
CN113407579B (zh) * 2021-07-15 2024-01-19 北京百度网讯科技有限公司 群组查询方法、装置、电子设备及可读存储介质
CN113763031A (zh) * 2021-07-27 2021-12-07 清华大学 一种商品推荐方法、装置、电子设备及存储介质
CN114529309A (zh) * 2022-02-09 2022-05-24 北京沃东天骏信息技术有限公司 一种信息审核方法、装置、电子设备及计算机可读介质

Similar Documents

Publication Publication Date Title
CN109460513B (zh) 用于生成点击率预测模型的方法和装置
CN110851713B (zh) 信息处理方法、推荐方法及相关设备
CN109492772B (zh) 生成信息的方法和装置
CN112633931A (zh) 点击率预测方法、装置、电子设备及介质
CN111046275B (zh) 基于人工智能的用户标签确定方法及装置、存储介质
CN113254785B (zh) 推荐模型训练方法、推荐方法和相关设备
CN111866610B (zh) 用于生成信息的方法和装置
CN111125574A (zh) 用于生成信息的方法和装置
CN111680147A (zh) 一种数据处理方法、装置、设备以及可读存储介质
CN113761153A (zh) 基于图片的问答处理方法、装置、可读介质及电子设备
CN112288471A (zh) 一种基于用户历史行为序列的广告点击率预测方法
CN112348592A (zh) 广告推荐方法、装置、电子设备及介质
CN109635260A (zh) 用于生成文章模板的方法、装置、设备和存储介质
CN115048571A (zh) 一种基于云平台的在线教育推荐管理***
CN117216535A (zh) 推荐文本生成模型的训练方法、装置、设备及介质
CN114445121A (zh) 一种广告点击率预测模型构建及广告点击率预测方法
CN113469752A (zh) 内容推荐方法、装置、存储介质及电子设备
CN113705698A (zh) 基于点击行为预测的信息推送方法及装置
CN114078024A (zh) 广告库存的预估方法、装置、介质以及电子设备
CN112989174A (zh) 信息推荐方法及装置、介质和设备
CN112118486B (zh) 内容项投放方法、装置、计算机设备及存储介质
CN112101015A (zh) 一种识别多标签对象的方法及装置
CN107169837A (zh) 用于辅助搜索的方法、装置、电子设备及计算机可读介质
CN112446738A (zh) 广告数据处理方法、装置、介质以及电子设备
CN115203516A (zh) 基于人工智能的信息推荐方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination