CN117221386A - 信息推送方法、装置、电子设备和可读介质 - Google Patents

信息推送方法、装置、电子设备和可读介质 Download PDF

Info

Publication number
CN117221386A
CN117221386A CN202211743037.4A CN202211743037A CN117221386A CN 117221386 A CN117221386 A CN 117221386A CN 202211743037 A CN202211743037 A CN 202211743037A CN 117221386 A CN117221386 A CN 117221386A
Authority
CN
China
Prior art keywords
feature
information
probability
model
click
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211743037.4A
Other languages
English (en)
Inventor
杨月奎
唐洋洋
伍海洋
张敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tsinghua University
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University, Tencent Technology Shenzhen Co Ltd filed Critical Tsinghua University
Priority to CN202211743037.4A priority Critical patent/CN117221386A/zh
Publication of CN117221386A publication Critical patent/CN117221386A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种信息推送方法、装置、电子设备和可读介质。该方法包括:根据推广信息的特征生成对应的M个嵌入向量;根据预设的特征块数量,将每个嵌入向量划分为N个特征块,得到M×N个特征块;根据每个特征块对应的架构参数,计算M×N个特征块对应的特征块权重,架构参数表示特征块被用于进行点击预测的概率,特征块权重表示对应的特征块对点击预测的重要程度;根据M×N个特征块权重和推广信息预测推广信息的点击概率;基于所述点击概率对所述推广信息进行推送。该方法能够提升信息推送的准确性。

Description

信息推送方法、装置、电子设备和可读介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种信息推送方法、装置、电子设备和可读介质。
背景技术
现实的大规模推荐***中往往包含上千个特征,涵盖了对象、物品、场景等信息。一般会将这些高纬稀疏特征映射到低纬稠密向量上,这个向量称为特征的嵌入向量。随后,会将特征的嵌入向量输入后面的网络交叉层进行信息交叉。
在相关技术中,在将特征转化为嵌入向量的过程中,针对于不同的特征,会选择一个设定好的尺寸来对特征进行裁剪并转换为嵌入向量。
然而,此类方案中,针对于不同尺寸的特征进行裁剪时,对于本身尺寸较大的特征会被剪裁掉一部分特征,不利于信息推送的准确性。
发明内容
基于上述技术问题,本申请提供一种信息推送方法、装置、电子设备和可读介质,以提高预测过程的执行效率。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供一种信息推送方法,包括:
根据推广信息的特征生成对应的M个嵌入向量;
根据预设的特征块数量,将每个嵌入向量划分为N个特征块,得到M×N个特征块;
根据每个特征块对应的架构参数,计算所述M×N个特征块对应的特征块权重,所述架构参数表示特征块被用于进行点击预测的概率,所述特征块权重表示对应的特征块对点击预测的重要程度;
根据M×N个特征块权重和所述推广信息预测所述推广信息的点击概率;
基于所述点击概率对所述推广信息进行推送。
根据本申请实施例的一个方面,提供一种信息推送装置,包括:
嵌入转换模块,用于根据推广信息的特征生成对应的M个嵌入向量;
向量划分模块,用于根据预设的特征块数量,将每个嵌入向量划分为N个特征块,得到M×N个特征块;
特征块权重模块,用于根据每个特征块对应的架构参数,计算所述M×N个特征块对应的特征块权重,所述架构参数表示特征块被用于进行点击预测的概率,所述特征块权重表示对应的特征块对点击预测的重要程度;
概率预测模块,用于根据M×N个特征块权重和所述推广信息预测所述推广信息的点击概率;
信息推送模块,用于基于所述点击概率对所述推广信息进行推送。
在本申请的一些实施例中,基于以上技术方案,特征块权重模块包括:
权重计算子模块,用于根据每个特征块对应的第一架构参数和第二架构参数,针对每个特征块计算对应的特征块权重,其中,所述第一架构参数和第二架构参数是根据所述推广信息的历史点击数据对每个特征块确定的,所述第一架构参数表示对应的特征块被用于点击预测的概率,所述第二架构参数表示对应的特征块不被用于点击预测的概率;
权重排列子模块,用于对于M个嵌入向量,将每个嵌入向量划分的N个特征块的特征块权重排列成所述M×N个特征块对应特征块权重矩阵。
在本申请的一些实施例中,基于以上技术方案,概率预测模块包括:
特征提取子模块,用于根据所述特征块权重矩阵中M列特征块权重进行特征提取,得到特征提取向量;
特征交叉子模块,用于根据所述推广信息和所述特征块权重矩阵进行特征交叉,得到特征交叉向量;
概率计算子模块,用于根据所述特征提取向量和特征交叉向量之间的概率映射,得到所述推广信息的点击概率。
在本申请的一些实施例中,基于以上技术方案,特征交叉子模块包括:
加权单元,用于对所述推广信息中各个特征的数据进行加权计算,得到第一交叉结果;
交叉单元,用于根据所述特征块权重矩阵中N行特征块权重进行特征交叉,得到第二交叉结果;
合并单元,用于合并所述第一交叉结果和所述第二交叉结果,得到特征交叉向量。
在本申请的一些实施例中,基于以上技术方案,所述特征提取向量通过特征提取模型计算得到,所述特征交叉向量通过特征交叉模型计算得到;信息推送装置还包括:
数据获取模块,用于获取所述推广信息对应的训练数据,所述训练数据是根据所述点击概率进行信息推送后得到的数据;
训练模块,用于根据所述训练数据,对所述架构参数、所述特征提取模型和所述特征交叉模型进行训练,以更新所述架构参数、所述特征提取模型的第一模型参数和所述特征交叉模型的第二模型参数;
预测模块,用于通过更新后的架构参数、更新后的特征提取模型和更新后的特征交叉模型根据所述推广信息对应的数据进行点击预测。
在本申请的一些实施例中,基于以上技术方案,所述训练数据包含训练集和验证集;训练模块包括:
子集选择子模块,用于从所述验证集中选择验证子集并从所述训练集中选择训练子集;
第一训练子模块,用于根据所述验证子集对所述架构参数、所述特征提取模型和所述特征交叉模型进行训练,以更新所述架构参数;
第二训练子模块,用于根据所述训练子集对更新后的架构参数、所述特征提取模型和所述特征交叉模型进行训练,以更新所述第一模型参数和所述第二模型参数。
在本申请的一些实施例中,基于以上技术方案,第一训练子模块包括:
第一预测单元,用于通过所述架构参数、所述特征提取模型和所述特征交叉模型,根据所述验证子集对所述推广信息进行点击预测,得到第一估计概率;
第一交叉熵计算单元,用于根据所述第一估计概率和所述验证子集之间的映射关系,计算所述验证子集的交叉熵;
第一更新单元,用于根据所述验证子集的交叉熵与所述架构参数之间的映射关系,更新所述架构参数。
在本申请的一些实施例中,基于以上技术方案,第二训练子模块包括:
第二预测单元,用于通过所述更新后的架构参数、所述特征提取模型和所述特征交叉模型,根据所述训练子集对所述推广信息进行点击预测,得到第二估计概率;
第二交叉熵计算单元,用于根据所述第二估计概率和所述训练子集之间的映射关系,计算所述训练子集的交叉熵;
第二更新单元,用于根据所述训练子集的交叉熵与所述第一模型参数和所述第二模型参数之间的映射关系,更新所述第一模型参数和所述第二模型参数。
在本申请的一些实施例中,基于以上技术方案,数据获取模块包括:
信息推送子模块,用于根据所述推广信息的点击概率,向目标对象推送所述推广信息;
样本获取子模块,用于获取所述目标对象针对所述推广信息的点击数据和展示数据作为正样本数据和负样本数据;
数据集划分子模块,用于按照预设比例,将所述正样本数据和负样本数据划分为训练集和验证集,作为训练数据。
在本申请的一些实施例中,基于以上技术方案,信息推送装置还包括:
候选信息获取子模块,用于根据目标对象的对象信息,获取多个候选信息;
候选概率预测子模块,用于根据各个候选信息的信息推广数据和对应的M×N个特征块权重,对所述多个候选信息进行点击预测,得到候选概率;
推广信息确定子模块,用于将所述候选概率满足候选条件的候选信息确定为推广信息。
在本申请的一些实施例中,基于以上技术方案,信息推送模块包括:
信息排序模块,用于根据所述推广信息集合中各个推广信息的点击概率对所述推广信息进行排序,得到信息排序结果;
信息推送模块,用于根据所述信息排序结果,对排序位置满足预设条件的推广信息进行推送。
根据本申请实施例的一个方面,提供一种电子设备,该电子设备包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,该处理器配置为经由执行可执行指令来执行如以上技术方案中的信息推送方法。
根据本申请实施例的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,当该计算机程序被处理器执行时实现如以上技术方案中的信息推送方法。
根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供信息推送方法。
在本申请的实施例中,通过将嵌入向量划分为相同数量的特征块,计算每个特征块的权重,并根据每个特征块的权重来预测推广信息的点击概率,从而利用特征块的权重分配来达到对嵌入向量进行向量尺寸的选择的效果,从而不需要在对不同尺寸的特征进行剪裁来得到统一尺寸的嵌入向量,保留了各个尺寸特征的数据内容而不会丢失特征,提升信息推送的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
在附图中:
图1为本申请技术方案在一个应用场景中的示例性***构架示意图;
图2是本申请实施例中信息推广流程的示意图;
图3为本申请实施例中一种信息推送方法的示意流程图;
图4为本申请实施例中一种信息推送方法的示意流程图;
图5为本申请实施例中广告推广的整理流程;
图6为本申请实施例中搜索阶段和重训练结果所采用模型的结构示意图;
图7示意性地示出了本申请实施例中信息推送装置的组成框图;
图8示出了适于用来实现本申请实施例的电子设备的计算机***的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应理解,本申请的方案可以应用于对数据处理的领域,并且具体应用于在信息推广过程中进行点击预测的场景中,例如各类应用场景的广告和推送信息推荐的场景,或者视频推荐、图文推荐和商品推荐等信息流推荐场景。在此类场景中,与推广信息相关的数据会被转换成特征向量。由于特征数量通常较大,所转换出的特征向量会成为高纬稀疏特征。这些特征需要被映射到低纬稠密向量上,得到嵌入向量,以便用于后续的计算。这其中就涉及到嵌入向量的维度的选择过程。在本申请的方案中,将每个嵌入向量拆分成固定数量的向量并纵向排列,形成特征块,将不同特征的特征块横向排列,构成特征块矩阵,然后,计算特征块矩阵中的每一个特征块是否被选择,从而达到选择嵌入向量的维度效果。随后根据选择的结果特征交叉输出的结果,再根据交叉结果来进行推广信息是否会被点击的点击概率预测。
下面对本申请技术方案在一个应用场景的***架构进行介绍。请参阅图1,图1为本申请技术方案在一个应用场景中的示例性***构架示意图。如图1所示,该应用场景中具体包含终端设备110、应用服务120、推广平台130和信息数据库140。其中,终端设备110为客户终端,终端上安装由能够进行信息推荐的应用。使用者在通过与应用服务120通信来获取使用者想要浏览的信息,在应用运行的过程中,会根据当前的使用场景执行对应的信息推广功能。在进行信息推广时,终端设备110上的应用会向应用服务120发起请求获取要推广的信息。应用服务120收到请求后向推广平台130要求获取对应的推广信息。推广平台130则根据应用服务120的请求,从信息数据库140中获取算法相关的信息来计算出使用者最有可能点击浏览的推广信息来推送给应用服务120,继而发送给终端设备110来进行展示。
上述的服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)以及大数据和人工智能平台等基础云计算服务的云服务器,本处不对此进行限制。上述的各个服务器可以实际部署在同一个物理服务器上,各个服务器的功能则构成管理***各个功能模块。终端设备包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端、飞行器等。终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。终端设备以及服务器的数量也不做限制。
本申请的方案中,关于特征块的选择过程所使用参数的确定过程可以基于人工智能进行,并且具体采用机器学习模型来进行参数调整和更新。人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术包括机器学习/深度学习方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
以广告推荐为例介绍本申请中的信息推广流程。为了便于介绍,请参阅图2,图2是本申请实施例中信息推广流程的示意图。确定要向终端应用推广的信息的过程包含两个阶段,分别为召回阶段210和排序阶段220。其中,召回阶段210用于根据待推广信息本身的特征以及浏览者的特征从大量的待推广信息中选出适合在终端应用的当前使用场景中进行展示的候选信息,例如与终端应用当前展示内容相关的推广信息或者符合当前终端应用关注内容的推广信息等。如图2所示,在广告推荐的召回阶段210中,服务器会从广告库中获取到适合应用当前使用场景的广告信息。在召回阶段210中获取到的推广内容的精细度通常较低,因此,在排序阶段220中会对召回阶段210中获取到的候选信息进行精准排序,从中挑选出排序较高的一部分候选信息,作为待推广的内容发送给终端应用进行展示。如图2所示,在排序阶段220中会对召回阶段210中召回的广告信息进行进一步的排序和挑选,并且在终端信息中展示挑选出的广告内容。在召回阶段210和在排序阶段220中被挑选出的候选信息通常被认为是在推广展示后,被点击概率较高的内容。因此,召回阶段210和排序阶段220的过程都可以被认为是预测各个候选信息的点击概率,并且选取点击概率较高的候选信息作为推广内容。
在本申请的具体实施方式中,涉及到用户信息、交易数据等相关的数据,当本申请的实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
下面结合具体实施方式对本申请提供的技术方案做出详细说明。为了便于介绍,请参阅图3,图3为本申请实施例中一种信息推送方法的示意流程图。该方法可以应用于上述的推广平台中。在本申请实施例中,以运行在服务器上的信息推送装置作为执行主体来对信息推送方法进行介绍,该方法可以包括如下的步骤S310至步骤S350:
步骤S310,根据推广信息的特征生成对应的M个嵌入向量。
在本实施例中,推广信息指的是从待推广信息的数据库中获取的原始信息。推广信息通常会包含基本信息,例如标识、推广信息的投放方的信息和推广内容的信息。推广信息通常还对应存在推广对象的信息,例如推广对象的浏览过的推广信息和关注的关键词和标签等内容。推广平台或者信息推送装置会从数据库中获取到推广信息和相关数据和推广对象的相关数据,并且对推广信息和相关数据和推广对象的相关数据进行特征提取,从而根据推广信息的特征生成对应的M个嵌入向量。其中,M为大于1的整数。具体特征提取的方式可以是根据各个特征对应的实际数据查表获得。通常,每个数据类别对应一个特征,例如,将“请求时间”作为一个数据特征,该特征可以通过查表来转化为嵌入向量,例如0点到12点对应嵌入值1,12点到24点对应嵌入值2,则请求时间15点则会转化为嵌入向量(0,1)。每一条推广信息对应的M个特征都对应被嵌入向量,则会得到对应于M个特征的M个嵌入向量。
步骤S320,根据预设的特征块数量,将每个嵌入向量划分为N个特征块,得到M×N个特征块。
在本实施例中,每个嵌入向量都会被划分为相同数量的特征块。信息推送装置会根据预设的特征块数量N,将每个嵌入向量划分为N个特征块,得到M×N个特征块。可以理解的是,各个嵌入向量划分特征块的的方式可以不同,但每个嵌入向量划分后得到的特征块数量是相同的。例如,以所有嵌入向量都用等分的方式进行划分为例,两个嵌入向量的长度分别为100和10,预设的特征块数量为5。分别进行划分为,两个嵌入向量都会被划分为5个特征块,但其中长度为100的嵌入向量的特征块包含20个特征值,而长度为10的嵌入向量的特征块则包含2个特征值,也就是说,不同嵌入向量所划分出的特征块的长度不一定相同,但划分的到特征块的数量是相同的。在一些实施例中,不同的嵌入向量还可以采用不同的划分方式,例如一部分采用等分,另一部分则根据各自的标准采用不等分的方式进行,例如对于无法除尽的特征值数量,允许特征块的长度不同等处理。
步骤S330,根据每个特征块对应的架构参数,计算所述M×N个特征块对应的特征块权重,所述架构参数表示特征块被用于进行点击预测的概率,所述特征块权重表示对应的特征块对点击预测的重要程度。
在本申请的所述中,对于M个嵌入向量划分出的特征块,会根据每个特征块对应的架构参数来计算对应的特征块权重。架构参数表示特征块被用于进行点击预测的概率。架构参数通常是信息推送装置通过对应的算法或者利用训练好的模型来计算得到的,并且会根据推荐对象对于预测结果的实际反馈来进行不断的更新和修正。特征块权重表示对应的特征块对点击预测的重要程度。特征块权重表示对应的特征块对点击预测的重要程度。重要程度高的特征块对点击预测结果的影响能力大,而重要程度低的特征块则对点击预测结果的影响能力低。可以理解的是,在每个嵌入特征的N个特征块中,会存在对预测结果不具备影响能力或者影响能力可以忽略不计的特征块,此类特征块的特征块权重通常是0。因此,计算各个特征块的特征块权重也可以被理解为是对各个特征块进行挑选的过程。在计算过程中,能够用于预测点击概率的特征块会被赋予对应的特征块权重,从而在后续的过程中用于进行点击概率预测,而不能或者不适合用于预测点击概率的特征块的特征块权重则会被赋予0,则其在后续的计算过程中不会被用于进行点击概率预测。
步骤S340,根据M×N个特征块权重和所述推广信息预测所述推广信息的点击概率。
具体的预测方式可以采用机器学习模型算法来对根据M×N个特征块权重和推广信息本身的特征数据来进行计算,来预测出推广信息的点击概率,其中,点击概率表示的是该推广信息被推送给推广对象后,推广对象会浏览该推广信息的实际内容的概率。例如推广的是一条链接,则点击概率为推广对象点击链接的概率,而推送的为视频,则点击概率可以是推广对象完整观看视频的概率,对于实际的场景,点击动作不一定的必须的。在具体的计算过程中,例如同一个特征的特征块排成一列,从而M个特征排列好则得到一个矩阵,然后按照矩阵的行和列来带入对应的交叉算法来计算,从而能够得到各个交叉算法的输出结果,再综合各个算法的输出结果,来输出推广信息的点击概率。可以理解的是,本实施例中所介绍的是对于一条推广信息进行点击概率预测的过程。在实际的召回和排序过程中,会按照需求对多条推广信息分别预测点击概率。
步骤S350,基于所述点击概率对所述推广信息进行推送。
具体地,在对所有的备选推广信息进行点击概率预测之后,信息推送装置会利用各个备选推广信息点击概率来确定出具体要推送的推广信息,并且对推广信息进行推送,例如确定要推送的广告或者货品等。
在本申请的实施例中,通过将嵌入向量划分为相同数量的特征块,计算每个特征块的权重,并根据每个特征块的权重来预测推广信息的点击概率,从而利用特征块的权重分配来达到对嵌入向量进行向量尺寸的选择的效果,从而不需要在对不同尺寸的特征进行剪裁来得到统一尺寸的嵌入向量,保留了各个尺寸特征的数据内容而不会丢失特征,提升信息推送的准确性。
在本申请的一个实施例中,请参阅图4,图4为本申请实施例中一种信息推送方法的示意流程图。基于以上技术方案,上述步骤S330,根据每个特征块对应的架构参数,计算所述M×N个特征块对应的特征块权重,具体包含如下步骤S410至S420:
步骤S410,根据每个特征块对应的第一架构参数和第二架构参数,针对每个特征块计算对应的特征块权重,其中,所述第一架构参数和第二架构参数是根据所述推广信息的历史点击数据对每个特征块确定的,所述第一架构参数表示对应的特征块被用于点击预测的概率,所述第二架构参数表示对应的特征块不被用于点击预测的概率;
步骤S420,对于M个嵌入向量,将每个嵌入向量划分的N个特征块的特征块权重排列成所述M×N个特征块对应特征块权重矩。
在本实施例中,信息推送装置会根据每个特征块对应的第一架构参数和第二架构参数来计算特征块对应的权重,并且特征块会被排列成特征块权重矩阵。具体地,架构参数具体包含两个参数,即第一架构参数和第二架构参数。例如,假设有m个特征:x1,x2,…,xm,经过查表后得到相应的嵌入向量为:v1,v2,…,vm。把vi等分成k(k≥1)个特征块b1i,b2i,…,bki。针对每个特征块bji,j∈{1,2…,k},信息推送装置赋予第一架构参数和第二架构参数:其中第一架构参数/>表示这个特征块bji在预测点击概率时被选择用于进行预测的概率,第二架构参数/>表示这个特征块bji在预测点击概率时被丢弃不用的概率。因此,每个特征块bji的特征块权重的计算方式如下:
其中,b′ji表示特征块权重。对于一个特征i的嵌入向量,vi=(b1i,b2i,…,bki),则对应的特征块权重向量则会变为vi′=(b′1i,b′2i,…,b′ki),其中i∈{1,2…,m}。对于M个嵌入向量,将每个嵌入向量划分的N个特征块替换为对应的特征块权重,则会得到M个特征块权重向量。再将M个特征块权重向量排列成特征块权重矩阵,具体的排列方式可以是以特征种类为行,即特征块权重矩阵中的每一列对应一个特征块权重向量,从而得到特征块权重矩阵v1’,v2‘,…,vm’。
在本实施例中,通过特征权重矩阵将嵌入向量的尺寸选择的问题,转换为在所有特征块中选出最优的特征块子集的问题。能够达到对于不同长度的嵌入向量进行统一长度计算的效果,不需要线性变换和补充0值作为填充,从而避免浪费了长嵌入向量的尾部信息,提高预测计算效率的准确性。
在本申请的一个实施例中,基于以上技术方案,上述步骤S340,根据M×N个特征块权重和所述推广信息预测所述推广信息的点击概率,具体包含如下步骤:
根据所述特征块权重矩阵中M列特征块权重进行特征提取,得到特征提取向量;
根据所述推广信息和所述特征块权重矩阵进行特征交叉,得到特征交叉向量;
根据所述特征提取向量和特征交叉向量之间的概率映射,得到所述推广信息的点击概率。
在本实施例中,对于得到的特征块权重,会分别进行特征提取和特征交叉处理。具体地,特征提取的可以采用任意适合的特征提取方式来进行。例如,可以采用多层感知机或者卷积神经网络来进行对特征块权重矩阵中M列特征块权重特征提取,即对M个特征块权重向量进行特征提取,具体方法如下:
logits1=MLP(v1’,v2‘,…,vm’)
其中,v1’,v2‘,…,vm’为M个特征块权重向量,logits1为特征提取的输出结果。特征交叉的过程可以采用各类特征交叉方式来对推广信息和特征块权重矩阵进行计算,例如采用将所有的特征块进行两两交叉,随后对各个组个赋予对应的权重来进行特征交叉,从而得到特征交叉的结果:
其中,wij为两个特征b′(j,i)b′(j,i+1)的组合对应的权重,w0为计算因子。
最后,根据所述特征提取向量和特征交叉向量之间的概率映射,得到所述推广信息的点击概率。具体地,输出的点击概率可以为:
p=sigmoid(logits1+logits2)
其中p为输出的点击概率。
在本申请的实施例中,通过对M列的特征进行特征提取,从而能够根据各个特征块的特征权重来对嵌入向量中要使用的特征进行选择,被选择的特征块数量决定了对应特征域的嵌入尺寸,简化了尺寸选择过程中所需要保存的中间数据,降低了计算过程的存储资源消耗。
在本申请的一个实施例中,基于以上技术方案,所述根据所述推广信息和所述特征块权重矩阵进行特征交叉,得到特征交叉向量,具体包含如下步骤:
对所述推广信息中各个特征的数据进行加权计算,得到第一交叉结果;
根据所述特征块权重矩阵中N行特征块权重进行特征交叉,得到第二交叉结果;
合并所述第一交叉结果和所述第二交叉结果,得到特征交叉向量。
在本实施例中,通过分阶段计算内积的方式进行特征交互交叉的过程。具体地,特征交叉的计算过程包含两阶的计算。在第一阶中,信息推送装置对推广信息中各个特征的数据进行加权计算,得到第一交叉结果。具体地,计算过程可以采用如下公式:
其中,xi为特征i的特征数据,wi为特征i对应的特征权重,w0为计算因子。通过第一阶的计算,能够基于特征数据本身进行对应的交叉计算,得到针对于原始特征数据的特征交叉结果。
在第二阶中,信息推送装置根据特征块权重矩阵中N行特征块权重进行特征交叉,得到第二交叉结果。具体地,计算方式如下:
其中,bj m第m个特征中第j行的特征块权重。可以理解,第二交叉结果按照特征块行的形式来进行交叉。可以理解,被认为不被用于进行点击概率预测的特征块的特征块权重bj m会被设置为0,因此在交叉过程中,即计算结果对输出的交叉结果也没有影响。
最后,信息推送装置合并第一交叉结果和第二交叉结果,得到特征交叉向量。具体的合并方式可以直接采用求和的方式,特征交叉向量logits2的计算方式如下:
logits2=logits2′+logits2
可以理解的,在此实施例中,特征提取和特征交叉最终的输出结果为:
logits=logits1+logits2′+logits2
而点击概率则为:
p=sigmoid(logits)
在本实施例中,根据多个特征在同一行中的特征块来进行内积计算,不同长度的嵌入向量之间的内积计算被转变成相同行的特征块之间的内积计算之和,与特征选择的过程结合,能够同步实现自动嵌入尺寸的选择和智能特征交叉的选择,减少计算过程的复杂度,提高方案的运行效率。
在本申请的一个实施例中,基于以上技术方案,所述特征提取向量通过特征提取模型计算得到,所述特征交叉向量通过特征交叉模型计算得到;上述步骤S340,根据M×N个特征块权重和所述推广信息预测所述推广信息的点击概率之后,本申请的方案还包含如下步骤:
获取所述推广信息对应的训练数据,所述训练数据是根据所述点击概率进行信息推送后得到的数据;
根据所述训练数据,对所述架构参数、所述特征提取模型和所述特征交叉模型进行训练,以更新所述架构参数、所述特征提取模型的第一模型参数和所述特征交叉模型的第二模型参数;
通过更新后的架构参数、更新后的特征提取模型和更新后的特征交叉模型根据所述推广信息对应的数据进行点击预测。
在本实施例中,在进行点击预测并且向推荐对象进行推荐之后,还会根据推荐对象的实际点击结果来对计算过程中所涉及的参数和模型进行训练和更新。具体地,信息推送装置从数据库或者从终端设备获取推广信息对应的训练数据,训练数据是根据所述点击概率进行信息推送后得到的数据。具体地,点击概率高的推广信息会被推送给推广对象,推广对象对于推广信息的反馈结果则会被作为训练数据,例如是否点击浏览、是否购买等结果。随后,信息推送装置根据训练数据,对架构参数、特征提取模型和特征交叉模型进行训练,以更新架构参数、特征提取模型的第一模型参数和特征交叉模型的第二模型参数。训练过程中会基于推广信息原本的信息预测点击概率,并且将预测结果的点击概率与实际结果一起计算损失,从而对架构参数、特征提取模型的第一模型参数和特征交叉模型的第二模型参数极性更新。随后,再通过更新后通过更新后的架构参数、更新后的特征提取模型和更新后的特征交叉模型根据推广信息对应的数据进行点击预测。利用更新后的参数和模型进行点击预测的流程与上述过程中所描述的流程相同,此处不在赘述。
在本申请的实施例中,在进行预测后,会根据实际的结果来更新预测所采用的参数和模型,从而能够根据实际结果即使更新预测能力,提高预测结果的准确性。
在本申请的一个实施例中,基于以上技术方案,训练数据包含训练集和验证集;上述步骤,根据所述训练数据,对所述架构参数、所述特征提取模型和所述特征交叉模型进行训练,具体包含如下步骤:
从所述验证集中选择验证子集并从所述训练集中选择训练子集;
根据所述验证子集对所述架构参数、所述特征提取模型和所述特征交叉模型进行训练,以更新所述架构参数;
根据所述训练子集对更新后的架构参数、所述特征提取模型和所述特征交叉模型进行训练,以更新所述第一模型参数和所述第二模型参数。
在本实施例中,训练数据会按照一定的比例被划分为训练集和验证集。在更新训练的过程中,信息推送装置会从验证集中选择出一个验证子集,具体的选择方式可以通过随机采样的方式进行。随后,根据选择出的验证子集中的数据对架构参数、特征提取模型和特征交叉模型进行训练。训练过程中会得到对验证子集的预测结果以及对应的损失结果。在根据损失结果和对应的计算公式求解,来得到架构参数的更新值。随后,基于更新后的机构参数,根据训练子集特征提取模型和特征交叉模型进行训练。训练过程与架构参数的过程类似,从而得到第一模型参数和第二模型参数的更新值。上述的过程会一直重复,架构参数、第一模型参数和第二模型参数直到在训练集和验证集上收敛,从而完成架构参数、第一模型参数和第二模型参数的更新过程。
在本申请的实施例中,通过验证集和训练集对应更新不同的架构参数和模型参数,从而能够确保参数的更新过程不会相互干扰和影响,有利于参数更新的准确性。
在本申请的一个实施例中,基于以上技术方案,上述步骤,根据所述验证子集对所述架构参数、所述特征提取模型和所述特征交叉模型进行训练,以更新所述架构参数,具体包含如下步骤:
通过所述架构参数、所述特征提取模型和所述特征交叉模型,根据所述验证子集对所述推广信息进行点击预测,得到第一估计概率;
根据所述第一估计概率和所述验证子集之间的映射关系,计算所述验证子集的交叉熵;
根据所述验证子集的交叉熵与所述架构参数之间的映射关系,更新所述架构参数。
具体地,信息推送装置通过架构参数、特征提取模型和特征交叉模型,根据验证子集对推广信息进行点击预测,得到第一估计概率。第一估计概率预测的方式与上述实施例中所描述的方式相同,验证子集的特征数据的嵌入向量会被划分相同数量的特征块,来进行特征交叉的预测过程。随后,根据第一估计概率和验证子集之间的映射关系,计算验证子集的损失结果。损失结果的计算方式如下:
其中,pi是第一预估概率,yi表示第i个样本的标签,即点击或未点击的结果。
在得到交叉熵后,信息推送装置根据验证子集的交叉熵与架构参数之间的映射关系,更新架构参数。具体地,映射关系可以采用如下公式:
其中,表示验证集上的交叉熵,A表示架构参数:/>W表示深度学习的模型参数,包括特征提取模型和特征交叉模型的参数,以及进行嵌入向量转换和尺寸选择过程中所采用的模型的参数。通过对进行求解优化,来计算得到更新的架构参数A。
在本申请的实施例中,提供了对架构参数更新的过程的具体实现方式,有利于方案的可操作性。
在本申请的一个实施例中,基于以上技术方案,上述步骤,根据所述训练子集对更新后的架构参数、所述特征提取模型和所述特征交叉模型进行训练,以更新所述第一模型参数和所述第二模型参数,具体包含如下步骤:
通过所述更新后的架构参数、所述特征提取模型和所述特征交叉模型,根据所述训练子集对所述推广信息进行点击预测,得到第二估计概率;
根据所述第二估计概率和所述训练子集之间的映射关系,计算所述训练子集的交叉熵;
根据所述训练子集的交叉熵与所述第一模型参数和所述第二模型参数之间的映射关系,更新所述第一模型参数和所述第二模型参数。
具体地,信息推送装置通过架构参数、特征提取模型和特征交叉模型,根据训练子集对推广信息进行点击预测,得到第二估计概率。第一估计概率预测的方式与上述实施例中所描述的方式相同,训练子集的特征数据的嵌入向量会被划分相同数量的特征块,来进行特征交叉的预测过程。随后,根据第二估计概率和训练子集之间的映射关系,计算训练子集的交叉熵。交叉熵的计算方式与上述的计算方式相同。
在得到交叉熵后,信息推送装置根据训练子集的交叉熵与架构参数之间的映射关系,更新架构参数。具体地,映射关系可以采用如下公式:
其中,表示训练集上的交叉熵,A表示架构参数:/>W表示深度学习的模型参数,包括特征提取模型和特征交叉模型的参数,以及进行嵌入向量转换和尺寸选择过程中所采用的模型的参数。通过对进行求解优化,来计算得到更新的模型参数W。
在本申请的实施例中,提供了对模型参数更新的过程的具体实现方式,基于更新后的架构参数来训练更新模型参数,从而能够利用划分更准确的特征块来对模型参数进行训练,有利于模型参数的准确性。
在本申请的一个实施例中,基于以上技术方案,上述步骤,获取所述推广信息对应的训练数据,具体包含如下步骤:
根据所述推广信息的点击概率,向目标对象推送所述推广信息;
获取所述目标对象针对所述推广信息的点击数据和展示数据作为正样本数据和负样本数据;
按照预设比例,将所述正样本数据和负样本数据划分为训练集和验证集,作为训练数据。
在本实施例中,信息推送装置根据推广信息的点击概率,向目标对象推送推广信息。具体地,信息推送装置会预测得到多个推广对象的点击概率,再将点击概率高的推广信息推送给目标对象。之后,信息推送装置会获取到目标对象针对所述推广信息的点击数据和展示数据作为正样本数据和负样本数据。其中,点击数据中正样本为对推广信息的一次点击,而负样本一般是展示数据中推广信息的一次曝光(展示但未得到点击)。负样本一般是从推广信息的库中经过一定的策略采样出来的推广信息和目标对象组成,样本被记为{(xi,yi)|i=1,…,N},其中xi表示第i个样本的全部特征,yi表示第i个样本的标签,当yi=0时表示负样本,当yi=1时表示正样本,N表示样本数量。在得到样本后,信息推送装置按照预设比例,将正样本数据和负样本数据划分为训练集和验证集,作为训练数据。可以理解,训练集和验证集中都会包含正样本数据和负样本数据。
在本申请的实施例中,通过实际点击结果作为样本数据,从而能够使得针对推广信息的参数更新更加符合实际的点击情况,避免推广结果出现偏差而打扰浏览过程,提高推广效果,提升用户体验。
在本申请的一个实施例中,基于以上技术方案,上述步骤S310,根据推广信息的特征生成对应的M个嵌入向量之前,本申请的方案还包含如下步骤:
根据目标对象的对象信息,获取多个候选信息;
根据各个候选信息的信息推广数据和对应的M×N个特征块权重,对所述多个候选信息进行点击预测,得到候选概率;
将所述候选概率满足候选条件的候选信息确定为推广信息。
具体地,信息推送装置首先根据目标对象的对象信息,获取多个候选信息。具体地,信息推送装置会根据目标对象的编号去对象数据库中查找该目标对象的详细数据信息,同时会根据候选推广编号在候选信息的数据库中查找所有候选推广信息的数据信息。同时也会得到当前场景的一些信息,比如请求时间、候选信息展示位置等。随后,信息推送装置根据各个候选信息的信息推广数据和对应的M×N个特征块权重,对所述多个候选信息进行点击预测,得到候选概率。信息推广数据通常是与候选信息相关的数据,例如数据内容和推广对象的相关信息。可以理解,该点击预测过程与上述所描述的过程相同,其中所使用的架构参数和模型参数等是上一次进行点击预测或者进行参数更新后的历史结果。在得到候选概率后,信息推送装置将候选概率满足候选条件的候选信息确定为推广信息。候选条件通常包含候选概率的阈值,候选概率高于阈值的候选信息会被选为推广信息。
在本申请的实施例中,通过M×N个特征块权重进行点击预测,根据预测结果来筛选候选信息,从而能够提高筛选推广信息的过程的执行效率。
在本申请的一个实施例中,基于以上技术方案,上述步骤S340,根据M×N个特征块权重和所述推广信息预测所述推广信息的点击概率之后,本申请的方案还包含如下步骤:
根据所述推广信息集合中各个推广信息的点击概率对所述推广信息进行排序,得到信息排序结果;
根据所述信息排序结果,对排序位置满足预设条件的推广信息进行推送。
在本实施例中,在对于推广信息预测出点击概率后,与其他已经预测得到点击概率的推广信息一起进行排序,从而得到信息排序结果。可以理解的是,该排序结果是针对于要推广的对象所生成的结果。随后,信息推送装置根据信息排序结果,对排序位置满足预设条件的推广信息进行推送。例如,选择信息排序最高的10个推广信息进行推送。以广告推送为例,信息推送装置会对各个广告预测出点击概率,并且按照点击概率的高低来将广告排序。当需要进行广告推送是,按照广告展现的要求向终端,按照广告排序的顺序选择出推送一定数量的广告进行推送。
在本申请的实施例中,根据预测的点击概率对推广信息进行排序,并且按照排序来进行推送,从而能够灵活选择要推广的信息,同时对于需要多次展现推广信息的场景能够利用满足预设条件的推广信息来展现不同的推广信息,提高推广展示灵活性。
下面以广告推广为示例介绍本申请方案的具体应用流程。为了便于介绍,请参阅图5。图5为本申请实施例中广告推广的整理流程。如图5所示,方案起始于原始数据层510。原始数据层中包含对象数据库和候选广告数据库。对象数据主要包括对象历史数据,比如注册时长、关注内容和浏览过的推荐内容等,广告数据是指候选广告的基本信息,主要包括广告ID、广告主信息、创意信息等。当一个用户访问平台页面时,平台会根据用户编号去用户数据库中查找该用户对应的对象数据的详细信息,同时会根据候选广告编号去广告库中查找所有候选广告的数据信息,同时也会得到当前场景的一些信息,比如请求时间、广告展示位置等,以供后续的特征嵌入环节使用。随后,服务器在特征嵌入层520中,通过对对象数据、广告数据和场景信息进行特征抽取,得到“类别”、“使用时长”、“广告ID”、“请求时间“等特征,通过查表得到每个特征对应的嵌入向量,最终将所有特征嵌入拼接成一个长向量,送入后面的网络交叉层540。
在嵌入尺寸选择层530中:通过上述方案中介绍的方式,通过将嵌入向量划分为特征块,并针对每个特征块计算对应权重来确认是否用于预测点击概率的方式,针对不同的特征域选择不同的嵌入尺寸。输出的特征块结果被驶入到网络交叉层540中,网络交叉层中采用多层感知机结构(若干全连接层+激活函数的串行结构)和因子分解机结构。在网络交叉层540中通过这两个结构对嵌入尺寸选择层530输出的特征块权重矩阵进行特征提取和交叉,输出的结果输入到目标定义层550中。在目标定义层550接收多层感知机与因子分解机的输出,通过计算来预测用户点击广告的概率值。在排序与展示层560中,当计算完用户对所有候选广告的点击概率值之后,对它们进行排序,选择概率最大的若干个广告进行展示。
上述的整体流程主要分为两个阶段,即搜索阶段和重训练阶段。其中,对于搜索阶段,主要通过特征嵌入层、嵌入尺寸选择层、网络交叉层和目标定义层来输出各个广告的概率,从而进行推荐。为了便于介绍,请参阅图6,图6为本申请实施例中搜索阶段和重训练结果所采用模型的结构示意图。如图6所示,结构中包含特征嵌入层610、嵌入尺寸选择层620以及多层感知机630和因子分解机640构成的网络交叉层。对于还未被使用过的初始模型,在搜索阶段中,对于特征的选择通常采用随机初始化的方式。而在重训练阶段,由于已经根据用户对于广告的点击数据来进行训练,因此,在嵌入尺寸选择层620中,会针对性的选择出适合用于预测点击率的特征块来进行预测。模型中各个层级的计算过程参见上文各个方案中所介绍的内容,在此不再赘述。
应当注意,尽管在附图中以特定顺序描述了本申请中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
以下介绍本申请的装置实施,可以用于执行本申请上述实施例中的信息推送方法。图7示意性地示出了本申请实施例中信息推送装置的组成框图。如图7所示,信息推送装置700主要可以包括:
嵌入转换模块710,根据推广信息的特征生成对应的M个嵌入向量;
向量划分模块720,根据预设的特征块数量,将每个嵌入向量划分为N个特征块,得到M×N个特征块;
特征块权重模块730,根据每个特征块对应的架构参数,计算所述M×N个特征块对应的特征块权重,所述架构参数表示特征块被用于进行点击预测的概率,所述特征块权重表示对应的特征块对点击预测的重要程度;
概率预测模块740,根据M×N个特征块权重和所述推广信息预测所述推广信息的点击概率;
信息推送模块750,用于基于所述点击概率对所述推广信息进行推送。
在本申请的一些实施例中,基于以上技术方案,特征块权重模块730包括:
权重计算子模块,用于根据每个特征块对应的第一架构参数和第二架构参数,针对每个特征块计算对应的特征块权重,其中,所述第一架构参数和第二架构参数是根据所述推广信息的历史点击数据对每个特征块确定的,所述第一架构参数表示对应的特征块被用于点击预测的概率,所述第二架构参数表示对应的特征块不被用于点击预测的概率;
权重排列子模块,用于对于M个嵌入向量,将每个嵌入向量划分的N个特征块的特征块权重排列成所述M×N个特征块对应特征块权重矩阵。
在本申请的一些实施例中,基于以上技术方案,概率预测模块740包括:
特征提取子模块,用于根据所述特征块权重矩阵中M列特征块权重进行特征提取,得到特征提取向量;
特征交叉子模块,用于根据所述推广信息和所述特征块权重矩阵进行特征交叉,得到特征交叉向量;
概率计算子模块,用于根据所述特征提取向量和特征交叉向量之间的概率映射,得到所述推广信息的点击概率。
在本申请的一些实施例中,基于以上技术方案,特征交叉子模块包括:
加权单元,用于对所述推广信息中各个特征的数据进行加权计算,得到第一交叉结果;
交叉单元,用于根据所述特征块权重矩阵中N行特征块权重进行特征交叉,得到第二交叉结果;
合并单元,用于合并所述第一交叉结果和所述第二交叉结果,得到特征交叉向量。
在本申请的一些实施例中,基于以上技术方案,所述特征提取向量通过特征提取模型计算得到,所述特征交叉向量通过特征交叉模型计算得到;信息推送装置700还包括:
数据获取模块,用于获取所述推广信息对应的训练数据,所述训练数据是根据所述点击概率进行信息推送后得到的数据;
训练模块,用于根据所述训练数据,对所述架构参数、所述特征提取模型和所述特征交叉模型进行训练,以更新所述架构参数、所述特征提取模型的第一模型参数和所述特征交叉模型的第二模型参数;
预测模块,用于通过更新后的架构参数、更新后的特征提取模型和更新后的特征交叉模型根据所述推广信息对应的数据进行点击预测。
在本申请的一些实施例中,基于以上技术方案,所述训练数据包含训练集和验证集;训练模块包括:
子集选择子模块,用于从所述验证集中选择验证子集并从所述训练集中选择训练子集;
第一训练子模块,用于根据所述验证子集对所述架构参数、所述特征提取模型和所述特征交叉模型进行训练,以更新所述架构参数;
第二训练子模块,用于根据所述训练子集对更新后的架构参数、所述特征提取模型和所述特征交叉模型进行训练,以更新所述第一模型参数和所述第二模型参数。
在本申请的一些实施例中,基于以上技术方案,第一训练子模块包括:
第一预测单元,用于通过所述架构参数、所述特征提取模型和所述特征交叉模型,根据所述验证子集对所述推广信息进行点击预测,得到第一估计概率;
第一交叉熵计算单元,用于根据所述第一估计概率和所述验证子集之间的映射关系,计算所述验证子集的交叉熵;
第一更新单元,用于根据所述验证子集的交叉熵与所述架构参数之间的映射关系,更新所述架构参数。
在本申请的一些实施例中,基于以上技术方案,第二训练子模块包括:
第二预测单元,用于通过所述更新后的架构参数、所述特征提取模型和所述特征交叉模型,根据所述训练子集对所述推广信息进行点击预测,得到第二估计概率;
第二交叉熵计算单元,用于根据所述第二估计概率和所述训练子集之间的映射关系,计算所述训练子集的交叉熵;
第二更新单元,用于根据所述训练子集的交叉熵与所述第一模型参数和所述第二模型参数之间的映射关系,更新所述第一模型参数和所述第二模型参数。
在本申请的一些实施例中,基于以上技术方案,数据获取模块包括:
信息推送子模块,用于根据所述推广信息的点击概率,向目标对象推送所述推广信息;
样本获取子模块,用于获取所述目标对象针对所述推广信息的点击数据和展示数据作为正样本数据和负样本数据;
数据集划分子模块,用于按照预设比例,将所述正样本数据和负样本数据划分为训练集和验证集,作为训练数据。
在本申请的一些实施例中,基于以上技术方案,信息推送装置700还包括:
候选信息获取子模块,用于根据目标对象的对象信息,获取多个候选信息;
候选概率预测子模块,用于根据各个候选信息的信息推广数据和对应的M×N个特征块权重,对所述多个候选信息进行点击预测,得到候选概率;
推广信息确定子模块,用于将所述候选概率满足候选条件的候选信息确定为推广信息。
在本申请的一些实施例中,基于以上技术方案,信息推送模块750还包括:
信息排序模块,用于根据所述推广信息集合中各个推广信息的点击概率对所述推广信息进行排序,得到信息排序结果;
信息推送模块,用于根据所述信息排序结果,对排序位置满足预设条件的推广信息进行推送。
需要说明的是,上述实施例所提供的装置与上述实施例所提供的方法属于同一构思,其中各个模块执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。
图8示出了适于用来实现本申请实施例的电子设备的计算机***的结构示意图。
需要说明的是,图8示出的电子设备的计算机***800仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图8所示,计算机***800包括中央处理单元(Central Processing Unit,CPU)801,其可以根据存储在只读存储器(Read-Only Memory,ROM)802中的程序或者从储存部分808加载到随机访问存储器(Random Access Memory,RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有***操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(Input/Output,I/O)接口805也连接至总线804。
以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分807;包括硬盘等的储存部分808;以及包括诸如LAN(Local Area Network,局域网)卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入储存部分808。
特别地,根据本申请的实施例,各个方法流程图中所描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本申请的***中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (15)

1.一种信息推送方法,其特征在于,包括:
根据推广信息的特征生成对应的M个嵌入向量;
根据预设的特征块数量,将每个嵌入向量划分为N个特征块,得到M×N个特征块;
根据每个特征块对应的架构参数,计算所述M×N个特征块对应的特征块权重,所述架构参数表示特征块被用于进行点击预测的概率,所述特征块权重表示对应的特征块对点击预测的重要程度;
根据M×N个特征块权重和所述推广信息预测所述推广信息的点击概率;
基于所述点击概率对所述推广信息进行推送。
2.根据权利要求1所述的方法,其特征在于,所述根据每个特征块对应的架构参数,计算所述M×N个特征块对应的特征块权重,包括:
根据每个特征块对应的第一架构参数和第二架构参数,针对每个特征块计算对应的特征块权重,其中,所述第一架构参数和第二架构参数是根据所述推广信息的历史点击数据对每个特征块确定的,所述第一架构参数表示对应的特征块被用于点击预测的概率,所述第二架构参数表示对应的特征块不被用于点击预测的概率;
对于M个嵌入向量,将每个嵌入向量划分的N个特征块的特征块权重排列成所述M×N个特征块对应特征块权重矩阵。
3.根据权利要求2所述的方法,其特征在于,所述根据M×N个特征块权重和所述推广信息预测所述推广信息的点击概率,包括:
根据所述特征块权重矩阵中M列特征块权重进行特征提取,得到特征提取向量;
根据所述推广信息和所述特征块权重矩阵进行特征交叉,得到特征交叉向量;
根据所述特征提取向量和特征交叉向量之间的概率映射,得到所述推广信息的点击概率。
4.根据权利要求3所述的方法,其特征在于,所述根据所述推广信息和所述特征块权重矩阵进行特征交叉,得到特征交叉向量,包括:
对所述推广信息中各个特征的数据进行加权计算,得到第一交叉结果;
根据所述特征块权重矩阵中N行特征块权重进行特征交叉,得到第二交叉结果;
合并所述第一交叉结果和所述第二交叉结果,得到特征交叉向量。
5.根据权利要求3所述的方法,其特征在于,所述特征提取向量通过特征提取模型计算得到,所述特征交叉向量通过特征交叉模型计算得到;所述根据M×N个特征块权重和所述推广信息预测所述推广信息的点击概率之后,所述方法还包括:
获取所述推广信息对应的训练数据,所述训练数据是根据所述点击概率进行信息推送后得到的数据;
根据所述训练数据,对所述架构参数、所述特征提取模型和所述特征交叉模型进行训练,以更新所述架构参数、所述特征提取模型的第一模型参数和所述特征交叉模型的第二模型参数;
通过更新后的架构参数、更新后的特征提取模型和更新后的特征交叉模型根据所述推广信息对应的数据进行点击预测。
6.根据权利要求5所述的方法,其特征在于,所述训练数据包含训练集和验证集;所述根据所述训练数据,对所述架构参数、所述特征提取模型和所述特征交叉模型进行训练,包括:
从所述验证集中选择验证子集并从所述训练集中选择训练子集;
根据所述验证子集对所述架构参数、所述特征提取模型和所述特征交叉模型进行训练,以更新所述架构参数;
根据所述训练子集对更新后的架构参数、所述特征提取模型和所述特征交叉模型进行训练,以更新所述第一模型参数和所述第二模型参数。
7.根据权利要求6所述的方法,其特征在于,所述根据所述验证子集对所述架构参数、所述特征提取模型和所述特征交叉模型进行训练,以更新所述架构参数,包括:
通过所述架构参数、所述特征提取模型和所述特征交叉模型,根据所述验证子集对所述推广信息进行点击预测,得到第一估计概率;
根据所述第一估计概率和所述验证子集之间的映射关系,计算所述验证子集的交叉熵;
根据所述验证子集的交叉熵与所述架构参数之间的映射关系,更新所述架构参数。
8.根据权利要求6所述的方法,其特征在于,所述根据所述训练子集对更新后的架构参数、所述特征提取模型和所述特征交叉模型进行训练,以更新所述第一模型参数和所述第二模型参数,包括:
通过所述更新后的架构参数、所述特征提取模型和所述特征交叉模型,根据所述训练子集对所述推广信息进行点击预测,得到第二估计概率;
根据所述第二估计概率和所述训练子集之间的映射关系,计算所述训练子集的交叉熵;
根据所述训练子集的交叉熵与所述第一模型参数和所述第二模型参数之间的映射关系,更新所述第一模型参数和所述第二模型参数。
9.根据权利要求5所述的方法,其特征在于,所述获取所述推广信息对应的训练数据,包括:
根据所述推广信息的点击概率,向目标对象推送所述推广信息;
获取所述目标对象针对所述推广信息的点击数据和展示数据作为正样本数据和负样本数据;
按照预设比例,将所述正样本数据和负样本数据划分为训练集和验证集,作为训练数据。
10.根据权利要求1所述的方法,其特征在于,所述根据推广信息的特征生成对应的M个嵌入向量之前,所述方法还包括:
根据目标对象的对象信息,获取多个候选信息;
根据各个候选信息的信息推广数据和对应的M×N个特征块权重,对所述多个候选信息进行点击预测,得到候选概率;
将所述候选概率满足候选条件的候选信息确定为推广信息。
11.根据权利要求1至10中任一项所述的方法,其特征在于,所述基于所述点击概率对所述推广信息进行推送,包括:
根据所述推广信息集合中各个推广信息的点击概率对所述推广信息进行排序,得到信息排序结果;
根据所述信息排序结果,对排序位置满足预设条件的推广信息进行推送。
12.一种信息推送装置,其特征在于,包括:
嵌入转换模块,用于根据推广信息的特征生成对应的M个嵌入向量;
向量划分模块,用于根据预设的特征块数量,将每个嵌入向量划分为N个特征块,得到M×N个特征块;
特征块权重模块,用于根据每个特征块对应的架构参数,计算所述M×N个特征块对应的特征块权重,所述架构参数表示特征块被用于进行点击预测的概率,所述特征块权重表示对应的特征块对点击预测的重要程度;
概率预测模块,用于根据M×N个特征块权重和所述推广信息预测所述推广信息的点击概率;
信息推送模块,用于基于所述点击概率对所述推广信息进行推送。
13.一种电子设备,其特征在于,包括:
处理器;
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至11中任一项所述的信息推送方法。
14.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至11中任一项所述的信息推送方法。
15.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机指令,所述计算机指令存储在计算机可读存储介质中,计算机设备的处理器从所述计算机可读存储介质读取并执行所述计算机指令,使得所述计算机设备执行如权利要求1至11中任一项所述的信息推送方法。
CN202211743037.4A 2022-12-29 2022-12-29 信息推送方法、装置、电子设备和可读介质 Pending CN117221386A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211743037.4A CN117221386A (zh) 2022-12-29 2022-12-29 信息推送方法、装置、电子设备和可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211743037.4A CN117221386A (zh) 2022-12-29 2022-12-29 信息推送方法、装置、电子设备和可读介质

Publications (1)

Publication Number Publication Date
CN117221386A true CN117221386A (zh) 2023-12-12

Family

ID=89041316

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211743037.4A Pending CN117221386A (zh) 2022-12-29 2022-12-29 信息推送方法、装置、电子设备和可读介质

Country Status (1)

Country Link
CN (1) CN117221386A (zh)

Similar Documents

Publication Publication Date Title
CN107463704B (zh) 基于人工智能的搜索方法和装置
US9990558B2 (en) Generating image features based on robust feature-learning
CN111008332B (zh) 内容项推荐方法、装置、服务器以及存储介质
WO2019232099A1 (en) Neural architecture search for dense image prediction tasks
CN111241394B (zh) 数据处理方法、装置、计算机可读存储介质及电子设备
CN110909182A (zh) 多媒体资源搜索方法、装置、计算机设备及存储介质
US11423307B2 (en) Taxonomy construction via graph-based cross-domain knowledge transfer
CN111914178A (zh) 基于人工智能的信息推荐方法、装置、电子设备及存储介质
CN112231580B (zh) 基于人工智能的信息推荐方法、装置、电子设备及存储介质
CN112199600A (zh) 目标对象识别方法和装置
CN106407381A (zh) 一种基于人工智能的推送信息的方法和装置
CN116452263A (zh) 一种信息推荐方法、装置、设备及存储介质、程序产品
Said et al. AI-based solar energy forecasting for smart grid integration
CN113705698B (zh) 基于点击行为预测的信息推送方法及装置
CN116993185B (zh) 时间序列预测方法、装置、设备及存储介质
CN112231299A (zh) 一种特征库动态调整的方法和装置
CN117217278A (zh) 模型训练方法、文本召回方法、设备、介质及程序产品
CN113837216B (zh) 数据分类方法、训练方法、装置、介质及电子设备
CN114580533A (zh) 特征提取模型的训练方法、装置、设备、介质及程序产品
CN117221386A (zh) 信息推送方法、装置、电子设备和可读介质
CN112417260B (zh) 本地化推荐方法、装置及存储介质
CN115329183A (zh) 数据处理方法、装置、存储介质及设备
CN115858911A (zh) 信息推荐方法、装置、电子设备及计算机可读存储介质
CN113094602A (zh) 酒店推荐方法、***、设备及介质
CN113128225A (zh) 命名实体的识别方法、装置、电子设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication