CN111738766B

CN111738766B - 用于多媒体信息的数据处理方法、装置以及服务器

Info

Publication number: CN111738766B
Application number: CN202010581757.XA
Authority: CN
Inventors: 王天驹; 卞俊杰; 叶璨; 韩帅; 杨乃君
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2020-06-23
Filing date: 2020-06-23
Publication date: 2023-10-27
Anticipated expiration: 2040-06-23
Also published as: CN111738766A

Abstract

本公开关于一种用于多媒体信息的数据处理方法、装置、服务器以及存储介质，该方法通过接收多媒体信息的资源确定指令，其中，资源确定指令基于信息请求而生成，多媒体信息中包含用于引导账户跳转到其他页面的引导信息，资源确定指令中至少携带有多媒体信息的目标展示位置信息；响应于资源确定指令，通过预定算法至少基于多媒体信息与目标展示位置信息，生成中间结果，其中，中间结果包括多媒体信息的曝光信息和交互信息；通过预定算法基于多媒体信息的曝光信息和交互信息，生成多媒体信息的转化信息；得到多媒体信息的转化信息对应的资源数据，实现通过同一预定算法获取转化信息的中间变量，提高确定投放多媒体信息所消耗的资源数据的准确性。

Description

用于多媒体信息的数据处理方法、装置以及服务器

技术领域

本公开涉及计算机技术领域，尤其涉及一种用于多媒体信息的数据处理方法、装置、服务器以及存储介质。

背景技术

ADX(AD Exchange)广告实时竞价交易平台中，广告通常经历展现、点击、激活这三个过程，而准确预测广告展现后的激活概率即广告转化率，可为后续的ADX竞价、估算广告投放成本提供重要依据。现有技术中对于广告转化率的预估，一般通过构建两个独立的模型进行广告投放过程中的广告投放到点击的展现点击率以及点击到激活的点击激活率的预估，进而计算广告投放到激活的转化率，即通过不同的算法模型获取广告投放过程中的不同的预测参数，进而基于中间过程的预测参数获取目标预测参数如广告转化率，这往往导致目标预测参数的准确度低。

发明内容

本公开提供一种用于多媒体信息的数据处理方法、装置、服务器以及存储介质，和一种广告投放资源消耗值获取方法、装置、服务器以及存储介质，以至少解决相关技术中点击激活率的预测准确性低，导致广告转化率的预测准确度低的问题。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种用于多媒体信息的数据处理方法，包括：

接收多媒体信息的资源确定指令，其中，所述资源确定指令基于信息请求而生成，所述多媒体信息中包含用于引导账户跳转到其他页面的引导信息，所述资源确定指令中至少携带有多媒体信息的目标展示位置信息；

响应于所述资源确定指令，通过预定算法至少基于所述多媒体信息与所述目标展示位置信息，生成中间结果，其中，所述中间结果包括所述多媒体信息的曝光信息和交互信息；

通过所述预定算法基于所述多媒体信息的曝光信息和交互信息，生成所述多媒体信息的转化信息；

得到所述多媒体信息的转化信息对应的资源数据。

在其中一个实施例中，所述通过预定算法至少基于所述多媒体信息与所述目标展示位置信息，生成中间结果的步骤，包括：

根据所述多媒体信息与所述目标展示位置信息，获取所述多媒体信息的多媒体展示特征向量；

将所述多媒体展示特征向量输入至设置有所述预定算法的算法模型中，分别通过所述算法模型中的曝光信息预测网络层以及所述交互信息预测网络层，获取所述多媒体信息的曝光信息和交互信息。

在其中一个实施例中，所述将所述多媒体展示特征向量输入至设置有所述预定算法的算法模型中的步骤之前，还包括：

获取多媒体训练样本，其中所述多媒体训练样本包括多媒体样本信息、所述多媒体样本信息的资源确定样本指令、曝光信息标签和转化信息标签；

根据所述多媒体样本信息与所述资源确定样本指令，获取所述多媒体样本信息的样本展示特征向量；

通过所述算法模型中的曝光信息预测网络层以及所述交互信息预测网络层，获取所述多媒体样本信息的曝光预测信息和交互预测信息；

根据所述曝光预测信息以及所述交互预测信息，生成所述多媒体样本信息的转化预测信息；

根据所述多媒体样本信息的所述曝光预测信息、所述转化预测信息、所述曝光信息标签和所述转化信息标签，对所述算法模型中的曝光信息预测网络层以及所述交互信息预测网络层中的网络参数进行调整。

在其中一个实施例中，所述获取多媒体训练样本的步骤，包括：

采集所述多媒体信息的历史资源确定指令，以及所述历史资源确定指令对应的历史投放数据，根据所述历史资源确定指令对应的历史投放数据获取所述多媒体信息的多媒体训练样本；

从所述历史投放数据确定所述多媒体信息的转化信息标签；

对转化信息标签为目标转化信息标签的历史资源确定指令进行过采样，得到多媒体训练样本。

在其中一个实施例中，所述根据所述多媒体样本信息的所述曝光预测信息、所述转化预测信息、所述曝光信息标签和所述转化信息标签，对所述算法模型中的曝光信息预测网络层以及所述交互信息预测网络层中的网络参数进行调整的步骤，包括：

根据所述多媒体样本信息的所述曝光预测信息以及所述曝光信息标签，获取所述算法模型的第一损失值；

根据所述多媒体样本信息的所述转化预测信息以及所述转化信息标签，获取所述算法模型的第二损失值；

根据所述第一损失值以及第二损失值确定所述算法模型的目标损失值；

根据所述目标损失值调整所述算法模型中的曝光信息预测网络层以及所述交互信息预测网络层中的网络参数。

根据本公开实施例的第二方面，提供一种用于多媒体信息的数据处理装置，包括：

指令接收模块，被配置执行接收多媒体信息的资源确定指令，其中，所述资源确定指令基于信息请求而生成，所述多媒体信息中包含用于引导账户跳转到其他页面的引导信息，所述资源确定指令中至少携带有多媒体信息的目标展示位置信息；

中间信息获取模块，被配置执行响应于所述资源确定指令，通过预定算法至少基于所述多媒体信息与所述目标展示位置信息，生成中间结果，其中，所述中间结果包括所述多媒体信息的曝光信息和交互信息；

转化信息获取模块，被配置执行通过所述预定算法基于所述多媒体信息的曝光信息和交互信息，生成所述多媒体信息的转化信息；

资源数据确定模块，被配置执行得到所述多媒体信息的转化信息对应的资源数据。

在其中一个实施例中，中间信息获取模块，被配置执行：

在其中一个实施例中，所述装置还包括模型训练模块，被配置执行：

在其中一个实施例中，所述模型训练模块，还被配置执行：

从所述历史投放数据确定所述多媒体信息的转化信息标签；

在其中一个实施例中，所述模型训练模块，还被配置执行：

根据本公开实施例的第三方面，提供一种服务器，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现如第一方面的任一项实施例中所述的用于多媒体信息的数据处理方法。

根据本公开实施例的第六方面，提供一种存储介质，当所述存储介质中的指令由服务器的处理器执行时，使得服务器能够执行如第一方面的任一项实施例中所述的用于多媒体信息的数据处理方法。

根据本公开实施例的第五方面，提供一种计算机程序产品，所述程序产品包括计算机程序，所述计算机程序存储在可读存储介质中，设备的至少一个处理器从所述可读存储介质读取并执行所述计算机程序，使得设备执行如第一方面的任一项实施例中所述的用于多媒体信息的数据处理方法。

本公开的实施例提供的技术方案至少带来以下有益效果：通过接收多媒体信息的资源确定指令，其中，资源确定指令基于信息请求而生成，多媒体信息中包含用于引导账户跳转到其他页面的引导信息，资源确定指令中至少携带有多媒体信息的目标展示位置信息；响应于资源确定指令，通过预定算法至少基于多媒体信息与目标展示位置信息，生成中间结果，其中，中间结果包括多媒体信息的曝光信息和交互信息；通过预定算法基于多媒体信息的曝光信息和交互信息，生成多媒体信息的转化信息，得到多媒体信息的转化信息对应的资源数据，实现通过同一预定算法获取转化信息的中间变量，进而得到的最终的转化信息以及转化信息的资源数据一致性高，提高多媒体信息的转化信息的准确性、投放多媒体信息所消耗的资源数据的准确性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种用于多媒体信息的数据处理方法的流程图。

图2是根据一示例性实施例示出的一种算法模型的示意图。

图3是根据一示例性实施例示出的一种算法模型训练过程步骤的流程图。

图4是根据一示例性实施例示出的一种用于多媒体信息的数据处理装置的框图。

图5是根据一示例性实施例示出的一种服务器的内部结构图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本公开可以应用于ADX(AD Exchange)广告实时竞价交易平台，ADX广告是业内比较广泛使用的广告投放方式，形式上为实时竞价，结合二价计费，广告计费方式有CPC(CostPer Mille，每一千人展示成本)、CPI(Cost Per Install,每安装成本)、CPA(Cost PerAction，每行动成本)等方式。在ADX广告实时竞价交易平台中，广告通常经历展现、点击、激活这三个过程，例如，广告主可通过广告平台将广告投放到多个网站页面，此为广告展现过程，在用户浏览网站页面时针对网站页面中的广告触发点击操作，此为广告点击过程，当用户浏览广告后进行与广告相关的行为，如通过手机应用程序广告提供的链接进行下载手机应用程序的行为、通过商品广告提供的链接进行商品购买的行为等，此为广告激活过程。其中，广告从展现到点击的过程、从点击到激活的过程呈现行为漏斗形态，也就是说曝光的广告数量、曝光后被点击的广告数据与点击/曝光后被激活的广告数量间的差异大，曝光后被点击的广告数据与点击后被激活的广告数量通常占所有曝光的广告数量的比例为万分之一数量级，传统的构建两个独立的模型进行广告投放过程中的广告投放到点击的展现点击率预估以及点击到激活的点击激活率预估的技术中，获取广告投放过程中的不同的预测参数，进而基于中间过程的预测参数获取广告转化率，这往往导致广告转化率的准确度低。而且点击激活率的预测模型通常使用的是曝光后被点击的广告数据进行模型训练，训练样本数量级少，正样本数据洗漱性高，导致训练得到的点击激活率的预测模型准确性低。

图1是根据一示例性实施例示出的一种用于多媒体信息的数据处理方法的流程图，如图2所示，用于多媒体信息的数据处理方法用于服务器中，包括以下步骤：

在步骤S110中，接收多媒体信息的资源确定指令，其中，资源确定指令基于信息请求而生成，多媒体信息中包含用于引导账户跳转到其他页面的引导信息，资源确定指令中至少携带有多媒体信息的目标展示位置信息。

在步骤S120中，响应于资源确定指令，通过预定算法至少基于多媒体信息与目标展示位置信息，生成中间结果，其中，中间结果包括多媒体信息的曝光信息和交互信息；

在步骤S130中，通过预定算法基于多媒体信息的曝光信息和交互信息，生成多媒体信息的转化信息；

在步骤S140中，得到多媒体信息的转化信息对应的资源数据。

其中，多媒体信息是指包含有引导账户跳转到特定页面的引导信息，例如广告信息，多媒体信息的形式可以是视频、图像、图文等，在此不进行限定。其中，资源确定指令用于指示服务器获取投放多媒体信息至目标展示位置所消耗的资源数据，资源数据可以是积分数量、货币数值等。

其中，服务器接收到资源确定指令后，响应该资源确定指令，利用预定算法根据多媒体信息以及目标展示位置信息获取投放该多媒体信息的中间结果，其中，中间结果用于表示多媒体信息投放的各个阶段过程中，账户(即用户账号)针对多媒体信息的反馈操作信息，具体地，中间结果至少包括曝光信息以及交互信息，曝光信息可用于表示多媒体信息的展示后被账户点击查看的次数或概率，交互信息可用于表示多媒体信息被账户点击查看后，响应引导信息执行跳转操作的次数或概率。具体地，在一个实施例中，服务器可以将多媒体信息以及目标展示位置信息输入至设置有预定算法的算法模型，通过设置有预定算法的算法模型获取投放该多媒体信息的中间结果。

在得到中间结果后，服务器根据中间结果中的曝光信息和交互信息，获取多媒体信息的转化信息，并基于转化信息获取对应的资源数据。其中，转化信息用于响应引导信息执行跳转操作行为的信息。

以应用于ADX广告实时竞价交易平台为例，多媒体信息为广告信息为例，当广告用户想要投放广告至指定的目标展示位置时，广告用户可通过终端发起资源确定指令至ADX广告实时竞价交易平台的服务器中，服务器在接收到资源确定指令后，响应该资源确定指令，确认投放广告信息至目标展示位置时，广告信息从展现到点击的曝光信息以及广告形象从点击到激活的交互信息，进而根据曝光信息以及交互西南西获取广告信息从展现到激活的转化信息，进而获取与转化信息对应的资源数据，如ADX广告实时竞价交易平台的积分，并将资源数据返回至广告用户对应的终端中。

上述用于多媒体信息的数据处理方法，通过接收多媒体信息的资源确定指令，其中，资源确定指令基于信息请求而生成，多媒体信息中包含用于引导账户跳转到其他页面的引导信息，资源确定指令中至少携带有多媒体信息的目标展示位置信息；响应于资源确定指令，通过预定算法至少基于多媒体信息与目标展示位置信息，生成中间结果，其中，中间结果包括多媒体信息的曝光信息和交互信息；通过预定算法基于多媒体信息的曝光信息和交互信息，生成多媒体信息的转化信息，得到多媒体信息的转化信息对应的资源数据，实现通过同一预定算法获取转化信息的中间变量，进而得到的最终的转化信息以及转化信息的资源数据一致性高，提高多媒体信息的转化信息的准确性、投放多媒体信息所消耗的资源数据的准确性。

在一个实施例中，通过预定算法至少基于多媒体信息与目标展示位置信息，生成中间结果的步骤，包括：根据多媒体信息与目标展示位置信息，获取多媒体信息的多媒体展示特征向量；将多媒体展示特征向量输入至设置有预定算法的算法模型中，分别通过算法模型中的曝光信息预测网络层以及交互信息预测网络层，获取多媒体信息的曝光信息和交互信息。

其中，多媒体信息包括多媒体本身的数据信息，例如，文字形式的多媒体信息可以包括上下文特征数据，视频形式的多媒体信息可以包括视频帧数据、音频数据等，图像形式的多媒体信息可以包括图像特征数据。目标展示位置信息包括表征在目标展示位置的位置信息以及该目标展示位置对应的投放对象信息等，投放对象信息例如投放对象的用户年龄、用户性别、用户画像信息等。具体地，在获取到多媒体信息与目标展示位置信息，服务器将多媒体信息与目标展示位置信息映射为多媒体信息在本次投放中的多媒体展示特征向量。进一步地，在一个实施例中，设置有预定算法的算法模型包括特征网络层，服务器可以将将多媒体信息与目标展示位置信息输入至设置有预定算法的算法模型，通过算法模型的特征网络层获取多媒体展示特征向量。

在获取到多媒体展示特征向量后，服务器将多媒体展示特征向量输入至设置有预定算法的算法模型中，分别通过算法模型中的曝光信息预测网络层以及交互信息预测网络层，获取多媒体信息的曝光信息和交互信息。

其中，设置有预定算法的算法模型可以是神经网络模型；这里的算法模型是指已经过训练的模型，输入的是多媒体展示特征向量，输出的是多媒体信息的曝光信息和交互信息。具体地，设置有预定算法的算法模型包括曝光信息预测网络层以及交互信息预测网络层，如图2所示，图2是根据一示例性实施例示出的算法模型的示意图。其中，曝光信息预测网络层用于依据多媒体展示特征向量，预测本次多媒体信息投放过程中多媒体信息展现后被点击查阅的曝光概率值，即曝光信息；交互信息预测网络层用于依据多媒体展示特征向量，预测本次多媒体信息投放过程中广告被点击查阅后，响应引导信息执行跳转操作的概率值，即交互信息。

进一步地，曝光信息预测网络层可以是二分类网络模型，通过该二分类网络模型可预测多媒体信息被归类为被点击查看类别、被忽略关闭类别的置信度，从而根据被归类到点击打开类别的置信度，确定多媒体信息的曝光信息；同样的，交互信息预测网络层也可以是二分类网络模型，通过该二分类网络模型可预测多媒体信息被归类为被点击后执行跳转操作的类别、点击后不执行跳转操作的类别的置信度，从而根据被归类到被点击后执行跳转操作的类别的置信度，确定多媒体信息的交互信息。

本实施例中通过设置有预定算法的算法模型实现准确获取转化信息的中间结果，后续可根据中间结果得到最终的转化信息以及转化信息的资源数据，提高多媒体信息的转化信息的准确性。

在一个实施例中，如图3所示，将多媒体展示特征向量输入至设置有预定算法的算法模型中的步骤之前，还包括：

在步骤S310中，获取多媒体训练样本，其中多媒体训练样本包括多媒体样本信息、多媒体样本信息的资源确定样本指令、曝光信息标签和转化信息标签；

在步骤S320中，根据多媒体样本信息与资源确定样本指令，获取多媒体样本信息的样本展示特征向量；

在步骤S330中，通过算法模型中的曝光信息预测网络层以及交互信息预测网络层，获取多媒体样本信息的曝光预测信息和交互预测信息；

在步骤S340中，根据曝光预测信息以及交互预测信息，生成多媒体样本信息的转化预测信息；

在步骤S350中，根据多媒体样本信息的曝光预测信息、转化预测信息、曝光信息标签和转化信息标签，对算法模型中的曝光信息预测网络层以及交互信息预测网络层中的网络参数进行调整。

本实施例为算法模型中的训练过程，其中，多媒体训练样本可以是从多媒体信息的历史投放数据中得到，例如，某一多媒体信息被投放100次，则可获取该多媒体信息对应的100条投放记录数据作为多媒体训练样本。

具体地，多媒体训练样本可以包括多媒体样本信息、该多媒体样本信息的资源确定样本指令，以及多媒体样本信息投放后的曝光信息标签和转化信息标签，其中，曝光信息标签记录着在资源确定样本指令对应的展示位置中，投放多媒体样本信息后，多媒体样本信息是否被点击查阅的情况，转化信息标签记录着在资源确定样本指令对应的展示位置中，投放多媒体样本信息后，多媒体样本信息是否执行跳转操作的情况。

在获取到多媒体训练样本，服务器根据多媒体样本信息以及资源确定样本指令，获取多媒体样本信息的样本展示特征向量，并将样本展示特征向量输入至算法模型中，通过算法模型中的曝光信息预测网络层，获取多媒体样本信息的曝光预测信息，同时通过交互信息预测网络层，获取多媒体样本信息的交互预测信息，进而根据曝光预测信息以及交互预测信息，生成多媒体样本信息的转化预测信息，后续根据多媒体样本信息的曝光预测信息、转化预测信息、曝光信息标签和转化信息标签，对算法模型中的曝光信息预测网络层以及交互信息预测网络层中的网络参数进行调整。可以理解的是，这里的算法模型是未进行训练的网络模型。

具体地，在获取到多媒体样本信息的曝光预测信息以及转化预测信息后，根据多媒体样本信息的曝光预测信息、转化预测信息、曝光信息标签和转化信息标签，获取转化率预测模型的损失函数，进而根据算法模型的损失函数对应的损失值对算法模型进行参数调整，实现算法模型的交互信息预测网络层的参数调整。

上述算法模型的训练过程，通过引入多媒体信息投放到点击的曝光信息以及投放到执行跳转操作的转化信息，辅助交互信息预测网络层的训练，用于预估多媒体信息投放到点击的交互信息的交互信息预测网络层作为算法模型的中间层，交互信息作为一个中间变量，将交互信息预测网络层的训练转化为一个端到端的算法模型的训练，由于用于预估多媒体信息对应转化信息的算法模型可基于全空间中所有投放的多媒体信息作为样本数据进行训练的，因而衍生的交互信息预测网络层也是基于全空间的中所有投放展现的多媒体信息作为样本数据进行训练的，可以利用展现但未被点击的多媒体信息进行模型网络训练，大大提高训练交互信息预测网络层的训练样本量，有效提高交互信息预测网络层的准确性，提高转化信息的准确度。同时，由于用于预估多媒体信息对应转化信息的算法模型是基于全空间的中所有投放展现的多媒体信息进行训练的，因此衍生的交互信息预测网络层也适用于全空间的中所有展现的多媒体信息的交互信息的确定，即是无偏的，有效避免模型有偏估计的问题，提高确定交互信息的准确性以及转化信息的准确性。

进一步地，在一个实施例中，根据多媒体样本信息的曝光预测信息、转化预测信息、曝光信息标签和转化信息标签，对算法模型中的曝光信息预测网络层以及交互信息预测网络层中的网络参数进行调整的步骤，包括：根据多媒体样本信息的曝光预测信息以及曝光信息标签，获取算法模型的第一损失值；根据多媒体样本信息的转化预测信息以及转化信息标签，获取算法模型的第二损失值；根据第一损失值以及第二损失值确定算法模型的目标损失值；根据目标损失值调整算法模型中的曝光信息预测网络层以及交互信息预测网络层中的网络参数。

其中，当多媒体样本信息在本次投放过程中被点击且响应引导信息执行跳转操作，曝光信息标签以及转化信息标签可以均标识为1，当多媒体样本信息在本次投放过程中被点击但未响应引导信息执行跳转操作，曝光信息标签标识为1而转化信息标签标识为0，当多媒体样本信息在本次投放过程中未响应引导信息执行跳转操作，曝光信息标签以及转化信息标签可以均标识为0。

在获取到多媒体样本信息的曝光预测信息以及转化预测信息后，服务器根据曝光预测信息以及曝光信息标签，计算第一损失值，并根据转化预测信息以及转化信息标签，计算第二损失值，从而根据第一损失值以及第二损失值确定目标损失值，利用目标损失值对算法模型的网络参数进行调整，实现对算法模型进行训练，直至算法模型收敛。其中，第一损失值以及第二损失值可以是利用交叉熵损失函数计算获得的。

具体地，可以是计算第一损失值以及第二损失值的加权平均值，将得到的加权平均值确定为算法模型的目标损失值。在获得算法模型的目标损失值后，利用反向传播算法，根据目标损失值对算法模型中各个网络层的网络参数进行调整。

在一个实施例中，获取多媒体训练样本的步骤，包括：采集多媒体信息的历史资源确定指令，以及历史资源确定指令对应的历史投放数据，根据历史资源确定指令对应的历史投放数据获取多媒体信息的多媒体训练样本；从历史投放数据确定多媒体信息的转化信息标签；对转化信息标签为目标转化信息标签的历史资源确定指令进行过采样，得到多媒体训练样本。

其中，转化信息标签中还可以记载着响应引导信息执行了跳转操作后，目标账号在次日或次周是否留存的情况。具体地，服务器可以获取多媒体信息的历史资源确定指令，以及历史资源确定指令对应的历史投放数据，历史投放数据中记载着多媒体信息每次投放过程中的数据信息，例如多媒体信息、目标展示位置信息以及多媒体信息投放后的转化信息、曝光信息等数据。在采集到多媒体信息的历史投放数据后，根据历史投放数据生成多媒体训练样本；同时，服务器根据转化信息标签获取多媒体信息此次投放后次留情况，当此次投放后次留情况为新增的用户在次日或次周依然留存，则对该多媒体训练样本进行过采样，即重复采样，从而得到最终的多媒体训练样本。以应用于ADX广告实时竞价交易平台为例，在广告投放过程中，广告主往往更关心广告展现并激活后用户的留存率等深度行为转化信息，当广告转化信息对应转发概率高，但广告激活后的用户次留率很低，会影响广告主对广告平台的信心，造成预算和出价的降低而影响ADX平台的收益，本示例性实施例中，对于留标签标识为新增的用户在次日或次周依然留存的广告训练样本进行重复采样，训练得到的模型更倾向于针对广告投放后用户深度行为转化率高的广告投放数据进行出价。

应该理解的是，虽然图2或图3的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2或图3中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

图4是根据一示例性实施例示出的一种用于多媒体信息的数据处理装置的框图。参照图4，该装置包括指令接收模块410，中间信息获取模块420，转化信息获取模块430和资源数据确定模块440。

指令接收模块410，被配置执行接收多媒体信息的资源确定指令，其中，资源确定指令基于信息请求而生成，多媒体信息中包含用于引导账户跳转到其他页面的引导信息，资源确定指令中至少携带有多媒体信息的目标展示位置信息；

中间信息获取模块420，被配置执行响应于资源确定指令，通过预定算法至少基于多媒体信息与目标展示位置信息，生成中间结果，其中，中间结果包括多媒体信息的曝光信息和交互信息；

转化信息获取模块430，被配置执行通过预定算法基于多媒体信息的曝光信息和交互信息，生成多媒体信息的转化信息；

资源数据确定模块440，被配置执行得到多媒体信息的转化信息对应的资源数据。

在其中一个实施例中，中间信息获取模块，被配置执行：根据多媒体信息与目标展示位置信息，获取多媒体信息的多媒体展示特征向量；将多媒体展示特征向量输入至设置有预定算法的算法模型中，分别通过算法模型中的曝光信息预测网络层以及交互信息预测网络层，获取多媒体信息的曝光信息和交互信息。

在一个实施例中，用于多媒体信息的数据处理装置还包括模型训练模块，被配置执行：获取多媒体训练样本，其中多媒体训练样本包括多媒体样本信息、多媒体样本信息的资源确定样本指令、曝光信息标签和转化信息标签；根据多媒体样本信息与资源确定样本指令，获取多媒体样本信息的样本展示特征向量；通过算法模型中的曝光信息预测网络层以及交互信息预测网络层，获取多媒体样本信息的曝光预测信息和交互预测信息；根据曝光预测信息以及交互预测信息，生成多媒体样本信息的转化预测信息；根据多媒体样本信息的曝光预测信息、转化预测信息、曝光信息标签和转化信息标签，对算法模型中的曝光信息预测网络层以及交互信息预测网络层中的网络参数进行调整。

在一个实施例中，模型训练模块，还被配置执行：采集多媒体信息的历史资源确定指令，以及历史资源确定指令对应的历史投放数据，根据历史资源确定指令对应的历史投放数据获取多媒体信息的多媒体训练样本；从历史投放数据确定多媒体信息的转化信息标签；对转化信息标签为目标转化信息标签的历史资源确定指令进行过采样，得到多媒体训练样本。

在一个实施例中，模型训练模块，还被配置执行：根据多媒体样本信息的曝光预测信息以及曝光信息标签，获取算法模型的第一损失值；根据多媒体样本信息的转化预测信息以及转化信息标签，获取算法模型的第二损失值；根据第一损失值以及第二损失值确定算法模型的目标损失值；根据目标损失值调整算法模型中的曝光信息预测网络层以及交互信息预测网络层中的网络参数。

图5是根据一示例性实施例示出的一种用于处理多媒体信息的设备500的框图。例如，设备500可以为一服务器。参照图5，设备500包括处理组件520，其进一步包括一个或多个处理器，以及由存储器522所代表的存储器资源，用于存储可由处理组件520的执行的指令，例如应用程序。存储器522中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件520被配置为执行指令，以执行上述用于多媒体信息的数据处理方法。

设备500还可以包括一个电源组件524被配置为执行设备500的电源管理，一个有线或无线网络接口526被配置为将设备500连接到网络，和一个输入输出(I/O)接口628。设备500可以操作基于存储在存储器522的操作***，例如Windows Server，Mac OS X，Unix，Linux，FreeBSD或类似。

在示例性实施例中，还提供了一种包括指令的存储介质，例如包括指令的存储器522，上述指令可由设备500的处理器执行以完成上述方法。存储介质可以是非临时性计算机可读存储介质，例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种用于多媒体信息的数据处理方法，其特征在于，包括：

得到所述多媒体信息的转化信息对应的资源数据；

其中，所述通过预定算法至少基于所述多媒体信息与所述目标展示位置信息，生成中间结果的步骤，包括：

2.根据权利要求1所述的用于多媒体信息的数据处理方法，其特征在于，所述将所述多媒体展示特征向量输入至设置有所述预定算法的算法模型中的步骤之前，还包括：

3.根据权利要求2所述的用于多媒体信息的数据处理方法，其特征在于，所述获取多媒体训练样本的步骤，包括：

从所述历史投放数据确定所述多媒体信息的转化信息标签；

4.根据权利要求2所述的用于多媒体信息的数据处理方法，其特征在于，所述根据所述多媒体样本信息的所述曝光预测信息、所述转化预测信息、所述曝光信息标签和所述转化信息标签，对所述算法模型中的曝光信息预测网络层以及所述交互信息预测网络层中的网络参数进行调整的步骤，包括：

5.一种用于多媒体信息的数据处理装置，其特征在于，包括：

资源数据确定模块，被配置执行得到所述多媒体信息的转化信息对应的资源数据；

其中，所述中间信息获取模块，被配置执行：

6.根据权利要求5所述的用于多媒体信息的数据处理装置，其特征在于，所述装置还包括模型训练模块，被配置执行：

7.根据权利要求6所述的用于多媒体信息的数据处理装置，其特征在于，所述模型训练模块，还被配置执行：

从所述历史投放数据确定所述多媒体信息的转化信息标签；

8.根据权利要求6所述的用于多媒体信息的数据处理装置，其特征在于，所述模型训练模块，还被配置执行：

9.一种服务器，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至4中任一项所述的用于多媒体信息的数据处理方法。

10.一种存储介质，当所述存储介质中的指令由服务器的处理器执行时，使得服务器能够执行如权利要求1至4中任一项所述的用于多媒体信息的数据处理方法。