CN114240506A

CN114240506A - 多任务模型的建模方法、推广内容处理方法及相关装置

Info

Publication number: CN114240506A
Application number: CN202111573367.9A
Authority: CN
Inventors: 吴寅初; 佘琪; 王长虎
Original assignee: Beijing Youzhuju Network Technology Co Ltd
Current assignee: Beijing Youzhuju Network Technology Co Ltd
Priority date: 2021-12-21
Filing date: 2021-12-21
Publication date: 2022-03-25
Also published as: WO2023116138A1

Abstract

本公开提供了一种多任务模型的建模方法、推广内容处理方法及相关装置，涉及人工智能技术领域。该多任务模型的建模方法包括：获取用于构建任务的特征，根据所述用于构建任务的特征构建初始任务集合；确定所述初始任务集合中不同任务之间的互信息；根据所述不同任务之间的互信息，获得相关任务集合，所述相关任务集合中包括的任务的互信息满足第一预设条件；根据所述相关任务集合中各任务对应的特征，生成多任务模型的样本，利用所述多任务模型的样本进行模型训练，获得所述多任务模型。如此，该方法能够使得多任务模型中多个任务之间的存在较强的相关性，提高多任务模型的学习效率。

Description

多任务模型的建模方法、推广内容处理方法及相关装置

技术领域

本公开涉及人工智能(artificial intelligence，AI)技术领域，尤其涉及多任务模型的建模方法、推广内容处理方法、装置、设备、计算机可读存储介质以及计算机程序产品。

背景技术

随着计算机技术尤其是人工智能技术的发展，人工智能技术的应用场景越来越广泛。例如，在推广内容(例如广告)推送的场景中，可以基于人工智能技术预测推广内容的转化率，进而基于该转化率向用户推送该推广内容。

为了提高模型的泛化能力，提高预测的转化率的准确性，通常采用多任务学习(muti task learning，MTL)的方式构建多任务模型。目前，基于人工主观经验选择多个任务，进行多任务学习，以使不同任务之间共享已学到的特征，进而提高多任务模型的学习效率以及泛化能力。

然而，依赖主观经验选择的多个任务会存在相关性较差的情况，会导致多个任务之间存在负面影响的情况，降低多任务模型的学习效率。

发明内容

本公开的目的在于：提供了一种多任务模型的建模方法、推广内容处理方法、装置、设备、计算机可读存储介质以及计算机程序产品，能够提高多任务模型的学习效率。

第一方面，本公开提供了一种多任务模型的建模方法，包括：

获取用于构建任务的特征，根据所述用于构建任务的特征构建初始任务集合；所述初始任务集合包括：推广内容的转化率、所述推广内容的播放时长、所述推广内容的呈现类型和所述推广内容中推广对象的信息中的至少两种；

确定所述初始任务集合中不同任务之间的互信息；

根据所述不同任务之间的互信息，获得相关任务集合，所述相关任务集合中包括的任务的互信息满足第一预设条件；

根据所述相关任务集合中各任务对应的特征，生成多任务模型的样本，利用所述多任务模型的样本进行模型训练，获得所述多任务模型。

第二方面，本公开提供了一种推广内容处理方法，包括：

获取用户对推广内容的行为的属性；

根据所述用户对所述推广内容的行为的属性和多任务模型，获得所述多任务模型的推理结果；所述多任务模型基于相关任务集合中个任务对应的特征生成的所述多任务模型的样本得到，所述相关任务集合基于不同任务之间的互信息得到，所述不同任务为用于构建任务的特征所构建的初始任务集合中的任务；所述推理结果包括推广内容的转化率、所述推广内容的播放时长、所述推广内容的呈现类型或所述推广内容中推广对象的信息中的多种；

根据所述推理结果，调整对所述推广内容的推广策略。

第三方面，本公开提供了一种多任务模型的建模装置，包括：

获取模块，用于获取用于构建任务的特征，根据所述用于构建任务的特征构建初始任务集合；所述初始任务集合包括：推广内容的转化率、所述推广内容的播放时长、所述推广内容的呈现类型和所述推广内容中推广对象的信息中的至少两种；

互信息确定模块，用于确定所述初始任务集合中不同任务之间的互信息；

相关任务确定模块，用于根据所述不同任务之间的互信息，获得相关任务集合，所述相关任务集合中包括的任务的互信息满足第一预设条件；

训练模块，用于根据所述相关任务集合中各任务对应的特征，生成多任务模型的样本，利用所述多任务模型的样本进行模型训练，获得所述多任务模型。

第四方面，本公开提供了一种推广内容处理装置，其特征在于，包括：

获取模块，用于获取用户对推广内容的行为的属性；

推理模块，用于根据所述用户对所述推广内容的行为的属性和多任务模型，获得所述多任务模型的推理结果；所述多任务模型基于相关任务集合中个任务对应的特征生成的所述多任务模型的样本得到，所述相关任务集合基于不同任务之间的互信息得到，所述不同任务为用于构建任务的特征所构建的初始任务集合中的任务；所述推理结果包括推广内容的转化率、所述推广内容的播放时长、所述推广内容的呈现类型或所述推广内容中推广对象的信息中的多种；

处理模块，用于根据所述推理结果，调整对所述推广内容的推广策略。

第五方面，本公开提供一种计算机可读介质，其上存储有计算机程序，该程序被处理装置执行时实现本公开第一方面或第二方面中任一项所述方法的步骤。

第六方面，本公开提供一种电子设备，包括：

存储装置，其上存储有计算机程序；

处理装置，用于执行所述存储装置中的所述计算机程序，以实现本公开第一方面或第二方面中任一项所述方法的步骤。

第七方面，本公开提供了一种包含指令的计算机程序产品，当其在设备上运行时，使得设备执行上述第一方面或第二方面的任一种实现方式所述的方法。

从以上技术方案可以看出，本公开具有如下优点：

本公开提供了多任务模型的建模方法，该方法中，先获取用于构建任务的特征，基于该用于构建任务的特征构建初始任务集合，然后确定该初始任务集合中不同任务之间的互信息，基于该互信息对初始任务集合中进行筛选，得到相关性较强的相关任务集合；接着，基于该相关任务集合中个任务对应的特征，生成多任务模型的样本，以对多任务模型进行训练。与单纯依赖主观经验选择的多个任务相比，本公开对初始任务集合进行筛选后得到的相关任务集合中的任务之间的相关性较强。如此，在进行多任务学习过程中，能够提高多任务模型的学习效率。

本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

为了更清楚地说明本公开实施例的技术方法，下面将对实施例中所需使用的附图作以简单地介绍。

图1为本公开实施例提供的一种多任务模型的建模方法的流程图；

图2为本公开实施例提供的一种获取相关任务集合的示意图；

图3为本公开实施例提供的一种多任务模型的示意图；

图4为本公开实施例提供的又一种多任务模型的建模方法的流程图；

图5为本公开实施例提供的一种推广内容处理方法的流程图；

图6为本公开实施例提供的一种多任务模型的建模装置的示意图；

图7为本公开实施例提供的一种推广内容处理装置的示意图；

图8为本公开实施例提供的一种电子设备的结构示意图。

具体实施方式

本公开实施例中的术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。

首先对本公开实施例中所涉及到的一些技术术语进行介绍。

多任务模型指基于多任务学习的方式构建的模型。多任务学习的核心在于：多个任务并行训练，并且互相共享已学到的特征。在推广内容推送场景中，通常也需要对多项内容进行预测，每一项内容可以抽象为一个任务，例如预测转化率、预测***、预测用户是否点击推广内容等。基于此，可以基于多任务学习的方式，构建多任务模型，以对多项内容进行预测。

在多任务学习过程中，多个任务之间的相关性较强时，多个任务共享已学到的特征，可以提高多任务模型的学习效率；多个任务之间的相关性较弱时，多个任务共享已学到的特征，多个任务之间会出现负迁移现象，即，多个任务之间互相产生负面影响，使每个任务预测的准确率均降低，降低多任务模型的学习效率。

目前，主要依赖主观经验来选择多个任务，并构建多任务模型。基于主观经验选择的多个任务会存在相关性较差的情况，进而降低多任务模型的学习效率。

有鉴于此，本公开实施例提供了一种多任务模型的建模方法，该方法可以由电子设备执行。电子设备可以是服务器。服务器可以是云服务器，例如是中心云计算集群中的中心服务器，或者是边缘云计算集群中的边缘服务器。当然，服务器也可以是本地数据中心中的服务器。本地数据中心是指用户直接控制的数据中心。

该多任务模型的建模方法包括：电子设备获取用于构建任务的特征，根据用于构建任务的特征构建初始任务集合，然后确定初始任务集合中不同任务之间的互信息，基于不同任务之间的互信息，得到相关任务集合，相关任务集合中的互信息满足第一预设条件，根据该相关任务集合中个任务对应的特征，生成多任务模型的样本，利用多任务模型的样本进行模型训练，获得多任务模型。

可见，在本公开实施例提供的多任务模型的建模方法中，电子设备先对初始任务集合进行了筛选，得到的相关任务集合中的任务之间的相关性较强，与单纯地依赖主观经验选择的多个任务相比，提高了多任务模型对应的多个任务之间的相关性。如此，在进行多任务学习过程中，能够提高多任务模型的学习效率。

利用本公开实施例提供的多任务模型的建模方法得到的多任务模型可以应用于多种场景。例如，推广内容推送场景中，多任务模型可以用于预测推广内容的转化率、推广内容的播放时长(推广内容开始播放起直至用户关闭该推广内容所经过的时长)。电子设备可以将用户对推广内容的行为的属性，输入给多任务模型，进而得到上述推理结果。接着电子设备可以基于上述推理结果，调整该推广内容的推广策略。例如推广内容的转化率大于或等于转化率阈值时，且推广内容的播放时长大于或等于时长阈值时，提高该推广内容的推广次数；推广内容的转化率小于转化率阈值时，且推广内容的播放时长小于时长阈值时，降低该推广内容的推广次数。

为了使得本公开的技术方案更加清楚、易于理解，下面以电子设备的角度，对本公开实施例提供的多任务模型的建模方法进行介绍。如图1所示，该图为本公开实施例提供的一种多任务模型的建模方法的流程图，该方法包括：

S101：电子设备获取用于构建任务的特征，根据该用于构建任务的特征构建初始任务集合。

电子设备可以获取初始数据，该初始数据包括多个特征。举例说明，在推广内容推送场景中，初始数据可以包括推广内容的转化率、推广内容的播放时长、推广内容的呈现类型、推广内容中推广对象的信息、推广内容的生成时间等特征。

电子设备可以基于初始数据获取用于构建任务的特征。在一些示例中，电子设备可以接收开发人员配置的多个特征，作为用于构建任务的特征。例如，电子设备可以通过显示装置(例如显示屏)向用户呈现多个候选特征，如上述初始数据所包括的特征，接着根据开发人员对多个候选特征的选择操作，将开发人员所选择的特征作为用于构建任务的特征。接着，电子设备基于该用于构建任务的特征，构建初始任务集合。

S102：电子设备确定初始任务集合中不同任务之间的互信息。

互信息(mutual information，MI)是指两个随机变量之间的关联程度，即给定一个随机变量后，另一个随机变量不确定性的削弱程度。例如，互信息取值为0(最小值)时，表明给定一个随机变量对确定另一个随机变量没有关系；互信息取值为随机变量的熵(最大值)时，表明给定一个随机变量，能够完全消除另一个随机变量的不确定性。

如图2所示，电子设备可以分别计算初始任务集合中不同任务之间的互信息。例如电子设备可以基于初始任务集合中任务的特征，计算不同任务之间的互信息。具体地，电子设备可以基于如下公式计算初始任务集合中不同任务之间的互信息：

其中，I(X；Y)为初始任务集合中任务X和任务Y之间的互信息；x为任务X对应的特征，y为任务Y对应的特征；p(x，y)为任务X和任务Y同时发生的概率，p(x)为任务X发生的概率，p(y)为任务Y发生的概率。

需要说明的是，初始任务集合中不同任务之间的互信息是非负的，即，I(X；Y)≥0，并且，I(Y；X)＝I(X；Y)，均表示初始任务集合中任务X和任务Y之间的互信息。

S103：电子设备根据不同任务之间的互信息，获得相关任务集合，该相关任务集合中包括的任务的互信息满足第一预设条件。

如上述，互信息可以表征多个随机变量中一个随机变量对另一个随机变量的不确定性，基于此，电子设备可以基于初始任务集合中不同任务之间的互信息，对初始任务集合进行筛选，进而得到相关任务集合，该相关任务集合中包括的任务的互信息满足第一预设条件。例如，第一预设条件可以是不同任务之间的互信息大于或等于互信息阈值。

在一些示例中，电子设备可以接收开发人员配置的互信息阈值，以基于该配置的互信息阈值来确定相关任务集合，从而使得开发人员在一定的范围内，对相关任务集合中的任务进行调整。

本公开实施例不具体限定互信息阈值，如上述，互信息阈值可以为开发人员配置的数值，也可以是默认值。例如互信息阈值可以为0.1、0.2等。

S104：电子设备根据相关任务集合中各任务对应的特征，生成多任务模型的样本，利用该多任务模型的样本进行模型训练，获得该多任务模型。

在确定相关任务集合后，电子设备可以基于相关任务集合中的任务构建多任务模型。由于相关任务集合中的任务之间的互信息满足第一预设条件，表明该相关任务集合中的任务之间的相关性较强。因此，基于相关性较强的任务构建多任务模型后，该多任务模型的学习效率较高。

电子设备可以基于相关任务集合中个任务对应的特征，生成多任务模型的样本。多任务模型的样本包括样本的特征向量及样本的特征向量的标签。如上述，初始数据包括多个特征，相关任务集合中的任务对应的特征为初始数据的多个特征中的部分特征，基于此，电子设备可以将相关任务集合中任务对应的特征作为样本的特征向量的标签，从初始数据中去掉上述相关任务集合中任务对应的特征后，得到的初始数据作为样本的特征向量。

举例说明，初始数据包括特征1、特征2、特征3、特征4和特征5，相关任务集合中任务1对应特征1、任务2对应特征2。电子设备可以将特征1作为用于监控任务1的样本的特征向量的标签、将特征2作为用于监控任务2的样本的特征向量的标签，从初始数据中去掉特征1和特征2，得到包括特征3、特征4和特征5的初始数据，将该包括特征3、特征4和特征5的初始数据作为多任务模型的样本的特征向量。

接着，电子设备可以利用多任务模型的样本，进行模型训练，得到多任务模型。如图3所示，该图为本公开实施例提供的一种多任务模型的示意图。该多任务模型包括相关任务集合中的多个任务各自对应的任务独占网络310以及输出网络330、以及共享网络320。其中，任务独占网络310可以是深度神经网络(deep neural networks，DNN)、卷积神经网络(convolutional neural network，CNN)或自注意力网络；类似的，共享网络320也可以是深度神经网络、卷积神经网络或自注意力网络。

需要说明的是，本申请不具体限定任务独占网络310和共享神经网络320的类型。在图像场景下，为了构建内容信息的不变性，可以利用卷积神经网络构建共享网络320和任务独占网络310；在推广内容场景下，为了满足对特征交叉的需求，可以利用深度神经网络构建共享网络320和任务独占网络310；在文本场景下，为了满足对时序信息并行处理的需求，可以利用自注意力网络构建共享网络320和任务独占网络310。输出网络330可以采用sigmoid、relu等激活函数得到各个任务对应的输出(例如可以是分类值、回归值)。

在一些示例中，电子设备可以将多任务模型的样本的特征向量输入共享网络320，得到共享分量，然后将该共享分量输入给相关任务集合中各个任务的任务独占网络，得到各个任务独占网络的输出。接着电子设备可以基于多任务模型的样本的特征向量的标签值，以及任务独占网络的输出确定损失值，基于该损失值更新任务独占网络的权重，以进行模型训练，进而得到该多任务模型。

基于上述内容描述，本公开实施例提供了一种多任务模型的建模方法，与单纯依赖主观经验选择的多个任务相比，电子设备对初始任务集合进行筛选后得到的相关任务集合中的任务之间的相关性较强。如此，在进行多任务学习过程中，能够提高多任务模型的学习效率。进一步，满足多种场景下的业务需求，实现对多项内容更为准确地预测。

本公开实施例还提供了一种多任务模型的建模方法，该方法在图2所示的实施例的基础上，对相关任务集合中的任务进一步分组聚合，从而平衡聚合后相关任务集合中多个任务分组中正样本数量。如图4所示，该多任务模型的建模方法还包括：

S401：电子设备对相关任务集合中满足第二预设条件的任务进行聚合。

第二预设条件可以是相关任务集合中任务相关性大于相关性阈值的多个任务。电子设备可以基于该第二预设条件对相关任务集合中的任务进行聚合，聚合后的所述相关任务集合包括多个任务分组。

继续参见图3，电子设备可以获取相关任务集合中多个任务对应的任务独占网络310的输出之间的相关性，然后基于该任务独占网络310的输出之间的相关性，对所述相关任务集合中的多个任务进行聚合。具体地，电子设备可以基于如下公式，计算相关任务集合中多个任务对应的任务独占网络310的输出之间的相关性：

其中，r_mn为相关任务集合中的任务m与任务n之间的相关性；O_im为样本i在任务m对应的任务独占网络310的输出，

为任务m对应的任务独占网络310对所有样本的输出的均值；O_in为样本i在任务n对应的任务独占网络310的输出，

为任务n对应的任务独占网络310对所有样本的输出的均值，K为样本总数。

在一些示例中，电子设备可以将任务m和任务n之间的相关性r_mn与相关性阈值进行比较，r_mn≥相关性阈值时，将任务m和任务n聚合为一个分组，如此电子设备可以得到聚合后的所述相关任务集合包括多个任务分组。

S402：电子设备针对每个任务分组，根据任务分组中任务的正样本数量，确定多个目标任务。

其中，多个目标任务的正样本数量之和大于正样本数量阈值，该正样本数量阈值为每个任务分组中正样本数量之和的最小值。举例说明，聚合后的相关任务集合包括多个任务分组，以多个任务分组包括任务分组G1和任务分组G2为例，其中，任务分组G1包括任务T1、任务T2、任务T3，任务T1的正样本数量为100、任务T2的正样本数量为200、任务T3的正样本数量为300；任务分组G2包括任务T4、任务T5和任务T6，任务T4的正样本数量为200、任务T5的正样本数量为400、任务T6的正样本数量为500。可见，任务分组G1的正样本数量之和为600，任务分组G2的正样本数量之和为1100。电子设备可以将任务分组G1的正样本数量之和600作为正样本数量阈值。

在一些示例中，电子设备可以对任务分组G2中任务T4、任务T5和任务T6进行排序，如按照正样本数量由小到大的顺序进行逐个加和，直至任务分组G2中任务的正样本数量之和大于或等于上述正样本数量阈值600。电子设备可以确定任务分组中任务正样本数量之和大于或等于正样本数量阈值时，任务分组中的多个任务为多个目标任务。如此，电子设备在将任务T4的正样本数量与任务T5的正样本数量进行加和后，加和结果等于正样本数量阈值，电子设备可以将任务T4和任务T5作为该任务分组中的多个目标任务。

在另一些示例中，电子设备可以在任务分组G2随机选择多个任务的正样本数量进行加和，直至多个任务的正样本数量大于或等于正样本数量阈值，接着将随机选择的多个任务确定为多个目标任务。延续上例，电子设备可以将任务分组G2中的任务T5和任务T6的正样本数量进行加和，加和结果大于正样本数量阈值，如此，电子设备可将任务T5和任务T6确定为多个目标任务。

需要说明的是，任务分组G2中任务T4和任务T5的正样本数量之和大于或等于正样本数量阈值是指：当减去任务分组G2中的任务T4或任务T5中任一个的正样本数量时，会使剩余任务的正样本数量之和小于正样本数量阈值。

电子设备确定任务分组的多个目标任务后，可以将任务分组中除该目标任务之外的任务去除。以任务分组G2中的多个目标任务为任务T4和任务T5为例，电子设备可以将任务T6从任务分组G2中去除。

在一些实施例中，电子设备可以基于该任务分组中的多个目标任务对应的特征，生成多任务模型的样本。以任务分组G2包括的目标任务为任务T4和任务T5为例，针对与该任务分组G2，将任务T4对应的正样本的特征向量的标签作为该任务分组G2的标签，以及将任务T5对应的正样本的特征向量的标签也作为该任务分组G2的标签。如此，在本实施例中，电子设备能够将多个任务分组包括的正样本数量进行均衡配置，减少因正样本数量差异较大而使多任务模型的学习效率降低的情况。

基于上述内容描述，多任务模型的建模方法通过对包含多个特征的大规模数据进行统计信息的分析，基于相关性确定相关任务集合，实现对高相关任务的聚合。利用高相关任务进行多任务模型训练，能够减少负向迁移，提高多任务模型的学习效率。

进一步，基于确定的相关任务集合构建多任务模型的结构，结合皮尔逊系数完成带有模型泛化信息的任务聚合；以正样本数量最小的任务分组对应的正样本数量为正样本数量阈值进行各分组任务筛选与组合，从而实现不同任务正样本量的均衡。经过分组聚合后的不同任务间正样本数量可以做到完全等比例，使多任务模型无偏向的完成多任务学习过程。

本公开实施例还提供了一种推广内容处理方法，如图5所示，该推广内容处理方法包括：

S501：电子设备获取用户对推广内容的行为的属性。

用户对推广内容的行为的属性可以包括用户对推广内容进行观看的时长、用户是否对推广内容进行点击操作、用户所点击的推广内容的呈现类型(例如视频类型、图片类型等)、用户是否被推广内容转化等等。

需要说明的是，电子设备需要提前获取用户的授权，在获取到用户对相应数据(如上述用户对推广内容的行为的属性)的授权使用后，电子设备才能获取到用户对推广内容的行为的属性等数据。

S502：电子设备根据用户对推广内容的行为的属性和多任务模型，获得多任务模型的推理结果。

其中，多任务模型基于相关任务集合中个任务对应的特征生成的多任务模型的样本得到，相关任务集合基于不同任务之间的互信息得到，不同任务为用于构建任务的特征所构建的初始任务集合中的任务；推理结果包括推广内容的转化率、推广内容的播放时长、推广内容的呈现类型或推广内容中推广对象的信息中的多种。训练多任务模型的过程可以参见上述实施例中介绍，此处不再赘述。

S503：电子设备根据推理结果，调整对推广内容的推广策略。

在一些示例中，当推理结果表明推广内容的转化率大于转化率阈值，且推广内容的播放时长大于时长阈值时，电子设备提高该推广内容的推广次数；当推广内容的转化率小于转化率阈值时，且推广内容的播放时长小于时长阈值时，电子设备降低该推广内容的推广次数。在另一些示例中，推广内容的呈现类型为预设类型(例如视频类型)，且推广内容中推广对象的信息为预设信息(例如指示该推广对象为游戏、虚拟物品或实物)时，电子设备提高该推广内容的推广次数。如此，减少推广内容的无效投放，减少资源浪费。

图6是根据一示例性公开实施例示出的一种多任务模型的建模装置的示意图，如图6所示，所述多任务模型的建模装置600包括：

获取模块601，用于获取用于构建任务的特征，根据所述用于构建任务的特征构建初始任务集合；所述初始任务集合包括：推广内容的转化率、所述推广内容的播放时长、所述推广内容的呈现类型和所述推广内容中推广对象的信息中的至少两种；

互信息确定模块602，用于确定所述初始任务集合中不同任务之间的互信息；

相关任务确定模块603，用于根据所述不同任务之间的互信息，获得相关任务集合，所述相关任务集合中包括的任务的互信息满足第一预设条件；

训练模块604，用于根据所述相关任务集合中各任务对应的特征，生成多任务模型的样本，利用所述多任务模型的样本进行模型训练，获得所述多任务模型。

可选的，所述相关任务确定模块603，还用于对所述相关任务集合中满足第二预设条件的任务进行聚合。

可选的，所述相关任务确定模块603，具体用于确定所述相关任务集合中多个任务对应的任务独占网络的输出之间的相关性；根据所述相关性对所述相关任务集合中的多个任务进行聚合。

可选的，所述相关任务确定模块603，还用于针对每个任务分组，根据所述任务分组中任务的正样本数量，确定多个目标任务，所述多个目标任务的正样本数量之和大于正样本数量阈值，所述正样本数量阈值为每个任务分组中正样本数量之和的最小值；

所述训练模块604，具体用于根据所述任务分组中所述目标任务对应的特征，生成多任务模型的样本。

可选的，所述相关任务确定模块603，具体用于按照所述任务分组中任务的正样本数量由小到大的顺序进行逐个加和，直至所述任务分组中任务的正样本数量之和大于或等于所述正样本数量阈值；确定所述任务分组中任务正样本数量之和大于或等于所述正样本数量阈值时，所述任务分组中的多个任务为多个目标任务

可选的，所述训练模块604，具体用于将所述多任务模型的样本的特征向量输入共享网络，得到共享分量；将所述共享分量输入给所述相关任务集合中各个任务的任务独占网络，得到所述各个任务的任务独占网络对应的输出；根据所述多任务模型的样本的特征向量的标签值，以及所述任务独占网络的输出，训练所述多任务模型。

可选的，所述任务独占网络包括深度神经网络、卷积神经网络或自注意力网络；所述共享网络包括深度神经网络、卷积神经网络或自注意力网络。

图7是根据一示例性公开实施例示出的一种推广内容处理装置的示意图，如图7所示，所述推广内容处理装置700包括：

获取模块701，用于获取用户对推广内容的行为的属性；

推理模块702，用于根据所述用户对所述推广内容的行为的属性和多任务模型，获得所述多任务模型的推理结果；所述多任务模型基于相关任务集合中个任务对应的特征生成的所述多任务模型的样本得到，所述相关任务集合基于不同任务之间的互信息得到，所述不同任务为用于构建任务的特征所构建的初始任务集合中的任务；所述推理结果包括推广内容的转化率、所述推广内容的播放时长、所述推广内容的呈现类型或所述推广内容中推广对象的信息中的多种；

处理模块703，用于根据所述推理结果，调整对所述推广内容的推广策略。

上述各模块的功能在上一实施例中的方法步骤中已详细阐述，在此不做赘述。

下面参考图8，其示出了适于用来实现本公开实施例的电子设备800的结构示意图，该电子设备用于实现如图6所示的多任务模型的建模装置600对应的功能，或用于实现如图7所示的推广内容处理装置700对应的功能。图8示出的电子设备仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图8所示，电子设备800可以包括处理装置(例如中央处理器、图形处理器等)801，其可以根据存储在只读存储器(ROM)802中的程序或者从存储装置808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中，还存储有电子设备800操作所需的各种程序和数据。处理装置801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。

通常，以下装置可以连接至I/O接口805：包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置806；包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置807；包括例如磁带、硬盘等的存储装置808；以及通信装置809。通信装置809可以允许电子设备800与其他设备进行无线或有线通信以交换数据。虽然图8示出了具有各种装置的电子设备800，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在非暂态计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置809从网络上被下载和安装，或者从存储装置808被安装，或者从ROM 802被安装。在该计算机程序被处理装置801执行时，执行本公开实施例的方法中限定的上述功能。

需要说明的是，本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、RF(射频)等等，或者上述的任意合适的组合。

在一些实施方式中，客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol，超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信，并且可以与任意形式或介质的数字数据通信(例如，通信网络)互连。通信网络的示例包括局域网(“LAN”)，广域网(“WAN”)，网际网(例如，互联网)以及端对端网络(例如，ad hoc端对端网络)，以及任何当前已知或未来研发的网络。

上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。

上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备：

确定所述初始任务集合中不同任务之间的互信息；

根据所述相关任务集合中各任务对应的特征，生成多任务模型的样本，利用所述多任务模型的样本进行模型训练，获得所述多任务模型；或者，

获取用户对推广内容的行为的属性；

根据所述推理结果，调整对所述推广内容的推广策略。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码，上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的模块可以通过软件的方式实现，也可以通过硬件的方式来实现。其中，模块的名称在某种情况下并不构成对该模块本身的限定，例如，第一获取模块还可以被描述为“获取至少两个网际协议地址的模块”。

本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如，非限制性地，可以使用的示范类型的硬件逻辑部件包括：现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑设备(CPLD)等等。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

根据本公开的一个或多个实施例，示例1提供了一种多任务模型的建模方法，获取用于构建任务的特征，根据所述用于构建任务的特征构建初始任务集合；所述初始任务集合包括：推广内容的转化率、所述推广内容的播放时长、所述推广内容的呈现类型和所述推广内容中推广对象的信息中的至少两种；确定所述初始任务集合中不同任务之间的互信息；根据所述不同任务之间的互信息，获得相关任务集合，所述相关任务集合中包括的任务的互信息满足第一预设条件；根据所述相关任务集合中各任务对应的特征，生成多任务模型的样本，利用所述多任务模型的样本进行模型训练，获得所述多任务模型。

根据本公开的一个或多个实施例，示例2提供了示例1的方法，所述方法还包括：

对所述相关任务集合中满足第二预设条件的任务进行聚合。

根据本公开的一个或多个实施例，示例3提供了示例2的方法，所述对所述相关任务集合中满足第二预设条件的任务进行聚合，包括：

确定所述相关任务集合中多个任务对应的任务独占网络的输出之间的相关性；

根据所述相关性对所述相关任务集合中的多个任务进行聚合。

根据本公开的一个或多个实施例，示例4提供了示例3的方法，聚合后的所述相关任务集合包括多个任务分组，所述方法还包括：

针对每个任务分组，根据所述任务分组中任务的正样本数量，确定多个目标任务，所述多个目标任务的正样本数量之和大于正样本数量阈值，所述正样本数量阈值为每个任务分组中正样本数量之和的最小值；

所述根据所述相关任务集合中各任务对应的特征，生成多任务模型的样本，包括：

根据所述任务分组中所述目标任务对应的特征，生成多任务模型的样本。

根据本公开的一个或多个实施例，示例5提供了示例4的方法，所述根据所述任务分组中任务的正样本数量，确定多个目标任务，包括：

按照所述任务分组中任务的正样本数量由小到大的顺序进行逐个加和，直至所述任务分组中任务的正样本数量之和大于或等于所述正样本数量阈值；

确定所述任务分组中任务正样本数量之和大于或等于所述正样本数量阈值时，所述任务分组中的多个任务为多个目标任务。

根据本公开的一个或多个实施例，示例6提供了示例1的方法，所述利用所述多任务模型的样本进行模型训练，包括

将所述多任务模型的样本的特征向量输入共享网络，得到共享分量；

将所述共享分量输入给所述相关任务集合中各个任务的任务独占网络，得到所述各个任务的任务独占网络对应的输出；

根据所述多任务模型的样本的特征向量的标签值，以及所述任务独占网络的输出，训练所述多任务模型。

根据本公开的一个或多个实施例，示例7提供了示例6的方法，所述任务独占网络包括深度神经网络、卷积神经网络或自注意力网络；所述共享网络包括深度神经网络、卷积神经网络或自注意力网络。

根据本公开的一个或多个实施例，示例8提供了一种推广内容处理方法，包括：获取用户对推广内容的行为的属性；根据所述用户对所述推广内容的行为的属性和多任务模型，获得所述多任务模型的推理结果；所述多任务模型基于相关任务集合中个任务对应的特征生成的所述多任务模型的样本得到，所述相关任务集合基于不同任务之间的互信息得到，所述不同任务为用于构建任务的特征所构建的初始任务集合中的任务；所述推理结果包括推广内容的转化率、所述推广内容的播放时长、所述推广内容的呈现类型或所述推广内容中推广对象的信息中的多种；根据所述推理结果，调整对所述推广内容的推广策略。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开中所涉及的公开范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述公开构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

此外，虽然采用特定次序描绘了各操作，但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地，在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

Claims

1.一种多任务模型的建模方法，其特征在于，包括：

确定所述初始任务集合中不同任务之间的互信息；

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

对所述相关任务集合中满足第二预设条件的任务进行聚合。

3.根据权利要求2所述的方法，其特征在于，所述对所述相关任务集合中满足第二预设条件的任务进行聚合，包括：

4.根据权利要求3所述的方法，其特征在于，聚合后的所述相关任务集合包括多个任务分组，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述任务分组中任务的正样本数量，确定多个目标任务，包括：

6.根据权利要求1所述的方法，其特征在于，所述利用所述多任务模型的样本进行模型训练，包括

7.根据权利要求6所述的方法，其特征在于，所述任务独占网络包括深度神经网络、卷积神经网络或自注意力网络；所述共享网络包括深度神经网络、卷积神经网络或自注意力网络。

8.一种推广内容处理方法，其特征在于，包括：

获取用户对推广内容的行为的属性；

根据所述推理结果，调整对所述推广内容的推广策略。

9.一种多任务模型的建模装置，其特征在于，包括：

10.一种推广内容处理装置，其特征在于，包括：

获取模块，用于获取用户对推广内容的行为的属性；

11.一种电子设备，其特征在于，包括：

存储装置，其上存储有计算机程序；

处理装置，用于执行所述存储装置中的所述计算机程序，以实现权利要求1至7中任一项所述方法的步骤；或，以实现权利要求8所述方法的步骤。

12.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理装置执行时实现权利要求1至7中任一项所述方法的步骤；或，该程序被处理装置执行时实现权利要求8所述方法的步骤。

13.一种计算机程序产品，其特征在于，当所述计算机程序产品在计算机上运行时，使得计算机执行如权利要求1至7中任一项所述方法的步骤；或，当所述计算机程序产品在计算机上运行时，使得计算机执行如权利要求8所述方法的步骤。