CN110569429A

CN110569429A - 一种内容选择模型的生成方法、装置和设备

Info

Publication number: CN110569429A
Application number: CN201910731597.XA
Authority: CN
Inventors: 胡丁相; 操颖平
Original assignee: Alibaba Group Holding Ltd
Current assignee: Advanced New Technologies Co Ltd; Advantageous New Technologies Co Ltd
Priority date: 2019-08-08
Filing date: 2019-08-08
Publication date: 2019-12-13
Anticipated expiration: 2039-08-08
Also published as: CN110569429B

Abstract

本说明书实施例公开了一种内容选择模型的生成方法、装置和电子设备，该方法包括：获取目标应用的历史时间段内的埋点日志，该埋点日志按照预设的标准化格式记录数据；获取目标应用的内容选择列表中多个内容的内容特征和目标应用的多个用户的用户特征；基于埋点日志，提取目标应用的多个用户对多个内容的行为特征、和多个内容的行为标签，行为标签用于指示多个用户对多个内容的交互行为；生成多个被标记的训练样本数据，该训练样本数据中包括目标内容的内容特征，对所述目标内容产生交互行为的目标用户的用户特征、所述目标用户对所述目标内容的行为特征、所述目标内容的行为标签；基于多个被标记的训练样本数据，为目标应用训练内容选择模型。

Description

一种内容选择模型的生成方法、装置和设备

技术领域

本文件涉及计算机软件技术领域，尤其涉及一种内容选择模型的生成方法、装置和电子设备。

背景技术

目前，随着互联网和电子商务的快速发展，信息量呈***式增长，用户在面对这些大量信息时往往无法从中获取真正感兴趣的信息。为了解决这个问题，个性化推荐***应运而生，个性化推荐***可以基于用户的兴趣特点、点击行为、购买行为等用户特征和行为来为用户推荐信息。

现有的个性化推荐***中的推荐模型的开发往往依赖于通过人工经验制定的运营规则，即通过划分人群的方式来为不同人群中的用户进行个性化推荐，但这种方式难以做到真正的个性化，且运营规则依赖于人工经验，推荐效果不佳。此外，现有的个性化推荐***还需基于不同的应用场景进行定制化开发，也就是说每次开发都需要耗费大量的时间从0到1进行建模、验证和部署上线，且建模过程中还需要人工标记，上线时间长，且开发得到的推荐模型可复用性低。

发明内容

本说明书实施例的目的是提供一种内容选择模型的生成方法、装置及电子设备，用于解决现有的推荐模型的开发过程往往需要耗费大量的时间，且开发得到的推荐模型可复用性低的问题。

为解决上述技术问题，本说明书实施例是这样实现的：

第一方面，提出了一种内容选择模型的生成方法，包括：

获取目标应用的历史时间段内的埋点日志，所述埋点日志按照预设的标准化格式记录数据；

获取所述目标应用的内容选择列表中多个内容的内容特征和所述目标应用的多个用户的用户特征；

基于所述埋点日志，提取所述历史时间段内所述目标应用的多个用户对所述多个内容的行为特征、和所述多个内容的行为标签，所述行为标签用于指示所述多个用户对所述多个内容的交互行为；

基于所述多个内容的内容特征、所述目标应用的多个用户的用户特征、所述目标应用的多个用户对所述多个内容的行为特征、和所述多个内容的行为标签，生成多个被标记的训练样本数据；其中，所述训练样本数据中包括目标内容的内容特征，对所述目标内容产生交互行为的目标用户的用户特征、所述目标用户对所述目标内容的行为特征、所述目标内容的行为标签；

基于所述多个被标记的训练样本数据，为所述目标应用训练内容选择模型。

第二方面，提出了一种内容选择模型的生成装置，包括：

日志获取单元，获取目标应用的历史时间段内的埋点日志，所述埋点日志按照预设的标准化格式记录数据；

特征获取单元，获取所述目标应用的内容选择列表中多个内容的内容特征和所述目标应用的多个用户的用户特征；

特征提取单元，基于所述埋点日志，提取所述历史时间段内所述目标应用的多个用户对所述多个内容的行为特征、和所述多个内容的行为标签，所述行为标签用于指示所述多个用户对所述多个内容的交互行为；

样本生成单元，基于所述多个内容的内容特征、所述目标应用的多个用户的用户特征、所述目标应用的多个用户对所述多个内容的行为特征、和所述多个内容的行为标签，生成多个被标记的训练样本数据；其中，所述训练样本数据中包括目标内容的内容特征，对所述目标内容产生交互行为的目标用户的用户特征、所述目标用户对所述目标内容的行为特征、所述目标内容的行为标签；

模型训练单元，基于所述多个被标记的训练样本数据，为所述目标应用训练内容选择模型。

第三方面，提出了一种电子设备，该电子设备包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器执行以下操作：

第四方面，提出了一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下操作：

由以上本说明书实施例提供的技术方案可见，本说明书实施例方案至少具备如下一种技术效果：

本说明书一个或多个实施例通过在埋点日志中设置标准化格式来记录数据，实现了对作为训练样本数据的数据源的标准化，以及通过埋点日志获取用户对内容选择列表中的多个内容的行为特征，实现了对内容列表中的多个内容添加行为标签，并能基于添加了行为标签的多个内容、这多个内容的内容特征、以及与这多个内容发生交互行为的用户的用户特征生成多个被标记的训练样本数据，最后基于多个被标记的训练样本数据训练得到内容选择模型，层层推进实现了内容选择模型训练过程的自动化，提高了模型训练效率。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本说明书一个实施例提供的生成内容选择模型的***架构示意图。

图2是本说明书的一个实施例提供的内容选择模型循环迭代更新的示意图。

图3是本说明书的一个实施例提供的一种内容选择模型的生成方法的实现流程示意图。

图4是本说明书的一个实施例提供的内容选择模型的生成装置的结构示意图。

图5是说明书的一个实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本说明书的目的、技术方案和优点更加清楚，下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本说明书一部分实施例，而不是全部的实施例。基于本文件中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本文件保护的范围。

以下结合附图，详细说明本说明书各实施例提供的技术方案。

如图1所示，为本说明书一个实施例提供的生成内容选择模型的***架构示意图，自底向上包括日志层、样本层、特征层、模型层和应用层。为了实现内容选择模型生成的自动化，本说明书实施例中的日志层可预先对埋点日志中的数据格式、埋点信息的类型以及埋点信息的源头进行标准化设置，比如可以将日志生成的日期、用户的标识、内容的标识、用户对内容的点击标识、用户对内容的转化标识等数据格式进行标准化设置，还可以对要获取的埋点信息的类型进行标准化设置。

在获取了标准化处理后的埋点日志之后，为了提高内容选择模型的训练效率，本说明书实施例可以基于埋点日志中获取的多个用户对多个内容的行为特征，提取出这多个内容的行为标签，即可以提取出多个携带行为标签的内容作为样本存储到样本层中，该行为标签可以是对用户是否点击或转化了某个内容的标记，即点击样本和转化样本，以点击样本为例用户若点击了该内容则设置其行为标签为1，用户若没有点击该内容则设置其行为标签为0。

为了积累足够多的特征，以训练得到内容选择模型，本说明书实施例在初始阶段时会在特征层中搜集并积累目标应用的用户的用户特征数据、目标应用的内容选择列表中的内容特征数据、目标应用的用户所处的场景特征数据、以及用户对内容选择列表中的内容的行为特征数据，以便内容选择模型训练时调用这些特征数据。

在这些特征数据积累到一定量或者积累到预设时间段之后，则可以通过模型层中的自动特征提取机制和自动样本抽样机制将这些特征数据和有携带有行为标签的内容合并起来，作为训练样本数据，通过自动工作流机制训练得到内容选择模型。训练完成的内容选择模型可被模型层中的自动模型部署机制进行部署，供应用层中的目标应用或其他应用调用，具体可以用于于权益选择、内容选择和产品选择等场景中。

为了不断优化训练完成的内容选择模型，在内容选择模型被目标应用或其他应用调用时，可基于目标应用或其他应用的埋点日志获取按照标准化格式记录的行为特征，并基于该行为特征对内容选择模型进行进一步优化，从而实现图2所示的内容选择模型，从埋点日志回流→样本准备→特征工程→模型训练→模型部署→模型调用→日志回流→…的循环迭代更新。

下面结合图3，对本发明实施例的方案做进一步的描述。

图3是本说明书一个或多个实施例提供的一种内容选择模型的生成方法的实现流程示意图。图3的方法可由包含图1所示的生成内容选择模型的***架构的装置执行。应理解，该包含图1所示的生成内容选择模型的***架构的装置可由一个或多个服务器来实现，等等。图3的方法可包括：

S310，获取目标应用的历史时间段内的埋点日志，该埋点日志按照预设的标准化格式记录数据。

应理解，为了实现内容选择模型训练过程的自动化，提高内容选择模型的训练效率，本说明书实施例中的埋点日志按照预设的标准化格式记录数据，该预设的标准化格式可对埋点日志中记录数据的格式、埋点日志中记录数据的类型和埋点日志中记录数据的来源都进行标准化设置。

应理解，在初始阶段，也就是还没有训练得到内容选择模型时，则无法通过内容选择模型为用户从目标应用的内容选择列表中选择合适的内容。此时，为了获取用户对目标应用的内容选择列表中多个内容的行为特征，本说明书实施例可提供一个目标应用的内容选择列表，该内容选择列表中包括多个内容，在用户使用目标应用的内容选择功能时，可为用户从内容选择列表中随机选择一些内容展示给用户，在用户对展示的内容产生点击、分享或转化等交互行为时，则可以将这些交互行为记录到对应的内容的行为特征数据库中。

S320，获取目标应用的内容选择列表中多个内容的内容特征和目标应用的多个用户的用户特征。

其中，目标应用的内容选择列表中多个内容的内容特征和多个用户的用户特征，也可以基于目标应用的埋点日志或其他渠道来获取，该获取过程可以是一次完成，也可以分多次完成，而为了减少数据获取次数和解析次数，进而减少冗余信息的获取和存储，本说明书实施例中的用户特征和内容特征一旦被获取，则可以存储在对应的用户特征数据库和内容特征数据库中。具体地，获取目标应用的内容选择列表中多个内容的内容特征和目标应用的多个用户的用户特征，包括：

获取目标应用的第一历史时间段内的第一埋点日志，该第一埋点日志按照预设的标准化格式记录内容相关数据；

从第一埋点日志记录的内容相关数据中，提取目标应用的内容选择列表中多个内容的内容特征，并将这多个内容的内容特征与对应的内容标识相关联存储在内容特征数据库中；

获取目标应用的第二历史时间段内的第二埋点日志，该第二埋点日志按照预设的标准化格式记录用户相关数据；

从第二埋点日志记录的用户相关数据中，提取目标应用的多个用户的用户特征，并将这多个用户的用户特征与对应的用户标识相关联存储在用户特征数据库中。

若在获取了某个用户的用户特征或某个内容的内容特征之后，再次出现该用户或内容，则不再进行二次获取和解析得到其用户特征和内容特征。若需要用到获取过的用户特征和内容特征，则可以从用户特征数据和内容特征数据库中调用相应的用户特征和内容特征即可。

以内容特征为例，由于目标应用的内容选择列表中的多个内容可能在某一时间段内保持不变，那么在该时间段内，该目标应用的内容选择列表中的多个内容的内容特征一旦被获取，则可以记录在内容特征库中，以便快速调用这些内容的内容特征，从而减少从日志数据获取这些内容的内容特征相关数据的次数和从这些内容相关数据中解析得到内容特征的次数。

S330，基于埋点日志，提取历史时间段内目标应用的多个用户对多个内容的行为特征、和多个内容的行为标签，该行为标签用于指示多个用户对多个内容的交互行为。

应理解，展示给用户的内容是否符合用户的兴趣偏好，可通过用户对内容的交互行为来体现，比如点击行为、以及更进一步地购买等转化行为来挖掘展示给用户的内容是否符合其兴趣偏好。具体地，多个用户对多个内容的交互行为包括下述至少一种：

多个用户对多个内容的点击行为；

多个用户对多个内容的转化行为。

而行为标签则可以包括点击标签和转化标签，以点击标签为例，当用户点击了内容A时，则可以将该内容A的行为标签设置为1，而当用户没有点击内容A时，则可以将该内容A的行为标签设置为0。则多个用户对多个内容的行为特征具体也可以包括点击行为特征和转化行为特征。

应理解，用户在面对可选择的多个内容时，所处的场景中的天气、时间、位置等外部场景特征也可能会影响其最终的选择。为了提高训练得到的内容选择模型的准确性，本说明书实施例在训练内容选择模型时，还可以考虑用户当前所处的场景特征，比如天气、时间、位置等外部场景特征。具体地，基于埋点日志，提取历史时间段内目标应用的多个用户对多个内容的行为特征、和多个内容的行为标签，包括：

基于埋点日志，提取历史时间段内目标应用的多个用户对多个内容的行为特征、多个用户所处的场景特征和多个内容的行为标签。

应理解，为便于后期模型训练时，场景特征的调用，基于埋点日志提取得到的历史时间段内多个用户所处的场景特征也可以存储在图1所示的特征层中的场景特征数据库中，该场景特征在存储时，可以与用户的标识进行关联，并将关联对应的用户的标识的场景特征存储在场景特征数据库中。这样在后期模型训练时，可基于用户的标识从场景特征数据库中查找与其相匹配的场景特征。

S340，基于多个内容的内容特征、目标应用的多个用户的用户特征、目标应用的多个用户对多个内容的行为特征、和多个内容的行为标签，生成多个被标记的训练样本数据。

其中，训练样本数据中包括目标内容的内容特征，对目标内容产生交互行为的目标用户的用户特征、目标用户对目标内容的行为特征、目标内容的行为标签。应理解，该目标内容为目标应用的内容选择列表中的一个内容，目标用户为对目标内容产生交互行为的一个用户。

应理解，模型训练时，往往需要多个训练样本数据，且训练样本数据还需要被标记，也就是携带行为标签。本说明书实施例中，为了实现内容选择模型能够基于用户的用户特征、内容选择列表中的内容特征来为用户选择符合用户兴趣偏好的内容展示给用户，训练样本数据中应包含多个内容的内容特征、目标应用的多个用户的用户特征、目标应用的多个用户对多个内容的行为特征、和多个内容的行为标签。也就是说，具体可以基于多个内容的内容特征、目标应用的多个用户的用户特征、目标应用的多个用户对多个内容的行为特征、和多个内容的行为标签，按照预设格式拼接生成多个被标记的训练样本数据。

可选地，为了提高模型训练的准确率，本说明书实施例可以将用户所处的环境中的天气、位置、时间等场景特征与训练样本数据进行合并，得到训练样本数据。基于多个内容的内容特征、目标应用的多个用户的用户特征、目标应用的多个用户对多个内容的行为特征、和多个内容的行为标签，生成多个被标记的训练样本数据，包括：

基于多个内容的内容特征、目标应用的多个用户的用户特征、目标应用的多个用户对多个内容的行为特征、多个用户所处的场景特征和多个内容的行为标签，生成多个被标记的训练样本数据。

具体可以基于多个内容的内容特征、目标应用的多个用户的用户特征、目标应用的多个用户对多个内容的行为特征、多个用户所处的场景特征和多个内容的行为标签，按照预设格式拼接生成多个被标记的训练样本数据。

S350，基于多个被标记的训练样本数据，为目标应用训练内容选择模型。

应理解，实际应用中，从目标应用中可获取的被标记的训练样本数据的数量往往很庞大，为了减少模型训练时的计算压力，本说明书实施例可从多个被标记的训练样本数据中随机抽取一些训练样本数据。具体地，基于多个被标记的训练样本数据，为目标应用训练内容选择模型，包括：

从多个被标记的训练样本数据中随机抽取预设数量的训练样本数据；

基于预设数量的训练样本数据，为目标应用训练内容选择模型。

应理解，在实际应用中，训练样本数据中所包含的一些特征可能是中文格式或者一些特殊格式，这些格式的数据往往不能直接被模型训练时用到的深度学习所处理。为避免这种情况，本说明书实施例预先建立一个预设的特征映射表，该特征映射表可将一些无法直接用深度学习来处理的特征数据映射成可直接被深度学习处理的数据格式。具体地，基于预设数量的训练样本数据，为目标应用训练内容选择模型，包括：

基于预设的特征映射表，确定与预设数量的训练样本数据中的目标特征相匹配的特征字段，目标特征包括预设数量的训练样本数据中用户的用户特征、预设数量的训练样本数据中内容的内容特征、预设数量的训练样本数据中用户在历史时间段内对多个内容的行为特征；

基于预设数量的训练样本数据、与预设数量的训练样本数据中的目标特征相匹配的特征字段，为目标应用训练内容选择模型。

可选地，在基于多个被标记的训练样本数据，为目标应用训练内容选择模型之后，由于该内容选择模型还未上线使用过，也就无法判断其是否符合实际需求，为了进一步地验证和优化训练得到的内容选择模型，本说明书实施例提供的方法还包括：

获取目标应用针对目标用户的埋点日志，目标用户的埋点日志按照预设的标准化格式记录数据，该记录的数据中包括目标用户的用户标识和目标用户对目标内容的行为特征；

从用户特征数据库和内容特征数据库中，获取与目标用户的用户标识相匹配的用户特征、以及与目标应用的内容选择列表中的内容标识相匹配的内容特征；其中，用户特征数据库中包括目标应用的用户标识与用户特征的映射关系，内容特征数据库中包括目标应用的内容选择列表中的内容标识与内容特征的映射关系；

基于与目标用户的用户标识相匹配的用户特征、与目标应用的内容选择列表中的内容标识相匹配的内容特征、行为特征数据库和内容选择模型，从多个内容中为目标用户选择候选内容；行为记录数据库中包括目标应用的内容选择列表中的内容标识与行为记录之间的映射关系；

将候选内容展示给目标用户，以通过目标应用的埋点日志获取目标用户对候选内容的行为特征；

基于目标用户对候选内容的行为特征，优化内容选择模型。

其中，行为记录数据库中的目标应用的内容选择列表中的内容的行为记录，具体可以是历史时间段内内容选择列表中的内容被用户的点击次数和转化次数，比如可以是过去一个月或过去一个星期内内容选择列表中的内容被用户的点击次数和转化次数。

应理解，优化内容选择模型可基于目标用户对目标内容的反馈来实现，而目标用户对候选内容的反馈具体可以体现在目标用户对候选内容的行为特征上，比如目标用户是否点击候选内容、以及是否转化候选内容等行为特征，基于该行为特征则可以确定候选内容的行为标签，并基于此优化内容选择模型。具体地，基于目标用户对候选内容的行为特征，优化内容选择模型，包括：

基于目标用户对候选内容的行为特征，确定候选内容的行为标签；

基于与目标用户的用户标识相匹配的用户特征、候选内容的内容特征、目标用户对候选内容的行为特征和目标内容的行为标签，生成被标记的目标训练样本数据；

基于目标训练样本数据，优化内容选择模型。

可选地，为了获取目标用户所处的场景特征对其行为的影响，基于与目标用户的用户标识相匹配的用户特征、候选内容的内容特征、目标用户对候选内容的行为特征和候选内容的行为标签，生成被标记的目标训练样本数据，具体还可以基于与目标用户的用户标识相匹配的用户特征、候选内容的内容特征、目标用户对候选内容的行为特征、候选内容的行为标签和目标用户所处的场景特征，生成被标记的目标训练样本数据。

其中，目标用户所处的场景特征可以由目标应用针对目标用户的埋点日志记录得到。

图4是本说明书的一个实施例提供的内容选择模型的生成装置400的结构示意图。请参考图4，在一种软件实施方式中，内容选择模型的生成装置400可包括：

日志获取单元401，获取目标应用的历史时间段内的埋点日志，所述埋点日志按照预设的标准化格式记录数据；

特征获取单元402，获取所述目标应用的内容选择列表中多个内容的内容特征和所述目标应用的多个用户的用户特征；

特征提取单元403，基于所述埋点日志，提取所述历史时间段内所述目标应用的多个用户对所述多个内容的行为特征、和所述多个内容的行为标签，所述行为标签用于指示所述多个用户对所述多个内容的交互行为；

样本生成单元404，基于所述多个内容的内容特征、所述目标应用的多个用户的用户特征、所述目标应用的多个用户对所述多个内容的行为特征、和所述多个内容的行为标签，生成多个被标记的训练样本数据；其中，所述训练样本数据中包括目标内容的内容特征，对所述目标内容产生交互行为的目标用户的用户特征、所述目标用户对所述目标内容的行为特征、所述目标内容的行为标签；

模型训练单元405，基于所述多个被标记的训练样本数据，为所述目标应用训练内容选择模型。

可选地，在一种实施方式中，在所述模型训练单元404基于所述多个被标记的训练样本数据，为所述目标应用训练内容选择模型之后，所述装置还包括：

日志获取单元406，获取所述目标应用针对目标用户的埋点日志，所述目标用户的埋点日志按照预设的标准化格式记录的数据，所述记录的数据中包括所述目标用户的用户标识和目标用户对目标内容的行为特征；

特征获取单元407，从用户特征数据库和内容特征数据库中，获取与所述目标用户的用户标识相匹配的用户特征、以及与所述目标应用的内容选择列表中的内容标识相匹配的内容特征；其中，所述用户特征数据库中包括所述目标应用的用户标识与用户特征的映射关系，所述内容特征数据库中包括所述目标应用的内容选择列表中的内容标识与内容特征的映射关系；

内容选择单元408，基于与所述目标用户的用户标识相匹配的用户特征、与所述目标应用的内容选择列表中的内容标识相匹配的内容特征、行为特征数据库和所述内容选择模型，从所述多个内容中为所述目标用户选择候选内容；所述行为记录数据库中包括所述目标应用的内容选择列表中的内容标识与行为记录之间的映射关系；

内容展示单元409，将所述候选内容展示给所述目标用户，以通过所述目标应用的埋点日志获取所述目标用户对所述候选内容的行为特征；

模型优化单元410，基于所述目标用户对所述候选内容的行为数据，优化所述内容选择模型。

可选地，在一种实施方式中，所述模型优化单元410，用于：

基于所述目标用户对所述候选内容的行为特征，确定所述候选内容的行为标签；

基于与所述目标用户的用户标识相匹配的用户特征、所述候选内容的内容特征、所述目标用户对所述候选内容的行为特征和所述候选内容的行为标签，生成被标记的目标训练样本数据；

基于所述目标训练样本数据，优化所述目标推荐模型。

可选地，在一种实施方式中，所述模型训练单元405，从所述多个被标记的训练样本数据中随机抽取预设数量的训练样本数据；

基于所述预设数量的训练样本数据，为所述目标应用训练内容选择模型。

可选地，在一种实施方式中，所述模型训练单元405，基于预设的特征映射表，确定与所述预设数量的训练样本数据中的目标特征相匹配的特征字段，所述目标特征包括所述预设数量的训练样本数据中用户的用户特征、所述预设数量的训练样本数据中内容的内容特征、所述预设数量的训练样本数据中用户在所述历史时间段内对所述多个内容的行为特征；

基于所述预设数量的训练样本数据、与所述预设数量的训练样本数据中的目标特征相匹配的特征字段，为所述目标应用训练内容选择模型。

可选地，在一种实施方式中，所述特征提取单元403，基于所述埋点日志，提取所述历史时间段内所述目标应用的多个用户对所述多个内容的行为特征、所述多个用户所处的场景特征和所述多个内容的行为标签。

可选地，在一种实施方式中，所述样本生成单元404，基于所述多个内容的内容特征、所述目标应用的多个用户的用户特征、所述目标应用的多个用户对所述多个内容的行为特征、所述多个用户所处的场景特征和所述多个内容的行为标签，生成多个被标记的训练样本数据。

内容选择模型的生成装置400能够实现图1～图3的方法实施例的方法，具体可参考图1～图3所示实施例的内容选择模型的生成方法，不再赘述。

图5是本说明书的一个实施例电子设备的结构示意图。请参考图5，在硬件层面，该电子设备包括处理器，可选地还包括内部总线、网络接口、存储器。其中，存储器可能包含内存，例如高速随机存取存储器(Random-Access Memory，RAM)，也可能还包括非易失性存储器(non-volatile memory)，例如至少1个磁盘存储器等。当然，该电子设备还可能包括其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是ISA(Industry Standard Architecture，工业标准体系结构)总线、PCI(PeripheralComponent Interconnect，外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture，扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图5中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

存储器，用于存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器，并向处理器提供指令和数据。

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成内容选择模型的生成装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：

上述如本说明书图1～图3所示实施例揭示的内容选择模型的生成装置执行的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(CentralProcessing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific IntegratedCircuit，ASIC)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

该电子设备还可执行图1～图3的方法，并实现内容选择模型的生成装置在图1～图3所示实施例的功能，本说明书实施例在此不再赘述。

当然，除了软件实现方式之外，本说明书的电子设备并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

本说明书实施例还提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当被包括多个应用程序的便携式电子设备执行时，能够使该便携式电子设备执行图1～图3所示实施例的方法，并具体用于执行以下操作：

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

总之，以上所述仅为本说明书的较佳实施例而已，并非用于限定本说明书的保护范围。凡在本说明书的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本说明书的保护范围之内。

上述实施例阐明的***、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于***实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

Claims

1.一种内容选择模型的生成方法，包括：

2.如权利要求1所述的方法，在基于所述多个被标记的训练样本数据，为所述目标应用训练内容选择模型之后，所述方法还包括：

获取所述目标应用针对目标用户的埋点日志，所述目标用户的埋点日志按照预设的标准化格式记录的数据，所述记录的数据中包括所述目标用户的用户标识和目标用户对目标内容的行为特征；

从用户特征数据库和内容特征数据库中，获取与所述目标用户的用户标识相匹配的用户特征、以及与所述目标应用的内容选择列表中的内容标识相匹配的内容特征；其中，所述用户特征数据库中包括所述目标应用的用户标识与用户特征的映射关系，所述内容特征数据库中包括所述目标应用的内容选择列表中的内容标识与内容特征的映射关系；

基于与所述目标用户的用户标识相匹配的用户特征、与所述目标应用的内容选择列表中的内容标识相匹配的内容特征、行为特征数据库和所述内容选择模型，从所述多个内容中为所述目标用户选择候选内容；所述行为记录数据库中包括所述目标应用的内容选择列表中的内容标识与行为记录之间的映射关系；

将所述候选内容展示给所述目标用户，以通过所述目标应用的埋点日志获取所述目标用户对所述候选内容的行为特征；

基于所述目标用户对所述候选内容的行为数据，优化所述内容选择模型。

3.如权利要求2所述的方法，基于所述目标用户对所述候选内容的行为特征，优化所述内容选择模型，包括：

基于所述目标训练样本数据，优化所述内容选择模型。

4.如权利要求1所述的方法，基于所述多个被标记的训练样本数据，为所述目标应用训练内容选择模型，包括：

从所述多个被标记的训练样本数据中随机抽取预设数量的训练样本数据；

5.如权利要求4所述的方法，基于所述预设数量的训练样本数据，为所述目标应用训练内容选择模型，包括：

基于预设的特征映射表，确定与所述预设数量的训练样本数据中的目标特征相匹配的特征字段，所述目标特征包括所述预设数量的训练样本数据中用户的用户特征、所述预设数量的训练样本数据中内容的内容特征、所述预设数量的训练样本数据中用户在所述历史时间段内对所述多个内容的行为特征；

6.如权利要求1所述的方法，基于所述埋点日志，提取所述历史时间段内所述目标应用的多个用户对所述多个内容的行为特征、和所述多个内容的行为标签，包括：

基于所述埋点日志，提取所述历史时间段内所述目标应用的多个用户对所述多个内容的行为特征、所述多个用户所处的场景特征和所述多个内容的行为标签。

7.如权利要求6所述的方法，基于所述多个内容的内容特征、所述目标应用的多个用户的用户特征、所述目标应用的多个用户对所述多个内容的行为特征、和所述多个内容的行为标签，生成多个被标记的训练样本数据，包括：

基于所述多个内容的内容特征、所述目标应用的多个用户的用户特征、所述目标应用的多个用户对所述多个内容的行为特征、所述多个用户所处的场景特征和所述多个内容的行为标签，生成多个被标记的训练样本数据；

所述训练样本数据中包括目标内容的内容特征，对所述目标内容产生交互行为的目标用户的用户特征、所述目标用户对所述目标内容的行为特征、所述目标内容的行为标签，所述目标用户所处的场景特征。

8.一种内容选择模型的生成装置，包括：

9.一种电子设备，包括：

处理器；以及

10.一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下操作：