CN114241264B

CN114241264B - 用户判别模型训练方法、用户判别方法及相关装置

Info

Publication number: CN114241264B
Application number: CN202111555671.0A
Authority: CN
Inventors: 邓小明
Original assignee: Shenzhen Shang Mi Network Technology Co ltd
Current assignee: Shenzhen Shang Mi Network Technology Co ltd
Priority date: 2021-12-17
Filing date: 2021-12-17
Publication date: 2022-10-28
Anticipated expiration: 2041-12-17
Also published as: CN114241264A

Abstract

本申请提供用户判别模型训练方法、用户判别方法及相关装置。该方案根据三个训练样本的行为特征，对用户判别模型进行迭代调参，能够使用户判别模型学习到样本标签相同的训练样本的行为特征之间的特征共性和样本标签不同的训练样本的行为特征之间的特征差异，进而可学习到可准确区分不同类型的用户的行为特征，使得用户判别模型具备准确提取行为特征的能力；根据三个训练样本的判别结果和样本标签，对用户判别模型进行迭代调参，使得用户判别模型输出的判别结果能够接近于样本标签，进而使得用户判别模型具有准确区分用户是否为预设行为用户的能力；因此，利用用户判别模型可实现对用户是否为***的准确判别。

Description

用户判别模型训练方法、用户判别方法及相关装置

技术领域

本申请涉及数据挖掘领域，尤其用户判别模型训练方法、用户判别方法及相关装置。

背景技术

***的挖掘，是指基于用户的一些行为特征，判断用户是否为潜在的客户。其可应用于多种销售或者产品推荐场景中，有助于提升销售业绩或者产品的用户数。

在目前的一些挖掘方法中，一般是通过预先设置触发行为条件，当确定用户的行为与预设的触发行为条件相匹配时，则判定用户为***。如果触发行为条件设置得不合理，则会导致错过一些***或者挖掘出来的***不合理，这样就会存在***的挖掘不够精准的问题，具有局限性。

发明内容

本申请提供用户判别模型训练方法、用户判别方法及相关装置，以解决现有***挖掘方法不够精准的技术问题。

第一方面，提供一种用户判别模型训练方法，用户判别模型包括行为特征提取模块和判别模块，所述方法包括：

获取训练样本集，所述训练样本集包括多个训练样本的样本信息和样本标签，其中，一个训练样本的样本信息包括一个用户对应的行为编码，所述行为编码用于指示所述一个用户在预设时间周期内的网页浏览行为，一个样本标签用于指示一个用户是否属于预设行为用户，所述预设行为用户是指进行与预设类型的网页相关联的行为的用户；

从所述训练样本集中选取目标训练样本、所述目标训练样本的正参考样本和所述目标训练样本的负参考样本，并将所述目标训练样本、所述正参考样本和所述负参考样本各自的样本信息分别输入至所述行为特征提取模块，以得到所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征；其中，所述目标训练样本为所述训练样本集中的任意一个训练样本，所述正参考样本的样本标签与所述目标训练样本的样本标签相同，所述负参考样本的样本标签与所述目标训练样本的样本标签不同；

将所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征分别输入至所述判别模块，以获取所述目标训练样本、所述正参考样本和所述负参考样本各自对应的判别结果，一个判别结果用于指示一个训练样本对应的用户是否属于所述预设行为用户；

根据所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征，以及，所述目标训练样本、所述正参考样本和所述负参考样本各自对应的判别结果，以及，所述目标训练样本、所述正参考样本和所述负参考样本各自的样本标签，对所述用户判别模型进行调参，返回执行所述从所述训练样本集中选取目标训练样本、所述目标训练样本的正参考样本和所述目标训练样本的负参考样本的步骤，直至所述用户判别模型收敛，将收敛后的用户判别模型确定为目标用户判别模型。

在该技术方案中，通过为用户判别模型设置行为特征提取模块和判别模块，获取训练样本集，然后从训练样本集中获取训练样本、训练样本的正参考样本和训练样本的负参考样本共三个训练样本的样本信息输入至行为特征提取模块中，得到三个训练样本的行为特征；再将三个训练样本的行为特征输入至判别模块中，得到三个训练样本的判别结果；最后根据三个训练样本的行为特征、三个训练样本的判别结果以及三个训练样本的样本标签，对用户判别模型进行迭代调参，从而得到目标用户判别模型。根据三个训练样本的行为特征，对用户判别模型进行迭代调参，能够使用户判别模型学习到样本标签相同的训练样本的行为特征之间的特征共性和样本标签不同的训练样本的行为特征之间的特征差异，进而可学习到可准确区分不同类型的用户的行为特征，使得用户判别模型具备准确提取行为特征的能力；根据三个训练样本的判别结果和样本标签，对用户判别模型进行迭代调参，使得用户判别模型输出的判别结果能够接近于样本标签，进而使得用户判别模型具有准确区分用户是否为预设行为用户的能力；因此，通过对用户判别模型进行训练，可使用户判别模型准确提取行为特征的能力和用户识别能力，能够准确确定用户是否为预设行为用户，即实现对用户是否为***的准确判别。

结合第一方面，在一种可能的实现方式中，根据所述目标训练样本对应的行为特征与所述正参考样本对应的行为特征之间的差距，以及，所述目标训练样本对应的行为特征与所述负参考样本对应的行为特征之间的差距，计算特征提取损失，所述特征提取损失用于指示所述用户判别模型进行特征提取的精准度；根据所述目标训练样本对应的判别结果与所述目标训练样本的样本标签之间的差距、所述正参考样本对应的判别结果与所述正参考样本的样本标签之间的差距，以及，所述负参考样本对应的判别结果与所述负参考样本的样本标签之间的差距，计算判别损失，所述判别损失用于指示用户判别模型进行判别的精准度；根据所述特征提取损失和所述判别损失，得到所述用户判别模型的损失；根据所述用户判别模型的损失，对所述用户判别模型进行调参。通过计算特征提取损失，能够对用户判别模型特征提取的准确度进行衡量；通过计算判别损失，能够对用户判别模型判别的准确度进行衡量；根据总损失对用户判别模型进行调参，能够使得用户判别模型具有较强的特征提取能力和用户识别能力，从而使得用户判别模型具有更高的准确度。

结合第一方面，在一种可能的实现方式中，所述获取训练样本集，包括：获取第一用户在所述预设时间周期内的网页浏览行为数据，所述第一用户为任一用户，所述网页浏览行为数据包括第一行为对应的行为时间数据、第二行为对应的行为时间数据和/或第三行为对应的行为时间数据，所述第一行为是指浏览所述预设类型的网页，所述第二行为是指浏览除所述预设类型以外的网页，所述第三行为是指未浏览网页；按预设划分频率，将所述预设时间周期划分为多个时间片段；对所述第一用户在各时间片段内的网页浏览行为数据进行编码，以得到所述第一用户对应的行为编码。通过将用户浏览网页的行为时间数据进行编码，能够使得用户判别模型发现用户浏览网页的行为特征随时间变化的规律，进而具有较强的识别能力。

结合第一方面，在一种可能的实现方式中，若目标时间片段中第一用户进行目标行为的时长大于预设时间阈值，则将所述目标时间片段内的网页浏览行为数据编码为所述目标行为对应的行为编码，所述目标时间片段为所述多个时间片段中的任一时间片段，所述目标行为为所述第一行为、所述第二行为或所述第三行为。将网页浏览行为数据编码为时长大于预设时间阈值的行为的行为编码，使得行为编码能够准确反映用户的网页浏览行为。

结合第一方面，在一种可能的实现方式中，所述一个训练样本的样本信息还包括一个用户对应的行为时长编码，所述行为时长编码用于指示所述一个用户在所述预设时间周期内的浏览行为时长信息；所述获取训练样本集，还包括：根据所述第一行为对应的行为时间数据，确定所述第一行为对应的总时长；根据所述第二行为对应的行为时间数据，确定所述第二行为对应的总时长；根据所述第三行为对应的行为时间数据，确定所述第三行为对应的总时长；对所述第一行为对应的总时长、所述第二行为对应的总时长以及所述第三行为对应的总时长进行编码，得到所述第一用户对应的行为时长编码。通过将用户浏览网页的总时长进行编码，能够使得用户判别模型发现用户行为特征的时间长短规律，提供了更多维度供用户判别模型进行学习，使得用户判别模型能够进具有更强的识别能力。

第二方面，提供一种用户判别方法，包括：

获取目标用户的用户行为信息，所述用户行为信息包括目标行为编码，所述目标行为编码用于指示所述目标用户在预设时间周期内的网页浏览行为；

将所述用户行为信息输入至目标用户判别模型中，以得到所述目标用户的判别结果，所述判别结果用于指示所述目标用户是否为潜在的预设行为用户，所述目标用户判别模型为通过上述第一方面所述的用户判别模型训练方法训练得到，所述预设行为用户是指进行与预设类型的网页相关联的行为的用户。

由于通过上述第一方面的方法训练得到的目标用户判别模型具有准确的区分行为特征的能力和用户识别能力，目标用户判别模型学习到了预设行为用户相互之间的特征共性，以及预设行为用户和非预设行为用户之间的特征差异；在利用目标用户判别模型对目标用户进行判别时，可准确地判定用户是否为潜在的预设行为用户，也就可以实现对用户是否为***的准确挖掘。

第三方面，提供一种用户判别模型训练装置，所述用户判别模型包括行为特征提取模块和判别模块，所述用户判别模型训练装置包括：

样本获取模块，用于获取训练样本集，所述训练样本集包括多个训练样本的样本信息和样本标签，其中，一个训练样本的样本信息包括一个用户对应的行为编码，所述行为编码用于指示所述一个用户在预设时间周期内的网页浏览行为，一个样本标签用于指示一个用户是否属于预设行为用户，所述预设行为用户是指进行与预设类型的网页相关联的行为的用户；

第一输入模块，用于从所述训练样本集中选取目标训练样本、所述目标训练样本的正参考样本和所述目标训练样本的负参考样本，并将所述目标训练样本、所述正参考样本和所述负参考样本各自的样本信息分别输入至所述行为特征提取模块，以得到所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征；其中，所述目标训练样本为所述训练样本集中的任意一个训练样本，所述正参考样本的样本标签与所述目标训练样本的样本标签相同，所述负参考样本的样本标签与所述目标训练样本的样本标签不同；

第二输入模块，用于将所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征分别输入至所述判别模块，以获取所述目标训练样本、所述正参考样本和所述负参考样本各自对应的判别结果，一个判别结果用于指示一个训练样本对应的用户是否属于所述预设行为用户；

调参模块，用于根据所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征，以及，所述目标训练样本、所述正参考样本和所述负参考样本各自对应的判别结果，以及，所述目标训练样本、所述正参考样本和所述负参考样本各自的样本标签，对所述用户判别模型进行调参，触发第一输入模块执行所述从所述训练样本集中选取目标训练样本、所述目标训练样本的正参考样本和所述目标训练样本的负参考样本的步骤，直至所述用户判别模型收敛，将收敛后的用户判别模型确定为目标用户判别模型。

第四方面，提供一种用户判别装置，包括：

行为获取模块，用于获取目标用户的用户行为信息，所述用户行为信息包括目标行为编码，所述目标行为编码用于指示所述目标用户在预设时间周期内的网页浏览行为；

结果输出模块，用于将所述用户行为信息输入至目标用户判别模型中，以得到所述目标用户的判别结果，所述判别结果用于指示所述目标用户是否为潜在的预设行为用户，所述目标用户判别模型为通过上述第一方面所述的用户判别模型训练方法训练得到，所述预设行为用户是指进行与预设类型的网页相关联的行为的用户。

第五方面，提供一种计算机设备，包括存储器以及一个或多个处理器，一个或多个处理器用于执行存储在存储器中的一个或多个计算机程序，一个或多个处理器在执行一个或多个计算机程序时，使得该计算机设备实现上述第一方面的用户判别模型训练方法或用户判别方法。

第六方面，提供一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序包括程序指令，上述程序指令当被处理器执行时使上述处理器执行上述第一方面的用户判别模型训练方法或用户判别方法。

本申请可以实现如下技术效果：根据三个训练样本的行为特征，对用户判别模型进行迭代调参，能够使用户判别模型学习到样本标签相同的训练样本的行为特征之间的特征共性和样本标签不同的训练样本的行为特征之间的特征差异，进而可学习到可准确区分不同类型的用户的行为特征，使得用户判别模型具备准确提取行为特征的能力；根据三个训练样本的判别结果和样本标签，对用户判别模型进行迭代调参，使得用户判别模型输出的判别结果能够接近于样本标签，进而使得用户判别模型具有准确区分用户是否为预设行为用户的能力；因此，通过对用户判别模型进行训练，可使用户判别模型准确提取行为特征的能力和用户识别能力，能够准确确定用户是否为预设行为用户，即实现对用户是否为***的准确判别。

附图说明

图1为本申请实施例提供的一种用户判别模型的结构示意图；

图2为本申请提供的一种用户判别模型训练方法的流程示意图；

图3为本申请实施例提供的用户判别模型的一种具体结构示意图；

图4为本申请实施例提供的一种用户判别方法的流程示意图；

图5是本申请实施例提供的一种用户判别模型训练装置的结构示意图；

图6是本申请实施例提供的一种用户判别装置的结构示意图；

图7是本申请实施例提供的一种计算机设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。

本申请的技术方案可适用于数据挖掘的场景中，尤其可应用于***的挖掘。其中，本申请的技术方案具体可适用于对与浏览网页行为相关的某种***的挖掘。例如，本申请的技术方案可适用于对潜在的游戏用户的挖掘，与潜在的游戏用户相关的浏览网页行为可以是指浏览游戏类网页的行为；又如，本申请的技术方案也可适用于对潜在的购买商品的用户的挖掘，与潜在的购买商品的用户的浏览网页行为可以是指浏览购物类网页的行为；等等，不限于这里的举例。

本申请的技术方案旨在通过对用户判别模型进行训练，通过用户判别模型对不同用户在浏览网页这一行为上的行为特性进行数据挖掘，以发现相同类型的用户在浏览网页这一行为上的特征共性，和不同类型的用户在浏览网页这一行为上的特征差异，找到能够有效区分不同类型的用户的有关于浏览网页的目标行为特征；然后利用训练得到的用户判别模型完成对用户是否为***的识别判定，从而提高***的识别准确性。

以下具体介绍本申请的技术方案。

为便于理解，首先介绍本申请的用户判别模型，参见图1，图1为本申请实施例提供的一种用户判别模型的结构示意图，如图1所示，用户判别模型M包括行为特征提取模块M1和判别模块M2，其中，行为特征提取模块M1与判别模块M2连接，行为特征提取模块M1用于对用户浏览网页的行为特征进行提取，以得到用户在网页浏览行为上的行为随时间变化的规律；判别模块M2用于根据用户浏览网页的行为特征对用户是否属于预设行为用户进行判别，完成对用户是否为某种类型的***的判定。

请参见图2，图2为本申请提供的一种用户判别模型训练方法的流程示意图，该方法可应用于服务器或者终端设备上；如图2所示，该方法包括如下步骤：

S101，获取训练样本集，其中，训练样本集包括多个训练样本的样本信息和样本标签。

S102，从训练样本集中选取目标训练样本、目标训练样本的正参考样本和目标训练样本的负参考样本。

S103，将目标训练样本、目标训练样本的正参考样本和目标训练样本的负参考样本各自的样本信息输入至行为特征提取模块，以得到目标训练样本、目标训练样本的正参考样本和目标训练样本的负参考样本各自对应的行为特征。

S104，将目标训练样本、目标训练样本的正参考样本和目标训练样本的负参考样本各自对应的行为特征分别输入至判别模块，以获取目标训练样本、目标训练样本的正参考样本和目标训练样本的负参考样本各自对应的判别结果。

S105，根据目标训练样本、目标训练样本的正参考样本和目标训练样本的负参考样本各自对应的行为特征，以及，目标训练样本、目标训练样本的正参考样本和目标训练样本的负参考样本各自对应的判别结果，以及目标训练样本、目标训练样本的正参考样本和目标训练样本的负参考样本各自的样本标签，对用户判别模型进行调参。

S106，判断用户判别模型是否收敛。

若用户判别模型收敛，则执行步骤S107；若用户判别模型未收敛，则执行步骤S102。

S107，将收敛后的用户判别模型确定为目标判别模型。

以下分别对每个步骤进行解释说明：

上述步骤S101中的一个训练样本的样本信息可包括一个用户对应的行为编码，其中，一个用户对应的行为编码用于指示该一个用户在预设时间周期内的网页浏览行为。预设时间周期是指监测用户的网页浏览行为的时间周期，例如可以为一天、一周或一个月。预设时间周期可根据具体的需求进行设置。

其中，上述步骤S101中的一个训练样本的样本标签用于指示一个用户是否为预设行为用户，其中，预设行为用户是指进行与预设类型的网页相关联的行为的用户。例如，可以用1来指示用户是预设用户，用0来指示用户不是预设行为用户。当然，也可以按照独热编码(one-hot)的方式来对用户是否为预设行为用户进行指示，例如，用01来表示用户预设用户，用10来表示用户不是预设行为用户。本申请不对训练样本的样本标签的具体形式进行限定。

用户进行与预设类型的网页相关联的行为可以理解为是因浏览预设类型的网页而直接或间接诱使/触发用户进行的行为。例如，预设类型的网页为游戏类网页，则预设行为用户可以为游戏用户，也即进行游戏的用户；或者，预设类型的网页为购物类网页，则预设行为用户可以为进行购物行为的用户。应理解的是，预设用户行为和预设类型的网页可根据具体的业务需求进行设计。

在一种可能的实施方式中，可以将预设时间周期划分为多个时间片段，对用户在每个时间片段内的网页浏览行为进行统计和编码，从而得到一个用户对应的行为编码。

具体地，上述步骤S101可包括如下步骤A11～A13：

A11、获取第一用户在预设时间周期内的网页浏览行为数据。

这里，第一用户可以为用作训练样本的任一用户；网页浏览行为数据是指反映第一用户在预设时间周期内的网页浏览行为的行为时间数据，行为时间数据是指进行某种网页浏览行为的时间。本申请实施例中，用户的网页浏览行为可分为浏览预设类型的网页(以下称第一行为)、浏览非预设类型的网页(以下称第二行为)和未浏览网页的行为(以下称第三行为)这三种类型的网页浏览行为；相应地，网页浏览行为数据的种类也可以分为浏览预设类型的网页的行为时间数据(即第一行为对应的行为时间数据)、浏览除预设类型以外的网页的行为时间数据(即第二行为对应的行为时间数据)和未浏览网页的行为时间数据(即第三行为对应的行为时间数据)。其中，不同行为对应的行为时间数据在预设时间周期内的网页浏览行为数据中按行为发生时间进行排列。

例如，以预设类型的网页为游戏类网页、预设时间周期为1天为例，假设用户在9:00-11:00浏览了网页，其中，用户在9:00-9:30浏览了游戏类的网页，在9:30-11:00浏览了非游戏类的网页，在11：00-13:00未浏览网页，那么，用户在预设时间周期内的部分网页浏览行为数据为{第一行为对应的行为时间数据：9:00-9:30，第二行为对应的行为时间数据：9:30-11：00，第三行为对应的行为时间数据：11:00-13:00}。

A12、按预设划分频率，将预设时间周期划分为多个时间片段。

这里，按预设划分频率，将预设时间周期划分为多个时间片段，是指通过等分的方式划分预设时间周期，得到多个等时长的时间片段，划分得到的时间片段的数量等于预设划分频率。其中，预设划分频率可根据预设时间周期的时间长度和具体情况进行设计。预设划分频率越大，则时间片段划分的颗粒度越细。

例如，以预设时间周期为1天为例，预设划分频率为1440，则可以以1分钟为时间片段的时间长度，将1天划分为1440个时间片段。

A13、对第一用户在各时间片段内的网页浏览行为数据进行编码，以得到第一用户对应的行为编码。

这里，对第一用户在各时间片段内的网页浏览行为数据进行编码，以得到第一用户对应的行为编码，是指：根据第一用户在各时间片段内的网页浏览行为数据，确定第一用户在各时间片段内的网页浏览行为；利用不同行为编码来表示不同类型的网页浏览行为，得到各时间片段对应的行为编码；将所有时间片段对应的行为编码按时间片段的先后顺序进行排列，得到第一用户对应的行为编码。例如，可以用1来表示第一行为，用2来表示第二行为，用3来表示第三行为，对各时间片段内的网页浏览行为数据进行编码。

其中，在用不同编码来表示不同网页浏览行为，得到每个时间片段对应的行为编码的过程中，对于任意一个目标时间片段，若该目标时间片段内的网页浏览行为的类型只有一种，则直接将目标时间片段内的网页浏览行为数据编码为该目标时间片段内的网页浏览行为对应的行为编码。若该目标时间片段内的网页浏览行为的类型不止一种，若在目标时间片段中第一用户进行目标行为的时长大于预设时间阈值，则将目标时间片段内的网页浏览行为数据编码为目标行为对应的行为编码，目标行为可以为第一行为、第二行为或第三行为中的任意一种行为。其中，预设时间阈值可以设置为大于目标时间片段的时长的一半；进一步地，若目标片段内不存在时长大于预设时间阈值的目标行为，则可以将目标时间片段内的网页浏览行为数据编码为目标片段内时长最长的一个行为对应的行为编码。

以下举例对获取一个用户对应的行为编码进行说明。假设，用1来表示第一行为，用2来表示第二行为，用3来表示第三行为；预设时间周期为1天，预设划分频率为1440，预设时间阈值为30s。首先，可以将一天划分为1440个时间片段，每个时间片段的时长长度为1分钟。时间片段分别为时间片段1(00:00:00-00:00:01)、时间片段2(00:00:01-00:00:02)……时间片段1440(11:59:59-00:00:00)。然后获取用户在一天内的网页浏览行为数据，并按时间片段对网页浏览行为数据进行划分，得到时间片段1～时间片段1440中每个时间片段内的网页浏览行为数据。对每个时间内的网页浏览行为数据进行编码，得到1440个行为编码，1440个行为编码根据时间片段的先后顺序组合成一个1440维向量，1440维向量即为一个用户对应的行为编码。其中，若在时间片段v1中，用户只进行了第一行为，则将时间片段v1对应的网页浏览时间数据编码为1；若在时间片段v2中，用户进行了第一行为和第二行为，进行的时长分别为20s和40s，则将时间片段v2对应的网页浏览时间数据编码为2；若在时间片段v3中，用户进行了第一行为、第二行为、第三行为，进行的时长分别为15s、20s、25s，则将时间片段v3对应的网页浏览时间数据编码为3。

通过上述步骤A11～A13，将预设时间周期内划分为多个时间片段，并根据用户在各时间片段内的网页浏览行为数据，用不同行为编码来表示不同网页浏览行为，能够实现对用户的浏览行为的量化和编码；在时间片段内的网页浏览行为有多种的情况下，根据网页浏览行为的时长，将网页浏览行为数据编码为时长大于预设时间阈值或时长最大的行为对应的行为编码，使得行为编码能够准确反映用户的网页浏览行为。另外，通过将网页浏览行为划分为第一行为、第二行为以及第三行为进行编码作为样本信息，使得用户判别模型不仅可以学习到第一行为与预设行为之间的关联性，还可以学习到第二行为和第三行为与预设行为之间的关联性，从而能够有助于用户判别模型学习到用户在多个维度上的行为特征，进而具备更强的识别能力。

可选地，一个训练样本的样本信息除了可以包括一个用户对应的行为编码外，还可以包括一个用户对应的行为时长编码，其中，行为时长编码用于指示该一个用户在预设时间周期内的浏览行为时长信息。

上述步骤S101还可以包括如下步骤：

A21，根据第一行为对应的行为时间数据，确定第一行为对应的总时长。

这里，第一行为对应的总时长是指第一用户在预设时间周期内浏览预设类型网页的时间总长度。其中，可以根据第一行为对应的行为时间数据，确定第一用户在预设时间周期内的每个第一行为的持续时长，对预设时间周期内的所有第一行为的持续时长进行求和，得到第一行为对应的总时长。

A22，根据第二行为对应的行为时间数据，确定第二行为对应的总时长。

这里，第二行为对应的总时长是指第一用户在预设时间周期内浏览非预设类型网页的时间总长度。其中，可以根据第二行为对应的行为时间数据，确定第一用户在预设时间周期内的每个第二行为的持续时长，对预设时间周期内的所有第二行为的持续时长进行求和，得到第二行为对应的总时长。

A23，根据第三行为对应的行为时间数据，确定第三行为对应的总时长。

这里，第三行为对应的总时长是指第一用户在预设时间周期内未浏览网页的时间总长度。其中，可以根据第三行为对应的行为时间数据，确定第一用户在预设时间周期内的每个第三行为的持续时长，对预设时间周期内的所有第三行为的持续时长进行求和，得到第三行为对应的总时长。

A24，对第一行为时长对应的总时长、第二行为对应的总时长以及第三行为对应的总时长进行编码，得到第一用户对应的行为时长编码。

具体地，可以以一个时间片段的时间长度作为单位时间长度，通过二进制编码的方式来对第一行为对应的总时长、第二行为对应的总时长以及第三行为对应的总时长进行编码，得到第一用户对应的行为时长编码。

例如，时间片段的时间长度为1分钟，预设时间周期为1天，预设时间周期的总时长为1440分钟，则可以用12位的二进制编码来表示第一行为对应的总时长、第二行为对应的总时长以及第三行为对应的总时长。

通过上述步骤A21～A24，根据第一行为、第二行为以及第三行为各自对应的行为时间数据，确定第一行为、第二行为以及第三行为各自对应的总时长，并对第一行为、第二行为以及第三行为各自对应的总时长进行编码，实现对用户的浏览行为的时长的编码；通过将用户的浏览行为的时长进行编码并作为样本信息，能够丰富样本信息的信息量，从而使得用户判别模型能够学习到与浏览行为的时长信息与预设行为之间的关联性，提升用户判别模型的识别能力。

具体实现中，对于上述步骤S101，可以选择多个预设行为用户和多个非预设行为用户作为样本，监测多个预设行为用户和多个非预设行为用户在预设时间周期内的网页浏览行为，从而获取到多个预设行为用户和多个非预设行为用户在预设时间周期内的网页浏览行为数据，对每个用户在预设时间周期内的网页浏览行为数据，均按照上述确定第一用户对应的样本信息的方式，确定每个用户对应的样本信息，并根据每个用户的用户类型为每个用户构建样本标签，从而获得训练样本集。

本申请实施例中，上述步骤S102中的目标训练样本可以为训练样本集中的任意一个训练样本，目标训练样本的正参考样本是指样本标签与目标训练样本的样本标签相同的训练样本，目标样本的负参考样本是指样本标签与目标训练样本的样本标签不同的训练样本。具体地，若目标训练样本的样本标签用于指示该目标训练样本对应的用户为预设行为用户，那么目标训练样本的正参考样本的样本标签用于指示该正参考样本对应的用户为预设行为用户，目标训练样本的负参考样本的样本标签用于指示该负参考样本对应的用户不为预设行为用户；若目标训练样本的样本标签用于指示该目标训练样本对应的用户不为预设行为用户，那么目标训练样本的正参考样本的样本标签用于指示该正参考样本对应的用户不为预设行为用户，目标训练样本的负参考样本的样本标签用于指示该负参考样本对应的用户为预设行为用户。

具体实现中，对于上述步骤S102，可以从训练样本集中随机选取一个训练样本作为目标训练样本，并随机选取一个样本标签与目标训练样本的样本标签相同的训练样本作为正参考样本，随机选取一个样本标签与目标训练样本的样本标签不同的训练样本作为负参考样本。通过随机选取训练样本的方式，能够使得训练的效果较好。

本申请实施例中，上述步骤S103中的行为特征提取模块用于提取用户浏览网页的行为特征。通过将目标训练样本、目标训练样本的正参考样本和负参考样本各自对应的样本信息输入至行为特征提取模块，提取目标训练样本、目标训练样本的正参考样本和负参考样本各自对应的行为特征，使得用户判别模型能够对目标训练样本、目标训练样本的正参考样本和负参考样本各自对应的行为特征进行比较，从而找到用于体现相同标签的训练样本之间的特征共性的行为特征和用于体现不同标签的训练样本之间的特征差异的行为特征，从而能够实现对行为特征的准确提取。

其中，行为特征提取模块可以为任意一种能够实现行为特征提取的网络模型，如可以为由多层卷积层组成的网络模块，或者，由多个依次连接的残差结构组成的网络模块。

在一种具体实现方式中，行为特征提取模块可以包括多层神经网络。其中，多层神经网络进行特征提取的公式如下：

y＝F(h(x))

其中，x表示多层神经网络的输入；在本实施例中，为目标训练样本对应的样本信息、目标训练样本对应的正参考样本对应的样本信息或目标训练样本对应的负参考样本对应的负参考样本的样本信息。F[]表示激活函数，例如，可以为sigmoid函数；h()表示多层神经网络的函数关系，其中，h(x)＝W^Tx+b，W^T为相邻两层神经网络之间的权重矩阵，b为偏置项。

示例性地，行为特征提取模块M1可以如图3所示，包括三层神经网络，其中，第一层神经网络L1为输入层，包括a个神经元，a等于训练样本对应的样本信息的维度。例如，样本信息包括一个用户对应的行为编码，一个用户对应的行为编码为前述的1440维向量，则a等于1440。第二层神经网络L2和第三层神经网络为隐藏层，分别包括n个神经元和m个神经元。第一层神经网络L1与第二层神经网络L1之间的连线组成n*a的权重矩阵，将输入至输入层的信息(例如样本信息)转换为n维的行为特征；第二层神经网络L2与第三层神经网络之间的连线组成n*m的权重矩阵，将n维的行为特征转换为m维的行为特征。通过图3所示的行为特征提取模块M1，可以将a维的信息转换为m维行为特征。对于上述步骤S103，当将目标训练样本、目标训练样本的正参考样本和负参考样本各自对应的样本信息分别输入至图3所示的行为特征提取模块时，可得到目标训练样本、目标训练样本的正参考样本和负参考样本各自对应的m维行为特征。

应理解的是，多层神经网络的层数可不仅限于图3中的三层，还可以有更多层次，多层神经网络的层数和每层神经网络中的神经元的个数可根据实际情况进行设计。通过多层神经网络对目标训练样本、目标训练样本的正参考样本和负参考样本各自对应的行为特征进行提取，能够提取到训练样本中的非线性特征。

本申请实施例中，上述步骤S104中的判别模块用于基于行为特征提取模块提取到的行为特征对用户是否为预设行为用户进行判别，得到判别结果，即判别结果用于指示用户是否为预设行为用户。其中，判别模块可以为任意一种能够实现判别功能的模块。

在一种可行的实施方式中，判别模块可以为与行为特征提取模块连接的全连接层，全连接层用于基于特征提取模块输出的行为特征进行判别，输出用户为预设行为用户的概率和不为预设行为用户的概率。

示例性地，判别模块M2可以如图3所示，包括2个神经元，判别模块与第三层神经网络连接，判别模块与第三层神经网络之间的连线组成m*2的权重矩阵，将m维行为特征转换为2维判别结果，分别用于指示是否属于预设行为用户的概率。对于上述步骤S104，当将目标训练样本、目标训练样本的正参考样本和负参考样本各自对应的m维行为特征分别输入至判别模块时，可得到目标训练样本、目标训练样本的正参考样本和负参考样本各自对应的2维判别结果，其中，目标训练样本对应的2维判别结果用于指示目标训练样本对应的用户为预设行为用户和不为预设行为用户的概率；目标训练样本的正参考样本对应的2维判别结果用于指示目标训练样本的正参考样本对应的用户为预设行为用户和不为预设行为用户的概率；目标训练样本的负参考样本对应的2维判别结果用于指示目标训练样本的负参考样本对应的用户为预设行为用户和不为预设行为用户的概率。

通过将判别模块设置为全连接层，与特征提取模块连接，能够简化用户判别模型，从而提高用户判别模型的运算速度。

本申请实施例中，上述步骤S105中的对用户判别模型进行调参，是指根据目标训练样本、目标训练样本的正参考样本和目标训练样本的负参考样本各自对应的行为特征，以及，目标训练样本、目标训练样本的正参考样本和目标训练样本的负参考样本各自对应的判别结果，以及目标训练样本、目标训练样本的正参考样本和目标训练样本的负参考样本各自对应的样本标签，计算反映用户判别模型的精准度的损失，基于损失调整特征提取模块和判别模型的参数，使得调整参数后的用户判别模型的损失朝减小的方向变化，以提高用户判别模型的精准度。其中，用户判别模型的损失越小，则用户判别模型的精准度越高。

用户判别模型的损失可以由特征提取损失和判别损失两部分损失共同决定。其中，可以根据目标训练样本对应的行为特征、目标训练样本的正参考样本对应的行为特征、目标训练样本的负参考样本对应的行为特征，计算特征提取损失；根据目标训练样本、目标训练样本的正参考样本和目标训练样本的负参考样本各自对应的判别结果，以及目标训练样本、目标训练样本的正参考样本和目标训练样本的负参考样本各自对应的样本标签，计算判别损失。

其中，特征提取损失用于指示用户判别模型进行特征提取的精准度，特征提取损失越小，则说明用户判别模型进行特征提取的精准度越高，基于用户判别模型提取到的行为特征用于进行用户区分所能达到的区分效果越好；特征提取损失越大，则说明用户判别模型进行特征提取的准确度越低，基于用户判别模型提取到的行为特征用于进行用户区分所能达到的区分效果越差。

具体地，可根据目标训练样本对应的行为特征与目标训练样本的正参考样本对应的行为特征之间的差距，以及目标训练样本对应的行为特征与负参考样本对应的行为特征之间的差距，计算特征提取损失。特征提取损失的计算公式如下：

其中，L1为特征提取损失，m为行为特征的维度，y_1i为目标训练样本对应的行为特征，y_2i为目标训练样本的正参考样本对应的行为特征，y_3i为目标训练样本的负参考样本对应的行为特征，D为预设距离值。根据特征提取损失对用户判别模型进行调整，能够减小类内距离，增大类间距离，从而使得用户判别模型能够提取到较为精准的用于区分不同类型用户的行为特征。

其中，判别损失用于指示用户判别模型进行判别的精准度，判别损失越小，则说明用户判别模型判别用户类型的精准度越高，即判断用户是否属于预设行为用户越准确；判别损失越大，则说明用户判别模型判别用户类型的精准度越低，即判断用户是否属于预设行为用户越不准确。

具体地，可根据目标训练样本对应的判别结果与目标训练样本的样本标签之间的差距、目标训练样本的正参考样本对应的判别结果与目标训练样本的正参考样本的样本标签之间的差距，以及，目标训练样本的负参考样本对应的判别结果与目标训练样本的负参考样本的样本标签之间的差距，计算判别损失。判别损失的计算公式如下：

其中，L2为判别损失，y_1j为目标训练样本对应的判别结果，t_1j为目标训练样本的样本标签；y_2j为目标训练样本的正参考样本对应的判别结果，t_2j为目标训练样本的正参考样本的样本标签；y_3j为目标训练样本的负参考样本对应的判别结果，t_3j为目标训练样本的负参考样本的样本标签。通过根据判别对用户判别模型进行调整，能够使得用户判别模型具有较强的判别能力。

在计算得到特征提取损失和判别损失后，可以对特征提取损失和判别损失求和，得到用户判别模型的损失；可选地，也可以对特征提取损失和判别损失进行加权求和，得到用户判别模型的损失。用户判别模型的损失的计算公式如下：

L＝α1*L1+α2*L2

其中，L为用户判别模型的损失，α1为特征提取损失的权重，α2为判别损失的权重。通过加权求和的方式，能够有重点地调整用户判别模型训练的方向，从而能够提高用户判别模型的精准度。

上述步骤S106中判断用户判别模型是否收敛，是指判断用户判别模型是否符合预设条件，其中，预设条件可以是指用户判断模型的损失小于预设损失值，或者训练次数达到预设次数，训练次数可以理解为执行上述步骤S102～S105的次数。当用户判别模型符合预设条件时，说明用户判别模型收敛；当用户判别模型不符合预设条件时，说明用户判别模型未收敛。

上述可知，在图2对应的技术方案中，通过为用户判别模型设置行为特征提取模块和判别模块，获取训练样本集，然后从训练样本集中获取训练样本、训练样本的正参考样本和训练样本的负参考样本共三个训练样本的样本信息输入至行为特征提取模块中，得到三个训练样本的行为特征；再将三个训练样本的行为特征输入至判别模块中，得到三个训练样本的判别结果；最后根据三个训练样本的行为特征、三个训练样本的判别结果以及三个训练样本的样本标签，对用户判别模型进行迭代调参，从而得到目标用户判别模型。根据三个训练样本的行为特征，对用户判别模型进行迭代调参，能够使用户判别模型学习到样本标签相同的训练样本的行为特征之间的特征共性和样本标签不同的训练样本的行为特征之间的特征差异，进而可学习到可准确区分不同类型的用户的行为特征，使得用户判别模型具备准确提取行为特征的能力；根据三个训练样本的判别结果和样本标签，对用户判别模型进行迭代调参，使得用户判别模型输出的判别结果能够接近于样本标签，进而使得用户判别模型具有准确区分用户是否为预设行为用户的能力；因此，通过对用户判别模型进行训练，可使用户判别模型准确提取行为特征的能力和用户识别能力，能够准确确定用户是否为预设行为用户，即实现对用户是否为***的准确判别。

在训练得到目标用户判别模型后，可利用目标用户判别模型对用户是否为潜在的预设行为用户进行识别。参见图4，图4为本申请实施例提供的一种用户判别方法的流程示意图，如图4所示，该方法包括如下步骤：

S201，获取目标用户的用户行为信息。

这里，目标用户的行为信息包括目标行为编码，目标行为编码用于指示目标用户在预设时间周期内的网页浏览行为。

具体实现中，可以监测目标用户在预设时间周期内的网页浏览行为，获取目标用户在预设时间周期内的网页浏览行为数据，参考上述步骤A11～A13介绍的方式，根据目标用户在预设时间周期内的网页浏览行为数据，确定目标行为编码。

可选地，目标用户的行为信息还可以包括目标行为时长编码，目标行为时长编码用于指示目标用户在预设时间周期内的浏览行为时长信息。

具体实现中，可参考上述步骤A21～A24介绍的方式，确定目标行为时长编码。

S202，将目标用户的用户行为信息输入至目标判别模型中，以得到目标用户的判别结果。

这里，目标用户的判别结果用于指示目标用户是否为潜在的预设行为用户，有关于预设行为用户的含义，可参考前述描述。

具体地，将目标用户的用户行为信息输入至目标用户判别模型中后，通过目标判别模型中的行为特征提取模块对目标用户的用户行为信息进行行为特征提取，得到目标用户的行为特征；通过目标判别模型中的判别模块根据目标用户的行为特征对目标用户进行判别，从而得到目标用户的判别结果。其中，目标判别模型中的行为特征提取模块对用户目标用户的用户行为信息进行行为特征提取，得到目标用户的行为特征，以及目标判别模型中的判别模块根据目标用户的行为特征对目标用户进行判别的具体处理方式，可参考前述对行为特征提取模块和判别模块的介绍。

由于判别模块输出的目标用户的判别结果中包含了目标用户为潜在的预设行为用户的第一概率，和目标用户不为潜在的预设行为用户的第二概率；当第一概率大于第二概率时，则确定目标用户为潜在的预设行为用户；当第一概率小于第二概率时，则确定目标用户不为潜在的预设行为用户。

可选地，在根据目标用户的判别结果确定目标用户为潜在的预设行为用户的情况下，可以向目标用户推送触发执行预设行为的网页链接，从使得目标用户可根据网页链接进行预设行为。例如，预设行为为进行游戏，则向用户推送游戏链接。通过向目标用户推送触发执行预设行为的网页链接，能够实现对用户群体的精准发掘。

在上述技术方案中，通过目标用户判别模型对用户是否为潜在的预设行为用户进行判别，由于目标用户判别模型学习到了预设行为用户相互之间的特征共性，以及预设行为用户和非预设行为用户之间的特征差异，具有准确的特征提取能力和用户识别能力，因而可准确地判定用户是否为潜在的预设行为用户，从而可实现对***的准确挖掘。

上述介绍了本申请的方法，为了更好地实施本申请的方法，接下来介绍本申请的装置。

参见图5，图5是本申请实施例提供的一种用户判别模型训练装置的结构示意图，用户判别模型训练装置可以为服务器或终端设备。如图5所示，该用户判别模型训练装置30包括：

样本获取模块301，用于获取训练样本集，所述训练样本集包括多个训练样本的样本信息和样本标签，其中，一个训练样本的样本信息包括一个用户对应的行为编码，所述行为编码用于指示所述一个用户在预设时间周期内的网页浏览行为，一个样本标签用于指示一个用户是否属于预设行为用户，所述预设行为用户是指进行与预设类型的网页相关联的行为的用户；

第一输入模块302，用于从所述训练样本集中选取目标训练样本、所述目标训练样本的正参考样本和所述目标训练样本的负参考样本，并将所述目标训练样本、所述正参考样本和所述负参考样本各自的样本信息分别输入至所述行为特征提取模块，以得到所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征；其中，所述目标训练样本为所述训练样本集中的任意一个训练样本，所述正参考样本的样本标签与所述目标训练样本的样本标签相同，所述负参考样本的样本标签与所述目标训练样本的样本标签不同；

第二输入模块303，用于将所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征分别输入至所述判别模块，以获取所述目标训练样本、所述正参考样本和所述负参考样本各自对应的判别结果，一个判别结果用于指示一个训练样本对应的根据所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征，以及，所述目标训练样本、所述正参考样本和所述负参考样本各自对应的判别结果，以及，所述目标训练样本、所述正参考样本和所述负参考样本各自的样本标签，对所述用户判别模型进行调参，触发第一输入模块执行所述从所述训练样本集中选取目标训练样本、所述目标训练样本的正参考样本和所述目标训练样本的负参考样本的步骤，直至所述用户判别模型收敛，将收敛后的用户判别模型确定为目标用户判别模型。

在一种可能的设计中，上述调参模块304具体用于：根据所述目标训练样本对应的行为特征与所述正参考样本对应的行为特征之间的差距，以及，所述目标训练样本对应的行为特征与所述负参考样本对应的行为特征之间的差距，计算特征提取损失，所述特征提取损失用于指示所述用户判别模型进行特征提取的精准度；根据所述目标训练样本对应的判别结果与所述目标训练样本的样本标签之间的差距、所述正参考样本对应的判别结果与所述正参考样本的样本标签之间的差距，以及，所述负参考样本对应的判别结果与所述负参考样本的样本标签之间的差距，计算判别损失，所述判别损失用于指示用户判别模型进行判别的精准度；根据所述特征提取损失和所述判别损失，得到所述用户判别模型的损失；根据所述用户判别模型的损失，对所述用户判别模型进行调参。

在一种可能的设计中，上述样本获取模块301具体用于：获取第一用户在所述预设时间周期内的网页浏览行为数据，所述第一用户为任一用户，所述网页浏览行为数据包括第一行为对应的行为时间数据、第二行为对应的行为时间数据和/或第三行为对应的行为时间数据，所述第一行为是指浏览所述预设类型的网页，所述第二行为是指浏览除所述预设类型以外的网页，所述第三行为是指未浏览网页；按预设划分频率，将所述预设时间周期划分为多个时间片段；对所述第一用户在各时间片段内的网页浏览行为数据进行编码，以得到所述第一用户对应的行为编码。

在一种可能的设计中，上述样本获取模块301具体用于：若目标时间片段中第一用户进行目标行为的时长大于预设时间阈值，则将所述目标时间片段内的网页浏览行为数据编码为所述目标行为对应的行为编码，所述目标时间片段为所述多个时间片段中的任一时间片段，所述目标行为为所述第一行为、所述第二行为或所述第三行为。

在一种可能的设计中，所述一个训练样本的样本信息还包括一个用户对应的行为时长编码，所述行为时长编码用于指示所述一个用户在所述预设时间周期内的浏览行为时长信息；上述样本获取模块301还用于：根据所述第一行为对应的行为时间数据，确定所述第一行为对应的总时长；根据所述第二行为对应的行为时间数据，确定所述第二行为对应的总时长；根据所述第三行为对应的行为时间数据，确定所述第三行为对应的总时长；对所述第一行为对应的总时长、所述第二行为对应的总时长以及所述第三行为对应的总时长进行编码，得到所述第一用户对应的行为时长编码。

需要说明的是，图5对应的实施例中未提及的内容可参考前述方法实施例的描述，这里不再赘述。

上述装置，通过为用户判别模型设置行为特征提取模块和判别模块，获取训练样本集，然后从训练样本集中获取训练样本、训练样本的正参考样本和训练样本的负参考样本共三个训练样本的样本信息输入至行为特征提取模块中，得到三个训练样本的行为特征；再将三个训练样本的行为特征输入至判别模块中，得到三个训练样本的判别结果；最后根据三个训练样本的行为特征、三个训练样本的判别结果以及三个训练样本的样本标签，对用户判别模型进行迭代调参，从而得到目标用户判别模型。根据三个训练样本的行为特征，对用户判别模型进行迭代调参，能够使用户判别模型学习到样本标签相同的训练样本的行为特征之间的特征共性和样本标签不同的训练样本的行为特征之间的特征差异，进而可学习到可准确区分不同类型的用户的行为特征，使得用户判别模型具备准确提取行为特征的能力；根据三个训练样本的判别结果和样本标签，对用户判别模型进行迭代调参，使得用户判别模型输出的判别结果能够接近于样本标签，进而使得用户判别模型具有准确区分用户是否为预设行为用户的能力；因此，通过对用户判别模型进行训练，可使用户判别模型准确提取行为特征的能力和用户识别能力，能够准确确定用户是否为预设行为用户，即实现对用户是否为***的准确判别。

参见图6，图6是本申请实施例提供的一种用户判别装置的结构示意图，用户判别装置可以为服务器或终端设备。如图6所示，该用户判别装置40包括：

行为获取模块401，用于获取目标用户的用户行为信息，所述用户行为信息包括目标行为编码，所述目标行为编码用于指示所述目标用户在预设时间周期内的网页浏览行为；

结果输出模块402，用于将所述用户行为信息输入至目标用户判别模型中，以得到所述目标用户的判别结果，所述判别结果用于指示所述目标用户是否为潜在的预设行为用户，所述目标用户判别模型为通过前述方法实施例所述的用户判别模型训练方法训练得到，所述预设行为用户是指进行与预设类型的网页相关联的行为的用户。

需要说明的是，图6对应的实施例中未提及的内容可参考前述图4对应的方法实施例的描述，这里不再赘述。

上述装置，通过目标用户判别模型对用户是否为潜在的预设行为用户进行判别，由于目标用户判别模型学习到了预设行为用户相互之间的特征共性，以及预设行为用户和非预设行为用户之间的特征差异，具有准确的特征提取能力和用户识别能力，因而可准确地判定用户是否为潜在的预设行为用户，从而可实现对***的准确挖掘。

参见图7，图7是本申请实施例提供的一种计算机设备的结构示意图，该计算机设备50包括处理器501、存储器502。处理器501连接到存储器502，例如处理器501可以通过总线连接到存储器502。

处理器501被配置为支持该计算机设备50执行上述方法实施例中的方法中相应的功能。该处理器501可以是中央处理器(central processNngunNt，CPU)，网络处理器(network processor，NP)，硬件芯片或者其任意组合。上述硬件芯片可以是专用集成电路(applNcatNonspecNfNcNntegratedcNrcuNt，ASNC)，可编程逻辑器件(programmablelogNcdevNce，PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complex programmablelogNcdevNce，CPLD)，现场可编程逻辑门阵列(fNeld-programmable gate array，FPGA)，通用阵列逻辑(generNc array logNc，GAL)或其任意组合。

存储器502用于存储程序代码等。存储器502可以包括易失性存储器(volatNlememory，VM)，例如随机存取存储器(random access memory，RAM)；存储器302也可以包括非易失性存储器(non-volatNle memory，NVM)，例如只读存储器(read-only memory，ROM)，快闪存储器(flash memory)，硬盘(hard dNskdrNve，HDD)或固态硬盘(solNd-state drNve，SSD)；存储器502还可以包括上述种类的存储器的组合。

在一种可能的情况中，处理器501可以调用所述程序代码以执行以下操作：

在另一种可能的情况中，处理器501可以调用所述程序代码以执行以下操作：

将所述用户行为信息输入至目标用户判别模型中，以得到所述目标用户的判别结果，所述判别结果用于指示所述目标用户是否为潜在的预设行为用户，所述目标用户判别模型为通过前述方法实施例所述的用户判别模型训练方法训练得到，所述预设行为用户是指进行与预设类型的网页相关联的行为的用户。

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被计算机执行时使所述计算机执行如前述实施例所述的方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only memory，ROM)或随机存储记忆体(Random Accessmemory，RAM)等。

以上所揭露的仅为本申请较佳实施例而已，当然不能以此来限定本申请之权利范围，因此依本申请权利要求所作的等同变化，仍属本申请所涵盖的范围。

Claims

1.一种用户判别模型训练方法，其特征在于，所述用户判别模型包括行为特征提取模块和判别模块，所述方法包括：

根据所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征，以及，所述目标训练样本、所述正参考样本和所述负参考样本各自对应的判别结果，以及，所述目标训练样本、所述正参考样本和所述负参考样本各自的样本标签，对所述用户判别模型进行调参，返回执行所述从所述训练样本集中选取目标训练样本、所述目标训练样本的正参考样本和所述目标训练样本的负参考样本的步骤，直至所述用户判别模型收敛，将收敛后的用户判别模型确定为目标用户判别模型；

所述根据所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征，以及，所述目标训练样本、所述正参考样本和所述负参考样本各自对应的判别结果，以及，所述目标训练样本、所述正参考样本和所述负参考样本各自的样本标签，对所述用户判别模型进行调参，具体包括：

根据所述目标训练样本对应的行为特征与所述正参考样本对应的行为特征之间的差距，以及，所述目标训练样本对应的行为特征与所述负参考样本对应的行为特征之间的差距，计算特征提取损失，所述特征提取损失用于指示所述用户判别模型进行特征提取的精准度；

根据所述目标训练样本对应的判别结果与所述目标训练样本的样本标签之间的差距、所述正参考样本对应的判别结果与所述正参考样本的样本标签之间的差距，以及，所述负参考样本对应的判别结果与所述负参考样本的样本标签之间的差距，计算判别损失，所述判别损失用于指示用户判别模型进行判别的精准度；

根据所述特征提取损失和所述判别损失，得到所述用户判别模型的损失；

根据所述用户判别模型的损失，对所述用户判别模型进行调参。

2.根据权利要求1所述的方法，其特征在于；所述获取训练样本集，包括：

获取第一用户在所述预设时间周期内的网页浏览行为数据，所述第一用户为任一用户，所述网页浏览行为数据包括第一行为对应的行为时间数据、第二行为对应的行为时间数据和/或第三行为对应的行为时间数据，所述第一行为是指浏览所述预设类型的网页，所述第二行为是指浏览除所述预设类型以外的网页，所述第三行为是指未浏览网页；

按预设划分频率，将所述预设时间周期划分为多个时间片段；

对所述第一用户在各时间片段内的网页浏览行为数据进行编码，以得到所述第一用户对应的行为编码。

3.根据权利要求2所述的方法，其特征在于，所述对所述第一用户在各时间片段内的网页浏览行为数据进行编码，以得到所述第一用户对应的行为编码，包括：

若目标时间片段中第一用户进行目标行为的时长大于预设时间阈值，则将所述目标时间片段内的网页浏览行为数据编码为所述目标行为对应的行为编码，所述目标时间片段为所述多个时间片段中的任一时间片段，所述目标行为为所述第一行为、所述第二行为或所述第三行为。

4.根据权利要求2所述的方法，其特征在于，所述一个训练样本的样本信息还包括一个用户对应的行为时长编码，所述行为时长编码用于指示所述一个用户在所述预设时间周期内的浏览行为时长信息；

所述获取训练样本集，还包括：

根据所述第一行为对应的行为时间数据，确定所述第一行为对应的总时长；

根据所述第二行为对应的行为时间数据，确定所述第二行为对应的总时长；

根据所述第三行为对应的行为时间数据，确定所述第三行为对应的总时长；

对所述第一行为对应的总时长、所述第二行为对应的总时长以及所述第三行为对应的总时长进行编码，得到所述第一用户对应的行为时长编码。

5.一种用户判别方法，其特征在于，包括：

将所述用户行为信息输入至目标用户判别模型中，以得到所述目标用户的判别结果，所述判别结果用于指示所述目标用户是否为潜在的预设行为用户，所述目标用户判别模型为通过权利要求1-4任一项所述的用户判别模型训练方法训练得到，所述预设行为用户是指进行与预设类型的网页相关联的行为的用户。

6.一种用户判别模型训练装置，其特征在于，所述用户判别模型包括行为特征提取模块和判别模块，所述用户判别模型训练装置包括：

调参模块，用于根据所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征，以及，所述目标训练样本、所述正参考样本和所述负参考样本各自对应的判别结果，以及，所述目标训练样本、所述正参考样本和所述负参考样本各自的样本标签，对所述用户判别模型进行调参，触发第一输入模块执行所述从所述训练样本集中选取目标训练样本、所述目标训练样本的正参考样本和所述目标训练样本的负参考样本的步骤，直至所述用户判别模型收敛，将收敛后的用户判别模型确定为目标用户判别模型；

所述调参模块，具体用于：

根据所述用户判别模型的损失，对所述用户判别模型进行调参；

触发第一输入模块执行所述从所述训练样本集中选取目标训练样本、所述目标训练样本的正参考样本和所述目标训练样本的负参考样本的步骤，直至所述用户判别模型收敛，将收敛后的用户判别模型确定为目标用户判别模型。

7.一种用户判别装置，其特征在于，包括：

结果输出模块，用于将所述用户行为信息输入至目标用户判别模型中，以得到所述目标用户的判别结果，所述判别结果用于指示所述目标用户是否为潜在的预设行为用户，所述目标用户判别模型为通过权利要求1-4任一项所述的用户判别模型训练方法训练得到，所述预设行为用户是指进行与预设类型的网页相关联的行为的用户。

8.一种计算机设备，其特征在于，包括存储器以及处理器，所述处理器用于执行存储在所述存储器中的一个或多个计算机程序，所述处理器在执行所述一个或多个计算机程序时，使得所述计算机设备实现如权利要求1-5任一项所述的方法。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如权利要求1-5任一项所述的方法。