WO2020024444A1

WO2020024444A1 - 人群绩效等级识别方法、装置、存储介质及计算机设备

Info

Publication number: WO2020024444A1
Application number: PCT/CN2018/111118
Authority: WO
Inventors: 金戈; 徐亮; 肖京
Original assignee: 平安科技（深圳）有限公司
Priority date: 2018-08-01
Filing date: 2018-10-21
Publication date: 2020-02-06
Also published as: CN109308564A

Abstract

一种人群绩效等级识别方法、装置、存储介质及计算机设备，涉及人工智能技术领域，主要目的在于能够在保证识别精确度的前提下，提升占比较低的目标人群召回率。所述方法包括：将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别，得到所述用户归属于特定叶子节点的信息熵（101）；若所述用户归属于特定叶子节点的信息熵大于或者等于预设阈值，则将所述用户对应的人群绩效特征输入到预设逻辑回归模型进行计算，得到所述用户归属于目标人群绩效等级的概率值（102）；根据所述用户归属于目标人群绩效等级的概率值和所述特定叶子节点的概率界限值，确定所述用户的人群绩效等级（103）。

Description

人群绩效等级识别方法、装置、存储介质及计算机设备

本申请要求与2018年8月1日提交中国专利局、申请号为2018108652995、申请名称为“人群绩效等级识别方法、装置、存储介质及计算机设备”的中国专利申请的优先权，其全部内容通过引用结合在申请中。

技术领域

本申请涉及人工智能技术领域，尤其是涉及一种人群绩效等级识别方法、装置、存储介质及计算机设备。

背景技术

近年来，很多行业开始重视人群绩效，尤其是开始重视识别人群绩效等级，通过识别出目标人群并对目标人群进行奖励，能够大大促进企业整体效益的提升。

目前，在识别人群绩效等级时，通常仅通过决策树模型识别人群绩效等级，即将决策树模型对用户识别得到的人群绩效等级，确定为用户的人群绩效等级。然而，由于人群数据量庞大且各个人群绩效等级的人群数据分布不平衡，决策树模型可能无法取得理想拟合效果，通常占比较低的人群通常为目标人群。例如，高绩效等级的人群数据通常会远小于普通绩效等级的人群数据，一般高绩效等级的人群占比通常为20％，普通绩效等级的人群占比通常为80％，高绩效等级的人群通常为目标人群。若仅通过决策树模型识别人群绩效等级，会发生决策树模型识别错误的情况，造成识别出来的占比较低的目标人群的数量较少，从而造成占比较低的目标人群召回率较低。

发明内容

本申请提供了一种人群绩效等级识别方法、装置、存储介质及计算机设备，主要在于能够减少信息熵大于或者等于预设阈值的叶子节点识别错误的情况，且能够在保证识别精确度的前提下，提升占比较低的目标人群召回率。

根据本申请的第一个方面，提供一种人群绩效等级识别方法，包括：

将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别，得到所述用户归属于特定叶子节点的信息熵；

若所述用户归属于特定叶子节点的信息熵大于或者等于预设阈值，则将所述用户对应的人群绩效特征输入到预设逻辑回归模型进行计算，得到所述用户归属于目标人群绩效等级的概率值；

根据所述用户归属于目标人群绩效等级的概率值和所述特定叶子节点的概率界限值，确定所述用户的人群绩效等级。

根据本申请的第二个方面，提供一种人群绩效等级识别装置，包括：

识别单元，用于将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别，得到所述用户归属于特定叶子节点的信息熵；

计算单元，用于若所述用户归属于特定叶子节点的信息熵大于或者等于预设阈值，则将所述用户对应的人群绩效特征输入到预设逻辑回归模型进行计算，得到所述用户归属于目标人群绩效等级的概率值；

确定单元，用于根据所述用户归属于目标人群绩效等级的概率值和所述特定叶子节点的概率界限值，确定所述用户的人群绩效等级。

根据本申请的第三个方面，提供一种非易失性可读存储介质，其上存储有计算机可读指令，该计算机可读指令被处理器执行时实现以下步骤：

根据本申请的第四个方面，提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现以下步骤：

本申请提供的一种人群绩效等级识别方法、装置、存储介质及计算机设备，与目前通常仅通过决策树模型识别人群绩效等级相比，本申请能够将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别，得到所述用户归属于特定叶子节点的信息熵。与此同时，在所述用户归属于特定叶子节点的信息熵大于或者等于预设阈值时，能够将所述用户对应的人群绩效特征输入到预设逻辑回归模型进行计算，得到所述用户归属于目标人群绩效等级的概率值；且能够根据所述用户归属于目标人群绩效等级的概率值与所述特定叶子节点的概率界限值，确定所述用户的人群绩效等级，从而能够实现结合预设决策树模型和预设逻辑回归模型识别人群绩效等级，即在预设决策树模型得到特定叶子节点的信息熵大于或者等于预设阈值时，能够通过所述预设逻辑回归模型计算的所述用户归属于目标人群绩效等级的概率值和所述特定叶子节点的概率界限值对用户进行进一步识别，进而能够减少信息熵大于或者等于预设阈值的叶子节点识别错误的情况，且能够在保证识别精确度的前提下，提升占比较低的目标人群召回率。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1示出了本申请实施例提供的一种人群绩效等级识别方法流程图；

图2示出了本申请实施例提供的另一种人群绩效等级识别方法流程图；

图3示出了本申请实施例提供的一种人群绩效等级识别装置的结构示意图；

图4示出了本申请实施例提供的另一种人群绩效等级识别装置的结构示意图；

图5示出了本申请实施例提供的一种计算机设备的实体结构示意图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本申请。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

如背景技术，目前，在识别人群绩效等级时，通常仅通过决策树模型识别人群绩效等级，即将决策树模型对用户识别得到的人群绩效等级，确定为用户的人群绩效等级。然而，由于人群数据量庞大且各个人群绩效等级的人群数据分布不平衡，决策树模型可能无法取得理想拟合效果，通常占比较低的人群通常为目标人群。若仅通过决策树模型识别人群绩效等级，会发生决策树模型识别错误的情况，造成识别出来的占比较低的目标人群的数量较少，从而造成占比较低的目标人群召回率较低。

为了解决上述问题，本申请实施例提供了一种人群绩效等级识别方法，如图1所示，所述方法包括：

101、将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别，得到所述用户归属于特定叶子节点的信息熵。

其中，所述人群绩效特征可以包括但不限于：月均学习课程数、工作地址经纬度、单月内互联网交易产品数。所述人群绩效等级可以包括：高绩效等级和普遍绩效等级。所述预设决策树模型可以为根据样本人群绩效特征和样本人群绩效等级建立的，所述预设决策树模型可以保存有人群绩效特征和人群绩效等级之间的对应规则。所述用户归属于的特定叶子节点可以为所述用户被预设决策树模型分类后的叶子节点，具体地可以为根据输入的人群绩效特征分类得到的，即每个人群绩效特征都可以作为识别所述用户类别的节点。在人群绩效特征输入到预设决策树模型后，预设决策树模型会根据人群绩效特征对所述用户进行分类，最终得到所述用户归属于特定叶子节点。

例如，月均学习课程数为50、工作地址经纬度为(123.435，41.819)、单月内互联网交易产品数为10，所述预设决策树模型会先根据月均学习课程数50对用户进行分类，然后根据工作地址经纬度(123.435，41.819)对用户进行分类；根据单月内互联网交易产品数10对用户进行分类，最后得到所述用户被分类的叶子节点1，因此，叶子节点1即为所述用户归属于的特定叶子节点。

需要说明的是，信息熵可以用于表示分类的不确定性，信息熵越大，则说明被分类的不确定性越大，越可能存在分类错误的情况。本申请实施例中，可以通过如下公式计算信息熵：

其中，D表示样本人群绩效特征和样本人群绩效等级组合的样本集合，c表示样本人群绩效等级的类别数，p _i表示样本用户被分类到样本人群绩效等级i类别的概率或者比例。

102、若所述用户归属于特定叶子节点的信息熵大于或者等于预设阈值，则将所述用户对应的人群绩效特征输入到预设逻辑回归模型进行计算，得到所述用户归属于目标人群绩效等级的概率值。

其中，所述预设阈值可以根据用户需求进行设置的，如所述预设阈值可以为0.88、0.89等。若所述用户归属于特定叶子节点的信息熵大于或者等于预设阈值，则说明预设决策树模型的特定叶子节点可能分类错误，通过将所述用户对应的人群绩效特征输入到预设逻辑回归模型进行计算，能够实现对所述用户进行二次分类识别。所述目标人群绩效等级可以为所述预设决策树模型中占比较低的人群绩效等级，具体地，在本申请实施例中所述目标人群绩效等级可以为高绩效等级。因此，通过所述预设逻辑回归模型可以输出所述用户归属于高绩效等级的概率值。

103、根据所述用户归属于目标人群绩效等级的概率值和所述特定叶子节点的概率界限值，确定所述用户的人群绩效等级。

其中，所述特定叶子节点的概率界限值可以为对所述特定叶子节点下的各个样本用户归属于目标人群绩效等级的概率值进行排序得到的，所述各个样本用户归属于目标人群绩效等级的概率值也可以为通过所述预设逻辑回归模型计算得到的。所述特定叶子节点的概率界限值可以用于评价所述用户归属于目标人群绩效等级的可能性大小。

在本申请实施例中，若所述用户归属于目标人群绩效等级的概率值小于所述特定叶子节点的概率界限值，则说明所述用户归属于目标人群绩效等级的可能性小，因此可以采用所述预设决策树模型的特定叶子节点分类结果，识别所述用户的人群绩效等级。若所述用户归属于目标人群绩效等级的概率值大于或者等于所述特定叶子节点的概率界限值，则说明所述用户归属于目标人群绩效等级的可能性大，因此可以将目标人群绩效等级确定为所述用户的人群绩效等级，以避免由于目标人群绩效等级占比较低，而造成占比较低的目标人群召回率较低的问题。

本申请实施例提供的一种人群绩效等级识别方法，与目前通常仅通过决策树模型识别人群绩效等级相比，本申请实施例能够将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别，得到所述用户归属于特定叶子节点的信息熵。与此同时，在所述用户归属于特定叶子节点的信息熵大于或者等于预设阈值时，能够将所述用户对应的人群绩效特征输入到预设逻辑回归模型进行计算，得到所述用户归属于目标人群绩效等级的概率值；且能够根据所述用户归属于目标人群绩效等级的概率值与所述特定叶子节点的概率界限值，确定所述用户的人群绩效等级，从而能够实现结合预设决策树模型和预设逻辑回归模型识别人群绩效等级，即在预设决策树模型得到特定叶子节点的信息熵大于或者等于预设阈值时，能够通过所述预设逻辑回归模型计算的所述用户归属于目标人群绩效等级的概率值和所述特定叶子节点的概率界限值对用户进行进一步识别，进而能够减少信息熵大于或者等于预设阈值的叶子节点识别错误的情况，且能够在保证识别精确度的前提下，提升占比较低的目标人群召回率。

进一步的，为了更好的说明上述人群绩效等级识别的过程，作为对上述实施例的细化和扩展，本申请实施例提供了另一种人群绩效等级识别方法，如图2所示，所述方法包括：

201、将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别，得到所述用户归属于特定叶子节点的信息熵。

对于本申请实施例，为了建立所述预设决策树模型，所述步骤201之前所述方法还可以包括：获取多个样本用户对应的样本人群绩效特征和样本人群绩效等级；根据所述样本人群绩效特征和所述样本人群绩效等级，建立所述预设决策树模型。具体地，可以通过决策树算法对所述样本人群绩效特征和所述样本人群绩效等级进行训练，得到所述预设决策树模型。所述预设决策树模型保存有人群绩效特征和人群绩效等级之间的对应规则。决策树算法可以是一种逼近离散函数值的方法。它是一种典型的分类方法，首先对数据进行处理，利用归纳算法生成可读的规则和决策树，然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。

此外，为了建立所述预设决策树模型，所述方法还可以包括：从所述预设决策树模型中选取样本用户归属的信息熵大于或者等于预设阈值的各个叶子节点，并选取所述各个叶子节点下的各个样本用户；根据所述各个样本用户对应的样本人群绩效特征和样本人群绩效等级，建立所述预设逻辑回归模型。具体地，可以通过逻辑回归算法对所述各个样本用户对应的样本人群绩效特征和样本人群绩效等级进行训练，得到所述预设逻辑回归模型。通过所述预设逻辑回归模型可以输出所述用户归属于目标人群绩效等级的概率值。逻辑回归算法又称为逻辑回归分析算法，是分类和预测算法中的一种。可以通过历史数据的表现对未来结果发生的概率进行预测。在本申请实施例中，逻辑回归算法对所述各个样本用户对应的样本人群绩效特征和样本人群绩效等级进行训练时，可以将样本人群绩效特征作为自变量，把样本人群绩效等级作为因变量训练所述预设逻辑回归模型。

需要说明的是，本申请实施例还支持根据所述预设逻辑回归模型，确定所述各个叶子节点的概率界限值的功能，包括：获取所述预设逻辑回归模型计算的所述各个样本用户归属于目标人群绩效等级的概率值；对所述各个样本用户归属于目标人群绩效等级的概率值进行排序；根据概率值排序结果，确定所述各个叶子节点的概率界限值。

具体地，可以按照概率值的高低顺序，对所述各个样本用户归属于目标人群绩效等级的概率值进行排序，并确定所述各个样本用户中对应样本人群绩效等级为目标人群绩效等级的样本用户的用户数量；然后将概率值排序位置与所述用户数量相等的概率值，确定为所述各个叶子节点的概率界限值。此外，本申请实施例还可以根据用户的实际需求调整叶子节点的概率界限值，如可以将任何排序位置上的概率值，确定为叶子节点的概率界限值。

例如，信息熵高于0.88的叶子节点1下有100个样本用户，其中，有60个样本用户对应的样本人群绩效等级为普通绩效等级，40个样本用户对应的样本人群绩效等级为高绩效等级，通过所述预设逻辑回归模型可以计算出这100个样本用户归属于高绩效等级的概率值，在得到这100个样本用户归属于高绩效等级的概率值后，可以对得到的100个概率值进行排序，然后将排序位置为40的概率值确定为叶子节点1的概率界限值。此外，还可以根据用户需求选取排序位置为35的概率值确定为叶子节点1的概率界限值。其他信息熵高于0.88的叶子节点的概率界限值也可以为采用类似方式进行确定，本申请实施例在此不进行重复举例。

进一步地，为了获取待识别用户对应的人群绩效特征，在步骤201之前，所述方法还可以包括：获取待识别用户对应的人群绩效数据；从所述人群绩效数据中提取出所述用户对应的人群绩效特征。其中，所述人群绩效数据可以为人工上传的，也可以为从企业的绩效管控***采集的。在本申请实施例中，可以通过特征关键字匹配的方式从人群绩效数据中提取出所述用户对应的人群绩效特征。具体地，可以将人群绩效特征关键字与所述人群绩效数据进行匹配，实现从所述人群绩效数据中提取出所述用户对应的人群绩效特征。

例如，若人群绩效特征关键字为“月均学习课程”，则可以从所述人群绩效数据中提取出所述用户对应的月均学习课程数，具体可以为80；若人群绩效特征关键字为“工作地址经纬度”，则可以从从所述人群绩效数据中提取出所述用户对应的工作地址经纬度，具体可以为(123.436，41.819)。若人群绩效特征关键字为“单月内互联网交易产品”，则可以从所述人群绩效数据中提取出所述用户对应的单月内互联网交易产品数，具体可以为20。

202、检测所述用户归属于特定叶子节点的信息熵是否大于或者等于预设阈值。若是，则执行步骤203；若否，则执行步骤206。

其中，所述预设阈值可以根据用户需求进行设置的，如所述预设阈值可以为0.88、0.89等。需要说明的是，由于数据分布不平衡的问题，所述预设决策树模型的叶子节点分类可能存在错误，例如，有1000个样本用户，以及其对应的样本人群绩效特征和样本人群绩效等级，其中包括80％的普通绩效等级的样本用户，包括20％的高绩效等级的样本用户，通过所述预设决策树模型可能只能将其中80％的样本用户正确分类，因此，本申请实施例通过叶子节点的信息熵，可以确定叶子节点是否存在分类错误的可能。

具体地，在对单个用户进行分类识别时，通过检测所述用户归属于特定叶子节点的信息熵是否大于或者等于预设阈值，能够检测特定叶子节点是否存在将所述用户分类错误的可能。若所述用户归属于特定叶子节点的信息熵大于或者等于预设阈值，则说明所述特定叶子节点可能将所述用户分类错误，因此可以执行步骤203以对所用户进行进一步识别，进而避免目标人群绩在训练集中占比较低而造成的低召回率的问题。若所述用户归属于特定叶子节点的信息熵小于预设阈值，则说明所述特定叶子节点的分类结果正确，因此可以执行步骤206，以所述特定叶子节点对应的人群绩效等级确定所述用户的人群绩效等级。

203、将所述用户对应的人群绩效特征输入到预设逻辑回归模型进行计算，得到所述用户归属于目标人群绩效等级的概率值。

204、检测所述用户归属于目标人群绩效等级的概率值是否大于或者等于所述特定叶子节点的概率界限值。若是，则执行步骤205；若否，则执行步骤206。

其中，所述特定叶子节点的概率界限值的确定方式可以参考步骤201下的相应描述和解释，在此不进行赘述。

205、将所述目标人群绩效等级确定为所述用户的人群绩效等级。

例如，若预设决策树模型确定所述用户归属于的特定叶子节点为叶子节点1，且所述用户归属于叶子节点1的信息熵为0.90，所述用户归属于叶子节点1的信息熵大于预设阈值0.88，则说明所述预设决策树模型对所述用户的分类可能不正确，此时可以通过预设逻辑回归模型计算所述用户归属于高绩效等级的概率值。若计算所述用户归属于高绩效等级的概率值为0.85，且通过所述预设逻辑回归模型确定叶子节点1的概率界限值为0.81，所述用户归属于高绩效等级的概率值大于叶子节点1的概率界限值，则说明所述用户属于高绩效人群的可能性较大，此时可以将高绩效等级确定为所述用户的人群绩效等级，即确定所述用户为高绩效人群。

206、将所述特定叶子节点对应的人群绩效等级确定为所述用户的人群绩效等级。

例如，若预设决策树模型确定所述用户归属于的特定叶子节点为叶子节点1，且所述用户归属于叶子节点1的信息熵为0.5，所述用户归属于叶子节点1的信息熵小于预设阈值0.88，则说明所述叶子节点1对所述用户的分类正确，可以将叶子节点1对应的普通绩效等级确定为所述用户的人群绩效等级，此时，确定所述用户为普通绩效人群。或者可以将叶子节点1对应的高绩效等级确定为所述用户的人群绩效等级，此时，确定所述用户为高绩效人群。

又例如，若预设决策树模型确定所述用户归属于的特定叶子节点为叶子节点1，且所述用户归属于叶子节点1的信息熵为0.92，所述用户归属于叶子节点1的信息熵大于预设阈值0.88，则说明所述预设决策树模型对所述用户的分类可能不正确，此时通过预设逻辑回归模型计算所述用户归属于高绩效等级的概率值。若计算所述用户归属于高绩效等级的概率值为0.34，且通过所述预设逻辑回归模型确定叶子节点1的概率界限值为0.81，所述用户归属于高绩效等级的概率值小于叶子节点1的概率界限值，则所述用户属于高绩效人群的可能性较小，此时可以将叶子节点1对应的普通绩效等级确定为所述用户的人群绩效等级，此时，确定所述用户为普通绩效人群。或者可以将叶子节点1对应的高绩效等级确定为所述用户的人群绩效等级，此时，确定所述用户为高绩效人群。

对于本申请实施例，从步骤205-206所涉及的举例可知，通过结合预设决策树模型和预设逻辑回归模型识别人群绩效等级，能够减少信息熵大于或者等于预设阈值的叶子节点识别错误的情况且能够识别出更多的占比较低的目标人群。

本申请实施例提供的另一种人群绩效等级识别方法，与目前通常仅通过决策树模型识别人群绩效等级相比，本申请实施例能够将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别，得到所述用户归属于特定叶子节点的信息熵。与此同时，在所述用户归属于特定叶子节点的信息熵大于或者等于预设阈值时，能够将所述用户对应的人群绩效特征输入到预设逻辑回归模型进行计算，得到所述用户归属于目标人群绩效等级的概率值；且能够根据所述用户归属于目标人群绩效等级的概率值与所述特定叶子节点的概率界限值，确定所述用户的人群绩效等级，从而能够实现结合预设决策树模型和预设逻辑回归模型识别人群绩效等级，即在预设决策树模型得到特定叶子节点的信息熵大于或者等于预设阈值时，能够通过所述预设逻辑回归模型计算的所述用户归属于目标人群绩效等级的概率值和所述特定叶子节点的概率界限值对用户进行进一步识别，进而能够减少信息熵大于或者等于预设阈值的叶子节点识别错误的情况，且能够在保证识别精确度的前提下，提升占比较低的目标人群召回率。

进一步地，作为图1的具体实现，本申请实施例提供了一种人群绩效等级识别装置，如图3所示，所述装置包括：识别单元31、计算单元32和确定单元33。

所述识别单元31，可以用于将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别，得到所述用户归属于特定叶子节点的信息熵。所述识别单元31是本装置中将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别，得到所述用户归属于特定叶子节点的信息熵的主要功能模块。

所述计算单元32，可以用于若所述用户归属于特定叶子节点的信息熵大于或者等于预设阈值，则将所述用户对应的人群绩效特征输入到预设逻辑回归模型进行计算，得到所述用户归属于目标人群绩效等级的概率值；所述计算单元32是本装置中在所述用户归属于特定叶子节点的信息熵大于或者等于预设阈值时，将所述用户对应的人群绩效特征输入到预设逻辑回归模型进行计算，得到所述用户归属于目标人群绩效等级的概率值的主要功能模块，也是核心模块。

所述确定单元33，可以用于根据所述用户归属于目标人群绩效等级的概率值和所述特定叶子节点的概率界限值，确定所述用户的人群绩效等级。所述确定单元33是本装置中根据所述用户归属于目标人群绩效等级的概率值和所述特定叶子节点的概率界限值，确定所述用户的人群绩效等级的主要功能模块，也是核心模块。

对于本申请实施例，为了建立所述预设决策树模型和所述预设逻辑回归模型，所述装置还包括：获取单元34、建立单元35和选取单元36，如图4所示。

所述获取单元34，可以用于获取多个样本用户对应的样本人群绩效特征和样本人群绩效等级。所述获取单元34是本装置中获取多个样本用户对应的样本人群绩效特征和样本人群绩效等级的主要功能模块。

所述建立单元35，可以用于根据所述样本人群绩效特征和所述样本人群绩效等级，建立所述预设决策树模型。所述建立单元35是本装置中根据所述样本人群绩效特征和所述样本人群绩效等级，建立所述预设决策树模型的主要功能模块。

所述选取单元36，可以用于从所述预设决策树模型中选取样本用户归属的信息熵大于或者等于预设阈值的各个叶子节点，并选取所述各个叶子节点下的各个样本用户。所述选取单元36是本装置中从所述预设决策树模型中选取样本用户归属的信息熵大于或者等于预设阈值的各个叶子节点，并选取所述各个叶子节点下的各个样本用户的主要功能模块。

所述建立单元35，可以用于根据所述各个样本用户对应的样本人群绩效特征和样本人群绩效等级，建立所述预设逻辑回归模型。所述建立单元35是本装置中根据所述各个样本用户对应的样本人群绩效特征和样本人群绩效等级，建立所述预设逻辑回归模型的主要功能模块。

所述确定单元33，还可以用于根据所述预设逻辑回归模型，确定所述各个叶子节点的概率界限值。对于本申请实施例，所述确定单元33可以包括：获取模块、排序模块和确定模块。

所述获取模块，可以用于获取所述预设逻辑回归模型计算的所述各个样本用户归属于目标人群绩效等级的概率值。所述排序模块，可以用于对所述各个样本用户归属于目标人群绩效等级的概率值进行排序。所述确定模块，可以用于根据概率值排序结果，确定所述各个叶子节点的概率界限值。所述排序模块，具体可以用于按照概率值的高低顺序，对所述各个样本用户归属于目标人群绩效等级的概率值进行排序；所述确定模块，具体可以用于确定所述各个样本用户中对应样本人群绩效等级为目标人群绩效等级的样本用户的用户数量；将概率值排序位置与所述用户数量相等的概率值，确定为所述各个叶子节点的概率界限值。

对于本申请实施例，为了最终确定所述用户的人群绩效等级，所述确定单元33，具体可以用于若所述用户归属于目标人群绩效等级的概率值大于或者等于所述特定叶子节点的概率界限值，则将所述目标人群绩效等级确定为所述用户的人群绩效等级；若所述用户归属于目标人群绩效等级的概率值小于所述特定叶子节点的概率界限值，则将所述特定叶子节点对应的人群绩效等级确定为所述用户的人群绩效等级。

此外，所述确定单元33，具体还可以用于若所述用户归属于特定叶子节点的信息熵小于预设阈值，则将所述特定叶子节点对应的人群绩效等级确定为所述用户的人群绩效等级。对于本申请实施例，为了获取待识别用户对应的人群绩效特征，所述装置还可以包括：提取单元37。

所述获取单元34，还可以用于获取待识别用户对应的人群绩效数据。所述获取单元34还是本装置中获取待识别用户对应的人群绩效数据的主要功能模块。

所述提取单元37，可以用于从所述人群绩效数据中提取出所述用户对应的人群绩效特征。所述提取单元37是本装置中从所述人群绩效数据中提取出所述用户对应的人群绩效特征的主要功能模块。

需要说明的是，本申请实施例提供的一种人群绩效等级识别装置所涉及各功能模块的其他相应描述，可以参考图1所示方法的对应描述，在此不再赘述。

基于上述如图1所示方法，相应的，本申请实施例还提供了一种存储介质，具体可以为计算机非易失性可读存储介质，其上存储有计算机可读指令，该计算机可读指令被处理器执行时实现以下步骤：将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别，得到所述用户归属于特定叶子节点的信息熵；若所述用户归属于特定叶子节点的信息熵大于或者等于预设阈值，则将所述用户对应的人群绩效特征输入到预设逻辑回归模型进行计算，得到所述用户归属于目标人群绩效等级的概率值；根据所述用户归属于目标人群绩效等级的概率值和所述特定叶子节点的概率界限值，确定所述用户的人群绩效等级。

基于上述如图1所示方法和如图3所示人群绩效等级识别装置的实施例，本申请实施例还提供了一种计算机设备的实体结构图，如图5所示，该计算机设备包括：处理器41、存储器42、及存储在存储器42上并可在处理器上运行的计算机可读指令，其中存储器42 和处理器41均设置在总线43上所述处理器61执行所述计算机可读指令时实现以下步骤：将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别，得到所述用户归属于特定叶子节点的信息熵；若所述用户归属于特定叶子节点的信息熵大于或者等于预设阈值，则将所述用户对应的人群绩效特征输入到预设逻辑回归模型进行计算，得到所述用户归属于目标人群绩效等级的概率值；根据所述用户归属于目标人群绩效等级的概率值和所述特定叶子节点的概率界限值，确定所述用户的人群绩效等级。该计算机设备还包括：总线43，被配置为耦接处理器41及存储器42。

通过本申请的技术方案，能够将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别，得到所述用户归属于特定叶子节点的信息熵。与此同时，在所述用户归属于特定叶子节点的信息熵大于或者等于预设阈值时，能够将所述用户对应的人群绩效特征输入到预设逻辑回归模型进行计算，得到所述用户归属于目标人群绩效等级的概率值；且能够根据所述用户归属于目标人群绩效等级的概率值与所述特定叶子节点的概率界限值，确定所述用户的人群绩效等级，从而能够实现结合预设决策树模型和预设逻辑回归模型识别人群绩效等级，即在预设决策树模型得到特定叶子节点的信息熵大于或者等于预设阈值时，能够通过所述预设逻辑回归模型计算的所述用户归属于目标人群绩效等级的概率值和所述特定叶子节点的概率界限值对用户进行进一步识别，进而能够减少信息熵大于或者等于预设阈值的叶子节点识别错误的情况，且能够在保证识别精确度的前提下，提升占比较低的目标人群召回率。

显然，本领域的技术人员应该明白，上述的本申请的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的计算机可读指令代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本申请不限制于任何特定的硬件和软件结合。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包括在本申请的保护范围之内。

Claims

一种人群绩效等级识别方法，其特征在于，包括：

将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别，得到所述用户归属于特定叶子节点的信息熵；

若所述用户归属于特定叶子节点的信息熵大于或者等于预设阈值，则将所述用户对应的人群绩效特征输入到预设逻辑回归模型进行计算，得到所述用户归属于目标人群绩效等级的概率值；

根据所述用户归属于目标人群绩效等级的概率值和所述特定叶子节点的概率界限值，确定所述用户的人群绩效等级。
根据权利要求1所述的方法，其特征在于，所述将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别之前，所述方法还包括：

获取多个样本用户对应的样本人群绩效特征和样本人群绩效等级；

根据所述样本人群绩效特征和所述样本人群绩效等级，建立所述预设决策树模型；

从所述预设决策树模型中选取样本用户归属的信息熵大于或者等于预设阈值的各个叶子节点，并选取所述各个叶子节点下的各个样本用户；

根据所述各个样本用户对应的样本人群绩效特征和样本人群绩效等级，建立所述预设逻辑回归模型，并根据所述预设逻辑回归模型，确定所述各个叶子节点的概率界限值。
根据权利要求2所述的方法，其特征在于，所述根据所述预设逻辑回归模型，确定所述各个叶子节点的概率界限值，包括：

获取所述预设逻辑回归模型计算的所述各个样本用户归属于目标人群绩效等级的概率值；

对所述各个样本用户归属于目标人群绩效等级的概率值进行排序；

根据概率值排序结果，确定所述各个叶子节点的概率界限值。
根据权利要求3所述的方法，其特征在于，所述对所述各个样本用户归属于目标人群绩效等级的概率值进行排序，包括：

按照概率值的高低顺序，对所述各个样本用户归属于目标人群绩效等级的概率值进行排序；

所述根据概率值排序结果，确定所述各个叶子节点的概率界限值，包括：

确定所述各个样本用户中对应样本人群绩效等级为目标人群绩效等级的样本用户的用户数量；

将概率值排序位置与所述用户数量相等的概率值，确定为所述各个叶子节点的概率界限值。
根据权利要求1所述的方法，其特征在于，所述根据所述用户归属于目标人群绩效等级的概率值与所述特定叶子节点的概率界限值，确定所述用户的人群绩效等级，包括：

若所述用户归属于目标人群绩效等级的概率值大于或者等于所述特定叶子节点的概率界限值，则将所述目标人群绩效等级确定为所述用户的人群绩效等级；

若所述用户归属于目标人群绩效等级的概率值小于所述特定叶子节点的概率界限值，则将所述特定叶子节点对应的人群绩效等级确定为所述用户的人群绩效等级。
根据权利要求1所述的方法，其特征在于，所述将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别，得到所述用户归属于特定叶子节点的信息熵之后，所述方法还包括：

若所述用户归属于特定叶子节点的信息熵小于预设阈值，则将所述特定叶子节点对应的人群绩效等级确定为所述用户的人群绩效等级。
根据权利要求1所述的方法，其特征在于，所述将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别，得到所述用户归属于特定叶子节点的信息熵之前，所述方法还包括：

获取待识别用户对应的人群绩效数据；

从所述人群绩效数据中提取出所述用户对应的人群绩效特征。
一种人群绩效等级识别装置，其特征在于，包括：

识别单元，用于将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别，得到所述用户归属于特定叶子节点的信息熵；

计算单元，用于若所述用户归属于特定叶子节点的信息熵大于或者等于预设阈值，则将所述用户对应的人群绩效特征输入到预设逻辑回归模型进行计算，得到所述用户归属于目标人群绩效等级的概率值；

确定单元，用于根据所述用户归属于目标人群绩效等级的概率值和所述特定叶子节点的概率界限值，确定所述用户的人群绩效等级。
根据权利要求8所述的装置，其特征在于，所述装置还包括：获取单元、建立单元和选取单元；

所述获取单元，用于获取多个样本用户对应的样本人群绩效特征和样本人群绩效等级；

所述建立单元，用于根据所述样本人群绩效特征和所述样本人群绩效等级，建立所述预设决策树模型；

所述选取单元，用于从所述预设决策树模型中选取样本用户归属的信息熵大于或者等于预设阈值的各个叶子节点，并选取所述各个叶子节点下的各个样本用户；

所述建立单元，还用于根据所述各个样本用户对应的样本人群绩效特征和样本人群绩效等级，建立所述预设逻辑回归模型；

所述确定单元，还用于根据所述预设逻辑回归模型，确定所述各个叶子节点的概率界限值。
根据权利要求9所述的装置，其特征在于，所述确定单元包括：

获取模块，用于获取所述预设逻辑回归模型计算的所述各个样本用户归属于目标人群绩效等级的概率值。

排序模块，用于对所述各个样本用户归属于目标人群绩效等级的概率值进行排序。

确定模块，用于根据概率值排序结果，确定所述各个叶子节点的概率界限值。
根据权利要求10所述的装置，其特征在于，所述排序模块，具体用于按照概率值的高低顺序，对所述各个样本用户归属于目标人群绩效等级的概率值进行排序；

所述确定模块，具体用于确定所述各个样本用户中对应样本人群绩效等级为目标人群绩效等级的样本用户的用户数量；将概率值排序位置与所述用户数量相等的概率值，确定为所述各个叶子节点的概率界限值。
根据权利要求8所述的装置，其特征在于，所述确定单元，具体用于若所述用户归属于目标人群绩效等级的概率值大于或者等于所述特定叶子节点的概率界限值，则将所述目标人群绩效等级确定为所述用户的人群绩效等级；若所述用户归属于目标人群绩效等级的概率值小于所述特定叶子节点的概率界限值，则将所述特定叶子节点对应的人群绩效等级确定为所述用户的人群绩效等级。
根据权利要求8所述的装置，其特征在于，所述确定单元33，具体还用于若所述用户归属于特定叶子节点的信息熵小于预设阈值，则将所述特定叶子节点对应的人群绩效等级确定为所述用户的人群绩效等级。
根据权利要求8所述的装置，其特征在于，所述装置还包括：提取单元；

所述获取单元，还用于获取待识别用户对应的人群绩效数据；

所述提取单元，用于从所述人群绩效数据中提取出所述用户对应的人群绩效特征。
一种非易失性可读存储介质，其上存储有计算机可读指令，其特征在于，所述计算机可读指令被处理器执行时实现人群绩效等级识别方法，包括：

将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别，得到所述用户归属于特定叶子节点的信息熵；若所述用户归属于特定叶子节点的信息熵大于或者等于预设阈值，则将所述用户对应的人群绩效特征输入到预设逻辑回归模型进行计算，得到所述用户归属于目标人群绩效等级的概率值；根据所述用户归属于目标人群绩效等级的概率值和所述特定叶子节点的概率界限值，确定所述用户的人群绩效等级。
根据权利要求15所述的非易失性可读存储介质，其特征在于，所述计算机可读指令被处理器执行时实现所述将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别之前，所述方法还包括：

获取多个样本用户对应的样本人群绩效特征和样本人群绩效等级；根据所述样本人群绩效特征和所述样本人群绩效等级，建立所述预设决策树模型；从所述预设决策树模型中选取样本用户归属的信息熵大于或者等于预设阈值的各个叶子节点，并选取所述各个叶子节点下的各个样本用户；根据所述各个样本用户对应的样本人群绩效特征和样本人群绩效等级，建立所述预设逻辑回归模型，并根据所述预设逻辑回归模型，确定所述各个叶子节点的概率界限值。
根据权利要求15所述的非易失性可读存储介质，其特征在于，所述计算机可读指令被处理器执行时实现所述根据所述预设逻辑回归模型，确定所述各个叶子节点的概率界限值，包括：

获取所述预设逻辑回归模型计算的所述各个样本用户归属于目标人群绩效等级的概率值；对所述各个样本用户归属于目标人群绩效等级的概率值进行排序；根据概率值排序结果，确定所述各个叶子节点的概率界限值。
一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令，其特征在于，所述计算机可读指令被处理器执行时实现人群绩效等级识别方法，包括：

将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别，得到所述用户归属于特定叶子节点的信息熵；若所述用户归属于特定叶子节点的信息熵大于或者等于预设阈值，则将所述用户对应的人群绩效特征输入到预设逻辑回归模型进行计算，得到所述用户归属于目标人群绩效等级的概率值；根据所述用户归属于目标人群绩效等级的概率值和所述特定叶子节点的概率界限值，确定所述用户的人群绩效等级。
根据权利要求18所述的计算机设备，其特征在于，所述计算机可读指令被处理器执行时实现所述将待识别用户对应的人群绩效特征输入到预设决策树模型进行识别之前，所述方法还包括：

获取多个样本用户对应的样本人群绩效特征和样本人群绩效等级；根据所述样本人群绩效特征和所述样本人群绩效等级，建立所述预设决策树模型；从所述预设决策树模型中选取样本用户归属的信息熵大于或者等于预设阈值的各个叶子节点，并选取所述各个叶子节点下的各个样本用户；根据所述各个样本用户对应的样本人群绩效特征和样本人群绩效等级，建立所述预设逻辑回归模型，并根据所述预设逻辑回归模型，确定所述各个叶子节点的概率界限值。
根据权利要求18所述的计算机设备，其特征在于，所述计算机可读指令被处理器执行时实现所述根据所述预设逻辑回归模型，确定所述各个叶子节点的概率界限值，包括：

获取所述预设逻辑回归模型计算的所述各个样本用户归属于目标人群绩效等级的概率值；对所述各个样本用户归属于目标人群绩效等级的概率值进行排序；根据概率值排序结果，确定所述各个叶子节点的概率界限值。