CN109583966A

CN109583966A - 一种高价值客户识别方法、***、设备及存储介质

Info

Publication number: CN109583966A
Application number: CN201811494415.3A
Authority: CN
Inventors: 李明; 王伟; 李双根; 黄丽诗
Original assignee: Ping An Bank Co Ltd
Current assignee: Ping An Bank Co Ltd
Priority date: 2018-12-07
Filing date: 2018-12-07
Publication date: 2019-04-05
Anticipated expiration: 2038-12-07
Also published as: CN109583966B

Abstract

本发明涉及一种高价值客户识别方法、***、设备及存储介质，通过将待识别客户信息输入至标杆群体相似人群识别模型生成与相应历史标杆群体信息是否匹配的识别结果，识别精度高，真正将客户的价值高低由定性描述转化为定量衡量，通过对高价值客户进行分类成与相应标杆群体同类的高价值潜力客户，确定其可拉伸的资产空间及可经营路径，有针对性、有方向的投放更多经营资源，提高客户的满意度，进而提升经营水平。可以精准识别高价值但低贡献的客户，提升经营效率，为高价值但低贡献的客户提供更优质服务，优化客户体验，提升贡献值，进而提升经营效果，为高净值客户提供更优质服务，降低高净值客户的流失率。

Description

一种高价值客户识别方法、***、设备及存储介质

技术领域

本发明涉及数据挖掘领域，尤其涉及一种高价值客户识别方法、***、设备及存储介质。

背景技术

高价值客户为运营企业贡献了巨大价值,同时为企业带来丰富的社会关系和强大的社会影响力,因此高价值客户已成为企业市场竞争的重点。但是至今仍没有一个有效的方法能从海量客户中准确定位和识别出高价值客户，实现将客户的价值高低由定性描述转化为定量衡量，使企业能最大限度地利用高价值客户资源，开展高价值客户行为的分析与预测，对高价值客户进行分类，确定其可拉伸的资产空间及可经营路径，有针对性、有方向的投放更多经营资源，开展个性化服务，提高客户的满意度，进而提升经营水平，这是运营企业在经营道路上一直需要探索和解决的问题。

发明内容

为了解决上述技术问题，本发明的目的在于提供一种高价值客户识别方法、***、设备及存储介质。

根据本发明的一个方面，提供了一种高价值客户识别方法，包括以下步骤：

将待识别客户信息输入至标杆群体相似人群识别模型生成与相应历史标杆群体信息是否匹配的识别结果，所述标杆群体相似人群识别模型用于表征所述待识别客户信息与所述识别结果的对应关系，

其中，

所述标杆群体相似人群识别模型通过采集贡献值超过第一预设阈值的历史高价值客户信息，形成历史高价值客户群体样本信息；

基于预设客户特征信息对历史高价值客户群体样本信息进行聚类分群，生成相应的历史聚类客群信息，采集所述历史聚类客群信息中超过第二预设阈值的历史高价值客户信息，形成历史标杆群体信息；

基于预设训练数据与测试数据的筛选条件，从历史标杆群体信息中筛选相应的历史高价值客户信息分别作为相应的训练数据信息及测试数据信息，基于历史标杆群体信息中标签与预设客户特征信息的第一预设关系以及所述的相应训练数据对初始模型训练，并经所述相应的测试数据测试及根据实际业务需求指标调整所得。

进一步的，所述预设客户特征信息包括资产、流水特征、负债情况、消费能力及偏好、投资产品特征及个人基本特征信息中的至少一项。

进一步的，历史标杆群体信息中标签与预设客户特征信息的第一预设关系为以历史标杆群体信息的标签作为因变量，以预设客户特征信息作为自变量。

进一步的，所述识别结果为待识别客户信息与相应历史标杆群体信息匹配度是否超过第四预设阈值，若是则将待识别客户信息归类于相应历史标杆群体信息，作为相应标杆群体的高价值潜力客户。

进一步的，所述的高价值客户识别方法，还包括：

基于第一预设历史周期内历史标杆群体信息中相应的资产信息与所述高价值潜力客户的可提升资产水平的第二预设关系生成所述高价值潜力客户的可提升资产水平。

进一步的，所述的高价值客户识别方法，还包括：

基于第二预设历史周期内历史标杆群体信息中相应的贡献值信息与所述高价值潜力客户的可提升贡献水平的第三预设关系生成所述高价值潜力客户的可提升贡献水平。

进一步的，所述的高价值客户识别方法，还包括：

基于第三预设历史周期内历史标杆群体信息中相应客户的产品购买偏好信息及产品购买路径信息生成所述高价值潜力客户的经营产品信息及相应的产品经营路径信息。

进一步的，基于第三预设历史周期内历史标杆群体信息中相应客户的产品购买偏好信息及产品购买路径信息生成所述高价值潜力客户的经营产品信息及相应的产品经营路径信息，包括：

基于第三预设历史周期内历史标杆群体信息中相应客户已购买产品的产品类别信息及相应的成交金额对所述客户已购买产品进行排序确定所述相应客户的产品购买偏好信息。

产品类别信息包括理财类、***、车贷、房贷、消费贷款、小微贷款、信用贷款、其他根据业务情况归类信息中的至少一项。

所述第一预设阈值、第二预设阈值、第三预设阈值及第四预设阈值均是根据实际业务情况确定。

所述的高价值客户识别方法，还包括：基于所述高价值潜力客户的可提升资产水平、可提升贡献水平、经营产品信息及相应的产品经营路径信息生成针对所述高价值潜力客户的针对客户的经营目标及经营方向信息。

根据本发明的另一个方面，提供了一种高价值客户识别***，包括：

识别单元，配置用于将待识别客户信息输入至标杆群体相似人群识别模型生成与相应历史标杆群体信息是否匹配的识别结果，所述标杆群体相似人群识别模型用于表征所述待识别客户信息与所述识别结果的对应关系，

标杆群体相似人群识别模型生成单元，配置用于通过采集贡献值超过第一预设阈值的历史高价值客户信息，形成历史高价值客户群体样本信息；

历史标杆群体信息中标签与预设客户特征信息的第一预设关系为以历史标杆群体信息的标签作为因变量，以预设客户特征信息作为自变量。

进一步的，识别单元中所述识别结果为待识别客户信息与相应历史标杆群体信息匹配度是否超过第四预设阈值，若是则驱动高价值潜力客户信息生成单元配置用于将待识别客户信息归类于相应历史标杆群体信息，作为相应标杆群体的高价值潜力客户。

所述高价值潜力客户信息生成单元还配置用于：

所述高价值潜力客户信息生成单元还配置用于：基于所述高价值潜力客户的可提升资产水平、可提升贡献水平、经营产品信息及相应的产品经营路径信息生成针对客户的经营目标及经营方向信息。

根据本发明的另一个方面，提供了一种设备，所述设备包括：

一个或多个处理器；

存储器，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器执行如上任一项所述的方法。

根据本发明的另一个方面，提供了一种存储有计算机程序的计算机可读存介质，该程序被处理器执行时实现如上任一项所述的方法。

与现有技术相比，本发明具有以下有益效果：

1、本发明示例的高价值客户识别方法，通过采集贡献值超过第一预设阈值的历史高价值客户信息，形成历史高价值客户群体样本信息；基于预设客户特征信息对历史高价值客户群体样本信息进行聚类分群，生成相应的历史聚类客群信息，采集所述历史聚类客群信息中超过第二预设阈值的历史高价值客户信息，形成历史标杆群体信息；基于预设训练数据与测试数据的筛选条件，从历史标杆群体信息中筛选相应的历史高价值客户信息分别作为相应的训练数据信息及测试数据信息，基于历史标杆群体信息中标签与预设客户特征信息的第一预设关系以及所述的相应训练数据对初始模型训练，并经所述相应的测试数据测试及根据实际业务需求指标调整生成标杆群体相似人群识别模型，由于标杆群体相似人群识别模型是根据上述历史数所得故识别针对性强、与实际客户情况息息相关，通过将待识别客户信息输入至标杆群体相似人群识别模型生成与相应历史标杆群体信息是否匹配的识别结果，识别精度高，与实际业务情况相适应，真正将客户的价值高低由定性描述转化为定量衡量，通过对高价值客户进行分类成与相应标杆群体同类的高价值潜力客户，确定其可拉伸的资产空间及可经营路径，有针对性、有方向的投放更多经营资源，提高客户的满意度，进而提升经营水平。可以精准识别高价值但低贡献的客户，提升经营效率，为高价值但低贡献的客户提供更优质服务，优化客户体验，提升贡献值，进而提升经营效果，为高净值客户提供更优质服务，降低高净值客户的流失率。

2、本发明示例的高价值客户识别***，组成简单，通过各个组成***及单元之间相互配合，生成与相应历史标杆群体信息是否匹配的识别结果，识别精度高，且与相应历史标杆群体信息相对应，真正将客户的价值高低由定性描述转化为定量衡量，便于企业后期通过分析相应历史标杆群体信息，预测相应标杆群体的高价值潜力客户的可提升资产水平、可提升贡献水平、经营产品信息及相应的产品经营路径信息生成针对客户的经营目标及经营方向信息。有针对性、有方向的投放更多经营资源，提高客户的满意度，进而提升经营水平。

3、本发明示例的设备及存储有计算机程序的计算机可读存介质，生成与相应历史标杆群体信息是否匹配的识别结果，真正将客户的价值高低由定性描述转化为定量衡量，识别精度高，便于企业后期通过分析相应历史标杆群体信息，预测相应标杆群体的高价值潜力客户的可提升资产水平、可提升贡献水平、经营产品信息及相应的产品经营路径信息生成针对客户的经营目标及经营方向信息。有利于企业有针对性、有方向的投放更多经营资源，提高客户的满意度，进而提升经营水平。

附图说明

图1为实施例一高价值客户识别方法流程图；

图2为实施例一轮廓系数与聚类数目关系图。

具体实施方式

为了更好的了解本发明的技术方案，下面结合具体实施例、说明书附图对本发明作进一步说明。

实施例一：

本实施例提供了一种高价值客户识别方法，如图1所示，包括以下步骤：

S1、采集贡献值超过第一预设阈值的历史高价值客户信息，形成历史高价值客户群体样本信息，具体可以选取过去一年贡献收入(高价值)排名在前n₁的客户，形成历史高价值客户群体样本信息，确认高价值人群，其中，根据实际业务情况确定第一预设阈值n₁取值(可以为5％-10％)；

S2、基于预设客户特征信息对历史高价值客户群体样本信息进行聚类分群，所述预设客户特征信息包括资产、流水特征、负债情况、消费能力及偏好、投资产品特征及个人基本特征信息中的至少一项，生成相应的历史聚类客群信息，采集所述历史聚类客群信息中超过第二预设阈值的历史高价值客户信息，形成历史标杆群体信息，具体过程可为：

S21、清洗人群特征：确定预设客户特征信息，即人群特征，包括资产、流水特征、负债情况、消费能力及偏好、投资产品特征及个人基本特征(学历、年龄、性别等)信息，如表1预设客户特征信息所示。

表1：预设客户特征信息

S22、对上述预设客户特征进行处理：

S221、丢弃缺失率高特征，因业务情况各异导致清洗特征可能不完全，去除缺失率大于n₃的特征，n₃建议10％-30％。

S222、对特征进行数据标准化操作。

S23、对TOP n₁客户即历史高价值客户群体样本进行聚类，得出k个历史聚类客群。以采用K-means算法为例子，利用轮廓系数方法确定聚类数目，即试探在K-means参数K(可以取值3-15)的各个取值下，计算其轮廓系数，取轮廓系数上升拐点作为聚类最后确认的客群数，如图2所示。

在确定参数K后，对历史高价值客户群体样本(高价值客群)进行聚类，得出K个历史聚类客群(高价值客群)。对于聚类的结果，应用时可利用对各聚类内个特征采用均值计算方法，描述该聚类群的特征，选取需要经营的群体。

S24、选取各(选取需要经营的)聚类群内即所述历史聚类客群过去一年贡献收入(高价值)排名在前n₂客户，形成历史标杆群体，作为该群的标杆人群，根据实际业务情况确定第二预设阈值n₂取值(可以为5％-10％)。

S3、基于预设训练数据与测试数据的筛选条件，从历史标杆群体信息中筛选相应的历史高价值客户信息分别作为相应的训练数据信息及测试数据信息，基于历史标杆群体信息中标签与预设客户特征信息的第一预设关系以及所述的相应训练数据对初始模型训练，并经所述相应的测试数据测试及根据实际业务需求指标调整生成标杆群体相似人群识别模型，历史标杆群体信息中标签与预设客户特征信息的第一预设关系为以历史标杆群体信息的标签作为因变量，以预设客户特征信息作为自变量，

具体可以以采用XGBoost算法进行模型训练学习为例，将历史标杆群体如高价值标杆客群A、高价值客群B、高价值客群C等高价值客群划分为训练数据集(占80％)和测试数据集(占20％)，基于历史标杆群体信息标签如客群标签作为因变量，预设客户特征信息即用户特征作为自变量，在优化的初始模型参数下(其中，初始模型主要参数包括学习率、树的最大深度、最小叶子节点样本权重和、节点分类所需的最小损失函数等)利用训练数据集对初始模型进行训练，确定训练结果后，利用测试数据集对模型进行验证。最后根据实际业务需求指标(召回率、精确率等)，对模型进行调整确定标杆群体相似人群识别模型；

S4、将待识别客户信息输入至标杆群体相似人群识别模型生成与相应历史标杆群体信息是否匹配的识别结果，所述识别结果为待识别客户信息与相应历史标杆群体信息匹配度是否超过第四预设阈值，若是则将待识别客户信息归类于相应历史标杆群体信息，作为相应标杆群体的高价值潜力客户，所述标杆群体相似人群识别模型用于表征所述待识别客户信息与所述识别结果的对应关系。

具体为：确定标杆群体相似人群识别模型后，对需要检测的目标对象即待识别客户应用该模型，根据实际业务可经营的客户数，取各客群预测得分前n₄的客户，即待识别客户信息与相应历史标杆群体信息匹配度是否超过第四预设阈值的客户，得出各个高价值客群的相似人群，即相应标杆群体的高价值潜力客户，其中，第四预设阈值n₄根据实际业务需求而定。

S5、基于第一预设历史周期内历史标杆群体信息中相应的资产信息与所述高价值潜力客户的可提升资产水平的第二预设关系生成所述高价值潜力客户的可提升资产水平，

具体通过历史标杆群体即各高价值标杆群内层级内第一预设历史周期如近一个资产月均中位数作为该层级内的标杆资产水平确定高相似高价值人群的可提升资产水平，即生成所述高价值潜力客户的可提升资产水平；

基于第二预设历史周期内历史标杆群体信息中相应的贡献值信息与所述高价值潜力客户的可提升贡献水平的第三预设关系生成所述高价值潜力客户的可提升贡献水平，具体通过历史标杆群体即各高价值标杆群内层级内第二预设历史周期如近一年贡献水平中位数作为该层级内的标杆贡献水平，确定高相似高价值人群的可提升贡献水平，即生成所述高价值潜力客户的可提升贡献水平；

基于第三预设历史周期内历史标杆群体信息中相应客户的产品购买偏好信息及产品购买路径信息生成所述高价值潜力客户的经营产品信息及相应的产品经营路径信息，具体包括：

基于第三预设历史周期内历史标杆群体信息中相应客户已购买产品的产品类别信息及相应的成交金额对所述客户已购买产品进行排序确定所述相应客户的产品购买偏好信息，产品类别信息包括理财类、***、车贷、房贷、消费贷款、小微贷款、信用贷款、其他根据业务情况归类信息中的至少一项，如表2所示。

表2：定义产品类别(根据业务现有产品进行归类)：

具体是通过统计历史标杆群体即各高价值标杆群内第三预设历史周期如近一年产品购买偏好以及产品购买路径，确定相似高价值人群的产品及其经营路径，即所述高价值潜力客户的经营产品信息及相应的产品经营路径信息。

具体包括：

(1)根据如上定义的产品类别，如理财产品类别，按成交金额排序计算各高价值标杆群内近一年产品的购买偏好。例如表3所示。

表3：各高价值标杆群内理财产品的购买偏好

(2)统计历史标杆群体即各高价值标杆群内第三预设历史周期如近一年产品购买路径，如表4所示。

表4：产品购买路径：

(3)通过历史标杆群体即各高价值标杆群内第三预设历史周期如近一年产品购买偏好以及产品购买路径，确定相似高价值人群的产品及其经营路径。

基于所述高价值潜力客户的可提升资产水平、可提升贡献水平、经营产品信息及相应的产品经营路径信息生成针对所述高价值潜力客户的针对客户的经营目标及经营方向信息。

通过寻找高价值样本人群，使用数据挖掘相似性学习技术识别更多高价值但低贡献人群(高潜力)，确定相似人群的经营目标和经营方向，应用于其他客户。

本实施例还提供了一种高价值客户识别***，包括：

识别单元，配置用于将待识别客户信息输入至标杆群体相似人群识别模型生成与相应历史标杆群体信息是否匹配的识别结果，所述标杆群体相似人群识别模型用于表征所述待识别客户信息与所述识别结果的对应关系；

所述预设客户特征信息包括资产、流水特征、负债情况、消费能力及偏好、投资产品特征及个人基本特征信息中的至少一项。

识别单元中所述识别结果为待识别客户信息与相应历史标杆群体信息匹配度是否超过第四预设阈值，若是则驱动高价值潜力客户信息生成单元配置用于将待识别客户信息归类于相应历史标杆群体信息，作为相应标杆群体的高价值潜力客户。

所述高价值潜力客户信息生成单元还配置用于：

基于第一预设历史周期内历史标杆群体信息中相应的资产信息与所述高价值潜力客户的可提升资产水平的第二预设关系生成所述高价值潜力客户的可提升资产水平；基于第二预设历史周期内历史标杆群体信息中相应的贡献值信息与所述高价值潜力客户的可提升贡献水平的第三预设关系生成所述高价值潜力客户的可提升贡献水平；基于第三预设历史周期内历史标杆群体信息中相应客户的产品购买偏好信息及产品购买路径信息生成所述高价值潜力客户的经营产品信息及相应的产品经营路径信息，具体是基于第三预设历史周期内历史标杆群体信息中相应客户已购买产品的产品类别信息及相应的成交金额对所述客户已购买产品进行排序确定所述相应客户的产品购买偏好信息，其中，产品类别信息包括理财类、***、车贷、房贷、消费贷款、小微贷款、信用贷款、其他根据业务情况归类信息中的至少一项；基于所述高价值潜力客户的可提升资产水平、可提升贡献水平、经营产品信息及相应的产品经营路径信息生成针对客户的经营目标及经营方向信息。

应当理解，上述高价值客户识别***记载的诸子***或单元与上述高价值客户识别方法描述的各个步骤相对应。由此，上文针对方法描述的操作和特征同样适用于上述高价值客户识别***的诸子***及其中包含的单元，在此不再赘述。

作为另一方面，本实施例还提供了适于用来实现本申请实施例的设备，设备包括计算机***，所述计算机***包括中央处理单元(CPU)，其可以根据存储在只读存储器(ROM)中的执行上述高价值客户识别方法描述的各个步骤的相应程序或者从存储部分加载到随机访问存储器(RAM)中的用于执行上述高价值客户识别方法描述的各个步骤相应的程序而执行各种适当的动作和处理。在RAM中，还存储有***操作所需的各种程序和数据。CPU、ROM以及RAM通过总线彼此相连。输入/输出(I/O)接口也连接至总线。

以下部件连接至I/O接口：包括键盘、鼠标等的输入部分；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分；包括硬盘等的存储部分；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分。通信部分经由诸如因特网的网络执行通信处理。驱动器也根据需要连接至I/O接口。可拆卸介质，诸如磁盘、光盘、磁光盘、半导体存储器等，根据需要安装在驱动器上，以便于从其上读出的计算机程序根据需要被安装入存储部分。

特别地，根据本公开的实施例，上述高价值客户识别方法描述的各个步骤描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括有形地包含在机器可读介质上的计算机程序，所述计算机程序包含用于执行上述高价值客户识别方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分从网络上被下载和安装，和/或从可拆卸介质被安装。

附图中的流程图，图示了按照本发明各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图中的每个方框可以代表一个模块、程序段、或代码的一部分，所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，流程图中的每个方框、以及流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中。这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。

作为另一方面，本实施例还提供了一种计算机可读存储介质，该计算机可读存储介质可以是上述实施例中所述***中所包含的计算机可读存储介质；也可以是单独存在，未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序，所述程序被一个或者一个以上的处理器用来执行描述于本申请的高价值客户识别方法。

实施例二：

本实施例与实施例一相同的特征不再赘述，本实施例与实施例一不同的特征在于：

具体可以选取过去半年贡献收入(高价值)排名在前n₁的客户，形成历史高价值客户群体样本信息，确认高价值人群，其中，根据实际业务情况确定第一预设阈值n₁取值(可以为5％)；

S221、丢弃缺失率高特征，因业务情况各异导致清洗特征可能不完全，去除缺失率大于n₃的特征，n₃可以为10％。

S23、对TOP n₁客户即历史高价值客户群体样本进行聚类，得出k个历史聚类客群。以采用K-means算法为例子，利用轮廓系数方法确定聚类数目，即试探在K-means参数K(可以取值3)的各个取值下，计算其轮廓系数，取轮廓系数上升拐点作为聚类最后确认的客群数。

S24、选取各(选取需要经营的)聚类群内即所述历史聚类客群过去半年贡献收入(高价值)排名在前n₂客户，形成历史标杆群体，作为该群的标杆人群，根据实际业务情况确定第二预设阈值n₂取值(可以为5％)。

具体可以以采用XGBoost算法进行模型训练学习为例，将历史标杆群体如高价值标杆客群A、高价值客群B、高价值客群C等高价值客群划分为训练数据集(占75％)和测试数据集(占25％)，基于历史标杆群体信息标签如客群标签作为因变量，预设客户特征信息即用户特征作为自变量，在优化的初始模型参数下(其中，初始模型主要参数包括学习率、树的最大深度、最小叶子节点样本权重和、节点分类所需的最小损失函数等)利用训练数据集对初始模型进行训练，确定训练结果后，利用测试数据集对模型进行验证。最后根据实际业务需求指标(召回率、精确率等)，对模型进行调整确定标杆群体相似人群识别模型；

通过历史标杆群体即各高价值标杆群内层级内第一预设历史周期如近一个资产月均中位数作为该层级内的标杆资产水平确定高相似高价值人群的可提升资产水平，即生成所述高价值潜力客户的可提升资产水平；

通过历史标杆群体即各高价值标杆群内层级内第二预设历史周期如近半年贡献水平中位数作为该层级内的标杆贡献水平，确定高相似高价值人群的可提升贡献水平，即生成所述高价值潜力客户的可提升贡献水平；

通过统计历史标杆群体即各高价值标杆群内第三预设历史周期如近半年产品购买偏好以及产品购买路径，确定相似高价值人群的产品及其经营路径，即所述高价值潜力客户的经营产品信息及相应的产品经营路径信息。

具体包括：

(1)根据如上定义的产品类别，如理财产品类别，按成交金额排序计算各高价值标杆群内近半年产品的购买偏好。

(2)统计历史标杆群体即各高价值标杆群内第三预设历史周期如近半年产品购买路径。

(3)通过历史标杆群体即各高价值标杆群内第三预设历史周期如近半年产品购买偏好以及产品购买路径，确定相似高价值人群的产品及其经营路径。

实施例三：

具体可以选取过去一年贡献收入(高价值)排名在前n₁的客户，形成历史高价值客户群体样本信息，确认高价值人群，其中，根据实际业务情况确定第一预设阈值n₁取值(可以为10％)；

S221、丢弃缺失率高特征，因业务情况各异导致清洗特征可能不完全，去除缺失率大于n₃的特征，n₃可以为30％。

S23、对TOP n₁客户即历史高价值客户群体样本进行聚类，得出k个历史聚类客群。以采用K-means算法为例子，利用轮廓系数方法确定聚类数目，即试探在K-means参数K(可以取值15)的各个取值下，计算其轮廓系数，取轮廓系数上升拐点作为聚类最后确认的客群数。

S24、选取各(选取需要经营的)聚类群内即所述历史聚类客群过去一年贡献收入(高价值)排名在前n₂客户，形成历史标杆群体，作为该群的标杆人群，根据实际业务情况确定第二预设阈值n₂取值(可以为10％)。

具体可以以采用XGBoost算法进行模型训练学习为例，将历史标杆群体如高价值标杆客群A、高价值客群B、高价值客群C等高价值客群划分为训练数据集(占85％)和测试数据集(占15％)，基于历史标杆群体信息标签如客群标签作为因变量，预设客户特征信息即用户特征作为自变量，在优化的初始模型参数下(其中，初始模型主要参数包括学习率、树的最大深度、最小叶子节点样本权重和、节点分类所需的最小损失函数等)利用训练数据集对初始模型进行训练，确定训练结果后，利用测试数据集对模型进行验证。最后根据实际业务需求指标(召回率、精确率等)，对模型进行调整确定标杆群体相似人群识别模型；

通过历史标杆群体即各高价值标杆群内层级内第二预设历史周期如近一年贡献水平中位数作为该层级内的标杆贡献水平，确定高相似高价值人群的可提升贡献水平，即生成所述高价值潜力客户的可提升贡献水平；

通过统计历史标杆群体即各高价值标杆群内第三预设历史周期如近一年产品购买偏好以及产品购买路径，确定相似高价值人群的产品及其经营路径，即所述高价值潜力客户的经营产品信息及相应的产品经营路径信息。

具体包括：

(1)根据如上定义的产品类别，如理财产品类别，按成交金额排序计算各高价值标杆群内近一年产品的购买偏好。

(2)统计历史标杆群体即各高价值标杆群内第三预设历史周期如近一年产品购买路径。

实施例四：

具体可以选取过去半年贡献收入(高价值)排名在前n₁的客户，形成历史高价值客户群体样本信息，确认高价值人群，其中，根据实际业务情况确定第一预设阈值n₁取值(可以为7％)；

S221、丢弃缺失率高特征，因业务情况各异导致清洗特征可能不完全，去除缺失率大于n₃的特征，n₃可以为20％。

S23、对TOP n₁客户即历史高价值客户群体样本进行聚类，得出k个历史聚类客群。以采用K-means算法为例子，利用轮廓系数方法确定聚类数目，即试探在K-means参数K(可以取值10)的各个取值下，计算其轮廓系数，取轮廓系数上升拐点作为聚类最后确认的客群数。

S24、选取各(选取需要经营的)聚类群内即所述历史聚类客群过去半年贡献收入(高价值)排名在前n₂客户，形成历史标杆群体，作为该群的标杆人群，根据实际业务情况确定第二预设阈值n₂取值(可以为8％)。

具体包括：

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离所述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能。

Claims

1.一种高价值客户识别方法，其特征是，包括以下步骤：

其中，

2.根据权利要求1所述的高价值客户识别方法，其特征是，历史标杆群体信息中标签与预设客户特征信息的第一预设关系为以历史标杆群体信息的标签作为因变量，以预设客户特征信息作为自变量。

3.根据权利要求1所述的高价值客户识别方法，其特征是，所述识别结果为待识别客户信息与相应历史标杆群体信息匹配度是否超过第四预设阈值，若是则将待识别客户信息归类于相应历史标杆群体信息，作为相应标杆群体的高价值潜力客户。

4.根据权利要求3所述的高价值客户识别方法，其特征是，还包括：

5.根据权利要求4所述的高价值客户识别方法，其特征是，还包括：

6.根据权利要求5所述的高价值客户识别方法，其特征是，还包括：

7.根据权利要求6所述的高价值客户识别方法，其特征是，还包括：

8.一种高价值客户识别***，其特征是，包括：

9.一种设备，其特征是，所述设备包括：

一个或多个处理器；

存储器，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器执行如权利要求1-7中任一项所述的方法。

10.一种存储有计算机程序的计算机可读存储介质，其特征是，该程序被处理器执行时实现如权利要求1-7中任一项所述的方法。