CN105760957A - 一种证券软流失客户的预测方法 - Google Patents

一种证券软流失客户的预测方法 Download PDF

Info

Publication number
CN105760957A
CN105760957A CN201610100070.3A CN201610100070A CN105760957A CN 105760957 A CN105760957 A CN 105760957A CN 201610100070 A CN201610100070 A CN 201610100070A CN 105760957 A CN105760957 A CN 105760957A
Authority
CN
China
Prior art keywords
client
assets
customer
trade
factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610100070.3A
Other languages
English (en)
Other versions
CN105760957B (zh
Inventor
俞仕新
胡甲
夏颖哲
杨杰
常凯
林雪松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guoyuan Securities Co Ltd
Original Assignee
Guoyuan Securities Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guoyuan Securities Co Ltd filed Critical Guoyuan Securities Co Ltd
Priority to CN201610100070.3A priority Critical patent/CN105760957B/zh
Publication of CN105760957A publication Critical patent/CN105760957A/zh
Application granted granted Critical
Publication of CN105760957B publication Critical patent/CN105760957B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Educational Administration (AREA)
  • Technology Law (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种证券软流失客户的预测方法,将客户属性分为只开通普通账户客户和开通了信用账户客户;对不同属性的客户,形成训练集和测试集;对只开通普通账户客户的训练集和测试集根据一定时间段内资产趋势变化特征进行分类,从分类后的只开通普通账户客户的训练集中和开通了信用账户客户的训练集中分别构造因变量因子、基本因子和总衍生因子;对只开通普通账户客户的训练集建立Lasso?Logistic模型;对开通了信用账户客户的训练集,建立Lasso?Logistic模型,只开通普通账户客户的测试集测试分析结果,开通了信用账户客户的测试集测试分析结果。从数据库中抽取分析出用户资产信息,能够快速将客户按资产变化特征分类,提高了模型预测的精确度和覆盖度。

Description

一种证券软流失客户的预测方法
技术领域
本发明涉及一种利用统计建模判断客户流失的方法,尤其涉及的是一种证券软流失客户的预测方法。
背景技术
近年来,随着证券行业发展和转型,原先的券商竞争格局被打破,投资者将有更多机会体验和评价各个券商的服务。券商的议价能力被大幅削弱,对于客户流失预测和进行有目的挽留已经成为了证券公司保证市场占有率的一个重要手段,但是目前很多公司仍沿用传统的客户流失预测模型,即以“客户销户”作为预测标准,这类的模型在目前的近年来不断变化地市场环境下逐渐失去作用,尤其随着“一码通”和“一人多户”政策的推出施行,投资者可以无成本转移账户和资产,不销户直接转走资产。因此,使用新的技术方法和模型对客户资产流失前的特征分析以及客户流失的预测在当前具有较为重要的意义。
发明内容
本发明的目的在于克服现有技术的不足,提供了一种证券软流失客户的预测方法,有效提高预测流失客户的精确度和覆盖度。
本发明是通过以下技术方案实现的,本发明包括以下步骤:
(1)提取结构化交易数据,计算考察时间点的客户属性,将客户属性分为只开通普通账户客户和开通了信用账户客户;
(2)对不同属性的客户,在模型起始时间点选取资产在一定范围以内的重点客户形成训练集,在模型终结时间点选取资产在一定范围以内的重点客户形成测试集;
(3)对只开通普通账户客户的训练集和测试集根据一定时间段内资产趋势变化特征进行分类,从分类后的只开通普通账户客户的训练集中和开通了信用账户客户的训练集中分别构造因变量因子、基本因子和总衍生因子;
(4)对只开通普通账户客户的训练集的各个类别分别建立Lasso-Logistic模型;对开通了信用账户客户的训练集,根据总体数据建立Lasso-Logistic模型,Lasso-Logistic模型方程为:其中X为自变量,Y为因变量;
(5)通过只开通普通账户客户的测试集测试分析结果,通过开通了信用账户客户的测试集测试分析结果,当测试结果满足因变量Y,提示为流失客户。
所述步骤(1)中,所述结构化交易数据包括日综合状况、客户信息、客户服务、含信用的交割明细流水、资金明细流水及委托明细流水。
所述步骤(3)中,只开通普通账户客户的分类方法如下:
(31)根据结构化交易数据计算客户考察时间点的资产,取考察时间点前不同长度的时段的客户资产均值作为资产的变化特征,按照资产的变化特征显著程度分出不同客户类型;
(32)当至少出现两次10%~20%幅度的资产下降,且两次间隔大于T1个交易日为缓降型;
当最近T2个交易日的资产下降额至少为历史交易日资产最大值的三成以上为陡降型,T2大于T1;
当至少出现三次大于40%幅度的资产变动为波动型;
其他的资产变动情况为普通型。
所述只开通普通账户客户的因变量因子构造是客户在考察时间点后T3个交易日资产不足前T4个交易日资产的一定比例;
所述基本因子构造包括普通账户平均持仓时间、普通账户换手率、普通账户日均资金余额占比、普通账户资金存取倍数、客户盈亏、双向交易天数、大盘指标、低风险产品购买;
所述总衍生因子为所述基本因子与所述基本因子的衍生因子之和;
所述基本因子的衍生因子是考察时间点前三个时间段只开通普通账户客户的基本因子的均值;
所述考察时间点前三个时间段包括前A0个交易日,前A0~A1个交易日以及前A1~A2个交易日,A2>A1>A0。
所述平均持仓时间=股票市值/股票成交金额;
所述换手率=成交金额/账户资产;
所述日均资金余额占比=账户金额/账户资产;
所述资金存取倍数=资金存取额/账户资产;
所述客户盈亏=客户盈亏;
所述双向交易天数=存在双向交易的总天数;
所述大盘指标=大盘指数*是否盈利;
所述低风险产品购买=是否购买低风险产品。
所述步骤(3)中,对于开通了信用账户客户,所述因变量因子构造为客户在考察时间点后T3个交易日资产不足前T4个交易日资产的一定比例;
所述资产为客户普通账户和信用账户的总资产;
所述基本因子构造包括信用账户平均持仓时间、信用账户换手率、信用账户日均资金余额占比、信用账户资金存取倍数、客户盈亏、双向交易天数、大盘指标、低风险产品购买;
所述总衍生因子为所述基本因子与所述基本因子的衍生因子之和;
所述基本因子的衍生因子包括考察时间点前三个时间段开通了信用账户客户的基本因子的均值;
所述考察时间点前三个时间段包括前A0个交易日,前A0~A1个交易日以及前A1~A2个交易日,A2>A1>A0。
所述步骤(4)中,只开通普通账户客户建立Lasso-Logistic模型的方法如下:
(411)利用Lasso算法构造惩罚函数,选出对模型解释能力最强的几个总衍生因子,组成自变量X;
(412)将考察时间点后A3个交易日资产不足前A4个交易日资产的B1%设为因变量Y;
(413)分别对缓降型、陡降型、波动型、普通型的样本的训练集建立Lasso-Logistic分析模型;
(414)用测试集对模型测试和计算建模指标,包括精度和覆盖度。
所述步骤(4)中,开通了信用账户客户建立Lasso-Logistic模型的方法如下:
(421)利用Lasso算法构造惩罚函数,选出对模型解释能力最强的几个所述总衍生因子,组成自变量X;
(422)将考察时间点后A3个交易日资产不足前A4个交易日资产的B2%设为因变量Y;
(423)对总体数据建立Lasso-Logistic模型;
(424)对训练集进行重抽样的方法,得到一个新的开通信用账户的客户样本,然后分别对这两个样本分别建立Lasso-Logistic模型;
(425)用测试集对模型测试和计算建模指标,所述建模指标包括精度和覆盖度。
所述重抽样指取出一定数量流失客户和一定数量非流失客户组成一个样本;
计算流失率,所述流失率=软流失客户数量/客户总数;
所述精度=预测为正确的软流失客户数量/预测为软流失的客户数量;
所述覆盖度=预测正确的软流失客户数量/真正软流失的客户数量。
所述对模型解释能力最强的几个所述衍生因子为绝对值大于Lasso算法中设定阈值的总衍生因子。
本发明相比现有技术具有以下优点:本发明从数据库中抽取分析出用户资产信息,能够快速将客户按资产变化特征分类,然后建立Lasso-Logistic模型,克服了传统预测模型和方法自变量解释能力不强、模型过时、不符合市场环境的问题,提高了模型预测的精确度和覆盖度。
附图说明
图1是本发明的流程示意图。
具体实施方式
下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图1所示,本实施例包括以下步骤:
(1)提取结构化交易数据,计算考察时间点(建模时间点/测试时间点)的客户属性,将客户属性分为只开通普通账户客户和开通了信用账户客户;开通信用账户的基础是必须要在有普通账户的基础上达到一定资产条件才可以开通信用账户,在计算开通了信用账户客户的资产的时候需要将该类客户的普通账户和信用账户的资产总和相加;
(2)对不同属性的客户,在模型起始时间点选取资产在一定范围以内的重点客户形成训练集,在模型终结时间点选取资产在一定范围以内的重点客户形成测试集;
(3)对普通账户客户的训练集和测试集根据一定时间段内资产趋势变化特征进行分类,从分类后的普通账户客户的训练集中和信用账户客户的训练集中分别构造因变量因子、基本因子和总衍生因子;
(4)对只开通普通账户客户的训练集的各个类别分别建立Lasso-Logistic模型;对开通了信用账户客户的训练集,根据总体数据建立Lasso-Logistic模型,Lasso-Logistic模型方程为:其中X为自变量,Y为因变量;β是Lasso-Logistic模型的参数,通常用统计学上的极大似然法(Maximum Likelihood Method)估计得出。其中极大似然法的主要思想是:当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大;
(5)通过只开通普通账户客户的测试集测试分析结果,通过开通了信用账户客户的测试集测试分析结果,当测试结果满足因变量Y,提示为流失客户。
本实施例的建模语言为R和Python。
本实施例的客户资产计算:只开通普通账户的客户为只开通普通账户客户,其资产为普通账户总资产,开通双融账户的客户为开通了信用账户客户,其资产为普通账户和信用账户的总资产,最终选取的是总资产大于三万的重点客户。
在模型起始时间点选取资产在三万以上的重点客户形成样本训练集合;在模型终结时间点选取资产在三万以上的重点客户形成样本测试集合,最终目的是筛选出有一定挽留潜力的客户。
结构化交易数据包括日综合状况表、客户信息表、客户服务表、交割明细流水表(含信用)、资金明细流水表及委托明细流水表。
例如:建模时间点为2014年8月29日,在建模时间点选取资产大于三万的重点客户形成样本训练集;测试时间点为2015年2月28日,在建模时间点选取资产大于三万的重点客户形成样本测试集;只开通普通账户客户的客户类型为缓降型、陡降型、波动型和普通型。
步骤(3)中,根据一定时间段内资产趋势变化特征将客户分类的方法,包括以下步骤:
(31)根据结构化交易数据计算客户考察时间点的资产,取考察时间点前不同长度的时段的客户资产均值作为资产的变化特征,按照资产的变化特征显著程度分出不同客户类型;
(32)当至少出现两次10%~20%幅度的资产下降,且两次间隔大于7个交易日为缓降型;
当最近15个交易日的资产下降额至少为历史交易日资产最大值的三成以上为陡降型;
当至少出现三次大于40%幅度的资产变动为波动型;
其他的资产变动情况为普通型。
本实施例中流失客户中占比三成的缓降型和波动型的客户将更容易预测,而陡降型和普通型的预测的难易程度将较高。
对于只开通普通账户的客户的所述因变量因子构造是客户在考察时间点后60个交易日资产不足前240个交易日资产的50%;
基本因子构造包括普通账户平均持仓时间、普通账户换手率、普通账户日均资金余额占比、普通账户资金存取倍数、客户盈亏、双向交易天数、大盘指标、低风险产品购买;
总衍生因子由所述基本因子与所述基本因子的衍生因子相结合来构成;所述基本因子的衍生因子是考察时间点前三个时间段只开通普通账户客户的所述基本因子的均值;
考察时间点前三个时间段包括前20个交易日,前20~60个交易日以及前60~120个交易日。
八个基本因子为:
平均持仓时间=股票市值/股票成交金额;
换手率=成交金额/账户资产;
日均资金余额占比=账户金额/账户资产;
资金存取倍数=资金存取额/账户资产;
客户盈亏=客户盈亏;
双向交易天数=存在双向交易的总天数;
大盘指标=大盘指数*是否盈利;
低风险产品购买=是否购买低风险产品。
本实施例中通过基本因子、账户种类和时间段相结合的方法,可以在任意时间点构造多个总衍生因子,其中八个基本因子的解释如下:
本实施例中将上述八个基本因子与三个时间段相结合,则共有8*3=24个衍生因子,同时将原来8个基本因子也作为衍生因子,一共得到32个总衍生因子作为备选自变量。
对于只开通普通账户的只开通普通账户客户建立Lasso-Logistic模型方法如下:
(411)利用Lasso算法构造惩罚函数,选出对模型解释能力最强的几个总衍生因子,组成自变量X;
(412)将考察时间点后60个交易日资产不足前240个交易日资产的50%设为因变量Y;
(413)分别对缓降型、陡降型、波动型、普通型的样本的训练集建立Lasso-Logistic分析模型;
(414)用测试集对模型测试和计算建模指标,包括精度和覆盖度。
本实施例中Lasso的算法是通过R语言中的Lars工具包实现,从32个总衍生因子中筛选出解释能力最强的因子,然后建立Logistic模型。具体模型中给出了Lasso-Logistic模型选出的变量及其解释,和考察变量系数,正的系数反应了这个变量对客户“软流失”有正的影响,反之,负的系数反映了这个变量对客户“软流失”有负的影响;系数的绝对值大小决定了这个变量对客户“软流失”的影响程度。当系数的绝对值超过设定阈值时,则将其选入自变量X。
本实施例中对于只开通普通账户的客户,缓降型、陡降型和波动型的预测精度很高,可以达到50%左右。对于总量为二十万的总客户量,若重点关注只开通普通账户的这三种类型客户,能够预测出七千位左右将出现“软流失”的客户。
对于开通信用账户的开通了信用账户客户,其因变量因子构造为客户在考察时间点后60个交易日资产不足前240个交易日资产的25%;
资产为客户普通账户和信用账户的总资产;
基本因子构造包括信用账户平均持仓时间、信用账户换手率、信用账户日均资金余额占比、信用账户资金存取倍数、客户盈亏、双向交易天数、大盘指标、低风险产品购买;
总衍生因子由所述基本因子与所述基本因子的衍生因子相结合来构成;
基本因子的衍生因子包括考察时间点
前三个时间段开通了信用账户客户的所述基本因子的均值;
考察时间点可以为任意时间点。
对于开通了信用账户客户建立Lasso-Logistic模型方法如下:
(421)利用Lasso算法构造惩罚函数,选出对模型解释能力最强的几个所述总衍生因子,组成自变量X;对模型解释能力最强的几个所述总衍生因子为绝对值大于Lasso算法中设定阈值的总衍生因子;
(422)将考察时间点后60个交易日资产不足前240个交易日资产的25%设为因变量Y;
(423)对总体数据建立Lasso-Logistic模型;
(424)对训练集进行重抽样的方法,得到一个新的开通信用账户的客户样本,然后分别对这两个样本分别建立Lasso-Logistic模型;
(425)用测试集对模型测试和计算建模指标,所述建模指标包括精度和覆盖度。
重抽样指取出一定数量流失客户和一定数量非流失客户组成一个样本;
流失率=软流失客户数量/客户总数;
精度=预测为正确的软流失客户数量/预测为软流失的客户数量;
覆盖度=预测正确的软流失客户数量/真正软流失的客户数量。
流失率是样本的基本属性,比如用于建模的测试样本集合,假设这个集合总共有10000人,到最后样本中软流失的客户为30个,那么集合流失率就是0.3%。
本实施例中,通过上述建模方法,开通了信用账户客户流失预测模型的精度为25%。选取50%的流失客户和50%非流失客户组成重抽样样本再次进行建模,重抽样后的总体精度有60%;对预测出的流失客户按流失的可能性大小按降序进行排序,取出预测为流失的客户中的可能性最大的前30%和前10%客户,能够做到对开通了信用账户客户建模分别达到80%和90%左右的预测精度。
本实施例包括只开只开通普通账户客户和开通了信用账户客户的潜在客户软流失率为3%,而对于四个普通账户类别缓降型、陡降型、波动型和普通型的预测精度分别达到了50%、53%、46%和18%,开通了信用账户客户软流失预测精度为24%。本实施例样本总体客户软流失预测精度达到22%,远远超过同行业的相关流失率预测精度(大约为9%)。重抽样流失率为50%的总体预测精度达到87%,同行业其他券商的重抽样预测精度仅为60%。因此,本发明的建模结果具有一定优势,尤其是没有重抽样的情况下缓降型、陡降型、波动型预测精度仍能够达到50%左右。
本发明的Lasso压缩变量法基本思想是在回归系数的绝对值之和小于一个常数的约束条件下,使残差平方和最小化,从而能够产生某些严格等于0的回归系数,达到精简模型的目的并得到解释能力较强的模型。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种证券软流失客户的预测方法,其特征在于,包括以下步骤:
(1)提取结构化交易数据,计算考察时间点的客户属性,将客户属性分为只开通普通账户客户和开通了信用账户客户;
(2)对不同属性的客户,在模型起始时间点选取资产在一定范围以内的重点客户形成训练集,在模型终结时间点选取资产在一定范围以内的重点客户形成测试集;
(3)对只开通普通账户客户的训练集和测试集根据一定时间段内资产趋势变化特征进行分类,从分类后的只开通普通账户客户的训练集中和开通了信用账户客户的训练集中分别构造因变量因子、基本因子和总衍生因子;
(4)对只开通普通账户客户的训练集的各个类别分别建立Lasso-Logistic模型;对开通了信用账户客户的训练集,根据总体数据建立Lasso-Logistic模型,Lasso-Logistic模型方程为:其中X为自变量,Y为因变量;
(5)通过只开通普通账户客户的测试集测试分析结果,通过开通了信用账户客户的测试集测试分析结果,当测试结果满足因变量Y,提示为流失客户。
2.根据权利要求1所述的一种证券软流失客户的预测方法,其特征在于,所述步骤(1)中,所述结构化交易数据包括日综合状况、客户信息、客户服务、含信用的交割明细流水、资金明细流水及委托明细流水。
3.根据权利要求1所述的一种证券软流失客户的预测方法,其特征在于,所述步骤(3)中,只开通普通账户客户的分类方法如下:
(31)根据结构化交易数据计算客户考察时间点的资产,取考察时间点前不同长度的时段的客户资产均值作为资产的变化特征,按照资产的变化特征显著程度分出不同客户类型;
(32)当至少出现两次10%~20%幅度的资产下降,且两次间隔大于T1个交易日为缓降型;
当最近T2个交易日的资产下降额至少为历史交易日资产最大值的三成以上为陡降型;
当至少出现三次大于40%幅度的资产变动为波动型;
其他的资产变动情况为普通型。
4.根据权利要求3所述的一种证券软流失客户的预测方法,其特征在于,所述步骤(3)中,所述只开通普通账户客户的因变量因子构造是客户在考察时间点后T3个交易日资产不足前T4个交易日资产的一定比例;
所述基本因子构造包括普通账户平均持仓时间、普通账户换手率、普通账户日均资金余额占比、普通账户资金存取倍数、客户盈亏、双向交易天数、大盘指标、低风险产品购买;
所述总衍生因子为所述基本因子与所述基本因子的衍生因子之和;
所述基本因子的衍生因子是考察时间点前三个时间段只开通普通账户客户的基本因子的均值;
所述考察时间点前三个时间段包括前A0个交易日,前A0~A1个交易日以及前A1~A2个交易日,A2>A1>A0。
5.根据权利要求4所述的一种证券软流失客户的预测方法,其特征在于,所述平均持仓时间=股票市值/股票成交金额;
所述换手率=成交金额/账户资产;
所述日均资金余额占比=账户金额/账户资产;
所述资金存取倍数=资金存取额/账户资产;
所述客户盈亏=客户盈亏;
所述双向交易天数=存在双向交易的总天数;
所述大盘指标=大盘指数*是否盈利;
所述低风险产品购买=是否购买低风险产品。
6.根据权利要求1所述的一种证券软流失客户的预测方法,其特征在于,所述步骤(3)中,对于开通了信用账户客户,所述因变量因子构造为客户在考察时间点后T3个交易日资产不足前T4个交易日资产的一定比例;
所述资产为客户普通账户和信用账户的总资产;
所述基本因子构造包括信用账户平均持仓时间、信用账户换手率、信用账户日均资金余额占比、信用账户资金存取倍数、客户盈亏、双向交易天数、大盘指标、低风险产品购买;
所述总衍生因子为所述基本因子与所述基本因子的衍生因子之和;
所述基本因子的衍生因子包括考察时间点前三个时间段开通了信用账户客户的基本因子的均值;
所述考察时间点前三个时间段包括前A0个交易日,前A0~A1个交易日以及前A1~A2个交易日,A2>A1>A0。
7.根据权利要求4所述的一种证券软流失客户的预测方法,其特征在于,所述步骤(4)中,只开通普通账户客户建立Lasso-Logistic模型的方法如下:
(411)利用Lasso算法构造惩罚函数,选出对模型解释能力最强的几个总衍生因子,组成自变量X;
(412)将考察时间点后A3个交易日资产不足前A4个交易日资产的B1%设为因变量Y;
(413)分别对缓降型、陡降型、波动型、普通型的样本的训练集建立Lasso-Logistic分析模型;
(414)用测试集对模型测试和计算建模指标,包括精度和覆盖度。
8.根据权利要求6所述的一种证券软流失客户的预测方法,其特征在于,所述步骤(4)中,开通了信用账户客户建立Lasso-Logistic模型的方法如下:
(421)利用Lasso算法构造惩罚函数,选出对模型解释能力最强的几个所述总衍生因子,组成自变量X;
(422)将考察时间点后A3个交易日资产不足前A4个交易日资产的B2%设为因变量Y;
(423)对总体数据建立Lasso-Logistic模型;
(424)对训练集进行重抽样的方法,得到一个新的开通信用账户的客户样本,然后分别对这两个样本分别建立Lasso-Logistic模型;
(425)用测试集对模型测试和计算建模指标,所述建模指标包括精度和覆盖度。
9.根据权利要求8所述的一种证券软流失客户的预测方法,其特征在于,所述重抽样指取出一定数量流失客户和一定数量非流失客户组成一个样本;
计算流失率,所述流失率=软流失客户数量/客户总数;
所述精度=预测为正确的软流失客户数量/预测为软流失的客户数量;
所述覆盖度=预测正确的软流失客户数量/真正软流失的客户数量。
10.根据权利要求8所述的一种证券软流失客户的预测方法,其特征在于,所述对模型解释能力最强的几个所述总衍生因子为绝对值大于Lasso算法中设定阈值的总衍生因子。
CN201610100070.3A 2016-02-23 2016-02-23 一种证券软流失客户的预测方法 Expired - Fee Related CN105760957B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610100070.3A CN105760957B (zh) 2016-02-23 2016-02-23 一种证券软流失客户的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610100070.3A CN105760957B (zh) 2016-02-23 2016-02-23 一种证券软流失客户的预测方法

Publications (2)

Publication Number Publication Date
CN105760957A true CN105760957A (zh) 2016-07-13
CN105760957B CN105760957B (zh) 2017-05-31

Family

ID=56331093

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610100070.3A Expired - Fee Related CN105760957B (zh) 2016-02-23 2016-02-23 一种证券软流失客户的预测方法

Country Status (1)

Country Link
CN (1) CN105760957B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107507084A (zh) * 2017-07-19 2017-12-22 深圳前海微众银行股份有限公司 金融资产展示方法、设备及计算机可读存储介质
CN107622326A (zh) * 2017-09-13 2018-01-23 阿里巴巴集团控股有限公司 用户分类、可用资源预测方法、装置及设备
CN107679946A (zh) * 2017-09-28 2018-02-09 平安科技(深圳)有限公司 基金产品推荐方法、装置、终端设备及存储介质
CN108242024A (zh) * 2017-05-05 2018-07-03 平安科技(深圳)有限公司 同业资产监控***及方法
CN108830645A (zh) * 2018-05-31 2018-11-16 厦门快商通信息技术有限公司 一种访客流失预测方法及***
CN109583966A (zh) * 2018-12-07 2019-04-05 平安银行股份有限公司 一种高价值客户识别方法、***、设备及存储介质
CN109583950A (zh) * 2018-11-26 2019-04-05 万菊仙 一种两融账户客户的挖掘平台
CN109636443A (zh) * 2018-11-17 2019-04-16 南京中数媒介研究有限公司 客户流失预测的深度学习方法及装置
CN110348914A (zh) * 2019-07-19 2019-10-18 中国银行股份有限公司 客户流失数据分析方法及装置
CN110837931A (zh) * 2019-11-08 2020-02-25 中国农业银行股份有限公司 客户流失预测方法、装置及存储介质
CN113379527A (zh) * 2020-03-09 2021-09-10 银联数据服务有限公司 一种***易睡眠客户的确定方法及装置
TWI758676B (zh) * 2020-01-03 2022-03-21 華南商業銀行股份有限公司 金融交易量警示系統
CN117408742A (zh) * 2023-12-15 2024-01-16 湖南三湘银行股份有限公司 用户筛分方法及***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050097028A1 (en) * 2003-05-22 2005-05-05 Larry Watanabe Method and system for predicting attrition customers
CN104809188A (zh) * 2015-04-20 2015-07-29 广东工业大学 一种企业人才流失的数据挖掘分析方法及装置
CN105005909A (zh) * 2015-06-17 2015-10-28 深圳市腾讯计算机***有限公司 预测流失用户的方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050097028A1 (en) * 2003-05-22 2005-05-05 Larry Watanabe Method and system for predicting attrition customers
CN104809188A (zh) * 2015-04-20 2015-07-29 广东工业大学 一种企业人才流失的数据挖掘分析方法及装置
CN105005909A (zh) * 2015-06-17 2015-10-28 深圳市腾讯计算机***有限公司 预测流失用户的方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘斌等: "《证券公司客户综合分析***的设计与实现》", 《计算机***应用》 *
陈东: "《数据仓库及数据挖掘技术在证券客户关系管理***中的应用研究》", 《数字技术与应用》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108242024A (zh) * 2017-05-05 2018-07-03 平安科技(深圳)有限公司 同业资产监控***及方法
WO2018202175A1 (zh) * 2017-05-05 2018-11-08 平安科技(深圳)有限公司 同业资产监控***及方法
CN107507084A (zh) * 2017-07-19 2017-12-22 深圳前海微众银行股份有限公司 金融资产展示方法、设备及计算机可读存储介质
CN107622326A (zh) * 2017-09-13 2018-01-23 阿里巴巴集团控股有限公司 用户分类、可用资源预测方法、装置及设备
CN107679946A (zh) * 2017-09-28 2018-02-09 平安科技(深圳)有限公司 基金产品推荐方法、装置、终端设备及存储介质
CN107679946B (zh) * 2017-09-28 2021-09-10 平安科技(深圳)有限公司 基金产品推荐方法、装置、终端设备及存储介质
CN108830645A (zh) * 2018-05-31 2018-11-16 厦门快商通信息技术有限公司 一种访客流失预测方法及***
CN109636443A (zh) * 2018-11-17 2019-04-16 南京中数媒介研究有限公司 客户流失预测的深度学习方法及装置
CN109583950A (zh) * 2018-11-26 2019-04-05 万菊仙 一种两融账户客户的挖掘平台
CN109583950B (zh) * 2018-11-26 2023-10-17 万菊仙 一种两融账户客户的挖掘平台
CN109583966B (zh) * 2018-12-07 2021-01-22 平安银行股份有限公司 一种高价值客户识别方法、***、设备及存储介质
CN109583966A (zh) * 2018-12-07 2019-04-05 平安银行股份有限公司 一种高价值客户识别方法、***、设备及存储介质
CN110348914A (zh) * 2019-07-19 2019-10-18 中国银行股份有限公司 客户流失数据分析方法及装置
CN110837931A (zh) * 2019-11-08 2020-02-25 中国农业银行股份有限公司 客户流失预测方法、装置及存储介质
TWI758676B (zh) * 2020-01-03 2022-03-21 華南商業銀行股份有限公司 金融交易量警示系統
CN113379527A (zh) * 2020-03-09 2021-09-10 银联数据服务有限公司 一种***易睡眠客户的确定方法及装置
CN117408742A (zh) * 2023-12-15 2024-01-16 湖南三湘银行股份有限公司 用户筛分方法及***
CN117408742B (zh) * 2023-12-15 2024-04-02 湖南三湘银行股份有限公司 用户筛分方法及***

Also Published As

Publication number Publication date
CN105760957B (zh) 2017-05-31

Similar Documents

Publication Publication Date Title
CN105760957B (zh) 一种证券软流失客户的预测方法
Al-Yahyaee et al. Volatility forecasting, downside risk, and diversification benefits of Bitcoin and oil and international commodity markets: A comparative analysis with yellow metal
Ukaegbu The significance of working capital management in determining firm profitability: Evidence from developing economies in Africa
TW552524B (en) Methods and systems for automated inferred valuation of credit scoring
Chen Classifying credit ratings for Asian banks using integrating feature selection and the CPDA-based rough sets approach
JP2003526146A (ja) 評価値を求めてリスクを低減する方法とシステム
JP2003535387A (ja) 金融商品等の資産ポートフォリオの高速評価
CZ20013132A3 (cs) Ohodnocovací předpovědní modely v situacích s chybějícími vstupy
CN105761112B (zh) 一种证券融资融券和资管目标客户的挖掘方法
JP2003529138A (ja) 収益と現在価値を最適化するための方法とシステム
JP2003529139A (ja) 最適なアンダーライトを行うためのポートフォリオの効率的サンプリング方法とシステム
JP2004500646A (ja) 競争入札の収益のシミュレーション方法とシステム
JP2004500642A (ja) キャッシュフローのリカバリとリスクを評価する方法とシステム
JP2003526147A (ja) 自動的にポートフォリオ記述統計値を求める相互相関ツール
Khalifa et al. Volatility transmission across currencies and commodities with US uncertainty measures
Sayed et al. Determinants of financial inclusion in Egypt
Cao et al. Bond rating using support vector machine
Gunay Impact of public information arrivals on cryptocurrency market: A case of twitter posts on ripple
Shin Extrapolation and complexity
Hu Predicting and improving invoice-to-cash collection through machine learning
Tilakaratne et al. Predicting stock market index trading signals using neural networks
Hatamlou et al. Forecasting gold price using data mining techniques by considering new factors
Shah Developing financial distress prediction models using cutting edge recursive partitioning techniques: a study of Australian mining performance
Ullah et al. Predicting Default Payment of Credit Card Users: Applying Data Mining Techniques
Lee et al. Industry co-movements of American depository receipts: Evidences from the copula approaches

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170531

CF01 Termination of patent right due to non-payment of annual fee