CN106408325A - 基于用户支付信息的用户消费行为预测分析方法及*** - Google Patents

基于用户支付信息的用户消费行为预测分析方法及*** Download PDF

Info

Publication number
CN106408325A
CN106408325A CN201610754174.6A CN201610754174A CN106408325A CN 106408325 A CN106408325 A CN 106408325A CN 201610754174 A CN201610754174 A CN 201610754174A CN 106408325 A CN106408325 A CN 106408325A
Authority
CN
China
Prior art keywords
feature
user
loss
variable
subsystem
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610754174.6A
Other languages
English (en)
Inventor
丘越崑
吴赟
张永鑫
颜小刚
邓东汉
段云欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHENZHEN AIBEI INFORMATION TECHNOLOGY Co Ltd
Original Assignee
SHENZHEN AIBEI INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHENZHEN AIBEI INFORMATION TECHNOLOGY Co Ltd filed Critical SHENZHEN AIBEI INFORMATION TECHNOLOGY Co Ltd
Priority to CN201610754174.6A priority Critical patent/CN106408325A/zh
Publication of CN106408325A publication Critical patent/CN106408325A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于互联网支付技术领域,提供了一种基于用户支付信息的用户消费行为预测分析方法及***,该***包括数据获取子***、数据汇总子***、标准特征形成子***、预测模型确定子***和实际测试子***。数据获取子***用于获取用户的交易数据、行为数据和客服反馈数据。数据汇总子***用于形成特征和该特征对应的特征变量。预测模型确定子***确定符合稳定性标准的用户流失预测模型。实际测试子***用于采用稳定性符合标准的用户流失预测模型,处理标准特征对应的特征变量,获得用户消费行为预测结果。本发明基于用户支付信息的用户消费行为预测分析方法及***,能够最大限度的挖掘与应用最底层互联网支付信息,有效预测用户消费行为。

Description

基于用户支付信息的用户消费行为预测分析方法及***
技术领域
本发明涉及互联网支付技术领域,具体涉及一种基于用户支付信息的用户消费行为预测分析方法及***。
背景技术
目前,数字娱乐、电子商务迅速兴起,网络支付技术也快速发展。网络支付过程中会产生大量的用户支付信息,其拥有来自支付用户最基础和直接的支付数据。
同时,各个商家或商户也需要获取用户的需求,甚至展开问卷调查,以抓取用户需求,调整运营策略。部分商家会结合交易数据,分析用户需求或流失率,但是分析结果准确度差。
如何最大限度的挖掘与应用支付数据,有效预测用户消费行为,是本领域技术人员亟需解决的问题。
发明内容
针对现有技术中的缺陷,本发明提供一种基于用户支付信息的用户消费行为预测分析方法及***,能够最大限度的挖掘与应用支付数据,有效预测用户消费行为。
第一方面,本发明提供一种基于用户支付信息的用户消费行为预测分析方法,该方法包括:
数据获取步骤:获取用户的交易数据、行为数据和客服反馈数据;
数据汇总步骤:汇总交易数据、行为数据和客服反馈数据,形成特征和该特征对应的特征变量;
标准特征形成步骤:根据特征对应的业务知识,剔除特征对应的异常特征变量;根据特征变量,构造并筛选复合变量;采用套索算法筛选特征中符合线性要求的特征,形成标准特征;
预测模型确定步骤:根据设定比例将预获取的样本集划分为训练集和测试集;采用用户流失预测模型,对训练集进行预测,获得预测结果;根据预测结果与训练集的实际流失标签,获得训练质量指标;采用用户流失预测模型,处理测试集,获得测试质量指标;根据训练质量指标和测试质量指标,确定符合稳定性标准的用户流失预测模型;
实际测试步骤:根据标准特征,获取待测试用户的标准特征对应的特征变量;采用稳定性符合标准的用户流失预测模型,处理标准特征对应的特征变量,获得用户消费行为预测结果。
进一步地,根据特征变量,构造并筛选复合变量,具体包括:
根据特征变量,构造特征变量的平方复合变量和/或交叉复合变量,
根据特征变量和复合变量的业务意义,筛选符合业务需求的复合变量。
基于上述任意用户支付信息的用户消费行为预测分析方法实施例,进一步地,在构造并筛选复合变量之后,采用套索算法筛选特征中符合线性要求的特征之前,该方法还包括:根据特征的方差膨胀因子检测结果和/或特征的业务意义,判断特征是否符合线性要求。
进一步地,根据特征的方差膨胀因子检测结果,判断特征是否符合线性要求,具体包括:
若特征的方差膨胀因子检测结果小于线性阈值,则判断特征符合线性要求;若特征的方差膨胀因子检测结果大于等于线性阈值,则判断特征不符合线性要求,线性阈值为预先设定的。
基于上述任意用户支付信息的用户消费行为预测分析方法实施例,进一步地,采用稳定性符合标准的用户流失预测模型,处理标准特征对应的特征变量,获得用户消费行为预测结果,具体包括:
采用稳定性符合标准的用户一周流失模型,处理标准特征对应的特征变量,获得流失概率;
若流失概率大于等于流失阈值,则判定该用户为将流失用户;
若流失概率小于流失阈值,则判定该用户为不流失用户;
稳定性符合标准的用户流失预测模型包括稳定性符合标准的用户一周流失模型,用户消费行为预测结果包括将流失用户和不流失用户。
第二方面,本发明提供一种基于用户支付信息的用户消费行为预测分析***,该***包括数据获取子***、数据汇总子***、标准特征形成子***、预测模型确定子***和实际测试子***。数据获取子***用于获取用户的交易数据、行为数据和客服反馈数据;数据汇总子***用于汇总交易数据、行为数据和客服反馈数据,形成特征和该特征对应的特征变量;标准特征形成子***用于根据特征对应的业务知识,剔除特征对应的异常特征变量,还用于根据特征变量,构造并筛选复合变量,以及用于采用套索算法筛选特征中符合线性要求的特征,形成标准特征;预测模型确定子***用于根据设定比例将预获取的样本集划分为训练集和测试集,采用用户流失预测模型,对训练集进行预测,获得预测结果,根据预测结果与训练集的实际流失标签,获得训练质量指标,采用用户流失预测模型,处理测试集,获得测试质量指标,以及用于根据训练质量指标和测试质量指标,确定符合稳定性标准的用户流失预测模型;实际测试子***用于根据标准特征,获取待测试用户的标准特征对应的特征变量,还用于采用稳定性符合标准的用户流失预测模型,处理标准特征对应的特征变量,获得用户消费行为预测结果。
进一步地,标准特征形成子***在根据特征变量,构造并筛选复合变量,具体用于:根据特征变量,构造特征变量的平方复合变量和/或交叉复合变量,根据特征变量和复合变量的业务意义,筛选符合业务需求的复合变量。
基于上述任意用户支付信息的用户消费行为预测分析***实施例,进一步地,该***还包括共线性判断子***,用于根据特征的方差膨胀因子检测结果和/或特征的业务意义,判断特征是否符合线性要求。
进一步地,共线性判断子***在根据特征的方差膨胀因子检测结果,判断特征是否符合线性要求时,具体用于:若特征的方差膨胀因子检测结果小于线性阈值,则判断特征符合线性要求,若特征的方差膨胀因子检测结果大于等于线性阈值,则判断特征不符合线性要求,线性阈值为预先设定的。
基于上述任意用户支付信息的用户消费行为预测分析***实施例,进一步地,实际测试子***具体用于:采用稳定性符合标准的用户一周流失模型,处理标准特征对应的特征变量,获得流失概率,若流失概率大于等于流失阈值,则判定该用户为将流失用户,若流失概率小于流失阈值,则判定该用户为不流失用户,稳定性符合标准的用户流失预测模型包括稳定性符合标准的用户一周流失模型,用户消费行为预测结果包括将流失用户和不流失用户。
由上述技术方案可知,本发明基于用户支付信息的用户消费行为预测分析方法及***,能够结合传统的交易数据、用户的行为数据和客服反馈数据等最底层数据,对用户的行为进行全方位的刻画,能够反映用户最真实状况。
同时,本发明基于用户支付信息的用户消费行为预测分析方法及***能够确定出符合线性要求的标准特征,以及符合稳定性标准的用户流失预测模型,采用该用户流失预测模型处理标特征对应的特征变量,能够对用户流失等行为进行精准预测,以支撑商户的运营和精准营销等。
因此,本实施例基于用户支付信息的用户消费行为预测分析方法及***,能够最大限度的挖掘与应用最底层互联网支付信息,有效预测用户消费行为,为商户进行精准营销提供准确的信息支持。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1示出了本发明所提供的一种基于用户支付信息的用户消费行为预测分析方法流程图;
图2示出了本发明所提供的一种基于用户支付信息的用户消费行为预测分析***的结构示意图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只是作为示例,而不能以此来限制本发明的保护范围。
需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
第一方面,本发明实施例提供一种基于用户支付信息的用户消费行为预测分析方法,结合图1,该方法包括:
数据获取步骤S1:获取用户的交易数据、行为数据和客服反馈数据;
在实际应用过程中,该方法可以通过客户端采集用户在收银台内部的行为数据、应用信息或其他信息,或通过基础平台获取交易数据。其中,行为数据主要是展示用户的操作,如进入游戏初始化,调起收银台,显示收银台,调起支付方式,各种支付方式的点击、调用和返回,收银台点击充值,各种支付方式充值、支付和返回,修改支付密码,登陆,注册等等;应用信息主要是当前应用信息,渠道信息,支付接口版本,应用版本,应用包名,终端***版本,终端当前已安装的所有应用信息;每当用户点开收银台或者进行支付时都可以采集到用户的支付数据,包含但不限于购买商品,支付金额,支付时间,支付方式;每当商户接入爱贝的支付接口,他们的商户信息和应用信息也是分析的要素。另外,爱贝为用户配备了7*24小时的客服,从客服那里可以收集用户的投诉信息,退款信息等等。
数据汇总步骤S2:汇总交易数据、行为数据和客服反馈数据,形成特征和该特征对应的特征变量;
其中,该步骤可以利用大数据技术结合数据仓库框架对采集的数据进行处理和汇总,具体利用hadoop和hive为平台,对数据进行处理,先加载所有数据到数据仓库的数据源层,然后结合商户信息、应用信息和其他信息组建成的宽表层,最后根据业务需要生成业务层表。将交易数据、行为数据和客服反馈数据转化为特征和该特征对应的特征变量,便于后续数据的调取或处理。
标准特征形成步骤S3:
根据特征对应的业务知识,剔除特征对应的异常特征变量;
其中,异常特征变量主要指某个特征的特征变量偏离均值太远,它们通常会使模型产生明显的偏离,从而影响模型质量,需要剔除。一般需要结合业务知识及统计数据来确定异常的标准,不同特征的异常值标准会有不同;
根据特征变量,构造并筛选复合变量;
采用套索算法筛选特征中符合线性要求的特征,形成标准特征;
其中,套索(Lasso)算法能够解决特征的共线性问题,且能够自动挑选特征。在此,采用套索(Lasso)算法获得的标准特征如下:
PAY_MONEY_2WEEKS_LOG(近两周交易总额的对数)
PAY_MONEY_4WEEKS_LOG(近四周交易总额取对数)
PAY_MONEY_1WEEK_RATIO(近一周交易总额与上上周交易总额比值)
PAY_MONEY_2WEEKS_RATIO(近两周交易总额与上上个两周交易总额比值)
PAY_TIMES_HISTORY(历史交易次数)
PAY_TIMES_1WEEK(近一周交易次数)
PAY_TIMES_2WEEKS(近两周交易次数)
PAY_TIMES_4WEEKS(近4周交易次数)
PAY_TIMES_WORKDAY_RATIO_1WEEK(近一周周末交易天数与工作日交易天数比值)
PAY_TIMES_WORKDAY_RATIO_2WEEKS(近两周周末交易天数与工作日交易天数比值)
PAY_TIMES_WORKDAY_RATIO_4WEEKS(近四周周末交易天数与工作日交易天数比值)
PAY_DAYS_1WEEK(近一周存在交易的天数)
PAY_DAYS_2WEEKS(近两周存在交易的天数)
PAY_DAYS_4WEEKS(近四周存在交易的天数)
PAY_DAYS_RATIO_1WEEK(近一周存在交易天数与上上周存在交易天数比值)
PAY_SILENCE_1WEEK(沉默天数是否大于一周)
PAY_FIRSTPAY_IS_NEW(是否首次交易)
PAY_D_ENTROPY(当天跟前一天的熵值差)
PAY_D_TIMEDEV_EUCLIDEANDISTANCE(当天跟前一天的向量欧式距离)
预测模型确定步骤S4:
根据设定比例将预获取的样本集划分为训练集和测试集;
在此,将样本集分测试集、训练集两部分,通过训练集来建立模型,模型建好后将其用在测试集上做测试。合理的模型在训练集和测试集的表现应非常接近,否则就有过度拟合的问题,也即模型对训练集的预测很好,但对测试集的预测很差。如果存在明显的过度拟合问题,则模型将失去推广应用的意义。在划分训练集和测试集操作中,随机抽取80%样本集做训练集,其余的样本做测试集。
采用用户流失预测模型,对训练集进行预测,获得预测结果;
用户流失预测模型采用的算法包括逻辑回归算法,该算法的应用条件是各个特征之间没有明显的共线性问题。该算法计算的复杂度不高,且易于理解和实现。
根据预测结果与训练集的实际流失标签,获得训练质量指标;
其中,评价模型质量的主要质量指标包括整体准确率、召回率、精度、F1-Measure,这四个质量指标有内在联系,单个质量指标越接近1,则该模型的预测效果越好。在此,该方法可以只给出整体准确率指标的结果,整体准确率也即预测正确的特征变量总数占总特横变量的比例,我们所建立的模型而言训练集的整体准确率达到了两个星号,即刻认为效果良好。
采用用户流失预测模型,处理测试集,获得测试质量指标;
根据训练质量指标和测试质量指标,确定符合稳定性标准的用户流失预测模型;
在此,该模型在测试集上的表现来看,对测试集做预测得到的上述四个质量指标和训练集对应的质量指标非常接近,结果在训练集和测试集之间是平衡的,说明该模型具有很好的稳定性。
实际测试步骤S5:
根据标准特征,获取待测试用户的标准特征对应的特征变量;
采用稳定性符合标准的用户流失预测模型,处理标准特征对应的特征变量,获得用户消费行为预测结果。
由上述技术方案可知,本实施例基于用户支付信息的用户消费行为预测分析方法,能够结合传统的交易数据、用户的行为数据和客服反馈数据等最底层数据,对用户的行为进行全方位的刻画,能够反映用户最真实状况。
同时,该方法能够确定出符合线性要求的标准特征,以及符合稳定性标准的用户流失预测模型,采用该用户流失预测模型处理标特征对应的特征变量,能够对用户流失等行为进行精准预测,以支撑商户的运营和精准营销等。在此,可采用网页多维度展示分析处理后的预测结果,包含但不限于销售排行、付费习惯、付费渗透率、游戏习惯等。
因此,本实施例基于用户支付信息的用户消费行为预测分析方法,能够最大限度的挖掘与应用最底层互联网支付信息,有效预测用户消费行为,为商户进行精准营销提供准确的信息支持。
具体地,在标准特征形成过程中,为了对上述数据进一步进行组合,以挖掘更多的信息,从而提高后续建模的质量,根据特征变量,构造并筛选复合变量,具体包括:根据特征变量,构造特征变量的平方复合变量和/或交叉复合变量,根据特征变量和复合变量的业务意义,筛选符合业务需求的复合变量。该方法能够将特征变量进行自身相乘,或与其他的特征变量进行交叉相乘,获得大量的复合变量,再根据特征变量自身的重要等级,以及复合变量的业务意义,筛选出符合业务需求的复合变量。
在构造并筛选复合变量之后,采用套索算法筛选特征中符合线性要求的特征之前,该方法还包括:根据特征的方差膨胀因子检测结果和/或特征的业务意义,判断特征是否符合线性要求。若特征的方差膨胀因子检测结果小于线性阈值,则判断特征符合线性要求;若特征的方差膨胀因子检测结果大于等于线性阈值,则判断特征不符合线性要求,线性阈值为预先设定的。采用方差膨胀因子(Variance Inflation Factor,VIF)来检查特征的共线性问题。通常认为VIF>10就存在共线性的问题,有时也要根据业务逻辑来判断。以VIF>10为标准,经计算后发现特征的共线性问题比较明显。根据方差膨胀因子或特征的业务意义,判断特征是否具有共线性问题,再进一步采用套索算法筛选出符合线性要求的特征,以提高数据处理效率和准确性。
具体地,在实际测试过程中,对于某类应用而言,先确定需要做预测的用户ID,并获取对应的30个特征变量,如历史交易金额数据、历史交易频次数据、交易沉默天数数据、交易金额行为模式变量、交易时间行为模式变量、用户交易时间段内时间差行为模式变量,这些特征变量对应的特征,也就是上述19个标准特征。对于用户未来一周流失预测,将上述特征变量输入用户一周流失模型,该模型会输出对应的流失概率p,概率大于0.5的归为将流失用户,小于或等于0.5的归为不流失用户;同样,对于用户未来两周流失预测,将上述特征变量输入用户两周流失模型,并按同样的标准将用户归为流失或不会流失。
第二方面,本发明实施例提供一种基于用户支付信息的用户消费行为预测分析***,结合图2,该***包括数据获取子***1、数据汇总子***2、标准特征形成子***3、预测模型确定子***4和实际测试子***5。数据获取子***1用于获取用户的交易数据、行为数据和客服反馈数据。数据汇总子***2用于汇总交易数据、行为数据和客服反馈数据,形成特征和该特征对应的特征变量。标准特征形成子***3用于根据特征对应的业务知识,剔除特征对应的异常特征变量,还用于根据特征变量,构造并筛选复合变量,以及用于采用套索算法筛选特征中符合线性要求的特征,形成标准特征。预测模型确定子***4用于根据设定比例将预获取的样本集划分为训练集和测试集,采用用户流失预测模型,对训练集进行预测,获得预测结果,根据预测结果与训练集的实际流失标签,获得训练质量指标,采用用户流失预测模型,处理测试集,获得测试质量指标,以及用于根据训练质量指标和测试质量指标,确定符合稳定性标准的用户流失预测模型。实际测试子***5,用于根据标准特征,获取待测试用户的标准特征对应的特征变量,还用于采用稳定性符合标准的用户流失预测模型,处理标准特征对应的特征变量,获得用户消费行为预测结果。
由上述技术方案可知,本实施例基于用户支付信息的用户消费行为预测分析***,能够结合传统的交易数据、用户的行为数据和客服反馈数据等最底层数据,对用户的行为进行全方位的刻画,能够反映用户最真实状况。
同时,该***能够确定出符合线性要求的标准特征,以及符合稳定性标准的用户流失预测模型,采用该用户流失预测模型处理标特征对应的特征变量,能够对用户流失等行为进行精准预测,以支撑商户的运营和精准营销等。在此,可采用网页多维度展示分析处理后的预测结果,包含但不限于销售排行、付费习惯、付费渗透率、游戏习惯等。
因此,本实施例基于用户支付信息的用户消费行为预测分析***,能够最大限度的挖掘与应用最底层互联网支付信息,有效预测用户消费行为,为商户进行精准营销提供准确的信息支持。
为了对上述数据进一步进行组合,以挖掘更多的信息,从而提高后续建模的质量,标准特征形成子***3在根据特征变量,构造并筛选复合变量,具体用于:根据特征变量,构造特征变量的平方复合变量和/或交叉复合变量,根据特征变量和复合变量的业务意义,筛选符合业务需求的复合变量。该标准特征形成子***3能够将特征变量进行自身相乘,或与其他的特征变量进行交叉相乘,获得大量的复合变量,再根据特征变量自身的重要等级,以及复合变量的业务意义,筛选出符合业务需求的复合变量。
同时,本实施例基于用户支付信息的用户消费行为预测分析***还包括共线性判断子***,其用于根据特征的方差膨胀因子检测结果和/或特征的业务意义,判断特征是否符合线性要求。共线性判断子***在根据特征的方差膨胀因子检测结果,判断特征是否符合线性要求时,具体用于:若特征的方差膨胀因子检测结果小于线性阈值,则判断特征符合线性要求,若特征的方差膨胀因子检测结果大于等于线性阈值,则判断特征不符合线性要求,线性阈值为预先设定的。共线性判断子***根据方差膨胀因子或特征的业务意义,判断特征是否具有共线性问题,再进一步采用套索算法筛选出符合线性要求的特征,以提高数据处理效率和准确性。
在实际测试过程中,若欲获取用户在未来一周的流失预测结果时,实际测试子***5具体用于:采用稳定性符合标准的用户一周流失模型,处理标准特征对应的特征变量,获得流失概率,若流失概率大于等于流失阈值,则判定该用户为将流失用户,若流失概率小于流失阈值,则判定该用户为不流失用户,稳定性符合标准的用户流失预测模型包括稳定性符合标准的用户一周流失模型,用户消费行为预测结果包括将流失用户和不流失用户。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (10)

1.一种基于用户支付信息的用户消费行为预测分析方法,其特征在于,包括:
数据获取步骤:
获取用户的交易数据、行为数据和客服反馈数据;
数据汇总步骤:
汇总所述交易数据、所述行为数据和所述客服反馈数据,形成特征和该特征对应的特征变量;
标准特征形成步骤:
根据所述特征对应的业务知识,剔除所述特征对应的异常特征变量;
根据所述特征变量,构造并筛选复合变量;
采用套索算法筛选所述特征中符合线性要求的特征,形成标准特征;
预测模型确定步骤:
根据设定比例将预获取的样本集划分为训练集和测试集;
采用用户流失预测模型,对所述训练集进行预测,获得预测结果;
根据所述预测结果与所述训练集的实际流失标签,获得训练质量指标;
采用所述用户流失预测模型,处理所述测试集,获得测试质量指标;
根据所述训练质量指标和所述测试质量指标,确定符合稳定性标准的用户流失预测模型;
实际测试步骤:
根据所述标准特征,获取待测试用户的所述标准特征对应的特征变量;
采用所述稳定性符合标准的用户流失预测模型,处理所述标准特征对应的特征变量,获得用户消费行为预测结果。
2.根据权利要求1所述基于用户支付信息的用户消费行为预测分析方法,其特征在于,
所述根据特征变量,构造并筛选复合变量,具体包括:
根据所述特征变量,构造所述特征变量的平方复合变量和/或交叉复合变量,
根据所述特征变量和所述复合变量的业务意义,筛选符合业务需求的复合变量。
3.根据权利要求1或2所述基于用户支付信息的用户消费行为预测分析方法,其特征在于,
在所述构造并筛选复合变量之后,采用套索算法筛选特征中符合线性要求的特征之前,该方法还包括:根据所述特征的方差膨胀因子检测结果和/或所述特征的业务意义,判断所述特征是否符合线性要求。
4.根据权利要求3所述基于用户支付信息的用户消费行为预测分析方法,其特征在于,
所述根据特征的方差膨胀因子检测结果,判断特征是否符合线性要求,具体包括:
若所述特征的方差膨胀因子检测结果小于线性阈值,则判断所述特征符合线性要求;
若所述特征的方差膨胀因子检测结果大于等于所述线性阈值,则判断所述特征不符合线性要求,所述线性阈值为预先设定的。
5.根据权利要求1所述基于用户支付信息的用户消费行为预测分析方法,其特征在于,
所述采用稳定性符合标准的用户流失预测模型,处理标准特征对应的特征变量,获得用户消费行为预测结果,具体包括:
采用稳定性符合标准的用户一周流失模型,处理所述标准特征对应的特征变量,获得流失概率;
若所述流失概率大于等于流失阈值,则判定该用户为将流失用户;
若所述流失概率小于所述流失阈值,则判定该用户为不流失用户;
所述稳定性符合标准的用户流失预测模型包括所述稳定性符合标准的用户一周流失模型,所述用户消费行为预测结果包括所述将流失用户和所述不流失用户。
6.一种基于用户支付信息的用户消费行为预测分析***,其特征在于,包括:
数据获取子***,用于获取用户的交易数据、行为数据和客服反馈数据;
数据汇总子***,用于汇总所述交易数据、所述行为数据和所述客服反馈数据,形成特征和该特征对应的特征变量;
标准特征形成子***,用于根据所述特征对应的业务知识,剔除所述特征对应的异常特征变量,还用于根据所述特征变量,构造并筛选复合变量,以及用于采用套索算法筛选所述特征中符合线性要求的特征,形成标准特征;
预测模型确定子***,用于根据设定比例将预获取的样本集划分为训练集和测试集,采用用户流失预测模型,对所述训练集进行预测,获得预测结果,根据所述预测结果与所述训练集的实际流失标签,获得训练质量指标,采用所述用户流失预测模型,处理所述测试集,获得测试质量指标,以及用于根据所述训练质量指标和所述测试质量指标,确定符合稳定性标准的用户流失预测模型;
实际测试子***,用于根据所述标准特征,获取待测试用户的所述标准特征对应的特征变量,还用于采用所述稳定性符合标准的用户流失预测模型,处理所述标准特征对应的特征变量,获得用户消费行为预测结果。
7.根据权利要求6所述基于用户支付信息的用户消费行为预测分析***,其特征在于,
所述标准特征形成子***在根据特征变量,构造并筛选复合变量,具体用于:根据所述特征变量,构造所述特征变量的平方复合变量和/或交叉复合变量,根据所述特征变量和所述复合变量的业务意义,筛选符合业务需求的复合变量。
8.根据权利要求6或7所述基于用户支付信息的用户消费行为预测分析***,其特征在于,该***还包括共线性判断子***,用于根据所述特征的方差膨胀因子检测结果和/或所述特征的业务意义,判断所述特征是否符合线性要求。
9.根据权利要求8所述基于用户支付信息的用户消费行为预测分析***,其特征在于,
所述共线性判断子***在根据特征的方差膨胀因子检测结果,判断特征是否符合线性要求时,具体用于:若所述特征的方差膨胀因子检测结果小于线性阈值,则判断所述特征符合线性要求,若所述特征的方差膨胀因子检测结果大于等于所述线性阈值,则判断所述特征不符合线性要求,所述线性阈值为预先设定的。
10.根据权利要求6所述基于用户支付信息的用户消费行为预测分析***,其特征在于,
所述实际测试子***,具体用于:采用稳定性符合标准的用户一周流失模型,处理所述标准特征对应的特征变量,获得流失概率,若所述流失概率大于等于流失阈值,则判定该用户为将流失用户,若所述流失概率小于所述流失阈值,则判定该用户为不流失用户,
所述稳定性符合标准的用户流失预测模型包括所述稳定性符合标准的用户一周流失模型,所述用户消费行为预测结果包括所述将流失用户和所述不流失用户。
CN201610754174.6A 2016-08-29 2016-08-29 基于用户支付信息的用户消费行为预测分析方法及*** Pending CN106408325A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610754174.6A CN106408325A (zh) 2016-08-29 2016-08-29 基于用户支付信息的用户消费行为预测分析方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610754174.6A CN106408325A (zh) 2016-08-29 2016-08-29 基于用户支付信息的用户消费行为预测分析方法及***

Publications (1)

Publication Number Publication Date
CN106408325A true CN106408325A (zh) 2017-02-15

Family

ID=58003693

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610754174.6A Pending CN106408325A (zh) 2016-08-29 2016-08-29 基于用户支付信息的用户消费行为预测分析方法及***

Country Status (1)

Country Link
CN (1) CN106408325A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107688865A (zh) * 2017-07-31 2018-02-13 上海恺英网络科技有限公司 识别网络游戏中潜在高消费用户的方法及设备
CN109492891A (zh) * 2018-10-26 2019-03-19 阿里巴巴集团控股有限公司 用户流失预测方法及装置
CN109508329A (zh) * 2018-12-07 2019-03-22 广州市诚毅科技软件开发有限公司 基于广电大数据的用户流失预警方法、***及存储介质
CN111178987A (zh) * 2020-04-10 2020-05-19 支付宝(杭州)信息技术有限公司 训练用户行为预测模型的方法和装置
CN111738775A (zh) * 2020-07-03 2020-10-02 支付宝(杭州)信息技术有限公司 一种用户支付意愿预测模型的训练方法及***
CN111783999A (zh) * 2020-07-01 2020-10-16 北京知因智慧科技有限公司 数据处理方法及装置
CN112330047A (zh) * 2020-11-18 2021-02-05 交通银行股份有限公司 一种基于用户行为特征的***还款概率预测方法
CN114202350A (zh) * 2020-08-31 2022-03-18 中移动信息技术有限公司 用户消费行为分类方法、装置、设备及计算机存储介质

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107688865A (zh) * 2017-07-31 2018-02-13 上海恺英网络科技有限公司 识别网络游戏中潜在高消费用户的方法及设备
CN109492891A (zh) * 2018-10-26 2019-03-19 阿里巴巴集团控股有限公司 用户流失预测方法及装置
CN109492891B (zh) * 2018-10-26 2022-04-29 创新先进技术有限公司 用户流失预测方法及装置
CN109508329A (zh) * 2018-12-07 2019-03-22 广州市诚毅科技软件开发有限公司 基于广电大数据的用户流失预警方法、***及存储介质
CN111178987A (zh) * 2020-04-10 2020-05-19 支付宝(杭州)信息技术有限公司 训练用户行为预测模型的方法和装置
CN111178987B (zh) * 2020-04-10 2020-06-30 支付宝(杭州)信息技术有限公司 训练用户行为预测模型的方法和装置
CN111783999A (zh) * 2020-07-01 2020-10-16 北京知因智慧科技有限公司 数据处理方法及装置
CN111738775A (zh) * 2020-07-03 2020-10-02 支付宝(杭州)信息技术有限公司 一种用户支付意愿预测模型的训练方法及***
CN114202350A (zh) * 2020-08-31 2022-03-18 中移动信息技术有限公司 用户消费行为分类方法、装置、设备及计算机存储介质
CN112330047A (zh) * 2020-11-18 2021-02-05 交通银行股份有限公司 一种基于用户行为特征的***还款概率预测方法

Similar Documents

Publication Publication Date Title
CN106408325A (zh) 基于用户支付信息的用户消费行为预测分析方法及***
US11068789B2 (en) Dynamic model data facility and automated operational model building and usage
US8630892B2 (en) Churn analysis system
US8874674B2 (en) System for optimizing social networking
WO2019037202A1 (zh) 目标客户的识别方法、装置、电子设备及介质
CN112734559B (zh) 企业信用风险评价方法、装置及电子设备
Chen The gamma CUSUM chart method for online customer churn prediction
US11797840B2 (en) Machine learning based approach for identification of extremely rare events in high-dimensional space
CN107784511A (zh) 一种用户流失预测方法及装置
CN111340606A (zh) 一种全流程收入稽核方法和装置
Chen et al. A combined mining-based framework for predicting telecommunications customer payment behaviors
CN115545886A (zh) 逾期风险识别方法、装置、设备及存储介质
CN113674013A (zh) 一种基于商户自定义规则的广告竞价调整方法及***
US10956429B1 (en) Prescriptive analytics platform and polarity analysis engine
CN112950359B (zh) 一种用户识别方法和装置
CN114493686A (zh) 一种运营内容生成推送方法及装置
CN114997879B (zh) 一种支付路由方法、装置、设备和存储介质
CN114626940A (zh) 数据分析方法、装置及电子设备
CN110766544A (zh) 信用风险的检测方法及装置、存储介质、电子装置
Guo Probabilistic forecasting in decision-making: new methods and applications
Wah Some applications of data mining
CN117291640A (zh) 消费行为识别的方法及装置、电子设备和存储介质
CN115688998A (zh) 房租收入预测方法、装置、电子设备和存储介质
CN114428900A (zh) ***挖掘方法及装置
CN115640461A (zh) 一种产品的推荐方法、装置、电子设备及其存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170215