CN107609708A - 一种基于***商店的用户流失预测方法及*** - Google Patents
一种基于***商店的用户流失预测方法及*** Download PDFInfo
- Publication number
- CN107609708A CN107609708A CN201710873746.7A CN201710873746A CN107609708A CN 107609708 A CN107609708 A CN 107609708A CN 201710873746 A CN201710873746 A CN 201710873746A CN 107609708 A CN107609708 A CN 107609708A
- Authority
- CN
- China
- Prior art keywords
- user
- set user
- training set
- loss
- lost
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000012549 training Methods 0.000 claims abstract description 99
- 230000003542 behavioural effect Effects 0.000 claims abstract description 52
- 238000000605 extraction Methods 0.000 claims abstract description 20
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 13
- 238000003066 decision tree Methods 0.000 claims abstract description 13
- 239000000284 extract Substances 0.000 claims description 12
- 230000005856 abnormality Effects 0.000 claims description 8
- 238000002790 cross-validation Methods 0.000 claims description 7
- 238000013480 data collection Methods 0.000 claims 1
- 238000004458 analytical method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000686 essence Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Landscapes
- Telephonic Communication Services (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于***商店的用户流失预测方法及***,包括以下步骤:从服务器日志中采集用户的基本信息、行为信息和游戏信息,并分为训练集用户和预测集用户;对训练集用户建立流失用户标签,并对原始数据进行预处理;对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行特征提取、选择及规范化;根据训练集用户的特征和流失用户标签,训练梯度提升决策树算法得到用户流失预测模型;根据预测集用户的特征,通过用户流失预测模型识别出***商店的流失用户。本发明基于***商店的业务场景,能够快速准确识别潜在流失用户,为***商店及时召回流失用户提供决策支持。
Description
技术领域
本发明涉及网络数据挖掘技术领域,具体是涉及一种基于***商店的用户流失预测方法及***。
背景技术
近年来,随着移动通信设备的普及与发展,***市场在全球范围持续稳定快速增长。***商店,作为用户***入口,一直是***商家的战略部署重地。在此前提下,***商店行业竞争白热化,各***商店面临用户流失严峻形势;而且,留住现有用户往往能比引入新用户产生更大利润。因此,对于日趋饱和的***商店行业,建立有效的用户流失预测分析机制,能为***商店的用户留存、乃至市场份额的占据与扩张提供决策支持,商业意义重大。
另一方面,有效用户流失预测分析机制的建立,必须基于对具体业务场景的精准理解。目前存在的游戏业务场景下的用户流失预测研究虽然类目繁多,针对的游戏类型从大型多人对战游戏到休闲游戏应有尽有,但都是仅针对单一游戏的分析。而基于***商店的用户流失预测分析,需要研究多种游戏类型下的用户行为,也就是说,多了“游戏”维度,其业务场景及相应特征工程的复杂度及建模的难度大大增加。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供了一种有效的基于***商店的用户流失预测方法及***。
本发明通过以下的方案实现:一种基于***商店的用户流失预测方法,包括以下步骤:
S1:从服务器日志中采集训练集用户和预测集用户的基本信息、行为信息和游戏信息,对训练集用户建立流失用户标签,并对原始数据进行预处理;
S2:对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行特征提取、选择及规范化;
S3:根据训练集用户的特征和流失用户标签,训练梯度提升决策树算法得到用户流失预测模型;
S4:根据预测集用户的特征,通过用户流失预测模型识别出***商店的流失用户。
本发明提出一种基于***商店的用户流失预测方法及***。该方法及***基于流失用户的定义,结合***商店的业务场景,提取服务器日志的用户数据作为用户基础特征、用户行为特征和用户游戏特征,训练并建立最优梯度提升决策树算法模型识别未来一段时间内的流失用户。本发明能够根据***商店的实际业务场景进行自调整,快速准确识别***商店的潜在流失用户,为***商店及时召回潜在流失用户提供决策支持,解决了市场日趋饱和的***商店行业预测流失用户的急切需求。同时,本发明还弥补了现有技术中基于***商店的用户流失预测技术的空缺。
作为本发明的进一步改进,所述步骤S1中具体包括:
S11:根据需要进行用户流失预测的时间段,从服务器日志中采集对应时间段的训练集用户和预测集用户的基本信息、行为信息和游戏信息,对训练集用户建立流失用户标签;
S12:对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行数据清洗,包括剔除异常用户和用户的无效事件。
作为本发明的进一步改进,所述流失用户的定义为:前n天上线的用户中,在后m天内未达到活跃条件的用户记为流失用户,其中活跃条件为用户的已发生事件总数大于j并且活跃时间大于k天;其中,n、m、j和k为可调参数。
作为本发明的进一步改进,所述步骤S2中具体包括:
S21:基于训练集用户和预测集用户的基本信息和游戏信息,提取基本特征和游戏特征;
S22:基于训练集用户的行为信息,提取行为特征;
S23:根据训练集用户的流失用户标签,对训练集用户的行为特征进行特征选择,获取关键行为特征;
S24:基于训练集用户的关键行为特征和预测集用户的行为信息,提取预测集用户的关键行为特征;
S25:规范化训练集用户和预测集用户的基本特征、游戏特征和关键行为特征。
作为本发明的进一步改进,所述S3具体为:通过设定考核指标,并采用K折交叉验证法获取最优用户流失预测模型。
作为本发明的进一步改进,所述考核指标包括精确率和召回率;所述精确率指预测为流失用户中实际为流失用户的概率,所述召回率指实际为流失用户中预测为流失用户的概率。
作为本发明的进一步改进,所述步骤S4具体为:以预测集用户的特征为输入变量,通过所述用户流失预测模型,输出用户的流失概率;若流失概率大于设定阈值,则标签为流失用户。
本发明还提供了一种基于***商店的用户流失预测***,其包括
数据采集及预处理模块,用于从服务器日志中采集训练集用户和预测集用户的基本信息、行为信息和游戏信息,对训练集用户建立流失用户标签,并对原始数据进行预处理;
特征提取、选择及规范化模块,用于对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行特征提取、选择及规范化;
训练模块,用于根据训练集用户的特征和流失用户标签,训练梯度提升决策树算法得到用户流失预测模型;
预测模块,用于根据预测集用户的特征,通过用户流失预测模型识别出***商店的流失用户。
作为本发明的进一步改进,所述数据采集及预处理模块包括:
数据采集子模块,用于根据需要进行用户流失预测的时间段,从服务器日志中采集对应时间段的训练集用户和预测集用户的基本信息、行为信息和游戏信息,对训练集用户建立流失用户标签;
预处理子模块,用于对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行数据清洗,包括剔除异常用户和用户的无效事件。
作为本发明的进一步改进,所述流失用户为:前n天上线的用户中,在后m天内未达到活跃条件的用户记为流失用户,其中活跃条件为用户的已发生事件总数大于j并且活跃时间大于k天;其中,n、m、j和k为设定的参数。
作为本发明的进一步改进,所述特征提取、选择及规范化模块具体包括:
基本特征和游戏特征提取子模块,用于基于训练集用户和预测集用户的基本信息和游戏信息,提取基本特征和游戏特征;
关键行为特征选择及提取子模块,用于基于训练集用户的行为信息,提取行为特征;根据训练集用户的流失用户标签,对训练集用户的行为特征进行选择,获取关键行为特征;基于训练集用户的关键行为特征和预测集用户的行为信息,提取预测集用户的关键行为特征;
特征规范化子模块,用于规范化训练集用户和预测集用户的基本特征、游戏特征和关键行为特征。
作为本发明的进一步改进,所述训练模块具体为:通过设定考核指标,并采用K折交叉验证法获取最优用户流失预测模型。
作为本发明的进一步改进,所述考核指标包括精确率和召回率;所述精确率为预测为流失用户中实际为流失用户的概率,所述召回率为实际为流失用户中预测为流失用户的概率。
作为本发明的进一步改进,所述预测模块具体为:以预测集用户的特征为输入变量,通过所述用户流失预测模型,输出用户的流失概率;若流失概率大于设定阈值,则标签为流失用户。
综上所述,本发明相比于现有技术,具备以下效果:
1、本发明通过提取服务器日志的用户数据作为用户基础特征、用户行为特征和用户游戏特征,训练并建立最优梯度提升决策树算法模型,能够快速准确地识别未来一段时间内***商店的潜在流失用户。
2、本发明提出流失用户可结合***商店的复杂场景进行定义,使模型能够灵活反映当前实际应用情形,预测准确率更高。
3、本发明提出的基于***商店的用户流失预测模型可根据***商店的实际业务场景进行自调整,对用户行为特征进实时选择以及实时训练最优梯度提升决策树模型,灵活度高,并且能够实时识别流失用户。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1是本发明的基于***商店的用户流失预测方法的步骤流程图。
图2是本发明的基于***商店的用户流失预测***的连接框图。
具体实施方式
以下结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
针对现有技术中,预测***商店流失用户技术的匮乏,以及竞争日益激烈的***商店行业对识别潜在流失用户的迫切需求,本发明提出一种基于***商店的用户流失预测方法及***。该方法及***基于流失用户的定义,利用选取的服务器日志用户数据和梯度提升决策树算法建立用户流失预测模型,识别未来一段时间内***商店的潜在流失用户,为留存用户提供决策支持。具体的技术方案通过以下实施例进行介绍。
请参阅图1,其为本发明的基于***商店的用户流失预测方法的步骤流程图。本发明提供了一种基于***商店的用户流失预测方法,具体包括以下步骤:
S1:从服务器日志中采集训练集用户和预测集用户的基本信息、行为信息和游戏信息,对训练集用户建立流失用户标签,并对原始数据进行预处理。具体的,作为本发明的进一步改进,所述流失用户的定义为:前n天上线的用户中,在后m天内未达到活跃条件的用户记为流失用户,其中活跃条件为用户的已发生事件总数大于j并且活跃时间大于k天;其中,n、m、j和k为可调参数,可以根据***商店的实际业务场景进行实时调整。
具体的,所述步骤S1包括:
S11:根据需要进行用户流失预测的时间段,从服务器日志中采集对应时间段的训练集用户和预测集用户的基本信息、行为信息和游戏信息,对训练集用户建立流失用户标签。
例如,在此实施例中,假如流失用户的定义中,n、m、j和k分别取7、7、7和0.5,则取预测日期前8-14天和前7天的服务器日志原始数据分别作为训练集用户和预测集用户的基础信息、行为信息和游戏信息。对于训练集用户的每个单一用户,进行如下的标签方法:
(1)若该用户在预测日期前7天满足活跃条件,则标签此用户为留存用户。
(2)若该用户在预测日期前7天未满足活跃条件,则标签此用户为流失用户。
S12:对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行数据清洗,包括剔除异常用户和用户的无效事件。
具体的,在本步骤中,剔除异常用户的步骤为:由于***商店的某些用户存在严重刷号行为,其设备所对应的账号可达上万,这些用户不仅没有预测流失的必要,而且会对数据产生噪声污染,影响预测效果。因此,将账号数大于设定阈值的设备定义为异常用户,并剔除异常用户。
剔除用户的无效事件的步骤为:服务器日志记录用户的发生事件时,由于手机网络连接不稳定及服务器延时回应等原因,用户的单一操作会造成多个重复记录的产生。因此,将相同账号下,与上一个事件相同并且时间间隔小于设定阈值的事件定义为无效事件,并剔除无效事件。
S2:对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行特征提取、选择及规范化。
具体的,所述步骤S2中具体包括:
S21:基于训练集用户和预测集用户的基本信息和游戏信息,提取基本特征和游戏特征。
其中,用户基本特征包括:注册账号数,已发生事件总数,每日已发生事件数,已注册天数,距上次登录天数,活跃区间,登录天数,注册渠道,用户手机***和VIP等级等。
用户游戏特征包括:用户游戏评级,用户游戏分类,用户游戏公会评级,用户游戏已上线天数等。
S22:基于训练集用户的行为信息,提取流失用户的行为特征。
在本步骤中,用户行为特征指用户在***商店中产生各行为类型的次数。在本实施例中,用户在***商店发生的事件类型上百种,也就是说,总共有上百维用户行为特征。然而,过高维数的特征工程并不利于数学建模,而且事实上,其中大部分事件本身内部强相关。因此,需要先对这上百种事件进行分类。在此实施例中,分类后的用户行为特征包括:登录行为次数,退出游戏行为次数,支付行为次数,点击消息提醒行为次数,点击导航栏行为次数,查看账号信息行为次数,小组行为次数,与客服交流行为次数,点击礼包行为次数,查看攻略行为次数,VIP行为次数,录屏行为次数和福利行为次数等。
S23:根据训练集用户的流失用户标签,对训练集用户的行为特征进行选择,获取关键行为特征。
具体的,计算每个训练集用户行为特征和流失用户标签的Pearson相关系数、互信息值及分类器重要性等,取相关性较强的用户行为特征作为关键用户行为特征。
S24:基于训练集用户的关键行为特征和预测集用户的行为信息,提取预测集用户的关键行为特征。
S25:规范化训练集用户和预测集用户的基本特征、游戏特征和关键行为特征。
具体的,在本步骤中具体处理方式包括对枚举特征进行独热编码处理。在此实施例中,所述枚举特征包括:注册渠道和用户游戏分类等。
S3:根据训练集用户的特征和流失用户标签,训练梯度提升决策树算法得到用户流失预测模型。
所述S3具体为:通过设定考核指标,并采用K折交叉验证法获取最优用户流失预测模型。
其中,梯度提升决策树算法模型可采用但不局限于XGBoost算法。
具体的,XGBoost的梯度提升决策树算法对传统的梯度提升决策树做了改良,例如在优化目标函数加入正则项并且多取了二阶导数信息、借鉴了随机森林的列抽样等,大幅度提高了预测准确率和计算效率。
所述考核指标包括精确率和召回率,并可根据***商店的业务场景赋予不同权重。精确率指预测为流失用户中实际为流失用户的概率,召回率指实际为流失用户中预测为流失用户的概率。
在此实施例中,基于***商店的实际业务场景,召回一个预测流失实际留存的用户的成本要比遗漏一个流失用户的成本低一些。也就是说,高召回率更重要。因此,赋予召回率更大的权重。
本实施例的K折交叉验证法指将训练模块的数据集均分成n个互斥子集,将每个子集数据分别做一次验证集,其余的K-1组子集数据作为训练集,这样会得到K个模型,用这K个模型最终的验证集的考核指标权重和的平均数作为此K折交叉验证下分类器的性能指标。基于该性能指标,选出最优用户流失预测模型。在本实施例中,K可取10。
S4:根据预测集用户的特征,通过用户流失预测模型识别出***商店的流失用户。
所述步骤S4具体为:以预测集用户的特征为输入变量,通过所述用户流失预测模型,输出用户的流失概率;若流失概率大于设定阈值,则标签为流失用户。例如,在此实施例中,可设定阈值为0.5。
请同时参阅图2,其为本发明的基于***商店的用户流失预测***的连接框图。为了实现上述的方法,本发明还提供了一种基于***商店的用户流失预测***,其包括数据采集及预处理模块1、特征提取、选择及规范化模块2、训练模块3和预测模块4。
所述数据采集及预处理模块1,用于从服务器日志中采集训练集用户和预测集用户的基本信息、行为信息和游戏信息,对训练集用户建立流失用户标签,并对原始数据进行预处理。所述流失用户为:前n天上线的用户中,在后m天内未达到活跃条件的用户记为流失用户,其中活跃条件为用户的已发生事件总数大于j并且活跃时间大于k天;其中,n、m、j和k为可调参数。
所述特征提取、选择及规范化模块2,用于对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行特征提取、选择及规范化。
所述训练模块3,用于根据训练集用户的特征和流失用户标签,训练梯度提升决策树算法得到用户流失预测模型。
所述预测模块4,用于根据预测集用户的特征,通过用户流失预测模型识别出***商店的流失用户。
进一步,所述数据采集及预处理模块1包括:数据采集子模块11和预处理子模块12。
所述数据采集子模块11,用于根据需要进行用户流失预测的时间段,从服务器日志中采集对应时间段的训练集用户和预测集用户的基本信息、行为信息和游戏信息,对训练集用户建立流失用户标签;
所述预处理子模块12,用于对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行数据清洗,包括剔除异常用户和用户的无效事件。
进一步,所述特征提取、选择及规范化模块2具体包括:基本特征和游戏特征提取子模块21、关键行为特征选择及提取子模块22和特征规范化子模块23。
所述基本特征和游戏特征提取子模块21,用于基于训练集用户和预测集用户的基本信息和游戏信息,提取基本特征和游戏特征。
所述关键行为特征选择及提取子模块22,用于基于训练集用户的行为信息,提取行为特征。同时,根据训练集用户的流失用户标签,对训练集用户的行为特征进行选择,获取关键行为特征。然后,基于训练集用户的关键行为特征和预测集用户的行为信息,提取预测集用户的关键行为特征。
所述特征规范化子模块23,用于规范化训练集用户和预测集用户的基本特征、游戏特征和关键行为特征。
进一步,所述训练模块3具体为:通过设定考核指标,并采用K折交叉验证法获取最优用户流失预测模型。具体地,所述考核指标包括精确率和召回率;所述精确率为预测为流失用户中实际为流失用户的概率,所述召回率为实际为流失用户中预测为流失用户的概率。
进一步,所述预测模块4具体为:以预测集用户的特征为输入变量,通过所述用户流失预测模型,输出用户的流失概率;若流失概率大于设定阈值,则标签为流失用户。
本发明所提供的用户流失预测方法及***,不仅适用于***商店,同时也适用于针对多种***提供服务的应用及相关产品。
相比于现有技术,本发明提出一种基于***商店的用户流失预测方法及***。该方法及***基于流失用户的定义,结合***商店的业务场景,提取服务器日志的用户数据作为用户基础特征、用户行为特征和用户游戏特征,训练并建立最优梯度提升决策树算法模型识别未来一段时间内的流失用户。另外,本发明能够根据***商店的实际业务场景进行自调整,快速准确识别***商店的潜在流失用户,为***商店及时召回潜在流失用户提供决策支持,解决了市场日趋饱和的***商店行业预测流失用户的急切需求。同时,本发明还弥补了现有技术中基于***商店的用户流失预测技术的空缺。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (10)
1.一种基于***商店的用户流失预测方法,其特征在于,包括以下步骤:
S1:从服务器日志中采集训练集用户和预测集用户的基本信息、行为信息和游戏信息,对训练集用户建立流失用户标签,并对原始数据进行预处理;
S2:对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行特征提取、选择及规范化;
S3:根据训练集用户的特征和流失用户标签,训练梯度提升决策树算法得到用户流失预测模型;
S4:根据预测集用户的特征,通过用户流失预测模型识别出***商店的流失用户。
2.根据权利要求1所述基于***商店的用户流失预测方法,其特征在于,所述步骤S1中具体包括:
S11:根据需要进行用户流失预测的时间段,从服务器日志中采集对应时间段的训练集用户和预测集用户的基本信息、行为信息和游戏信息,并对训练集用户建立流失用户标签;所述流失用户的定义为:前n天上线的用户中,在后m天内未达到活跃条件的用户记为流失用户,其中活跃条件为用户的已发生事件总数大于j并且活跃时间大于k天;其中,n、m、j和k为可调的参数;
S12:对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行数据清洗,包括剔除异常用户和用户的无效事件。
3.根据权利要求1所述基于***商店的用户流失预测方法,其特征在于,所述步骤S2中具体包括:
S21:基于训练集用户和预测集用户的基本信息和游戏信息,提取基本特征和游戏特征;
S22:基于训练集用户的行为信息,提取行为特征;
S23:根据训练集用户的流失用户标签,对训练集用户的行为特征进行特征选择,获取关键行为特征;
S24:基于训练集用户的关键行为特征和预测集用户的行为信息,提取预测集用户的关键行为特征;
S25:规范化训练集用户和预测集用户的基本特征、游戏特征和关键行为特征。
4.根据权利要求1所述基于***商店的用户流失预测方法,其特征在于,所述S3具体为:通过设定考核指标,并采用K折交叉验证法获取最优用户流失预测模型;所述考核指标包括精确率和召回率;所述精确率指预测为流失用户中实际为流失用户的概率,所述召回率指实际为流失用户中预测为流失用户的概率。
5.根据权利要求1所述基于***商店的用户流失预测方法,其特征在于,所述步骤S4具体为:以预测集用户的特征为输入变量,通过所述用户流失预测模型,输出用户的流失概率;若流失概率大于设定阈值,则标签为流失用户。
6.一种基于***商店的用户流失预测***,其特征在于,包括:
数据采集及预处理模块,用于从服务器日志中采集训练集用户和预测集用户的基本信息、行为信息和游戏信息,对训练集用户建立流失用户标签,并对原始数据进行预处理;
特征提取、选择及规范化模块,用于对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行特征提取、选择及规范化;
训练模块,用于根据训练集用户的特征和流失用户标签,训练梯度提升决策树算法得到用户流失预测模型;
预测模块,用于根据预测集用户的特征,通过用户流失预测模型识别出***商店的流失用户。
7.根据权利要求6所述基于***商店的用户流失预测***,其特征在于,所述数据采集及预处理模块包括:
数据采集子模块,用于根据需要进行用户流失预测的时间段,从服务器日志中采集对应时间段的训练集用户和预测集用户的基本信息、行为信息和游戏信息,对训练集用户建立流失用户标签;所述流失用户定义为:前n天上线的用户中,在后m天内未达到活跃条件的用户记为流失用户,其中活跃条件为用户的已发生事件总数大于j并且活跃时间大于k天;其中,n、m、j和k为可调的参数;
预处理子模块,用于对训练集用户和预测集用户的基本信息、行为信息和游戏信息进行数据清洗,包括剔除异常用户和用户的无效事件。
8.根据权利要求6所述基于***商店的用户流失预测***,其特征在于,所述特征提取、选择及规范化模块具体包括:
基本特征和游戏特征提取子模块,用于基于训练集用户和预测集用户的基本信息和游戏信息,提取基本特征和游戏特征;
关键行为特征选择及提取子模块,用于基于训练集用户的行为信息,提取行为特征;根据训练集用户的流失用户标签,对训练集用户的行为特征进行特征选择,获取关键行为特征;基于训练集用户的关键行为特征和预测集用户的行为信息,提取预测集用户的关键行为特征;
特征规范化子模块,用于规范化训练集用户和预测集用户的基本特征、游戏特征和关键行为特征。
9.根据权利要求6所述基于***商店的用户流失预测***,其特征在于,所述训练模块具体包括:通过设定考核指标,并采用K折交叉验证法获取最优用户流失预测模型;所述考核指标包括精确率和召回率;所述精确率为预测为流失用户中实际为流失用户的概率,所述召回率为实际为流失用户中预测为流失用户的概率。
10.根据权利要求6所述基于***商店的用户流失预测***,其特征在于,所述预测模块具体包括:以预测集用户的特征为输入变量,通过所述用户流失预测模型,输出用户的流失概率;若流失概率大于设定阈值,则标签为流失用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710873746.7A CN107609708B (zh) | 2017-09-25 | 2017-09-25 | 一种基于***商店的用户流失预测方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710873746.7A CN107609708B (zh) | 2017-09-25 | 2017-09-25 | 一种基于***商店的用户流失预测方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107609708A true CN107609708A (zh) | 2018-01-19 |
CN107609708B CN107609708B (zh) | 2021-03-26 |
Family
ID=61057924
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710873746.7A Active CN107609708B (zh) | 2017-09-25 | 2017-09-25 | 一种基于***商店的用户流失预测方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107609708B (zh) |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108257675A (zh) * | 2018-02-07 | 2018-07-06 | 平安科技(深圳)有限公司 | 慢阻肺发病风险预测方法、服务器及计算机可读存储介质 |
CN108712279A (zh) * | 2018-04-27 | 2018-10-26 | 中国联合网络通信集团有限公司 | 用户离网的预测方法及装置 |
CN108733631A (zh) * | 2018-04-09 | 2018-11-02 | 中国平安人寿保险股份有限公司 | 一种数据评估方法、装置、终端设备及存储介质 |
CN109034861A (zh) * | 2018-06-04 | 2018-12-18 | 挖财网络技术有限公司 | 基于移动端日志行为数据的用户流失预测方法及装置 |
CN109299265A (zh) * | 2018-10-15 | 2019-02-01 | 广州虎牙信息科技有限公司 | 潜在回流用户筛选方法、装置以及电子设备 |
CN109543734A (zh) * | 2018-11-14 | 2019-03-29 | 中国联合网络通信集团有限公司 | 用户画像方法及装置、存储介质 |
CN109636443A (zh) * | 2018-11-17 | 2019-04-16 | 南京中数媒介研究有限公司 | 客户流失预测的深度学习方法及装置 |
CN109711860A (zh) * | 2018-11-12 | 2019-05-03 | 平安科技(深圳)有限公司 | 用户行为的预测方法及装置、存储介质、计算机设备 |
CN109754290A (zh) * | 2019-01-15 | 2019-05-14 | 网易(杭州)网络有限公司 | 一种游戏数据的处理方法和装置 |
CN109767045A (zh) * | 2019-01-17 | 2019-05-17 | 北京腾云天下科技有限公司 | 一种流失用户的预测方法、装置、计算设备及介质 |
CN109767269A (zh) * | 2019-01-15 | 2019-05-17 | 网易(杭州)网络有限公司 | 一种游戏数据的处理方法和装置 |
CN109784993A (zh) * | 2019-01-06 | 2019-05-21 | 广州银汉科技有限公司 | 一种基于大数据的用户轨迹智能精准预测*** |
CN109815631A (zh) * | 2019-02-26 | 2019-05-28 | 网易(杭州)网络有限公司 | 一种游戏数据的处理方法和装置 |
CN110147803A (zh) * | 2018-02-08 | 2019-08-20 | 北大方正集团有限公司 | 用户流失预警处理方法与装置 |
CN110222267A (zh) * | 2019-06-06 | 2019-09-10 | 中山大学 | 一种游戏平台信息推送方法、***、存储介质及设备 |
CN110263326A (zh) * | 2019-05-21 | 2019-09-20 | 平安科技(深圳)有限公司 | 一种用户行为预测方法、预测装置、存储介质及终端设备 |
CN110634018A (zh) * | 2019-08-30 | 2019-12-31 | 阿里巴巴集团控股有限公司 | 一种流失用户的特征刻画方法、识别方法及相关装置 |
CN110852780A (zh) * | 2019-10-08 | 2020-02-28 | 百度在线网络技术(北京)有限公司 | 数据分析方法、装置、设备和计算机存储介质 |
CN110930192A (zh) * | 2019-11-22 | 2020-03-27 | 携程旅游信息技术(上海)有限公司 | 用户流失预测方法、***、设备和存储介质 |
CN111727451A (zh) * | 2018-09-10 | 2020-09-29 | 澪标分析株式会社 | 用于计算预测数据的信息处理装置等 |
CN111821694A (zh) * | 2020-07-24 | 2020-10-27 | 北京达佳互联信息技术有限公司 | 游戏新用户的防流失方法及装置、电子设备及存储介质 |
CN113827981A (zh) * | 2021-08-17 | 2021-12-24 | 杭州电魂网络科技股份有限公司 | 一种基于朴素贝叶斯的游戏流失用户预测方法和*** |
CN114022194A (zh) * | 2021-10-26 | 2022-02-08 | 共享智能铸造产业创新中心有限公司 | 平台用户流失的预测方法 |
CN115018562A (zh) * | 2022-07-06 | 2022-09-06 | 湖南草花互动科技股份公司 | 用户预流失预测方法、装置及*** |
CN116757750A (zh) * | 2023-06-05 | 2023-09-15 | 广州盈风网络科技有限公司 | 一种基于流失率预测的运营推送方法、装置、设备及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105335752A (zh) * | 2015-09-18 | 2016-02-17 | 国网山东省电力公司菏泽供电公司 | 一种基于主成分分析多变量决策树的接线方式识别方法 |
CN106203679A (zh) * | 2016-06-27 | 2016-12-07 | 武汉斗鱼网络科技有限公司 | 一种用户流失预测方法及*** |
CN106250403A (zh) * | 2016-07-19 | 2016-12-21 | 北京奇艺世纪科技有限公司 | 用户流失预测方法及装置 |
CN106997493A (zh) * | 2017-02-14 | 2017-08-01 | 云数信息科技(深圳)有限公司 | 基于多维度数据的彩票用户流失预测方法及其*** |
-
2017
- 2017-09-25 CN CN201710873746.7A patent/CN107609708B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105335752A (zh) * | 2015-09-18 | 2016-02-17 | 国网山东省电力公司菏泽供电公司 | 一种基于主成分分析多变量决策树的接线方式识别方法 |
CN106203679A (zh) * | 2016-06-27 | 2016-12-07 | 武汉斗鱼网络科技有限公司 | 一种用户流失预测方法及*** |
CN106250403A (zh) * | 2016-07-19 | 2016-12-21 | 北京奇艺世纪科技有限公司 | 用户流失预测方法及装置 |
CN106997493A (zh) * | 2017-02-14 | 2017-08-01 | 云数信息科技(深圳)有限公司 | 基于多维度数据的彩票用户流失预测方法及其*** |
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108257675A (zh) * | 2018-02-07 | 2018-07-06 | 平安科技(深圳)有限公司 | 慢阻肺发病风险预测方法、服务器及计算机可读存储介质 |
CN110147803A (zh) * | 2018-02-08 | 2019-08-20 | 北大方正集团有限公司 | 用户流失预警处理方法与装置 |
CN108733631A (zh) * | 2018-04-09 | 2018-11-02 | 中国平安人寿保险股份有限公司 | 一种数据评估方法、装置、终端设备及存储介质 |
CN108712279A (zh) * | 2018-04-27 | 2018-10-26 | 中国联合网络通信集团有限公司 | 用户离网的预测方法及装置 |
CN108712279B (zh) * | 2018-04-27 | 2021-08-17 | 中国联合网络通信集团有限公司 | 用户离网的预测方法及装置 |
CN109034861A (zh) * | 2018-06-04 | 2018-12-18 | 挖财网络技术有限公司 | 基于移动端日志行为数据的用户流失预测方法及装置 |
CN109034861B (zh) * | 2018-06-04 | 2022-06-07 | 挖财网络技术有限公司 | 基于移动端日志行为数据的用户流失预测方法及装置 |
CN111727451A (zh) * | 2018-09-10 | 2020-09-29 | 澪标分析株式会社 | 用于计算预测数据的信息处理装置等 |
CN109299265A (zh) * | 2018-10-15 | 2019-02-01 | 广州虎牙信息科技有限公司 | 潜在回流用户筛选方法、装置以及电子设备 |
CN109711860A (zh) * | 2018-11-12 | 2019-05-03 | 平安科技(深圳)有限公司 | 用户行为的预测方法及装置、存储介质、计算机设备 |
CN109543734A (zh) * | 2018-11-14 | 2019-03-29 | 中国联合网络通信集团有限公司 | 用户画像方法及装置、存储介质 |
CN109636443A (zh) * | 2018-11-17 | 2019-04-16 | 南京中数媒介研究有限公司 | 客户流失预测的深度学习方法及装置 |
CN109784993A (zh) * | 2019-01-06 | 2019-05-21 | 广州银汉科技有限公司 | 一种基于大数据的用户轨迹智能精准预测*** |
CN109754290A (zh) * | 2019-01-15 | 2019-05-14 | 网易(杭州)网络有限公司 | 一种游戏数据的处理方法和装置 |
CN109754290B (zh) * | 2019-01-15 | 2024-06-04 | 网易(杭州)网络有限公司 | 一种游戏数据的处理方法和装置 |
CN109767269A (zh) * | 2019-01-15 | 2019-05-17 | 网易(杭州)网络有限公司 | 一种游戏数据的处理方法和装置 |
CN109767269B (zh) * | 2019-01-15 | 2022-02-22 | 网易(杭州)网络有限公司 | 一种游戏数据的处理方法和装置 |
CN109767045A (zh) * | 2019-01-17 | 2019-05-17 | 北京腾云天下科技有限公司 | 一种流失用户的预测方法、装置、计算设备及介质 |
CN109815631A (zh) * | 2019-02-26 | 2019-05-28 | 网易(杭州)网络有限公司 | 一种游戏数据的处理方法和装置 |
CN110263326A (zh) * | 2019-05-21 | 2019-09-20 | 平安科技(深圳)有限公司 | 一种用户行为预测方法、预测装置、存储介质及终端设备 |
CN110222267B (zh) * | 2019-06-06 | 2023-07-25 | 中山大学 | 一种游戏平台信息推送方法、***、存储介质及设备 |
CN110222267A (zh) * | 2019-06-06 | 2019-09-10 | 中山大学 | 一种游戏平台信息推送方法、***、存储介质及设备 |
CN110634018A (zh) * | 2019-08-30 | 2019-12-31 | 阿里巴巴集团控股有限公司 | 一种流失用户的特征刻画方法、识别方法及相关装置 |
CN110852780A (zh) * | 2019-10-08 | 2020-02-28 | 百度在线网络技术(北京)有限公司 | 数据分析方法、装置、设备和计算机存储介质 |
CN110930192A (zh) * | 2019-11-22 | 2020-03-27 | 携程旅游信息技术(上海)有限公司 | 用户流失预测方法、***、设备和存储介质 |
CN111821694A (zh) * | 2020-07-24 | 2020-10-27 | 北京达佳互联信息技术有限公司 | 游戏新用户的防流失方法及装置、电子设备及存储介质 |
CN111821694B (zh) * | 2020-07-24 | 2024-05-21 | 北京达佳互联信息技术有限公司 | 游戏新用户的防流失方法及装置、电子设备及存储介质 |
CN113827981A (zh) * | 2021-08-17 | 2021-12-24 | 杭州电魂网络科技股份有限公司 | 一种基于朴素贝叶斯的游戏流失用户预测方法和*** |
CN114022194A (zh) * | 2021-10-26 | 2022-02-08 | 共享智能铸造产业创新中心有限公司 | 平台用户流失的预测方法 |
CN115018562A (zh) * | 2022-07-06 | 2022-09-06 | 湖南草花互动科技股份公司 | 用户预流失预测方法、装置及*** |
CN116757750A (zh) * | 2023-06-05 | 2023-09-15 | 广州盈风网络科技有限公司 | 一种基于流失率预测的运营推送方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN107609708B (zh) | 2021-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107609708A (zh) | 一种基于***商店的用户流失预测方法及*** | |
CN104794192B (zh) | 基于指数平滑、集成学习模型的多级异常检测方法 | |
CN110198310A (zh) | 一种网络行为反作弊方法、装置及存储介质 | |
CN110147711A (zh) | 视频场景识别方法、装置、存储介质和电子装置 | |
CN107886243A (zh) | 风险识别模型构建和风险识别方法、装置及设备 | |
CN112053221A (zh) | 一种基于知识图谱的互联网金融团伙欺诈行为检测方法 | |
CN109919624B (zh) | 一种基于时空集中性的网贷欺诈团伙识别与预警方法 | |
CN107103754A (zh) | 一种道路交通状况预测方法及*** | |
CN107153789A (zh) | 利用随机森林分类器实时检测安卓恶意软件的方法 | |
CN106778876A (zh) | 基于移动用户轨迹相似性的用户分类方法和*** | |
CN107644279A (zh) | 评价模型的建模方法及装置 | |
CN106022826A (zh) | 一种网络直播平台中的作弊用户识别方法与*** | |
CN106372072A (zh) | 一种基于位置的移动社会网络用户关系的识别方法 | |
CN103250376B (zh) | 用于执行与通信网络的节点有关的预测分析的方法和*** | |
CN108205684A (zh) | 图像消歧方法、装置、存储介质和电子设备 | |
CN104951807B (zh) | 股市情绪的确定方法和装置 | |
CN108304853A (zh) | 游戏相关度的获取方法、装置、存储介质和电子装置 | |
CN106960387A (zh) | 个人信用风险评估方法及*** | |
CN107766823A (zh) | 基于关键区域特征学习的视频中异常行为检测方法 | |
CN112053222A (zh) | 一种基于知识图谱的互联网金融团伙欺诈行为检测方法 | |
CN104679942A (zh) | 一种基于数据挖掘的建设用地承载效率测度方法 | |
CN106713290A (zh) | 一种识别主用户账号的方法及服务器 | |
CN115759640A (zh) | 一种智慧城市的公共服务信息处理***及方法 | |
CN104217088B (zh) | 运营商移动业务资源的优化方法与*** | |
CN107368499A (zh) | 一种客户标签建模及推荐方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |