CN113469730A - 一种非合同场景下的基于RF-LightGBM融合模型的客户复购预测方法及装置 - Google Patents
一种非合同场景下的基于RF-LightGBM融合模型的客户复购预测方法及装置 Download PDFInfo
- Publication number
- CN113469730A CN113469730A CN202110637643.7A CN202110637643A CN113469730A CN 113469730 A CN113469730 A CN 113469730A CN 202110637643 A CN202110637643 A CN 202110637643A CN 113469730 A CN113469730 A CN 113469730A
- Authority
- CN
- China
- Prior art keywords
- prediction
- repurchase
- lightgbm
- sample
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000004927 fusion Effects 0.000 title claims abstract description 23
- 230000006399 behavior Effects 0.000 claims abstract description 26
- 238000005457 optimization Methods 0.000 claims abstract description 21
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 13
- 238000007637 random forest analysis Methods 0.000 claims abstract description 12
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 238000003066 decision tree Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 2
- 238000003860 storage Methods 0.000 claims description 2
- 238000006243 chemical reaction Methods 0.000 abstract description 3
- 230000000694 effects Effects 0.000 description 15
- 238000011156 evaluation Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000013486 operation strategy Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000013102 re-test Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Medical Informatics (AREA)
- Probability & Statistics with Applications (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种非合同场景下的基于RF‑LightGBM融合模型的客户复购预测方法及装置。该方法包括:获取用户的历史数据,对其进行预处理和特征工程;经过数据预处理后的数据作为样本,利用SMOTE‑ENN方法对样本集进行平衡;通过TPE优化算法对随机森林算法、LightGBM算法进行超参数寻优,构建弱分类器;通过各弱分类器分别对所述训练样本进行集成学习得到强分类器,得到关于复购预测的最终结果。本发明根据企业已购客户的消费数据进行分析,精准预测既存客户的复购行为,根据复购行为指导客户关系管理决策及精准营销策略,提高营销转化率,降低企业运营成本。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种非合同场景下的基于RF-LightGBM融合模型的客户复购预测方法及装置。
背景技术
随着大数据时代的到来,从海量的消费者历史交易数据中预测消费者未来购买意向已成为企业管理中的重要问题。非合同场景下的客户复购行为预测主要是指企业与顾客未签订购买合同的情景下,顾客下一次购买该企业产品的重复购买行为预测。准确预测出有重复购买意向的消费者,通过精准营销可以更精确地匹配客户需求,提升新消费者的价值并将其转化为忠实客户。
现有技术中,中国发明专利(授权公告号CN109146533B)公开了一种信息推送方法和装置,其具体公开了获取用户针对同一物品类别的物品的至少两个订单信息,基于至少两个订单信息中的购买量,确定用户针对物品类别的物品的间隔期的日均消耗量,基于平均日均消耗量和最新订单对应的购买量,确定向用户的用户终端推送物品类别的物品关联的物品信息的推送日期,从而提高信息推送的有效性。中国发明专利(授权公告号CN108171530B)公开了一种用于客单价和复购率的提升方法及装置,其:选取目标门店的历史营销数据,获得历史营销活动效果,根据所述历史营销数据以及历史营销活动效果,得到该目标门店的营销活动效果预估初值;根据各个门店的历史营销活动满足门槛订单数和满足客单价订单数的比例构建门槛调节因子,使用所述门槛调节因子对所述目标门店的营销活动效果预估初值进行校准,获得所述目标门店的营销活动效果预估值,从而解决现有的推广活动效果评价技术中无法根据门槛的改变而更准确地预估营销活动效果的问题。上述现有技术虽然根据历史数据实现了产品推荐以及效果预测,但是并不能准确地预测客户行为。
现有机器学***台用户重复购买行为预测方法,包括:获取用户历史购买行为数据,融合深度Catboost个体模型、双层注意力BiGRU个体模型和DeepGBM个体模型,对用户历史购买数据中离散的购买记录数值和行为序列特征进行建模,提高预测结果的准确性。中国发明申请(公布号CN108520469A)公开了一种基于电商平台的用户重购行为分析方法,选取统计时段内用户的有效购买记录;进行数据清洗;对每笔有效购买记录打上是否为重复购买的标签、是否为平台重复购买的标签或是否为险种重复购买的标签;统计出购买用户总数、重复购买用户数、各平台的购买用户总数、各平台重复购买用户总数、各险种的购买用户总数及各险种的重复购买用户总数;计算出统计时段内的重复购买率、平台重复购买率和险种重复购买率。但是,由于在电商场景中,可以保留客户的收藏、点赞等“隐式”反馈行为,这是在更为广阔的非合同场景中所不具备的。且目前使用机器学习算法侧重于算法集成,忽略了数据集对预测结果的影响。一般在购买情境中,重复购买的用户占比少于单次购买的用户,这就存在数据类别不均衡的问题,往往造成模型的过拟合,造成预测精度低。
发明内容
为克服上述现有技术的不足,本发明提供了一种非合同场景下的基于RF-LightGBM融合模型的客户复购预测方法及装置,本发明采用如下技术方案:
一种非合同场景下基于RF-LightGBM融合模型的客户复购预测方法,包括如下步骤:
获取用户的历史购买记录数据,对其进行预处理,并提取特征;
使用样本均衡方法对经过特征提取后的数据进行平衡,得到均衡后的样本;
利用优化算法对训练样本数据进行训练,在指定的弱分类器超参数空间中对弱分类器进行迭代优化;
通过对各弱分类器赋予相同权重,进行集成学习得到强分类器;
使用强分类器进行预测,得到关于产品推荐、复购行为预测的最终结果;
根据所述最终结果,向用户的终端设备推送产品信息和/或向管理***发送复购行为预测结果。
进一步,所述提取特征包括:
最近购买时间、购买频次、购买总金额、关系持续时间、购买间隔。
进一步,所述样本均衡方法包括:
先使用SMOTE过采样方法对所述提取特征的少数类样本进行生成,再使用ENN(Edited KNN)方法对生成样本进行判断,若预测结果和实际类别标签不同则剔除该样本,得到均衡后的样本。
进一步,所述优化算法包括:
使用TPE(Tree-structured Parzen Estimator)树状Parzen估计优化算法对模型超参数进行优化,在最优超参数情况下进行模型训练。
进一步,所述弱分析器包括随机森林RF(Random Forestsm)模型、Light GBM模型,弱分析器输出结果均为分类概率值,数学表达式为:
式中,Ntree为决策树的总数,hi为第i颗决策树,P(x|y)表示预测样本x属于类别y的概率。
进一步,所述集成学习具体包括:
对RF模型、Light GBM模型赋给相同权重,在其预测概率基础上使用软投票(SoftVoting)方法进行集成,其数学表现形式为:
PSoft Voting=(PRF+PLightGBM)/2
其中,PSoft Voting指软投票融合模型的预测概率,PRF,PLightGBM分别表示随机森林、LightGBM模型的预测概率,Result表示融合模型的预测结果,1表示属于复购型用户,0表示属于未复购型用户,threshold表示分类阈值。
进一步,基于复购行为预测与复购概率预测作为产品推荐指导。
本发明还包括一种非合同场景下基于RF-LightGBM融合模型的客户复购预测装置,包括:
获取模块,获取用户的历史购买记录数据,对其进行预处理,并提取特征;
平衡模块,使用样本均衡方法对经过特征提取后的数据进行平衡,得到均衡后的样本;
优化训练模块,利用优化算法对训练样本数据进行训练,在指定的弱分类器超参数空间中对弱分类器进行迭代优化;
集成学习模块,通过对各弱分类器赋予相同权重,进行集成学习得到强分类器;
预测模块,使用强分类器进行预测,得到关于产品推荐、复购行为预测的最终结果;
推送模块,根据所述最终结果,向用户的终端设备推送产品信息。
本发明还包括一种电子设备,包括:
处理器,以及存储器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令从而执行如上所述任一的非合同场景下基于RF-LightGBM融合模型的客户复购预测方法。
本发明还包括一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述任一的非合同场景下基于RF-LightGBM融合模型的客户复购预测方法。
本发明所达到的有益效果:根据企业已有用户购买行为记录进行分析,精准预测既存用户复购情况,并据此指导客户关系管理策略及营销策略,提高营销转化率,降低相关运营成本;基于客户购买行为数据,精准预测客户对商品的复购行为,在满足客户实际有效需求的同时可以降低企业沟通成本;通过数据动态指导企业经营策略,数据推动决策、辅助实现产品营销目标,最终达到将合适的产品通过智能化的方式推荐给合适的用户的目标。
附图说明
图1为本发明的方法流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。
除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
如图1所示,本实施例公开了一种非合同场景下基于RF-LightGBM融合模型的客户复购预测方法,包括如下步骤:
(1)获取用户的历史购买记录数据,对其进行预处理,提取特征。所述历史购买记录数据是已经存在的数据。所述提取特征包括:最近购买时间(R)、购买频次(F)、购买总金额(M)、关系持续时间(S)、购买间隔(T)。
(2)使用SMOTE-ENN方法对经过特征提取后的数据进行样本均衡,得到模型训练集。对原始样本集各类别样本采用多次有放回抽样法,组成测试样本。
(3)利用TPE优化算法对训练样本数据进行训练,在指定的弱分类器超参数空间中对弱分类器进行迭代优化。
(4)通过对各弱分类器赋予相同权重,进行集成学习得到强分类器,并得到关于产品推荐、复购行为复测的最终结果。
本实施例中,预处理的步骤包括:为了便于计算机处理与用户标签,将字符型转换为数值型数据,将数值型数据转换为日期型数据。提取特征包括最近购买时间(R)、购买频次(F)、购买总金额(M)、关系持续时间(S)、购买间隔(T):
a)R:客户对本商品的最近一次消费时间,形式如下:
R=Tlast_time-Tplast_time
其中Tlast_time表示参考时间段段尾时间,Tplast_time表示参考时间段内客户对该商品最后一次订单交易时间。
b)F:客户在观察期对本产品的购买次数。
c)M:客户对本商品的购买总金额,形式如下:
其中n表示参考时间段内客户总共消费的次数,M表示客户单次消费的金额。
d)S:指客户在参考时间内发生的第一次交易至最后一次交易的间隔时间,形式如下:
S=Tplast_time-Tpfirst_time
其中Tplast_time表示参考时间段内客户对该商品最后一次订单交易时间,Tpfirst_time表示参考时间段内客户对该商品第一次订单交易时间。
e)T:为客户一定时期内的平均交易时间间隔,形式如下:
预处理与特征提取后对不平衡样本的处理可采用多种方法,本发明提出采用SMOTE-ENN方法,使用SMOTE-ENN方法的优点在于,对只有少量正样本的二分类问题具有很好的效果,经过不同方法的对比,SMOTE-ENN方法表现更佳。SMOTE-ENN方法步骤如下:
(1)SMOTE方法(Synthetic Minority Oversampling Technique):
设A表示少数类,任取Xi∈A,以欧氏距离为标准计算它到少数类样本集A中所有样本的距离,得到Xi的k个近邻样本,在这个最近邻样本中随机选择一个样本,即为Xij(j=1,2,...,n);在Xi与Xij(j=1,2,...,n)之间进行随机线性插值,构造新的少数类样本Yj:
Yj=Xi+rand(0,1)×(Xij-Xi)
式中,rand(0,1)表示区间(0,1)内的一个随机数。
(2)ENN方法(Edited KNN)
对SMOTE方法生成的数据集ND中的每一个样本使用K近邻(K=5)法预测,若预测结果和实际类别标签不同则剔除该样本。选用欧式距离作为KNN算法的度量公式,形式如下:
式中,x,y分别代表两个不同用户,i代表特征编号。
指定弱分类器的超参数配置空间,在SMOTE-ENN方法构建的样本集上采用TPE优化算法对指定弱分类器参数空间进行迭代优化,其优化公式为:
x*=arg minx∈χF(x)
式中,F(x)代表弱学习器的目标函数;x*是F(x)取得最好结果时的参数。
TPE算法密度定义为:
式中,l(x)由观测值{xi}的目标函数F(x)小于y*的密度组成,g(x)由观测值{xi}的目标函数F(x)大于等于y*的密度组成。使用y*作为观测值y的分位点γ。得到期望提高(Expected Improvement,EI)为:
所述随机森林模型输出结果为所有决策树的概率取平均,其数学表现形式为:
其中,Ntree为决策树的总数,hi为第i颗决策树,P(x|y)表示预测样本x属于类别y的概率。
所述LightGBM模型亦使用上述方法输出分类概率。
对RF模型、Light GBM模型赋给相同权重,在其预测概率基础上使用软投票(SoftVoting)方法进行集成,其数学表现形式为:
PSoft Voting=(PRF+PLightGBM)/2
其中,PSoft Voting指软投票融合模型的预测概率,PRF,PLightGBM分别表示随机森林、LightGBM模型的预测概率,Result表示融合模型的预测结果,1表示属于复购型用户,0表示属于未复购型用户。根据测试,本发明阈值threshold设定为0.5,大于0.5预测标签为1,小于0.5预测标签为0,得到预测矩阵
以上便可实现对客户复购行为的预测。
根据所述最终结果,向用户的终端设备推送产品信息和/或向管理***发送复购行为预测结果。
本发明性能度量:目前算法使用准确率P、召回率R和F1值作为评价指标,通过本发明中数据预处理方法的实施,进行上述指标计算,利用上述所求得标签矩阵计算评价指标,计算公式为:
本发明在非合同场景下企业多渠道营销过程中均有良好表现,以超市电销为例,应用***后,可以大幅提高电销转化率,促进产生更多交易。对于企业来说,能实现提升营销导向性、增加销售成功率、增加成单量及交易金额、减少人员成本等效果。数据集上的表现,具体来说:(1)SMOTE-ENN生成的训练集上,模型预测准确率98.73%,召回率99.09%,F1值0.9874;(2)真实样本组成的验证集合上,模型预测准确率87.13%,召回率95.15%,F1值0.8587;(3)结果均优于RF、LightGBM单一模型预测性能。
本发明通过改进经典RFM模型从客户历史购买记录这一显示反馈中提炼用户行为特征组成样本集,解决了现有技术中非合同场景下不具有大量隐式反馈的问题;本发明通过SMOTE-ENNN样本平衡方法,有效解决了现有技术中数据集数据类别不均衡的问题;实施例结果表明,本发明的方法具有良好的预测性能与实际应用价值。
Claims (10)
1.一种非合同场景下基于RF-LightGBM融合模型的客户复购预测方法,其特征在于,包括如下步骤:
获取用户的历史购买记录数据,对其进行预处理,并提取特征;
使用样本均衡方法对经过特征提取后的数据进行平衡,得到均衡后的样本;
利用优化算法对训练样本数据进行训练,在指定的弱分类器超参数空间中对弱分类器进行迭代优化;
通过对各弱分类器赋予相同权重,进行集成学习得到强分类器;
使用强分类器进行预测,得到关于产品推荐、复购行为预测的最终结果;
根据所述最终结果,向用户的终端设备推送产品信息和/或向管理***发送复购行为预测结果。
2.根据权利要求1所述的非合同场景下基于RF-LightGBM融合模型的客户复购预测方法,其特征在于,所述提取特征包括:
最近购买时间、购买频次、购买总金额、关系持续时间、购买间隔。
3.根据权利要求1所述的非合同场景下基于RF-LightGBM融合模型的客户复购预测方法,其特征在于,所述样本均衡方法包括:
先使用SMOTE过采样方法对所述提取特征的少数类样本进行生成,再使用ENN(EditedKNN)方法对生成样本进行判断,若预测结果和实际类别标签不同则剔除该样本,得到均衡后的样本。
4.根据权利要求1所述的非合同场景下基于RF-LightGBM融合模型的客户复购预测方法,其特征在于,所述优化算法包括:
使用TPE(Tree-structured Parzen Estimator)树状Parzen估计优化算法对模型超参数进行优化,在最优超参数情况下进行模型训练。
7.根据权利要求1所述的非合同场景下基于RF-LightGBM融合模型的客户复购预测方法,其特征在于,基于复购行为预测与复购概率预测作为产品推荐指导。
8.一种非合同场景下基于RF-LightGBM融合模型的客户复购预测装置,其特征在于,包括:
获取模块,获取用户的历史购买记录数据,对其进行预处理,并提取特征;
平衡模块,使用样本均衡方法对经过特征提取后的数据进行平衡,得到均衡后的样本;
优化训练模块,利用优化算法对训练样本数据进行训练,在指定的弱分类器超参数空间中对弱分类器进行迭代优化;
集成学习模块,通过对各弱分类器赋予相同权重,进行集成学习得到强分类器;
预测模块,使用强分类器进行预测,得到关于产品推荐、复购行为预测的最终结果;
推送模块,根据所述最终结果,向用户的终端设备推送产品信息。
9.一种电子设备,其特征在于:
包括处理器,以及存储器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令从而执行如权利要求1-7任一项所述的非合同场景下基于RF-LightGBM融合模型的客户复购预测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:该程序被处理器执行时实现如权利要求1-7中任一所述的非合同场景下基于RF-LightGBM融合模型的客户复购预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110637643.7A CN113469730A (zh) | 2021-06-08 | 2021-06-08 | 一种非合同场景下的基于RF-LightGBM融合模型的客户复购预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110637643.7A CN113469730A (zh) | 2021-06-08 | 2021-06-08 | 一种非合同场景下的基于RF-LightGBM融合模型的客户复购预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113469730A true CN113469730A (zh) | 2021-10-01 |
Family
ID=77869309
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110637643.7A Pending CN113469730A (zh) | 2021-06-08 | 2021-06-08 | 一种非合同场景下的基于RF-LightGBM融合模型的客户复购预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113469730A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114049155A (zh) * | 2021-11-17 | 2022-02-15 | 浙江华坤道威数据科技有限公司 | 基于大数据分析的营销运营方法、*** |
CN114511330A (zh) * | 2022-04-18 | 2022-05-17 | 山东省计算中心(国家超级计算济南中心) | 一种基于改进的cnn-rf的以太坊庞氏骗局检测方法及*** |
CN114549071A (zh) * | 2022-02-18 | 2022-05-27 | 上海钧正网络科技有限公司 | 一种营销策略的确定方法、装置、计算机设备及存储介质 |
CN114863341A (zh) * | 2022-05-17 | 2022-08-05 | 济南大学 | 一种在线课程学习监督方法及*** |
CN115204537A (zh) * | 2022-09-17 | 2022-10-18 | 华北理工大学 | 基于Bagging的学生成绩预测方法 |
CN117593044A (zh) * | 2024-01-18 | 2024-02-23 | 青岛网信信息科技有限公司 | 一种双角度的营销活动效果预测方法、介质及*** |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107016569A (zh) * | 2017-03-21 | 2017-08-04 | 聚好看科技股份有限公司 | 一种网络产品的目标用户账号获取方法及装置 |
CN107294993A (zh) * | 2017-07-05 | 2017-10-24 | 重庆邮电大学 | 一种基于集成学习的web异常流量监测方法 |
WO2018069817A1 (en) * | 2016-10-10 | 2018-04-19 | Tata Consultancy Services Limited | System and method for predicting repeat behavior of customers |
CN108171530A (zh) * | 2017-12-06 | 2018-06-15 | 口碑(上海)信息技术有限公司 | 一种用于客单价和复购率的提升方法及装置 |
CN108520469A (zh) * | 2018-06-19 | 2018-09-11 | 南京新贝金服科技有限公司 | 一种基于电商平台的用户重购行为分析方法 |
CN108776922A (zh) * | 2018-06-04 | 2018-11-09 | 北京至信普林科技有限公司 | 基于大数据的理财产品推荐方法及装置 |
CN110210913A (zh) * | 2019-06-14 | 2019-09-06 | 重庆邮电大学 | 一种基于大数据的商家回头客预测方法 |
CN110322085A (zh) * | 2018-03-29 | 2019-10-11 | 北京九章云极科技有限公司 | 一种客户流失预测方法和装置 |
CN110599336A (zh) * | 2018-06-13 | 2019-12-20 | 北京九章云极科技有限公司 | 一种金融产品购买预测方法及*** |
CN110956497A (zh) * | 2019-11-27 | 2020-04-03 | 桂林电子科技大学 | 一种电子商务平台用户重复购买行为预测方法 |
CN111008871A (zh) * | 2019-12-10 | 2020-04-14 | 重庆锐云科技有限公司 | 一种房地产复购客户跟进数量计算方法、装置及存储介质 |
CN111045716A (zh) * | 2019-11-04 | 2020-04-21 | 中山大学 | 一种基于异构数据的相关补丁推荐方法 |
CN111899055A (zh) * | 2020-07-29 | 2020-11-06 | 亿达信息技术有限公司 | 大数据金融场景下的基于机器学习和深度学习的保险客户复购预测方法 |
-
2021
- 2021-06-08 CN CN202110637643.7A patent/CN113469730A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018069817A1 (en) * | 2016-10-10 | 2018-04-19 | Tata Consultancy Services Limited | System and method for predicting repeat behavior of customers |
CN107016569A (zh) * | 2017-03-21 | 2017-08-04 | 聚好看科技股份有限公司 | 一种网络产品的目标用户账号获取方法及装置 |
CN107294993A (zh) * | 2017-07-05 | 2017-10-24 | 重庆邮电大学 | 一种基于集成学习的web异常流量监测方法 |
CN108171530A (zh) * | 2017-12-06 | 2018-06-15 | 口碑(上海)信息技术有限公司 | 一种用于客单价和复购率的提升方法及装置 |
CN110322085A (zh) * | 2018-03-29 | 2019-10-11 | 北京九章云极科技有限公司 | 一种客户流失预测方法和装置 |
CN108776922A (zh) * | 2018-06-04 | 2018-11-09 | 北京至信普林科技有限公司 | 基于大数据的理财产品推荐方法及装置 |
CN110599336A (zh) * | 2018-06-13 | 2019-12-20 | 北京九章云极科技有限公司 | 一种金融产品购买预测方法及*** |
CN108520469A (zh) * | 2018-06-19 | 2018-09-11 | 南京新贝金服科技有限公司 | 一种基于电商平台的用户重购行为分析方法 |
CN110210913A (zh) * | 2019-06-14 | 2019-09-06 | 重庆邮电大学 | 一种基于大数据的商家回头客预测方法 |
CN111045716A (zh) * | 2019-11-04 | 2020-04-21 | 中山大学 | 一种基于异构数据的相关补丁推荐方法 |
CN110956497A (zh) * | 2019-11-27 | 2020-04-03 | 桂林电子科技大学 | 一种电子商务平台用户重复购买行为预测方法 |
CN111008871A (zh) * | 2019-12-10 | 2020-04-14 | 重庆锐云科技有限公司 | 一种房地产复购客户跟进数量计算方法、装置及存储介质 |
CN111899055A (zh) * | 2020-07-29 | 2020-11-06 | 亿达信息技术有限公司 | 大数据金融场景下的基于机器学习和深度学习的保险客户复购预测方法 |
Non-Patent Citations (9)
Title |
---|
JAMES BERGSTRA: "Algorithms for hyper-parameter optimization", ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS, 31 December 2011 (2011-12-31), pages 1 * |
JAMES BERGSTRA: "Algorithms for hyper-parameter optimization", ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS, pages 1 * |
JUN WU: "User Value Identification Based on Improved RFM Model and -Means++ Algorithm for Complex Data Analysis", WIRELESS COMMUNICATIONS AND MOBILE COMPUTING * |
季晨雨;: "不平衡数据分类研究及在银行营销中的应用", 山西电子技术, no. 05 * |
张李义;李一然;文璇;: "新消费者重复购买意向预测研究", 数据分析与知识发现, no. 11 * |
张浩;陈龙;魏志强: "基于数据增强和模型更新的异常流量检测技术", 信息网络安全, no. 02, 10 February 2020 (2020-02-10), pages 66 * |
张浩等: "基于数据增强和模型更新的异常流量检测技术", 信息网络安全, pages 66 * |
杨霞霞;苏锋;黄戌霞;: "基于改进随机森林算法的不平衡数据分类方法研究", 网络安全技术与应用, no. 10 * |
陶新民等: "不均衡数据SVM分类算法及其应用", 31 October 2011, 黑龙江科学技术出版社, pages: 43 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114049155A (zh) * | 2021-11-17 | 2022-02-15 | 浙江华坤道威数据科技有限公司 | 基于大数据分析的营销运营方法、*** |
CN114049155B (zh) * | 2021-11-17 | 2022-08-19 | 浙江华坤道威数据科技有限公司 | 基于大数据分析的营销运营方法、*** |
CN114549071A (zh) * | 2022-02-18 | 2022-05-27 | 上海钧正网络科技有限公司 | 一种营销策略的确定方法、装置、计算机设备及存储介质 |
CN114511330A (zh) * | 2022-04-18 | 2022-05-17 | 山东省计算中心(国家超级计算济南中心) | 一种基于改进的cnn-rf的以太坊庞氏骗局检测方法及*** |
CN114863341A (zh) * | 2022-05-17 | 2022-08-05 | 济南大学 | 一种在线课程学习监督方法及*** |
CN114863341B (zh) * | 2022-05-17 | 2024-05-31 | 济南大学 | 一种在线课程学习监督方法及*** |
CN115204537A (zh) * | 2022-09-17 | 2022-10-18 | 华北理工大学 | 基于Bagging的学生成绩预测方法 |
CN117593044A (zh) * | 2024-01-18 | 2024-02-23 | 青岛网信信息科技有限公司 | 一种双角度的营销活动效果预测方法、介质及*** |
CN117593044B (zh) * | 2024-01-18 | 2024-05-31 | 青岛网信信息科技有限公司 | 一种双角度的营销活动效果预测方法、介质及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113469730A (zh) | 一种非合同场景下的基于RF-LightGBM融合模型的客户复购预测方法及装置 | |
CN108648074B (zh) | 基于支持向量机的贷款评估方法、装置及设备 | |
US11663493B2 (en) | Method and system of dynamic model selection for time series forecasting | |
CN111062757B (zh) | 基于多路径寻优匹配的信息推荐方法及*** | |
CN110503531B (zh) | 时序感知的动态社交场景推荐方法 | |
CN109636482B (zh) | 基于相似度模型的数据处理方法及*** | |
CN107403345A (zh) | 畅销商品预测方法及***、存储介质及电子终端 | |
CN112418653A (zh) | 一种基于机器学习算法的携号转网潜客识别***及方法 | |
Chitra et al. | Customer retention in banking sector using predictive data mining technique | |
CN110826886A (zh) | 一种基于聚类算法和主成分分析的电力客户画像构建方法 | |
CN111949887A (zh) | 物品推荐方法、装置及计算机可读存储介质 | |
CN112785441B (zh) | 数据处理方法、装置、终端设备及存储介质 | |
CN112417294A (zh) | 一种基于神经网络挖掘模型的业务智能推荐方法 | |
CN110147389A (zh) | 帐号处理方法和装置、存储介质及电子装置 | |
CN115204985A (zh) | 购物行为预测方法、装置、设备及存储介质 | |
CN116187808A (zh) | 一种基于虚拟电厂用户-套餐标签画像的电力套餐推荐方法 | |
CN114861050A (zh) | 一种基于神经网络的特征融合推荐方法及*** | |
CN111861679A (zh) | 一种基于人工智能的商品推荐方法 | |
CN117314593A (zh) | 一种基于用户行为分析的保险项目推送方法及*** | |
CN111506813A (zh) | 一种基于用户画像的遥感信息精准推荐方法 | |
CN112150179A (zh) | 一种信息推送方法和装置 | |
EP3493082A1 (en) | A method of exploring databases of time-stamped data in order to discover dependencies between the data and predict future trends | |
CN115293867A (zh) | 财务报销用户画像优化方法、装置、设备及存储介质 | |
US20230230143A1 (en) | Product recommendation system, product recommendation method, and recordingmedium storing product recommendation program | |
CN113407827A (zh) | 基于用户价值分类的信息推荐方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |