CN109509033B - 一种消费金融场景下的用户购买行为大数据预测方法 - Google Patents

一种消费金融场景下的用户购买行为大数据预测方法 Download PDF

Info

Publication number
CN109509033B
CN109509033B CN201811535802.7A CN201811535802A CN109509033B CN 109509033 B CN109509033 B CN 109509033B CN 201811535802 A CN201811535802 A CN 201811535802A CN 109509033 B CN109509033 B CN 109509033B
Authority
CN
China
Prior art keywords
user
model
features
module
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811535802.7A
Other languages
English (en)
Other versions
CN109509033A (zh
Inventor
王进
陈瑀
许景益
欧阳卫华
孙开伟
刘彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiang Chunyan
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201811535802.7A priority Critical patent/CN109509033B/zh
Publication of CN109509033A publication Critical patent/CN109509033A/zh
Application granted granted Critical
Publication of CN109509033B publication Critical patent/CN109509033B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明请求保护一种消费金融场景下的用户购买行为大数据预测方法,包括:101对用户的APP操作行为日志数据进行预处理操作;102对用户的APP操作行为日志数据进行特征工程操作;103对构建特征完成的样本集进行特征选择;104建立2个机器学习模型,并进行模型融合操作;105通过建立的模型,根据用户个人属性及其历史APP操作行为日志数据对用户在未来一个周是否购买APP上的优惠券进行预测。本发明为商家广告精准投放,个性化优惠信息推荐提供有力的决策支持。

Description

一种消费金融场景下的用户购买行为大数据预测方法
技术领域
本发明属于机器学习、自然语言处理、大数据分析与处理技术领域,尤其基于多模型融合消费金融场景下用户购买预测。
背景技术
当前网络购物的兴起催生出了许多的生活服务类APP,在消费金融场景下其往往提供了手机商城、饭票影票、在线客服、基金理财、办卡开卡、额度管理、消费信贷、账单管理等全方位功能,同时实现了LBS查询服务和手机远程支付,全面满足并提升了持卡人对金融和日常生活需求的消费体验。
发卡银行在不断拓展业务与场景的同时,也希望通过数据积累与数据驱动,主动捕捉用户价值信息与消费需求,发挥数据价值,给用户提供更加精准的服务。以购物为例,相比于传统的实体店铺和传统电商平台,在消费金融场景下更能将用户线下的资产情况,以及线上的网络消费行为进行资料整合,来进行综合分析,以便为用户提供更好的服务体验,为金融机构以及平台商家提供更为精准的决策服务。
随着人工智能和大数据等技术不断渗透,依靠金融科技主动收集、分析、整理各类金融数据,为用户提供更优质的服务以及为平台商家提供决策支持,并且进行精准营销,成为解决消费金融场景下主动捕捉用户信息与消费需求,发挥数据价值的有效途径。
发明内容
本发明旨在解决以上现有技术的问题。提出了一种为商家广告精准投放,个性化优惠信息推荐提供有力的决策支持的消费金融场景下的用户购买行为大数据预测方法。本发明的技术方案如下:
一种消费金融场景下的用户购买行为大数据预测方法,其包括以下步骤:
101.对用户的APP操作行为日志数据进行包括对OCC_TIM字段进行切割在内的预处理操作;
102.根据对用户历史APP操作行为日志数据的分析,对训练集和测试集进行特征工程构建,所述对特征工程进行构建是指得到用户历史APP操作行为日志数据构建离散特征、基础统计特征、时序特征、词袋模型特征和词向量模型特征;
103.通过特征选择法对步骤101得到的特征进行降维;
104.建立2个机器学习模型,分别是.xgboost模型和lightgbm模型,.xgboost模型用于预测出结果1,lightgbm模型用于预测出结果2,并将两个机器学习模型基于模型相关性约束排名的融合操作;
105.通过融合操作建立的模型,根据用户个人属性及其历史APP操作行为日志数据对用户在未来一个周是否购买APP上的优惠券进行预测。
进一步的,所述步骤101对用户的APP操作行为日志数据进行预处理操作具体步骤为:
针对于训练集和测试集中的OCC_TIM字段,该字段表示用户行为发生的具体时间,需要事先将它切割为三列分别是:年、月、日。
进一步的,所述步骤102构建离散特征、基础统计特征、时序特征、词袋模型特征和词向量模型特征,具体包括:
1021.离散特征:对于EVT_LBL点击模块字段,对其进行拆分,分为一级模块、二级模块、三级模块,再分别对其离散,每一个模块拥有一列值,这些值是统计了用户对于该模块的点击量;对于TCH_TYP事件类型字段,也做同样的处理,以反映出用户喜好使用的设备类型;
1022.基础统计特征:用户总的点击次数、用户点击天数、用户每天平均点击量、用户各种行为类型次数对用户总次数的占比、用户在一周各天对用户总次数的占比、用户在各个小时对用户总次数的占比;
1023.时序特征:用户点击的时间间隔、用户最大连续点击天数、用户最后一次点击距离最后一天的间隔;对于最后一天的统计包括:总点击,各用户对各一级模块,各用户对二级模块,各用户对三级模块,用户在各小时,用户对各事件类型;对于最后二天的统计包括:总点击,各用户对各一级模块,各用户对二级模块,各用户对三级模块,用户在各小时,用户对各事件类型;在最后一天用户的各种行为类型的占比、在最后二天用户的各种行为类型的占比;前十天,中间十天,最后十天分别统计:用户总次数,用户对各一级模块,用户对各二级模块,用户对各三级模块,用户在各个小时的统计,用户对各个事件的统;分别统计4个区间的用户出现总次数、用户对各个事件的点击总次数,然后再用后一个区间的统计值减去前一个区间的统计值;
1024.词袋模型特征:每个用户在每个一级模块出现的次数、每个用户在每个二级模块出现的次数、每个用户在每个三级模块出现的次数;
1025.词向量模型特征:通过word2vec,得到所有模块的词向量,然后计算每个用户点击过模块的均值向量作为特征;统计一个事先指定窗口大小为5的word共现次数,以word周边的共现词的次数作为当前word的向量,得到一个共现矩阵,然后再对该共现矩阵使用SVD奇异值分解进行降维以及降低稀疏性,得到矩阵U,最后对U进行归一化得到一个稠密矩阵作为词向量特征。
进一步的,所述步骤103对构建特征完成的样本集进行特征选择,具体步骤为:首先计算出每一个特征的方差,然后将方差低于阈值0.5的特征删除;然后将剩余特征分别输入算法xgboost、lightgbm、catboost、GBDT、RF、SVM,输出每个特征的特征重要性,以这些输出的特征重要性为基础构建相关矩阵A,再利用PCA将矩阵A降至指定维度500,完成特征选择。
进一步的,所述步骤104建立2个机器学习模型,并进行模型融合操作具体步骤为:
1041.xgboost模型:主要设置以下参数'max_depth':3、'objective':'rank:pairwise'、'scale_pos_weight':0.7、'eta':0.02、'min_child_weight':18、'colsample_bytree':0.8、'subsample':0.8;
1042.lightgbm模型:主要设置以下参数'boosting_type':'gbdt'、'num_leaves':31、'learning_rate':0.01、'feature_fraction':0.8、'bagging_fraction':0.8;
1043.多模型融合:采用基于模型相关性约束的排名融合方法,首先通过两个模型输出的特征重要性,将这两组特征重要性看做两组向量,计算其皮尔逊相关系数h;然后在排名融合的机制中加入这一系数,用于约束模型权重对融合结果的影响,当h越大,即两个模型越相关时,权重系数的影响就会增大,当h越小,即两个模型越不相关,权重系数的影响就会减小,其遵循公式:
∑|0.5*(1-h)-(weighti*h)|/ranki公式(1)
其中weighti为第i个单模型根据验证表现得出的权重系数,它根据各个模型验证得分的比例来计算得到,ranki为样本在第i个模型中的预测值排名,即该样本的预测为正的概率值在整个数据集下的升序排名。
进一步的,所述步骤105通过建立的模型,根据用户个人属性及其历史APP操作行为日志数据对用户在未来一个周是否购买APP上的优惠券进行预测具体步骤为:
融合方式采用基于模型相关性约束的排名融合,其中ranki为第i个模型的rank排序,weighti为第i个模型AUC值所占权重,为了让每个将进行融合的模型都起到一定作用,而不受个别效果突出模型影响过大,首先对
Figure BDA0001906825750000041
的值取对数进行平滑,再将各模型求和得到的score用于计算AUC得分:
Figure BDA0001906825750000042
当score大于0.9的时候,说明该条测试数据对应的用户很大可能会在未来一周购买APP上的优惠券。
本发明的优点及有益效果如下:
本发明1025提出一种利用SVD奇异值分解对词语共现矩阵进行矩阵降维以及降低稀疏性,来得到词向量特征的方法,更好反映出用户习惯,提高模型效率。
本发明103提出一种链式特征过滤法来进行特征选择,利用了特征方差、不同模型输出特征重要性、PCA降维等方式来进行特征的精简,同时兼顾了“特征是否发散”,“特征与目标的相关性”这两个特征选择最关心的方面,使得模型具有更佳的泛化性能。
本发明1043提出的基于模型相关性约束的排名融合方法,利用了皮尔逊相关系数来反映两个不同模型之间的差异性,然后在排名融合的机制中加入这一系数,用于约束模型权重系数对融合结果的影响,避免了模型对权重系数的过度依赖,从而提高模型精度与稳定性。
附图说明
图1是本发明优选实施例提供的一种消费金融场景下的用户购买行为大数据预测方法的流程图。
图2为本发明优选实施例提供的一种消费金融场景下的用户购买行为大数据预测方法的基于词频统计的词向量特征提取方法的流程图。
图3为本发明优选实施例提供的一种消费金融场景下的用户购买行为大数据预测方法中链式特征过滤法流程图。
图4为本发明优选实施例提供的一种消费金融场景下的用户购买行为大数据预测方法中基于模型相关性约束的排名融合示例图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
本发明解决上述技术问题的技术方案是:
参考图1,图1为本发明实施例一提供一种消费金融场景下的用户购买行为大数据预测方法的流程图,具体包括:
101.对用户的APP操作行为日志数据进行预处理操作,具体如下:针对于训练集和测试集中的OCC_TIM字段,该字段表示用户行为发生的具体时间,其格式为“2018-03-2216:31:44”,为了便于后续操作需要事先将它切割为三列分别是:年、月、日。由于时分秒信息没法发挥作用,所以这里直接进行舍弃。
102.对用户的APP操作行为日志数据进行特征工程操作,具体如下:根据对用户历史APP操作行为日志数据的分析,对训练集和测试集进行特征工程构建,所述对特征工程进行构建是指对用户历史APP操作行为日志数据构建离散特征、基础统计特征、时序特征、词袋模型特征和词向量模型特征。
1021.离散特征:对于EVT_LBL(点击模块)字段,因为其为点击模块名称,所以我们对其进行拆分,分为了一级模块、二级模块、三级模块,再分别对其离散,但并不是简单的one-hot(独热编码),每一个模块拥有一列值,这些值是统计了用户对于该模块的点击量,这样可以清晰的刻画出用户的点击行为习惯,对于TCH_TYP(事件类型)字段,由于数据也是离散型,所以我们也做了同样的处理,以反映出用户喜好使用的设备类型。
1022.基础统计特征:用户总的点击次数、用户点击天数、用户每天平均点击量、用户各种行为类型次数对用户总次数的占比、用户在一周各天对用户总次数的占比、用户在各个小时对用户总次数的占比。
1023.时序特征:用户点击的时间间隔、用户最大连续点击天数、用户最后一次点击距离最后一天的间隔;对于最后一天的统计(总点击,各用户对各一级模块,各用户对二级模块,各用户对三级模块,用户在各小时,用户对各事件类型);对于最后二天的统计(总点击,各用户对各一级模块,各用户对二级模块,各用户对三级模块,用户在各小时,用户对各事件类型);在最后一天用户的各种行为类型的占比、在最后二天用户的各种行为类型的占比;前十天,中间十天,最后十天分别统计(用户总次数,用户对各一级模块,用户对各二级模块,用户对各三级模块,用户在各个小时的统计,用户对各个事件的统计);分别统计4个区间(1-7,1-14,1-21,1-28)的用户出现总次数、用户对各个事件的点击总次数,然后再用后一个区间的统计值减去前一个区间的统计值。
1024.词袋模型特征:每个用户在每个一级模块出现的次数、每个用户在每个二级模块出现的次数、每个用户在每个三级模块出现的次数。
1025.词向量模型特征:首先是基于神经网络隐藏层输出得到词向量。通过word2vec,得到所有模块的词向量,然后计算每个用户点击过的模块的均值向量作为特征;其次是基于词频统计得到词向量。统计一个事先指定窗口大小为5的word共现次数,以word周边的共现词的次数作为当前word的向量,得到一个共现矩阵,然后再对该共现矩阵使用SVD(奇异值分解)进行降维以及降低稀疏性,得到矩阵U,最后对U进行归一化得到一个稠密矩阵作为词向量特征。其过程见图2。
103.对构建特征完成的样本集进行特征选择,具体如下:在102特征工程部分,构建了一系列离散特征、基础统计特征、时序特征、词袋模型特征和词向量模型特征,特征总数高达两千多维,高维特征一方面可能会导致维数灾难,另一方面很容易导致过拟合。从这一点出发,通过特征选择来降低特征维度。考虑到特征特征是否发散以及特征与目标的相关性,采用一种链式特征过滤法来进行特征选择,首先计算出每一个特征的方差,然后将方差低于阈值0.5的特征删除。然后将剩余特征分别输入算法xgboost、lightgbm、catboost、GBDT、RF、SVM,输出每个特征的特征重要性,以这些输出的特征重要性为基础构建相关矩阵A,再利用PCA将矩阵A降至指定维度500,即完成了特征选择。链式特征过滤法的具体流程见图3。
104.建立2个机器学习模型,并进行模型融合操作,具体如下:
1041.xgboost模型:主要设置以下参数'max_depth':3、'objective':'rank:pairwise'、'scale_pos_weight':0.7、'eta':0.02、'min_child_weight':18、'colsample_bytree':0.8、'subsample':0.8。
1042.lightgbm模型:主要设置以下参数'boosting_type':'gbdt'、'num_leaves':31、'learning_rate':0.01、'feature_fraction':0.8、'bagging_fraction':0.8。
1043.多模型融合:我们采用的方式是基于模型相关性约束的排名融合。具体说就是,先通过两个模型的算法输出的特征重要性,将这两组特征重要性看做两组向量,计算其皮尔逊相关系数h。然后在排名融合的机制中加入这一系数,用于约束模型权重对融合结果的影响。当h越大,即两个模型越相关时,权重系数的影响就会增大。当h越小,即两个模型越不相关,权重系数的影响就会减小。融合示例见图4。其遵循公式:
∑|0.5*(1-h)-(weighti*h)|/ranki公式(1)
其中weighti为第i个单模型根据验证表现得出的权重系数,它根据各个模型验证得分的比例来计算得到。ranki为样本在第i个模型中的预测值排名,即该样本的预测为正的概率值在整个数据集下的升序排名。
105.通过建立的模型,根据用户个人属性及其历史APP操作行为日志数据对用户在未来一个周是否购买APP上的优惠券进行预测,具体如下:根据权利要求6中所述的各模型,构建的框架主要实现两个模型的融合:融合方式采用基于模型相关性约束的排名融合,其中ranki为第i个模型的rank排序,weighti为第i个模型AUC值所占权重,为了让每个将进行融合的模型都起到一定作用,而不受个别效果突出模型影响过大,这里首先对
Figure BDA0001906825750000081
的值取对数进行平滑,再将各模型求和得到的score为最终AUC最终得分:
Figure BDA0001906825750000091
当score大于0.9的时候,说明该条测试数据对应的用户很大可能会在未来一周购买APP上的优惠券,为商家精准营销提供支持,也为提升用户体验提供帮助。
以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。

Claims (4)

1.一种消费金融场景下的用户购买行为大数据预测方法,其特征在于,包括以下步骤:
步骤101对用户的APP操作行为日志数据进行包括对OCC_TIM字段进行切割在内的预处理操作;
步骤102.根据对用户历史APP操作行为日志数据的分析,对训练集和测试集进行特征工程构建,所述对特征工程进行构建是指得到用户历史APP操作行为日志数据构建离散特征、基础统计特征、时序特征、词袋模型特征和词向量模型特征;
步骤103.通过特征选择法对步骤101得到的特征进行降维;
步骤104.建立2个机器学习模型,分别是.xgboost模型和lightgbm模型,.xgboost模型用于预测出结果1,lightgbm模型用于预测出结果2,并将两个机器学习模型基于模型相关性约束排名的融合操作;
步骤105.通过融合操作建立的模型,根据用户个人属性及其历史APP操作行为日志数据对用户在未来一个周是否购买APP上的优惠券进行预测
所述步骤103对构建特征完成的样本集进行特征选择,具体步骤为:首先计算出每一个特征的方差,然后将方差低于阈值0.5的特征删除;然后将剩余特征分别输入算法xgboost、lightgbm、catboost、GBDT、RF、SVM,输出每个特征的特征重要性,以这些输出的特征重要性为基础构建相关矩阵A,再利用PCA将矩阵A降至指定维度500,完成特征选择;
所述步骤104建立2个机器学习模型,并进行模型融合操作具体步骤为:
步骤1041.xgboost模型:主要设置以下参数'max_depth':3、'objective':'rank:pairwise'、'scale_pos_weight':0.7、'eta':0.02、'min_child_weight':18、'colsample_bytree':0.8、'subsample':0.8;
步骤1042.lightgbm模型:主要设置以下参数'boosting_type':'gbdt'、'num_leaves':31、'learning_rate':0.01、'feature_fraction':0.8、'bagging_fraction':0.8;
步骤1043.多模型融合:采用基于模型相关性约束的排名融合方法,首先通过两个模型输出的特征重要性,将这两组特征重要性看做两组向量,计算其皮尔逊相关系数h;然后在排名融合的机制中加入这一系数,用于约束模型权重对融合结果的影响,当h越大,即两个模型越相关时,权重系数的影响就会增大,当h越小,即两个模型越不相关,权重系数的影响就会减小,其遵循公式:
∑|0.5*(1-h)-(weighti*h)|/ranki公式   (1)
其中weighti为第i个单模型根据验证表现得出的权重系数,它根据各个模型验证得分的比例来计算得到,ranki为样本在第i个模型中的预测值排名,即该样本的预测为正的概率值在整个数据集下的升序排名。
2.根据权利要求1所述的消费金融场景下的用户购买行为大数据预测方法,其特征在于,所述步骤101对用户的APP操作行为日志数据进行预处理操作具体步骤为:
针对于训练集和测试集中的OCC_TIM字段,该字段表示用户行为发生的具体时间,需要事先将它切割为三列分别是:年、月、日。
3.根据权利要求1所述的消费金融场景下的用户购买行为大数据预测方法,其特征在于,所述步骤102构建离散特征、基础统计特征、时序特征、词袋模型特征和词向量模型特征,具体包括:
步骤1021.离散特征:对于EVT_LBL点击模块字段,对其进行拆分,分为一级模块、二级模块、三级模块,再分别对其离散,每一个模块拥有一列值,这些值是统计了用户对于该模块的点击量;对于TCH_TYP事件类型字段,也做同样的处理,以反映出用户喜好使用的设备类型;
步骤1022.基础统计特征:用户总的点击次数、用户点击天数、用户每天平均点击量、用户各种行为类型次数对用户总次数的占比、用户在一周各天对用户总次数的占比、用户在各个小时对用户总次数的占比;
1023.时序特征:用户点击的时间间隔、用户最大连续点击天数、用户最后一次点击距离最后一天的间隔;对于最后一天的统计包括:总点击,各用户对各一级模块,各用户对二级模块,各用户对三级模块,用户在各小时,用户对各事件类型;对于最后二天的统计包括:总点击,各用户对各一级模块,各用户对二级模块,各用户对三级模块,用户在各小时,用户对各事件类型;在最后一天用户的各种行为类型的占比、在最后二天用户的各种行为类型的占比;前十天,中间十天,最后十天分别统计:用户总次数,用户对各一级模块,用户对各二级模块,用户对各三级模块,用户在各个小时的统计,用户对各个事件的统;分别统计4个区间的用户出现总次数、用户对各个事件的点击总次数,然后再用后一个区间的统计值减去前一个区间的统计值;
步骤1024.词袋模型特征:每个用户在每个一级模块出现的次数、每个用户在每个二级模块出现的次数、每个用户在每个三级模块出现的次数;
步骤1025.词向量模型特征:通过word2vec,得到所有模块的词向量,然后计算每个用户点击过模块的均值向量作为特征;统计一个事先指定窗口大小为5的word共现次数,以word周边的共现词的次数作为当前word的向量,得到一个共现矩阵,然后再对该共现矩阵使用SVD奇异值分解进行降维以及降低稀疏性,得到矩阵U,最后对U进行归一化得到一个稠密矩阵作为词向量特征。
4.根据权利要求1所述的消费金融场景下的用户购买行为大数据预测方法,其特征在于,所述步骤105通过建立的模型,根据用户个人属性及其历史APP操作行为日志数据对用户在未来一个周是否购买APP上的优惠券进行预测具体步骤为:
融合方式采用基于模型相关性约束的排名融合,其中ranki为第i个模型的rank排序,weighti为第i个模型AUC值所占权重,为了让每个将进行融合的模型都起到一定作用,而不受个别效果突出模型影响过大,首先对
Figure FDA0004056338710000041
的值取对数进行平滑,再将各模型求和得到的score用于计算最终AUC得分:
Figure FDA0004056338710000042
当score大于0.9的时候,说明该条测试数据对应的用户很大可能会在未来一周购买APP上的优惠券。
CN201811535802.7A 2018-12-14 2018-12-14 一种消费金融场景下的用户购买行为大数据预测方法 Active CN109509033B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811535802.7A CN109509033B (zh) 2018-12-14 2018-12-14 一种消费金融场景下的用户购买行为大数据预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811535802.7A CN109509033B (zh) 2018-12-14 2018-12-14 一种消费金融场景下的用户购买行为大数据预测方法

Publications (2)

Publication Number Publication Date
CN109509033A CN109509033A (zh) 2019-03-22
CN109509033B true CN109509033B (zh) 2023-04-07

Family

ID=65752692

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811535802.7A Active CN109509033B (zh) 2018-12-14 2018-12-14 一种消费金融场景下的用户购买行为大数据预测方法

Country Status (1)

Country Link
CN (1) CN109509033B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109961191B (zh) * 2019-04-03 2022-06-03 北京奇艺世纪科技有限公司 一种优惠券发放方法及装置
CN110363582A (zh) * 2019-06-29 2019-10-22 上海淇馥信息技术有限公司 基于用户意愿的金融服务优惠信息推广方法、装置及电子设备
CN110414716B (zh) * 2019-07-03 2022-05-20 北京科技大学 一种基于LightGBM的企业失信概率预测方法及***
CN111738477B (zh) * 2019-08-01 2023-11-07 北方工业大学 基于深层特征组合的电网新能源消纳能力预测方法
CN110515904B (zh) * 2019-08-13 2022-04-29 北京达佳互联信息技术有限公司 媒体文件的质量预测模型训练方法、质量预测方法及装置
CN110782277A (zh) * 2019-10-12 2020-02-11 上海陆家嘴国际金融资产交易市场股份有限公司 资源处理方法、装置、计算机设备和存储介质
CN111178987B (zh) * 2020-04-10 2020-06-30 支付宝(杭州)信息技术有限公司 训练用户行为预测模型的方法和装置
CN112132209B (zh) * 2020-09-19 2024-05-31 北京智能工场科技有限公司 一种基于偏向性特征的属性预测方法
CN113763112A (zh) * 2021-02-25 2021-12-07 北京沃东天骏信息技术有限公司 一种信息推送方法及装置
CN112785095A (zh) * 2021-03-12 2021-05-11 北京顶象技术有限公司 贷款预测方法、装置、电子设备和计算机可读存储介质
CN114757103B (zh) * 2022-04-19 2023-03-17 河南大学 基于时空光梯度增强机的地表o3浓度估算方法
CN115239442B (zh) * 2022-09-22 2023-01-06 湖南快乐通宝小额贷款有限公司 一种互联网金融产品推广的方法及***和存储介质
CN115539026B (zh) * 2022-09-27 2023-11-14 西南石油大学 一种复杂储层水平井初期产量融合预测方法
CN117876015B (zh) * 2024-03-11 2024-05-07 南京数策信息科技有限公司 一种用户行为数据分析方法、装置及相关设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845731A (zh) * 2017-02-20 2017-06-13 重庆邮电大学 一种基于多模型融合的潜在换机用户发现方法
CN106845717A (zh) * 2017-01-24 2017-06-13 哈尔滨工业大学 一种基于多模型融合策略的能源效率评价方法
CN107506845A (zh) * 2017-07-07 2017-12-22 成都阜特科技股份有限公司 一种基于多模型融合的售电量预测方法及其***
CN107909433A (zh) * 2017-11-14 2018-04-13 重庆邮电大学 一种基于大数据移动电子商务的商品推荐方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002222409A (ja) * 2001-01-26 2002-08-09 Fuji Electric Co Ltd ニューラルネットワークの最適化学習方法
US20090132347A1 (en) * 2003-08-12 2009-05-21 Russell Wayne Anderson Systems And Methods For Aggregating And Utilizing Retail Transaction Records At The Customer Level
US8650079B2 (en) * 2004-02-27 2014-02-11 Accenture Global Services Limited Promotion planning system
US20150170175A1 (en) * 2009-01-21 2015-06-18 Truaxis, Inc. Method and system for identifying a cohort of users based on past shopping behavior and other criteria
KR101387898B1 (ko) * 2012-08-21 2014-04-22 주식회사 이베이코리아 인터넷을 이용한 전자상거래에서의 쇼핑이머니 관리서비스 방법 및 이를 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
WO2015161515A1 (en) * 2014-04-25 2015-10-29 Yahoo! Inc. Systems and methods for commercial query suggestion
CN104268648B (zh) * 2014-09-28 2018-01-12 福州大学 融合用户多种交互信息和用户主题信息的用户排名***
CN104899253B (zh) * 2015-05-13 2018-06-26 复旦大学 面向社会图像的跨模态图像-标签相关度学习方法
US10866987B2 (en) * 2015-07-31 2020-12-15 RCRDCLUB Corporation Evaluating performance of recommender system
US10726438B2 (en) * 2015-09-03 2020-07-28 Microsoft Technology Licensing, Llc Personalized contextual coupon engine
US20180322406A1 (en) * 2017-05-04 2018-11-08 Zestfinance, Inc. Systems and methods for providing machine learning model explainability information
CN107301562A (zh) * 2017-05-16 2017-10-27 重庆邮电大学 一种o2o优惠券使用大数据预测方法
CN107424007A (zh) * 2017-07-12 2017-12-01 北京京东尚科信息技术有限公司 一种构建电子券敏感度识别模型的方法和装置
CN107895283B (zh) * 2017-11-07 2021-02-09 重庆邮电大学 一种基于时间序列分解的商家客流量大数据预测方法
CN107832830A (zh) * 2017-11-17 2018-03-23 湖北工业大学 基于改进型灰狼优化算法的入侵检测***特征选择方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845717A (zh) * 2017-01-24 2017-06-13 哈尔滨工业大学 一种基于多模型融合策略的能源效率评价方法
CN106845731A (zh) * 2017-02-20 2017-06-13 重庆邮电大学 一种基于多模型融合的潜在换机用户发现方法
CN107506845A (zh) * 2017-07-07 2017-12-22 成都阜特科技股份有限公司 一种基于多模型融合的售电量预测方法及其***
CN107909433A (zh) * 2017-11-14 2018-04-13 重庆邮电大学 一种基于大数据移动电子商务的商品推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
冯健飞.基于深度神经网络的推荐***排序模型研究.《中国优秀硕士学位论文全文数据库 信息科技辑》.2019,(第undefined期), I138-1428. *
宋益多.基于用户特征的搜索广告点击率预测研究.《中国优秀硕士学位论文全文数据库 (信息科技辑)》.2018,(第undefined期),I138-3593. *

Also Published As

Publication number Publication date
CN109509033A (zh) 2019-03-22

Similar Documents

Publication Publication Date Title
CN109509033B (zh) 一种消费金融场景下的用户购买行为大数据预测方法
CN109977151B (zh) 一种数据分析方法及***
Thorleuchter et al. Analyzing existing customers’ websites to improve the customer acquisition process as well as the profitability prediction in B-to-B marketing
CN108665311B (zh) 一种基于深度神经网络的电商用户时变特征相似性计算推荐方法
CN109767318A (zh) 贷款产品推荐方法、装置、设备及存储介质
US20090132347A1 (en) Systems And Methods For Aggregating And Utilizing Retail Transaction Records At The Customer Level
CN109300039A (zh) 基于人工智能和大数据进行智能产品推荐的方法及***
CN109255651A (zh) 一种基于大数据的搜索广告转化智能预测方法
CN112418956A (zh) 一种金融产品的推荐方法及装置
CN110599336A (zh) 一种金融产品购买预测方法及***
US20200250185A1 (en) System and method for deriving merchant and product demographics from a transaction database
CN110880127A (zh) 消费水平的预测方法、装置、电子设备及存储介质
CN111429214B (zh) 一种基于交易数据的买卖双方匹配方法及装置
US20130173237A1 (en) Score fusion based on the gravitational force between two objects
Negi et al. Cryptocurrency Price Analysis using Deep Learning
Vaganov et al. Forecasting purchase categories with transition graphs using financial and social data
Rahman et al. A Classification Based Model to Assess Customer Behavior in Banking Sector.
CN115841345B (zh) 跨境大数据智能化分析方法、***以及存储介质
CN116800831A (zh) 一种业务数据推送方法、装置、存储介质及处理器
JP5603678B2 (ja) 需要予測装置及び需要予測方法
Leventhal Predictive Analytics for Marketers: Using Data Mining for Business Advantage
CN113706258B (zh) 基于组合模型的产品推荐方法、装置、设备及存储介质
CN113254775A (zh) 一种基于客户浏览行为序列的***产品推荐方法
CN115563176A (zh) 一种电子商务数据处理***及方法
Ehsani Customer churn prediction from Internet banking transactions data using an ensemble meta-classifier algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230802

Address after: Room 801, 85 Kefeng Road, Huangpu District, Guangzhou City, Guangdong Province

Patentee after: Yami Technology (Guangzhou) Co.,Ltd.

Address before: 400065 Chongwen Road, Nanshan Street, Nanan District, Chongqing

Patentee before: CHONGQING University OF POSTS AND TELECOMMUNICATIONS

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230815

Address after: Room 1502, No. 35, Lane 255, Wanping South Road, Xuhui District, Shanghai, 200030

Patentee after: Jiang Chunyan

Address before: Room 801, 85 Kefeng Road, Huangpu District, Guangzhou City, Guangdong Province

Patentee before: Yami Technology (Guangzhou) Co.,Ltd.

TR01 Transfer of patent right