CN111046076A - 一种银行用户行为数据的高效精准分析方法 - Google Patents

一种银行用户行为数据的高效精准分析方法 Download PDF

Info

Publication number
CN111046076A
CN111046076A CN201911235927.2A CN201911235927A CN111046076A CN 111046076 A CN111046076 A CN 111046076A CN 201911235927 A CN201911235927 A CN 201911235927A CN 111046076 A CN111046076 A CN 111046076A
Authority
CN
China
Prior art keywords
user behavior
model
data
behavior data
steps
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911235927.2A
Other languages
English (en)
Inventor
苏钰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Suoxinda Data Technology Co Ltd
Original Assignee
Shenzhen Suoxinda Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Suoxinda Data Technology Co Ltd filed Critical Shenzhen Suoxinda Data Technology Co Ltd
Priority to CN201911235927.2A priority Critical patent/CN111046076A/zh
Publication of CN111046076A publication Critical patent/CN111046076A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种银行用户行为数据的高效精准分析方法,涉及银行用户行为数据处理技术领域,解决现有银行***中的用户行为分析方法存在数据处理效率低,误差大,可靠性不佳等技术不足,步骤为:步骤1,数据清洗;步骤2,构建输入矩阵;步骤3,深度因子分解机建模,基于模型设置构建模型;步骤4,进行个性化推荐,将用户行为数据与模型拟合以得到各个用户对应的兴趣产品排名;模型拟合完成后预测用户对不同产品点击率,然后根据点击率进行排序,选出点击率较高的前n个产品以得到不同用户对不同产品的偏好信息。能获得用户与产品之间的二维交互关系,还可以获得其他信息之间的多维交互关系,点击率的预测准确度比现有技术得到了极大的增强。

Description

一种银行用户行为数据的高效精准分析方法
技术领域
本申请涉及银行用户行为数据处理技术领域,特别涉及一种银行用户行为数据的高效精准分析方法改进方面。
背景技术
随着大数据时代的到来,个性化推荐在当今社会显得越来越重要,其在银行金融行业有着巨大的作用以及发展潜力。而个性化推荐的关键在于可以对银行用户数据实现高效精准的分析。
然而银行现有的用户行为分析方法存在数据处理效率低,误差大,可靠性不佳等技术不足,造成该问题的根本原因在于银行现用于用户行为分析的方法较为简单,因而无法很好地挖掘用户与产品之间的交互关系,进而给出合适的分析结果。
银行现有的用户行为分析方法包括协同过滤,因子分解机,深度学习等方法,这些方法都存在一定的问题,例如协同过滤方法只能通过相似性确定推荐需求,因子分解机方法无法抓取高维交互作用,深度学习方法则对低维交互抓取效果不佳。
发明内容
综上所述,本发明的目的在于解决现有银行***中的用户行为分析方法存在数据处理效率低,误差大,可靠性不佳等技术不足,而提出一种银行用户行为数据的高效精准分析方法。
为解决本发明所提出的技术不足,采用的技术方案为:
一种银行用户行为数据的高效精准分析方法,其特征在于所述方法步骤为:
步骤1,数据清洗,对原始数据中的重复数据、异常数据和无效数据进行清除,纠正错误数据,根据分析数据分布情况,使用中位数或者平均值填补缺失值;
步骤2,构建输入矩阵,将原数据按照域分割转化为新的输入向量;
步骤3,深度因子分解机建模,基于模型设置构建模型;
步骤4,进行个性化推荐,将用户行为数据与模型拟合以得到各个用户对应的兴趣产品排名;模型拟合完成后预测用户对不同产品点击率,然后根据点击率进行排序,选出点击率较高的前n个产品以得到不同用户对不同产品的偏好信息。
作为对本发明技术方案进一步限定的技术方案包括有:
步骤2中将原数据按照域分割转化为新的输入向量的方法步骤包括:对数据特征以域为单位,将每个分类变量转化为独热编码的向量,连续变量用自身数值表示;将每个实例转化为(x,y)的形式;
其中x表示为:
Figure BDA0002304871670000021
其中x是一个向量,
Figure BDA0002304871670000022
表示原数据中的第j个域;
其中y表示为:
Figure BDA0002304871670000023
Figure BDA0002304871670000024
用于评估一个用户对特定产品点击的概率。
步骤3中的基于模型设置构建模型的模型包括:构建一个深度因子分解机模型,其包含3个部分,分别是:嵌入层部分、因子分解机部分以及深度网络部分。
所述的深度因子分解机模型的构成为:
Figure BDA0002304871670000025
其中
Figure BDA0002304871670000026
是预测的点击率,yFM是因子分解机部分的输出,yDNN是深度网络部分的输出。
所述的嵌入层部分的构成为:
嵌入层连接输入向量,其表示如下:
a|0|=[e1,e2,...,em]
其中ei时候第i个域的嵌入,m是域的数量,之后a||将会传入后续网络结构中。
所述的因子分解机部分的构成包括:
一个加数单元和一个内积单元,因子分解机部分的输出为yFM,表示如下:
Figure BDA0002304871670000031
其中w∈Rd,并且Vi∈Rk,加数单元<w,x>反应一阶特征的重要性,内积单元反应二阶特征的交互效应。
所述的深度网络部分的详细构成包括:
全连接层组成的深度网络,其前馈过程为:
a|l+1|=σ(W|l|a|l|+b|l|)
其中l是层的深度,σ是一个激活函数;a|l|,W|l|,b|l|分别是第l层的输出,模型权重和偏置值;
最终输出为yDNN,其表达如下:
yDNN=σ(W|H|+1·aH+b|H|+1)
其中|H|是隐藏层的数目,σ是激活函数。
所述的因子分解机部分的表达方程为:
Figure BDA0002304871670000041
所述的拟合模型的方法为:通过反向传播和求导链式法则,以修正模型参数以实现模型拟合。
采用孤立森林方法进行异常值检测,并清除重复数据、异常数据和无效数据,纠正错误数据。
本发明的有益效果为:本发明提供的银行用户行为数据的高效精准分析方法与现有技术相比具有以下优点:
通过结合深度学习和因子分解机模型,使得该方法既能获得用户与产品之间的二维交互关系,还可以获得其他信息之间的多维交互关系,以此方法,点击率的预测准确度比现有技术得到了极大的增强,本发明为了克服现有银行***的用户行为数据分析方法效果不佳的问题,且对输入信息没有限制。
附图说明
图1所示为本发明一实施例提供的银行用户行为数据的高效精准分析方法的流程图。
图2所示为深度因子分解机的模型示意图。
具体实施方式
为了更进一步地对本发明的特征和优点能更明显易懂,下文特举较佳实施例,并配合附图,作详细说明如下:
如图1所示,本实施例提供的银行用户行为数据的高效精准分析方法包括:
步骤1,对数据进行数据清洗;对原始数据中的重复数据、异常数据和无效数据进行清除,纠正错误数据,根据分析数据分布情况,使用中位数或者平均值填补缺失值;具体方法可以是:对原始数据通过孤立森林方法进行异常值检测,并清除重复数据、异常数据和无效数据,纠正错误数据;根据分析数据分布情况,使用中位数或者平均值对缺失值进行填补。
步骤2,构建输入矩阵,将原数据按照域分割转化为新的输入向量;即将输入数据实例转化为(x,y)的形式;其中对于x,其中对数据特征以域为单位,将每个分类变量转化为独热编码的向量,连续变量用自身数值表示,最终表示为:
公式一:
Figure BDA0002304871670000051
其中x是一个向量,
Figure BDA0002304871670000052
表示原数据中的第j个域。x通常高维且稀疏。
其中y表示为:
公式二:
Figure BDA0002304871670000053
其中在用户行为数据分析项目中,
Figure BDA0002304871670000054
用于评估一个用户对特定产品点击的概率。
步骤3,深度因子分解机建模,基于模型设置构建模型;
深度因子分解机建模,基于模型设置构建模型,深度因子分解机模型可表示为:
公式三:
Figure BDA0002304871670000055
其中
Figure BDA0002304871670000061
是预测的点击率,yFM是因子分解机部分的输出,yDNN是深度网络部分的输出。
其中嵌入层部分连接输入向量,其公式可表示为:
公式四:
a|0|=[e1,e2,...,em]
其中ei时候第i个域的嵌入,即将各个特征交互后的结果,m是域的数量,之后a|0|将会传入后续网络结构中。
其中因子分解机部分,包括一个加数单元和一个内积单元,因子分解机部分的输出为yFM,公式可表示为:
公式五:
Figure BDA0002304871670000062
其中w∈Rd,并且Vi∈Rk,加数单元<w,x>反应一阶特征的重要性,内积单元反应二阶特征的交互效应,即既能反应用户和产品本身的特征,同时也能获取其相关特征。
上述因子分解机部分的表达方程可以转化为:
公式六:
Figure BDA0002304871670000071
通过上述数学变换,将计算复杂度从O(kn2)降低到O(kn),使其计算速度加快。
其中深度网络部分是由全连接层组成的深度网络,其前馈过程公式可表达为:
公式七:
a|l+1|=σ(W|l|a|l|+b|l|)
其中l是层的深度,σ是一个激活函数。a|l|,W|l|,b|l|分别是第l层的输出,模型权重和偏置值。
最终输出为yDNN,其公式可表达为:
公式八:
yDNN=σ(W|H|+1·aH+b|H|+1)
其中|H|是隐藏层的数目,σ是激活函数。
步骤4,进行个性化推荐,将用户行为数据与模型拟合以得到各个用户对应的兴趣产品排名;模型拟合完成后预测用户对不同产品点击率,然后根据点击率进行排序,选出点击率较高的前n个产品以得到不同用户对不同产品的偏好信息。
其中拟合模型,类似于其他深度学习模型,通过反向传播和求导链式法则对参数进行调整。模型拟合完成后预测用户对不同产品点击率,然后根据点击率进行排序,选出点击率较高的前n个产品以得到不同用户对不同产品的偏好信息。本发明结合深度学习和因子分解机模型,使得该方法既能获得用户与产品之间的二维交互关系,还可以获得其他信息之间的多维交互关系,以此方法,点击率的预测准确度比现有技术得到了极大的增强。
以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (10)

1.一种银行用户行为数据的高效精准分析方法,其特征在于所述方法步骤为:
步骤1,数据清洗,对原始数据中的重复数据、异常数据和无效数据进行清除,纠正错误数据,根据分析数据分布情况,使用中位数或者平均值填补缺失值;
步骤2,构建输入矩阵,将原数据按照域分割转化为新的输入向量;
步骤3,深度因子分解机建模,基于模型设置构建模型;
步骤4,进行个性化推荐,将用户行为数据与模型拟合以得到各个用户对应的兴趣产品排名;模型拟合完成后预测用户对不同产品点击率,然后根据点击率进行排序,选出点击率较高的前n个产品以得到不同用户对不同产品的偏好信息。
2.根据权利要求1所述一种银行用户行为数据的高效精准分析方法,其特征在于:步骤2中将原数据按照域分割转化为新的输入向量的方法步骤包括:对数据特征以域为单位,将每个分类变量转化为独热编码的向量,连续变量用自身数值表示;将每个实例转化为(x,y)的形式;
其中x表示为:
Figure FDA0002304871660000011
其中x是一个向量,
Figure FDA0002304871660000012
表示原数据中的第j个域;
其中y表示为:
Figure FDA0002304871660000013
Figure FDA0002304871660000014
用于评估一个用户对特定产品点击的概率。
3.根据权利要求1所述一种银行用户行为数据的高效精准分析方法,其特征在于:步骤3中的基于模型设置构建模型的模型包括:构建一个深度因子分解机模型,其包含3个部分,分别是:嵌入层部分、因子分解机部分以及深度网络部分。
4.根据权利要求3所述一种银行用户行为数据的高效精准分析方法,其特征在于:所述的深度因子分解机模型的构成为:
Figure FDA0002304871660000015
其中
Figure FDA0002304871660000021
是预测的点击率,yFM是因子分解机部分的输出,yDNN是深度网络部分的输出。
5.根据权利要求3所述一种银行用户行为数据的高效精准分析方法,其特征在于:所述的嵌入层部分的构成为:
嵌入层连接输入向量,其表示如下:
a|0|=[e1,e2,...,em]
其中ei时候第i个域的嵌入,m是域的数量,之后a|0|将会传入后续网络结构中。
6.根据权利要求3所述一种银行用户行为数据的高效精准分析方法,其特征在于:所述的因子分解机部分的构成包括:
一个加数单元和一个内积单元,因子分解机部分的输出为yFM,表示如下:
Figure FDA0002304871660000022
其中w∈Rd,并且Vi∈Rk,加数单元<w,x>反应一阶特征的重要性,内积单元反应二阶特征的交互效应。
7.根据权利要求3所述一种银行用户行为数据的高效精准分析方法,其特征在于:所述的深度网络部分的详细构成包括:
全连接层组成的深度网络,其前馈过程为:
a|l+1|=σ(W|l|a|l|+b|l|)
其中l是层的深度,σ是一个激活函数;a|l|,W|l|,b|l|分别是第l层的输出,模型权重和偏置值;
最终输出为yDNN,其表达如下:
yDNN=σ(W|H|+1·aH+b|H|+1)
其中|H|是隐藏层的数目,σ是激活函数。
8.根据权利要求3所述一种银行用户行为数据的高效精准分析方法,其特征在于:所述的因子分解机部分的表达方程为:
Figure FDA0002304871660000031
9.根据权利要求1述一种银行用户行为数据的高效精准分析方法,其特征在于:所述的拟合模型的方法为:通过反向传播和求导链式法则,以修正模型参数以实现模型拟合。
10.根据权利要求1述一种银行用户行为数据的高效精准分析方法,其特征在于:采用孤立森林方法进行异常值检测,并清除重复数据、异常数据和无效数据,纠正错误数据。
CN201911235927.2A 2019-12-05 2019-12-05 一种银行用户行为数据的高效精准分析方法 Pending CN111046076A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911235927.2A CN111046076A (zh) 2019-12-05 2019-12-05 一种银行用户行为数据的高效精准分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911235927.2A CN111046076A (zh) 2019-12-05 2019-12-05 一种银行用户行为数据的高效精准分析方法

Publications (1)

Publication Number Publication Date
CN111046076A true CN111046076A (zh) 2020-04-21

Family

ID=70234729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911235927.2A Pending CN111046076A (zh) 2019-12-05 2019-12-05 一种银行用户行为数据的高效精准分析方法

Country Status (1)

Country Link
CN (1) CN111046076A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190147356A1 (en) * 2017-11-14 2019-05-16 Adobe Systems Incorporated Generating a predictive behavior model for predicting user behavior using unsupervised feature learning and a recurrent neural network
CN109960759A (zh) * 2019-03-22 2019-07-02 中山大学 基于深度神经网络的推荐***点击率预测方法
CN110263243A (zh) * 2019-01-23 2019-09-20 腾讯科技(深圳)有限公司 媒体信息推荐方法、装置、存储介质和计算机设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190147356A1 (en) * 2017-11-14 2019-05-16 Adobe Systems Incorporated Generating a predictive behavior model for predicting user behavior using unsupervised feature learning and a recurrent neural network
CN110263243A (zh) * 2019-01-23 2019-09-20 腾讯科技(深圳)有限公司 媒体信息推荐方法、装置、存储介质和计算机设备
CN109960759A (zh) * 2019-03-22 2019-07-02 中山大学 基于深度神经网络的推荐***点击率预测方法

Similar Documents

Publication Publication Date Title
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及***
CN112101190A (zh) 一种遥感图像分类方法、存储介质及计算设备
CN110309195B (zh) 一种基于fwdl模型的内容推荐方法
CN113255844B (zh) 基于图卷积神经网络交互的推荐方法及***
CN111127146A (zh) 基于卷积神经网络与降噪自编码器的信息推荐方法及***
CN112085565A (zh) 基于深度学习的信息推荐方法、装置、设备及存储介质
CN115222998B (zh) 一种图像分类方法
CN112819523B (zh) 结合内/外积特征交互和贝叶斯神经网络的营销预测方法
CN110851654A (zh) 基于张量化数据降维的工业设备故障检测分类方法
CN113159892B (zh) 一种基于多模态商品特征融合的商品推荐方法
CN110727855A (zh) 一种基于改进因子分解机的个性化推荐方法
CN113761359A (zh) 数据包推荐方法、装置、电子设备和存储介质
CN116976505A (zh) 基于信息共享的解耦注意网络的点击率预测方法
CN114781503A (zh) 一种基于深度特征融合的点击率预估方法
CN115203550A (zh) 一种增强邻居关系的社交推荐方法及***
CN117334271B (zh) 一种基于指定属性生成分子的方法
CN117635238A (zh) 一种商品推荐方法、装置、设备及存储介质
CN111428181A (zh) 一种基于广义加性模型结合矩阵分解的银行理财产品推荐方法
CN114841778B (zh) 一种基于动态图神经网络的商品推荐方法
CN111046076A (zh) 一种银行用户行为数据的高效精准分析方法
CN112699271B (zh) 一种提升用户视频网站留存时间的推荐方法
CN115689639A (zh) 一种基于深度学习的商业广告点击率预测方法
CN115357715A (zh) 基于奇异值分解和领域预训练的短文本聚类方法
CN111949884B (zh) 一种基于多模态特征交互深度融合推荐方法
CN114610871A (zh) 基于人工智能算法的情报***建模分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination