CN108665323B - 一种用于理财产品推荐***的集成方法 - Google Patents
一种用于理财产品推荐***的集成方法 Download PDFInfo
- Publication number
- CN108665323B CN108665323B CN201810484714.2A CN201810484714A CN108665323B CN 108665323 B CN108665323 B CN 108665323B CN 201810484714 A CN201810484714 A CN 201810484714A CN 108665323 B CN108665323 B CN 108665323B
- Authority
- CN
- China
- Prior art keywords
- user
- item
- preference
- users
- recommendation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Technology Law (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种用于理财产品推荐***的集成方法,基于数据平滑的协同过滤算法可以对稀疏数据进行填充,减少数据的稀疏性问题。基于人口统计学的推荐算法不需要历史数据,也不依赖物品的属性,可以解决用户的冷启动问题;将两种算法与表现性能良好的基于项目聚类和矩阵分解的推荐算法进行集成,扩大推荐算法的使用场景,提高推荐算法的自适应性。本发明集成方法可以有效地减少数据的稀疏性和解决冷启动问题,提升对每一位用户的推荐性能。
Description
技术领域
本发明属于在线产品推荐技术领域,尤其涉及一种用于理财产品推荐***的集成方法。
背景技术
传统的推荐算法多以用户评分数据计算用户的兴趣偏好以及资源相似度,对稀疏数据以及新用户的推荐质量较低,无法最大化挖掘隐性数据所带的信息。
近年来,针对数据稀疏性带来的问题,为了提升推荐效果,学者们将主成分分析、聚类分析、奇异值分解等算法引入到传统的协同过滤推荐算法中,通过降维,缩小目标用户搜索最近邻居的范围,使得推荐的精度和实时性有了明显提升,但冷启动问题依然存在。
现有技术的主要结构和原理:
1.生成用户-项目属性偏好模型。用户对项目属性的偏好模型是进行用户聚类和相似度计算的基础,通过分析用户-项目评分矩阵和项目-属性矩阵,建立用户对项目中出现的所有属性的偏好权重矩阵。
2.用户聚类。采用SOM与K-means聚类相结合的混合聚类模型对用户进行聚类:
2.1将得到的用户-项目属性偏好矩阵作为聚类的输入数据,通过SOM对输入训练较少的次数进行粗聚类,输出聚类簇ClusterSOM、神经元的权值ωSOM、聚类簇数目K;
2.2将ωSOM作为原始质心Ooriginal,对于每一个簇内元素不为0的聚类簇,寻找与Ooriginal距离最近的元素作为该簇最终的质心OSOM;
2.3以K、OSOM作为K-means聚类的聚类簇数目和初始聚类质心,对用户进一步聚类,输出用户聚类结果ClusterResult。
3.用户相似度计算和最近邻居查询。采用余弦计算目标用户Ui与所在聚类簇cindex中其他用户的相似度,计算得到最近邻居集合MKnear。
4.评分预测。找到目标用户Ui针对目标项目Iij的最近邻用户集合MKnear后,通过集合MKnear中的用户对目标项目Iij评分的加权平均值来描述目标用户Ui对目标项目Iij的评分。评分预测公式如式(1)所示:
5.生成推荐。重复步骤(3)和步骤(4),预测目标用户Ui对所有未评分项目的评分,选择预测评分最高的N个项目推荐给目标用户Ui。
目前有很多推荐算法,但是在任何背景或任何数据下都不存在一种算法总是优于其它推荐算法。现有的推荐***多为单一的一种方法,具有自身的局限性,不能灵活地应用于各类场景中。在推荐方面表现良好的算法不能有效地解决数据的稀疏性和冷启动问题。
发明内容
本发明提供一种用于理财产品推荐***的集成方法,减少了数据稀疏性带来的影响,解决了推荐***的冷启动问题。提高推荐算法的自适应性,扩大推荐算法的适用场景。
基于数据平滑的协同过滤算法可以对稀疏数据进行填充,减少数据的稀疏性问题。基于人口统计学的推荐算法不需要历史数据,也不依赖物品的属性,可以解决用户的冷启动问题。将两种算法与表现性能良好的基于项目聚类和矩阵分解的推荐算法进行集成,扩大推荐算法的使用场景,提高推荐算法的自适应性。本发明集成方法可以有效地减少数据的稀疏性和解决冷启动问题,提升对每一位用户的推荐性能。
附图说明
图1为本发明用于理财产品推荐***的集成方法流程图。
具体实施方式
如图1所示,本发明提供一种用于理财产品推荐***的集成方法,包括以下步骤:
输入数据为:用户特征信息、项目-属性矩阵、用户-项目评分矩阵;输出数据为:产品推荐模型、用户推荐结果。
步骤一:基于人口统计学的推荐算法。
对传统的基于人口统计学的推荐算法进行改进,为不同的用户属性赋予不同的权值。本发明选取年龄、性别、职业和爱好4种特征作为考虑的范围,将各属性信息预处理成数字型表示法的形式。计算用户之间的相似度得到用户偏好。
1.年龄属性,本发明以5岁为增量,比如年龄32岁可记为7,年龄56岁记为12。利用欧几里得距离计算用户s与用户t之间年龄的相似度,如式(2)所示。
其中A(s,t)表示用户s与用户t在年龄上的相似度,xs、xt分别为用户s和t的年龄分段值。
2.性别是一种对称的二元属性,即两个状态都是同等重要的。男性记为1,女性记为0,这样根据用户性别的取值可以得到一个两行两列的列表,如表1所示。这里采用S(s,t)表示用户s与用户t在性别上的相似度,如式(3)所示,其中a是对象s和t都取1情况的属性值,b是对象t取1和对象s取0情况的属性值,c是对象t中取0和对象s取1情况的属性值,d是对象s和t都取0情况的属性值。
表格1二元属性取值
3.职业、爱好属于标签类型的属性,即用某些字段来描述这一属性,对这类属性,利用式(4)来计算用户s与t之间的相似度。式(4)中k表示用户s与t共同拥有的同一属性的标签个数,n表示该属性可供选择的标签个数。
4.用户相似度的计算。对用户u及其k个邻居集合Uk,式(5)计算用户的信息相似度,并且保存Top-N个与目标用户u相似的用户集合Uk。在用户人口统计特征方法下,特征越多,越能准确预测用户兴趣。
计算用户偏好
得到用户之间的相似度后,会给用户推荐和他兴趣最相似的K个用户喜欢的物品,采用如下公式来计算用户u对物品i的偏好:
其中,S(u,k)包含和用户u最相近的K个用户,N(i)是对物品i有过行为的用户集合,wuv是用户u和用户v的兴趣相似度,rvi表示用户v对物品i的偏好。
得到预测偏好矩阵
n是物品的数量,m是用户的数量。
步骤二:基于项目聚类和矩阵分解的推荐算法
1.计算物品间的相似度
通过采用曼哈顿距离来计算物品之间的距离。
rui表示用户u对物品i的喜爱程度。dij表示物品i与物品j之间的距离。
物品i与物品j之间的相似度表示为式(9)。
ci表示物品i的流行度,cj表示物品j的流行度。物品的流行度就是点击该物品的人数。
然后将物品进行分类,得到不同的聚类中心{c1,c2,Λ,ck},k为聚类的数目。
2.构建物品向量。
基于k个聚类中心,K设置为200,物品向量被定义为
其中,
将物品向量归一化:
最后,物品i的向量为:
pi=(pi1,pi2,Λ,pik,Λ,piK) (13)
其中,
3.计算预测偏好矩阵。基于物品向量和奇异值分解(SVD),可以得到预测偏好矩阵:
其中,allMean是偏好的平均值,bu表示用户和allMean之间的偏差,bi表示物品和allMean之间的偏差,qu是用户u的向量,由随机值初始化。
步骤三:基于数据平滑的协同过滤算法。
1.计算用户的相似度。采用皮尔逊相关系数来计算相似度。
用户u和用户u'之间的相似度为:
2.基于上一步,平滑了用户尚未点击的数据集。用户的偏好表示为:
其中,Cu(i)∈Cu表示在聚类Cu中的点击过物品i的用户集,|Cu(i)|表示在聚类Cu中的点击过物品i的用户数量。
可以通过计算加权和得到预测偏好:
3.得到预测偏好矩阵。
n是物品的数量,m是用户的数量。
步骤四:对算法进行集成
根据步骤一、二和三,得到了用户对每个产品的预测偏好,基于这些偏好,进行算法集成。
1.线性加权融合法
汇总单一模型的结果,然后按不同算法赋予不同的权重,将多个推荐算法的结果进行加权,即可得到结果:
2.交叉融合法
在推荐结果中,穿插不同推荐模型的结果,以确保结果的多样性。
rec(u)表示对用户u推荐的物品,reck(u)表示算法k对用户u推荐的物品。
3.瀑布融合法
瀑布型融合方法采用了将多个模型串联的方法。每个推荐算法被视为一个过滤器,通过将不同粒度的过滤器前后衔接的方法来进行,在该方法中,前一个推荐方法过滤的结果,将作为后一个推荐方法的候选集合输入,层层递进,候选结果在此过程中会被逐步遴选,最终得到一个量少质高的推荐结果集合。
Claims (2)
1.一种用于理财产品推荐***的集成方法,其特征在于,包括以下步骤:
步骤一:基于人口统计学的推荐算法;
选取年龄、性别、职业和爱好4种特征,将各属性信息预处理成数字型表示法的形式,计算用户之间的相似度得到用户偏好和得到预测偏好矩阵;
步骤二:基于项目聚类和矩阵分解的推荐算法
步骤2.1、计算物品间的相似度
通过采用曼哈顿距离来计算物品之间的距离;
其中,rui表示用户u对物品i的喜爱程度,dij表示物品i与物品j之间的距离,
物品i与物品j之间的相似度表示为式(9);
其中,ci表示物品i的流行度,cj表示物品j的流行度;物品的流行度就是点击该物品的人数,然后将物品进行分类,得到不同的聚类中心{c1,c2,…,ck},k为聚类的数目;
步骤2.2、构建物品向量
基于k个聚类中心,K设置为200,物品向量被定义为
其中,
将物品向量归一化:
最后,物品i的向量为:
pi=(pi1,pi2,…,pik,…,piK) (13)
其中,
步骤2.3、计算预测偏好矩阵
基于物品向量和奇异值分解(SVD),得到预测偏好矩阵:
其中,allMean是偏好的平均值,bu表示用户和allMean之间的偏差,bi表示物品和allMean之间的偏差,qu是用户u的向量,由随机值初始化;
步骤三:基于数据平滑的协同过滤算法
步骤3.1、计算用户的相似度
采用皮尔逊相关系数来计算相似度,用户u和用户u’之间的相似度为:
步骤3.2、基于上一步,平滑了用户尚未点击的数据集
用户的偏好表示为:
其中,Cu(i)∈Cu表示在聚类Cu中的点击过物品i的用户集,|Cu(i)|表示在聚类Cu中的点击过物品i的用户数量,
通过计算加权和得到预测偏好:
步骤3.3、得到预测偏好矩阵
n是物品的数量,m是用户的数量;
步骤四:对算法进行集成
根据步骤一、二和三,得到了用户对每个产品的预测偏好,基于这些偏好,进行算法集成;
步骤一中,用户偏好的计算过程如下:
得到用户之间的相似度后,会给用户推荐和他兴趣最相似的K个用户喜欢的物品,采用如下公式来计算用户u对物品i的偏好:
其中,S(u,k)包含和用户u最相近的K个用户,N(i)是对物品i有过行为的用户集合,wuv是用户u和用户v的兴趣相似度,rvi表示用户v对物品i的偏好;
预测偏好矩阵的计算过程如下:
其中,n是物品的数量,m是用户的数量。
2.如权利要求1所述的用于理财产品推荐***的集成方法,其特征在于,步骤四采用如下方法进行集成:
1)线性加权融合法
汇总单一模型的结果,然后按不同算法赋予不同的权重,将多个推荐算法的结果进行加权,即可得到结果:
2)交叉融合法
在推荐结果中,穿插不同推荐模型的结果,以确保结果的多样性,
其中,rec(u)表示对用户u推荐的物品,reck(u)表示算法k对用户u推荐的物品;
3)瀑布型融合方法
瀑布型融合方法采用了将多个模型串联的方法,每个推荐算法被视为一个过滤器,通过将不同粒度的过滤器前后衔接的方法来进行,在该方法中,前一个推荐方法过滤的结果,将作为后一个推荐方法的候选集合输入,层层递进,候选结果在此过程中会被逐步遴选,最终得到一个量少质高的推荐结果集合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810484714.2A CN108665323B (zh) | 2018-05-20 | 2018-05-20 | 一种用于理财产品推荐***的集成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810484714.2A CN108665323B (zh) | 2018-05-20 | 2018-05-20 | 一种用于理财产品推荐***的集成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108665323A CN108665323A (zh) | 2018-10-16 |
CN108665323B true CN108665323B (zh) | 2021-01-05 |
Family
ID=63776873
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810484714.2A Active CN108665323B (zh) | 2018-05-20 | 2018-05-20 | 一种用于理财产品推荐***的集成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108665323B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109544231A (zh) * | 2018-11-21 | 2019-03-29 | 浙江工商大学 | 基于物流信息平台的物流配送服务个性化推荐方法 |
CN109902235B (zh) * | 2019-03-06 | 2023-07-07 | 太原理工大学 | 基于蝙蝠优化的用户偏好聚类协同过滤推荐算法 |
CN109977315A (zh) * | 2019-03-29 | 2019-07-05 | 厦门铠甲网络股份有限公司 | 一种文章推荐方法、装置、设备及存储介质 |
CN112241894A (zh) * | 2019-07-16 | 2021-01-19 | 百度时代网络技术(北京)有限公司 | 内容投放方法、装置以及终端 |
CN110930259B (zh) * | 2019-11-15 | 2023-05-26 | 安徽海汇金融投资集团有限公司 | 一种基于混合策略的债权推荐方法及*** |
CN110930226A (zh) * | 2019-11-26 | 2020-03-27 | 中国建设银行股份有限公司 | 一种金融产品推荐方法、装置、电子设备及存储介质 |
CN111179037B (zh) * | 2019-12-31 | 2023-07-25 | 中国银行股份有限公司 | 理财产品的推荐方法及装置 |
CN111652669A (zh) * | 2020-04-15 | 2020-09-11 | 珠海小礼鱼科技有限公司 | 一种智能终端导购***及方法 |
CN111552852B (zh) * | 2020-04-27 | 2021-09-28 | 北京交通大学 | 基于半离散矩阵分解的物品推荐方法 |
CN111966907A (zh) * | 2020-08-21 | 2020-11-20 | 贝壳技术有限公司 | 用户偏好冷启动方法、装置、介质和电子设备 |
CN113379482B (zh) * | 2021-05-28 | 2023-12-01 | 车智互联(北京)科技有限公司 | 一种物品推荐方法、计算设备以及存储介质 |
CN113393297A (zh) * | 2021-06-17 | 2021-09-14 | 中国工商银行股份有限公司 | 一种理财产品推送方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011096255A (ja) * | 2009-10-30 | 2011-05-12 | Nec (China) Co Ltd | ランキング指向の協調フィルタリング推薦方法および装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103246672B (zh) * | 2012-02-09 | 2016-06-08 | 中国科学技术大学 | 对用户进行个性化推荐的方法和装置 |
CN102968506A (zh) * | 2012-12-14 | 2013-03-13 | 北京理工大学 | 一种基于扩展特征向量的个性化协同过滤推荐方法 |
CN106997347A (zh) * | 2016-01-22 | 2017-08-01 | 华为技术有限公司 | 信息推荐方法及服务器 |
CN106846106A (zh) * | 2017-01-16 | 2017-06-13 | 南京师范大学 | 一种图构建框架下的矩阵分解推荐方法 |
CN106980648B (zh) * | 2017-02-27 | 2021-07-27 | 南京邮电大学 | 一种基于概率矩阵分解结合相似度的个性化推荐方法 |
-
2018
- 2018-05-20 CN CN201810484714.2A patent/CN108665323B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011096255A (ja) * | 2009-10-30 | 2011-05-12 | Nec (China) Co Ltd | ランキング指向の協調フィルタリング推薦方法および装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108665323A (zh) | 2018-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108665323B (zh) | 一种用于理财产品推荐***的集成方法 | |
CN108363804B (zh) | 基于用户聚类的局部模型加权融合Top-N电影推荐方法 | |
CN110059198B (zh) | 一种基于相似性保持的跨模态数据的离散哈希检索方法 | |
KR100997541B1 (ko) | 신상품 추천문제 해결을 위한 내용기반 필터링과 협업 필터링을 혼합한 사용자 프로파일 기반 이미지 추천 방법 및 장치 | |
CN108537624B (zh) | 一种基于深度学习的旅游服务推荐方法 | |
CN104834686B (zh) | 一种基于混合语义矩阵的视频推荐方法 | |
CN107944035B (zh) | 一种融合视觉特征和用户评分的图像推荐方法 | |
CN107894998B (zh) | 视频推荐方法及装置 | |
CN113158023B (zh) | 基于混合推荐算法的公共数字生活精准分类服务方法 | |
CN109947987B (zh) | 一种交叉协同过滤推荐方法 | |
CN108897791B (zh) | 一种基于深度卷积特征和语义相似度量的图像检索方法 | |
CN115391576A (zh) | 一种基于聚类的联邦图学习方法及*** | |
CN110442618B (zh) | 融合专家信息关联关系的卷积神经网络评审专家推荐方法 | |
CN109034953B (zh) | 一种电影推荐方法 | |
Liu et al. | Using collaborative filtering algorithms combined with Doc2Vec for movie recommendation | |
CN106339486A (zh) | 一种基于大规模词汇树的增量学习的图像检索方法 | |
Anwar et al. | Mrec-crm: Movie recommendation based on collaborative filtering and rule mining approach | |
CN115712780A (zh) | 一种基于云计算和大数据的信息推送方法及装置 | |
Chen et al. | A fuzzy matrix factor recommendation method with forgetting function and user features | |
CN116680363A (zh) | 一种基于多模态评论数据的情感分析方法 | |
CN108389113A (zh) | 一种协同过滤推荐方法和*** | |
CN107622071B (zh) | 通过间接相关反馈在无查源下的衣服图像检索***及方法 | |
CN115204967A (zh) | 一种融入用户长短期兴趣表征隐式反馈的推荐方法 | |
CN113221003B (zh) | 一种基于对偶理论的混合过滤推荐方法及*** | |
CN108984551A (zh) | 一种基于多类别联合软聚类的推荐方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210617 Address after: 200335 Room 301, building 1, 111 Fuquan Road, Changning District, Shanghai Patentee after: SHANGHAI DIGITAL CHINA INFORMATION TECHNOLOGY SERVICE Co.,Ltd. Address before: 100124 No. 100 Chaoyang District Ping Tian Park, Beijing Patentee before: Beijing University of Technology |