CN103279552A - 一种基于用户兴趣分组的协同过滤推荐方法 - Google Patents

一种基于用户兴趣分组的协同过滤推荐方法 Download PDF

Info

Publication number
CN103279552A
CN103279552A CN2013102268778A CN201310226877A CN103279552A CN 103279552 A CN103279552 A CN 103279552A CN 2013102268778 A CN2013102268778 A CN 2013102268778A CN 201310226877 A CN201310226877 A CN 201310226877A CN 103279552 A CN103279552 A CN 103279552A
Authority
CN
China
Prior art keywords
user
article
collaborative filtering
matrix
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013102268778A
Other languages
English (en)
Inventor
卜佳俊
陈纯
王灿
徐斌
秦绪震
吴晓凡
谭树龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN2013102268778A priority Critical patent/CN103279552A/zh
Publication of CN103279552A publication Critical patent/CN103279552A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于用户兴趣分组的协同过滤推荐方法,在获取用户和物品之间的关系数据之后,针对这些数据进行如下操作:首先将数据进行规范化表达;接着对数据进行降维处理,将用户和物品映射到共同的低维空间;之后利用聚类方法把降维之后的用户和物品划分到不同的兴趣分组;在每一个分组基础上利用协同过滤的推荐方法进行预测;最后将不同分组的预测值进行合并,并向用户进行推荐。本方法的优点在于:可以更精细地描述用户和物品之间的关系,能够快速地找到用户的兴趣分组,提高协同过滤推荐方法的准确度。

Description

一种基于用户兴趣分组的协同过滤推荐方法
技术领域
本发明涉及个性化推荐方法的技术领域,特别是基于协同过滤的推荐方法。 
背景技术
现在我们时时享受着互联网飞速发展带来的便捷,在线音乐播放,在线购物等丰富了我们的生活,但同时我们也处在一个信息***的时代。2011年淘宝发布的数据显示其在线商品数量超过8亿,这给用户寻找合适的商品带来了麻烦。推荐***在很大程度上缓解了这个问题,准确的推荐算法不仅能给用户带了方便,还能增加网站的收益。推荐方法的好坏很大程度上影响了用户的体验,如何提高推荐算法的准确性成为这些年研究的热点。 
协同过滤算法是经典的推荐算法之一,并被广泛的应用于各种信息服务中。它的本质思想是通过找到目标用户的相似用户所喜爱的物品,作为目标用户潜在的喜好预测。这种思想是简单而有效的。但是我们发现,在有些情况下,在某些物品子集上拥有相似兴趣的用户在其他物品子集上并不一定具有相似的偏好,甚至有可能具有截然相反的兴趣。因此本方法试图去寻找一些有意义的联合子集(包含用户、物品),并在联合子集中采用协同过滤算法进行推荐,以达到提高推荐准确性的目的。本方法提出了一个能提高协同过滤推荐方法准确性的框架,因此能适用于任何协同推荐算法。 
发明内容
本发明要克服现有协同过滤推荐方法准确性不高的缺点,提出了一种基于用户兴趣分组的协同过滤推荐方法,向用户提供更准确、更相关的物品。 
该方法包括以下步骤: 
1.在获取用户和物品之间的关系数据之后,针对这些数据进行以下操作: 
1)将用户和物品关系的数据进行规范化表达; 
2)进行降维处理,将用户和物品映射到一个低维空间; 
3)利用聚类方法把用户和物品分成到多个不同的分组; 
4)在每一个分组上利用任意的协同过滤方法得到预测值; 
5)将不同分组的预测值进行合并,并向用户进行推荐。 
进一步: 
步骤1)中将用户和物品关系的数据进行规范化表达: 
1)将用户和物品的关系用矩阵的形式进行表达,一种可能的形式例如,m名用户和n件商品的关系可以表示为T∈Rm×n的形式,其中元素Tij代表了第i名用户对第j件商品的偏好; 
2)对上面的矩阵进行归一化处理得到归一化矩阵; 
所述的步骤2)中进行降维处理,将用户和物品映射到一个低维空间: 
假设步骤1)中得到的归一化矩阵为S,构造矩阵  M = I n - S - S T I m , 求得对应矩阵M最小的r个特征值的特征向量x1,x2…xr,它们构成一个低维空间表示为X*=[x1,x2…xr],矩阵X*就是我们要得到的低维矩阵; 
所述的步骤5)中将不同子矩阵的预测值进行合并: 
用Pre(ui,yj,k)表示在分组k中预测的用户ui对物品yj的兴趣度, 
那么不同预测值合并的结果Yij可以根据下面的方法得到: 
Figure 2013102268778100002DEST_PATH_IMAGE002
其中δik是可调节的参数,用来设定在不同的分组中,预测值在最后的结果中的权重。 
本发明提出了基于用户兴趣分组的协同过滤推荐方法,其优点在于:对用户和物品进行分组,然后在各个分组上进行协同过滤推荐;适用于所有使用协同过滤推荐算法的情形,可以提高推荐***的准确性,帮助用户找到更相关的物品。 
附图说明
图1是本发明的方法流程图。 
具体实施方式
参照附图,进一步说明本发明: 
一种基于用户兴趣分组的协同过滤推荐方法,该方法包括以下步骤: 
1.在获取用户和物品之间的关系数据之后,针对这些数据进行以下操作步骤: 
1)将用户和物品关系的数据进行规范化表达; 
2)进行降维处理,将用户和物品映射到一个低维空间; 
3)利用聚类方法把用户和物品分成到多个不同的分组; 
4)在每一个分组上利用任意的协同过滤方法得到预测值; 
5)将不同分组的预测值进行合并,并向用户进行推荐。 
步骤1)中将用户和物品关系的数据进行规范化表达: 
1)将用户和物品的关系用矩阵的形式进行表达,一种可能的形式例如,m名用户和n件商品的关系可以表示为T∈Rm×n的形式,其中元素Tij代表了第i名用户对第j件商品的偏好; 
2)对上面的矩阵进行归一化处理得到归一化矩阵; 
所述的步骤2)中进行降维处理,将用户和物品映射到一个低维空间: 
假设步骤1)中得到的归一化矩阵为S,构造矩阵  M = I n - S - S T I m , 求得对应矩阵M最小的r个特征值的特征向量 x1,x2,…xr,它们构成一个低维空间表示为X*=[x1,x2…xr],矩阵X*就是我们要得到的低维矩阵; 
所述步骤3)中利用K-means聚类方法将用户和物品分成不同的分组,其具体流程如下: 
1)首先当前用户和物品总数为N,预先设定类别数K的值; 
2)从N个用户和物品中随机选择K个作为初始聚类中心; 
3)对剩余的N-K个用户和物品中的每一个,计算它与2)中选出的K个中心的欧式距离,得出最小的距离Ki,将其归为第i类; 
4)重新计算每一类的聚类中心,并更新步骤2)中的值,重复步骤3)4),直到4)中的计算的中心和2)中的中心重合。 
所述的步骤4)中利用Item-Based协同过滤算法预测用户对物品的兴趣度,其具体流程如下: 
计算两个物品之间的相似性,一种可以选择的方法是计算调整的余弦相似度,公式如下: 
sim ( i , j ) = Σ u ∈ U ( R u , i - R ‾ u ) ( R u , j - R ‾ u ) Σ u ∈ U ( R u , i - R ‾ u ) 2 Σ u ∈ U ( R u , j - R ‾ u ) 2
其中Ru,i表示用户u对物品i的打分,                                                  
Figure 88574DEST_PATH_IMAGE001
表示用户u的所有打分的平均值; 
根据之前算好的物品之间的相似度,对用户未打分的物品进行预测,可以利用加权的求和的方法,其具体内容如下: 
对用户u已打分数的物品分数进行加权求和,权值为各个物品与物品i的相似度,然后对所有物品相似度的和求平均,计算用户u对物品i的打分,公式如下: 
Pre u , i = Σ allsimilaritems , N ( s i , N * R u , N ) Σ allsimilaritems , N ( | s i , N | )
其中si,N为物品i与物品N的相似度,Ru,N为用户u对物品N的打分。 
所述的步骤5)中将不同子矩阵的预测值进行合并: 
用Pre(ui,yj,k)表示在分组k中预测的用户ui对物品yj的兴趣度,那么不同预测值合并的结果Yij可以根据下面的方法得到: 
Figure 2013102268778100002DEST_PATH_IMAGE006
其中δik是可调节的参数,用来设定在不同的分组中,预测值在最后的结果中的权重。 
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围的不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。 

Claims (5)

1.一种基于用户兴趣分组的协同过滤推荐方法,该方法的特征在于获取用户和物品之间的关系数据之后,针对这些数据进行如下操作: 
1)将数据进行规范化表达; 
2)对数据进行降维处理,将用户和物品映射到共同的低维空间; 
3)利用聚类方法把降维之后的用户和物品划分到不同的兴趣分组; 
4)在每一个分组上利用协同过滤方法得到预测值; 
5)将不同分组的预测值进行合并,并向用户进行推荐。 
2.如权利要求1所述的基于用户兴趣分组的协同过滤推荐方法,其特征在于:所述的步骤1)中数据进行规范化表达: 
1)将用户和物品的关系用矩阵的形式进行表达,m名用户和n件商品的关系表示为T∈Rm×n的形式,其中元素Tij代表了第i名用户对第j件商品的偏好; 
2)对上面的矩阵进行归一化处理得到归一化矩阵。 
3.如权利要求1所述的基于用户兴趣分组的协同过滤推荐方法,其特征在于:所述的步骤2)中对数据进行降维处理,将用户和物品映射到一个低维空间: 
由步骤1)处理得到的归一化矩阵表示为S,构造矩阵                                                   
Figure 2013102268778100001DEST_PATH_IMAGE001
求得对应矩阵M最小的r个特征值的特征向量x1,x2…xr,它们构成一个低维空间,表示为X*=[x1,x2…xr],矩阵X*就是低维矩阵。 
4.如权利要求1所述的基于用户兴趣分组的协同过滤推荐方法,其特征在于:所述的步骤4)中利用协同过滤算法预测用户对物品的兴趣度,其具体流程如下: 
1)计算两个物品之间的相似性,一种可以选择的方法是计算调整的余弦相似度,公式如下: 
Figure 2013102268778100001DEST_PATH_IMAGE002
其中Ru,i表示用户u对物品i的打分,
Figure FDA00003310923400022
表示用户u的所有打分的平均值; 
2)根据之前算好的物品之间的相似度,对用户未打分的物品进行预测,可以利用加权的求和方法,其具体内容如下: 
对用户u已打分数的物品分数进行加权求和,权值为各个物品与物品i的相似度,然后对所有物品相似度的和求平均,计算用户u对物品i的打分,公式如下: 
Figure 2013102268778100001DEST_PATH_IMAGE003
其中si,N为物品i与物品N的相似度,Ru,N为用户u对物品N的打分。 
5.如权利要求1所述的基于用户兴趣分组的协同过滤推荐方法,其特征在于:所述的步骤5)中将不同子矩阵的预测值进行合并: 
用Pre(ui,yj,k)表示在分组k中预测的用户ui对物品yj的兴趣度,不同预测值合并的结果Yij可以根据下面的方法得到: 
Figure 2013102268778100001DEST_PATH_IMAGE004
其中δik是可调节的参数,用来设定在不同的分组中,预测值在最后的结果中的权重。 
CN2013102268778A 2013-06-06 2013-06-06 一种基于用户兴趣分组的协同过滤推荐方法 Pending CN103279552A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013102268778A CN103279552A (zh) 2013-06-06 2013-06-06 一种基于用户兴趣分组的协同过滤推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013102268778A CN103279552A (zh) 2013-06-06 2013-06-06 一种基于用户兴趣分组的协同过滤推荐方法

Publications (1)

Publication Number Publication Date
CN103279552A true CN103279552A (zh) 2013-09-04

Family

ID=49062071

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013102268778A Pending CN103279552A (zh) 2013-06-06 2013-06-06 一种基于用户兴趣分组的协同过滤推荐方法

Country Status (1)

Country Link
CN (1) CN103279552A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886003A (zh) * 2013-09-22 2014-06-25 天津思博科科技发展有限公司 一种协同过滤处理器
CN104462603A (zh) * 2014-12-31 2015-03-25 国家电网公司 信息处理方法和装置
CN105302880A (zh) * 2015-10-14 2016-02-03 合一网络技术(北京)有限公司 内容关联推荐方法及装置
CN105447126A (zh) * 2015-11-17 2016-03-30 苏州蜗牛数字科技股份有限公司 一种游戏道具个性化推荐方法
CN105809474A (zh) * 2016-02-29 2016-07-27 深圳市未来媒体技术研究院 一种层次化商品信息过滤推荐方法
CN107220382A (zh) * 2017-06-28 2017-09-29 环球智达科技(北京)有限公司 数据分析方法
CN107944485A (zh) * 2017-11-17 2018-04-20 西安电子科技大学 基于聚类群组发现的推荐***及方法、个性化推荐***
CN108763367A (zh) * 2018-05-17 2018-11-06 南京大学 一种基于深度对齐矩阵分解模型进行学术论文推荐的方法
CN109409964A (zh) * 2018-11-27 2019-03-01 口碑(上海)信息技术有限公司 优质品牌的识别方法及装置
CN110298528A (zh) * 2018-03-23 2019-10-01 北京京东尚科信息技术有限公司 物品分组的方法和装置
CN112307332A (zh) * 2020-10-16 2021-02-02 四川大学 基于用户画像聚类的协同过滤推荐方法、***及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110184977A1 (en) * 2008-09-27 2011-07-28 Jiachun Du Recommendation method and system based on collaborative filtering
US20110302165A1 (en) * 2010-06-08 2011-12-08 Kazuo Ishii Content recommendation device and content recommendation method
CN102609523A (zh) * 2012-02-10 2012-07-25 上海视畅信息科技有限公司 基于物品分类和用户分类的协同过滤推荐算法
CN103093376A (zh) * 2013-01-16 2013-05-08 北京邮电大学 基于奇异值分解算法的聚类协同过滤推荐***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110184977A1 (en) * 2008-09-27 2011-07-28 Jiachun Du Recommendation method and system based on collaborative filtering
US20110302165A1 (en) * 2010-06-08 2011-12-08 Kazuo Ishii Content recommendation device and content recommendation method
CN102609523A (zh) * 2012-02-10 2012-07-25 上海视畅信息科技有限公司 基于物品分类和用户分类的协同过滤推荐算法
CN103093376A (zh) * 2013-01-16 2013-05-08 北京邮电大学 基于奇异值分解算法的聚类协同过滤推荐***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郁雪: "基于协同过滤技术的推荐方法研究", 《中国博士学位论文全文数据库(电子期刊)》, 15 December 2010 (2010-12-15) *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886003A (zh) * 2013-09-22 2014-06-25 天津思博科科技发展有限公司 一种协同过滤处理器
CN104462603A (zh) * 2014-12-31 2015-03-25 国家电网公司 信息处理方法和装置
CN105302880A (zh) * 2015-10-14 2016-02-03 合一网络技术(北京)有限公司 内容关联推荐方法及装置
CN105447126A (zh) * 2015-11-17 2016-03-30 苏州蜗牛数字科技股份有限公司 一种游戏道具个性化推荐方法
CN105809474B (zh) * 2016-02-29 2020-11-17 深圳市未来媒体技术研究院 一种层次化商品信息过滤推荐方法
CN105809474A (zh) * 2016-02-29 2016-07-27 深圳市未来媒体技术研究院 一种层次化商品信息过滤推荐方法
CN107220382A (zh) * 2017-06-28 2017-09-29 环球智达科技(北京)有限公司 数据分析方法
CN107944485A (zh) * 2017-11-17 2018-04-20 西安电子科技大学 基于聚类群组发现的推荐***及方法、个性化推荐***
CN107944485B (zh) * 2017-11-17 2020-03-06 西安电子科技大学 基于聚类群组发现的推荐***及方法、个性化推荐***
CN110298528A (zh) * 2018-03-23 2019-10-01 北京京东尚科信息技术有限公司 物品分组的方法和装置
CN110298528B (zh) * 2018-03-23 2024-06-18 北京京东尚科信息技术有限公司 物品分组的方法和装置
CN108763367B (zh) * 2018-05-17 2020-07-10 南京大学 一种基于深度对齐矩阵分解模型进行学术论文推荐的方法
CN108763367A (zh) * 2018-05-17 2018-11-06 南京大学 一种基于深度对齐矩阵分解模型进行学术论文推荐的方法
CN109409964A (zh) * 2018-11-27 2019-03-01 口碑(上海)信息技术有限公司 优质品牌的识别方法及装置
CN112307332A (zh) * 2020-10-16 2021-02-02 四川大学 基于用户画像聚类的协同过滤推荐方法、***及存储介质

Similar Documents

Publication Publication Date Title
CN103279552A (zh) 一种基于用户兴趣分组的协同过滤推荐方法
CN103412948B (zh) 基于聚类的协同过滤的商品推荐方法及***
CN107146089B (zh) 一种刷单识别方法及装置,电子设备
CN105224699B (zh) 一种新闻推荐方法及装置
CN105095256B (zh) 基于用户之间相似度进行信息推送的方法及装置
US9798797B2 (en) Cluster method and apparatus based on user interest
Lee et al. Prea: Personalized recommendation algorithms toolkit
US20190355021A1 (en) Heuristic customer clustering
CN103761237A (zh) 一种基于用户特征及其信任度的协同过滤推荐方法
CN104281956A (zh) 基于时间信息的适应用户兴趣变化的动态推荐方法
CN112488863B (zh) 一种在用户冷启动场景下的险种推荐方法及相关设备
CN102184364A (zh) 基于半监督学习的推荐***托攻击检测方法
CN106021329A (zh) 基于用户相似度的稀疏数据协同过滤推荐方法
CN104239496B (zh) 一种结合模糊权重相似性度量和聚类协同过滤的方法
CN104298787A (zh) 一种基于融合策略的个性化推荐方法及装置
CN104077357A (zh) 基于用户的协同过滤组合推荐方法
Kommineni et al. Machine learning based efficient recommendation system for book selection using user based collaborative filtering algorithm
Zheng et al. Deviation-based contextual SLIM recommenders
CN110275952A (zh) 基于用户短期兴趣的新闻推荐方法、装置及介质
CN106372956B (zh) 一种基于用户搜索日志进行意图实体识别的方法和***
CN106326390A (zh) 基于协同过滤的推荐方法
CN106991173A (zh) 基于用户偏好的协同过滤推荐方法
CN105095476A (zh) 基于Jaccard均衡距离的协同过滤推荐方法
CN105574213A (zh) 一种基于数据挖掘技术的微博推荐方法及装置
CN104166732A (zh) 一种基于全局评分信息的项目协同过滤推荐方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130904