CN102521420A - 基于偏好模型的社会化过滤方法 - Google Patents
基于偏好模型的社会化过滤方法 Download PDFInfo
- Publication number
- CN102521420A CN102521420A CN2012100002281A CN201210000228A CN102521420A CN 102521420 A CN102521420 A CN 102521420A CN 2012100002281 A CN2012100002281 A CN 2012100002281A CN 201210000228 A CN201210000228 A CN 201210000228A CN 102521420 A CN102521420 A CN 102521420A
- Authority
- CN
- China
- Prior art keywords
- group
- group member
- influence
- vector
- analyzed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于偏好模型的社会化过滤方法,主要解决现有技术针对用户比较多,社交关系复杂的情况,过滤方法准确性不高的问题,其实现方案是:通过分析组员之间社会化关系,计算组员对组的影响因子;通过分析组内组员喜好对象分布情况,计算组员喜好对象对组的影响因子;综合上述两种影响因子,共同对组的偏好模型进行特征表示,得到组的加权影响向量。然后计算过滤系数,判断推荐条件,来过滤出组的共同相似爱好,提高社会化过滤方法的准确性和效率。本发明具有对组的偏好模型分析的优点,仅需修改获取其领域内关键字向量,即可在网络上实现对不同领域对象的推荐。
Description
技术领域
本发明属于信息化处理技术领域,涉及协同过滤,特别是一种社会化过滤方法,可用于在网络中的信息交互和共享。
背景技术
随着互联网的发展,网络已经变成信息共享的平台,在该平台上用户之间实现信息的交互和共享,所以对于信息的共享和交互处理就是急需解决的问题。如何让人们在海量的数据中想要找到他们需要的信息,实现用户之间的信息共享与交互,就需要采用协同过滤技术。该方法是不依赖于用户的属性信息和物品的内容信息,而仅仅通过分析大量的用户对物品的行为信息,从中找出特定的行为模式,据此来预测用户的偏好。所谓偏好,表示的是用户所感兴趣的信息类型。
近年,随着以Facebook和Twitter为代表的社会网络的兴起,社会化过滤逐渐成为协同过滤技术的研究热点。社会化过滤方法利用用户和他的好友偏好的共同点,来分析好友的偏好,从而预测给定用户的偏好。最简单的社会化过滤算法是基于邻域的算法。除了简单的邻域模型,还有其他社会化过滤算法。利用图模型将用户的社会网络和用户物品的偏好关系建模到一张图中,然后利用随机游走算法给用户做社会化推荐。一个矩阵分解的算法来分解用户的社会网络矩阵和用户物品偏好矩阵,计算出用户的特征向量和物品的特征向量,并最终利用特征向量的点乘度量用户对物品的偏好。
但是以上这些社会化推荐方法,随着用户和商品的增多,***的性能会越来越低;都是针对单个用户进行偏好发现,所以对于用户比较多时,社交关系复杂的情况,推荐准确性就会大大下降。
发明内容
本发明的目的是针对已有方法的不足,提出一种基于偏好模型的社会化过滤方法,依据用户之间的关系建立群体偏好特征,从而解决在用户比较多,用户的偏好相似度比较低的情况下,通过计算群体偏好特征的加权影响向量,提高对用户偏好过滤方法的准确性。
为实现上述目的,本发明包括如下步骤:
(1)从网页配置文件中获取一个组G={u1,u2,…,ug},ul为组员,1≤l≤g,g为组G中组员的个数;再从组内获取所有组员喜好对象的列表M={m1,m2,…,mp},mi为组员喜好对象,1≤i≤p,p为列表M中对象的个数;
(3)使用关键字表示组员喜好对象mi,得到组员喜好对象mi的关键字向量Wi={w1,w2,…,wn},wq为组员喜好对象mi的关键字,1≤q≤n,n为组员喜好对象mi的关键字个数;
(4)将对象列表M的关键字向量表示为W={W1,W2,…,Wp},Wi表示组员喜好对象mi的关键字向量,1≤i≤p;
(6)输入待分析对象m′,并使用关键字表示待分析对象m′,得到待分析对象m′的关键字向量W′={w′1,w′2,…,w′k},其中w′r为待分析对象m′的关键字,1≤r≤k,k为待分析对象m′的关键字个数;
(7)根据步骤(6)中所述待分析对象m′的关键字向量W′和步骤(5)中所述组G的加权影响向量计算待分析对象m′的过滤系数Y:
其中,yi为过滤因子,1≤i≤p;
(8)根据步骤(7)中所述待分析对象m′的过滤系数Y,判断推荐条件:若Y≥λ,则表示待分析对象m′满足推荐条件,并向组G予以推荐;反之不予以推荐,λ为推荐***预设的阈值,0≤λ≤1。
与现有技术相比,本发明具有如下优点:
1)本发明利用组员之间社会化关系,提出了组员ul和组员喜好对象mi对组的影响因子,来对用户的偏好特征进行表示,从而提高社会化过滤方法的准确性。
2)本发明以组为单位进行偏好描述,提出了组的加权影响向量将过滤方法的处理对象由个人变成组,降低了过滤方法计算的复杂度,从而提高社会化过滤方法的效率。
附图说明
图1是本发明采用基于兴趣模型的社会化过滤方法流程图;
图2是本发明针对群组中成员关系的拓扑结构图。
具体实施方式:
下面结合附图对本发明进行详细说明:
参照图1,本发明的具体实现步骤如下:
本发明中所述基于兴趣模型的社会化过滤方法,有很多应用领域。比如,对电影的推荐,论文的推荐等领域。下面我们以电影推荐为例,介绍如何使用基于偏好模型的社会化过滤方法。具体步骤如下:
步骤1:获取组G以及对象列表M信息
从网页配置文件中获取一个组G={u1,u2,…,ug},ul为组员,1≤l≤g,g为组G中组员的个数;再从组内获取所有组员喜好对象的列表M={m1,m2,…,mp},mi为组员喜好对象,1≤i≤p,p为列表M中对象的个数;
所述喜好对象,是指组员在其网页上显示其喜好的对象信息;
所述的喜好对象列表,是取每个组员所喜好对象的一个并集。
图2给出的一个组的拓扑结构图,表示组员之间的好友关系图,组员之间的连线表示他们的好友关系,该组表示为G={u1,u2,…,u5},组员分别为u1,u2,u3,u4和u5,其中组员u1喜好的对象有m1,m2,m3和m4;组员u2喜好的对象有m2,m5和m6;组员u3喜好的对象是m2,m3,m4和m5;组员u4喜好的对象是m3,m5和m6;组员u5喜好的对象是m1和m4。
所有组员喜好对象列表M,就由组员u1,u2,u3,u4和u5的喜好对象取并集:则对象列表:
M={m1,m2,m3,m4}∩{m2,m5,m6}
{m2,m3,m4,m5}∩{m3,m5,m6}∩{m1,m4}
={m1,m2,m3,m4,m5,m6}。
步骤2:计算对组G的综合影响度向量
2.1)计算组员ul对组G的影响因子其中,表示组员ul在组G中的好友个数,组G={u1,u2,…,ug},ul为组员,1≤l≤g,g为组G中组员的个数。
2.2)计算对象mi的对组G的影响因子 表示组G内包含组员喜好对象mi的组员个数,表示组G内组员ul所有喜好的对象的个数,组员喜好对象列表M={m1,m2,…,mp},mi为组员喜好对象,1≤i≤p,p为列表M中对象的个数。
如附图2,对象m1分别在组员u1和u5喜好的对象列表中出现,组G内包含组员喜好对象m1的组员个数各组员喜好的对象个数分别为4,3,4,3和2,所有组员喜好的对象的个数之和则组G对对象m1的影响因子为依次得到其余组员喜好对象对组G的影响因子。
2.3)根据组员ul对组G的影响因子和组员喜好对象mi对组G的影响因子,计算组员喜好对象mi对组G的加权影响因子xi:
计算所有对象的xi即得到加权影响因子向量X:
步骤3:获取组G喜好对象的关键字向量。
使用关键字表示组员喜好对象mi,得到组员喜好对象mi的关键字向量Wi={w1,w2,…,wn},wq为组员喜好对象mi的关键字,1≤q≤n,n为组员喜好对象mi的关键字个数。
例如对于电影对象,则根据组G所喜爱的电影列表M,可以通过查询IMDB(Internet Movie Database,互联网电影资料库)获取电影的关键字。如图2中,将电影m1的关键字表示成向量:
W1={w1,w2,…,wn}
={Compassion,Tragic Villain,Mental Illness};
对于论文对象,则根据组G所喜爱的论文列表M,可以通过查询万方数据库获取论文的关键字。如图2中,将论文m1的关键字表示成向量:
W1={w1,w2,…,wn}
={Data Ming,SVM,Methion Learning}。
步骤4:表示对象列表M的关键字向量W。
将对象列表M的关键字向量表示为W={W1,W2,…,Wp},Wi表示组员喜好对象mi的关键字向量,1≤i≤p。
例如对于电影对象,则综合所有电影m1,m2,…,m6的关键字向量最终得到组G喜好的电影的关键字向量:
W={W1,W2,…,WM}
={(Compassion,Tragic Villain,Mental Illness),…
(Crushed To Deah,Disney Animation Feature,)};
对于论文对象,则综合所有论文m1,m2,…,m6的关键字向量最终得到组G喜好的论文的关键字向量:
W={W1,W2,…,WM}
={(Data Ming,SVM,Methion Learning),…
(Feature Expretion,CRFs,Desetion Tree)}。
步骤5:计算组G的综合加权影响向量。
步骤6:输入待分析对象,对其进行关键字向量的表示。
输入待分析对象m′,并使用关键字表示待分析对象m′,得到待分析对象m′的关键字向量W′={w′1,w′2,…,w′k},其中w′r为待分析对象m′的关键字,1≤r≤k,k为待分析对象m′的关键字个数。
例如对于电影对象,则通过IMDB获取待推荐电影m′的关键字,得到待推荐电影m′的关键字向量:
W′={w′1,w′2,…,w′k}
={Accident,Child,Tragic Villain};
对于论文对象,则通过万方数据库获取待推荐论文m′的关键字,得到待推荐论文m′的关键字向量:
W′={w′1,w′2,…,w′k}
={Data Base,Filing,Information Extraction}。
步骤7:计算过滤系数。
采用文本相似度算法,对W′={Accident,Child,Tragic Villain}和W中每个项进行比较,W1={Compassion,Tragic Villain,Mental Illness},通过比较可见,W′与W3、W4相似,而W′与W1、W2、W5不相似,则y1=y2=y5=0, 过滤系数为:
对于论文对象,则根据待推荐电影m′的关键字向量W′和步骤5中所述组G的加权影响向量计算待推荐电影m′的过滤系数Y:
采用文本相似度算法,对W′={Data Base,Filing,Information Extraction}和W中每个项进行比较,W1={Data Ming,SVM,Mecthion Learning},通过比较可见,W′和与W1、W4相似,而W′与W2、W3、W5不相似,则y2=y3=y5=0, 过滤系数为:
步骤8:判断推荐条件。
根据步骤7中所述待分析对象m′的过滤系数Y,判断推荐条件:若Y≥λ,则表示待分析对象m′满足推荐条件,并向组G予以推荐;反之不予以推荐,λ为推荐***预设的阈值,0≤λ≤1。
例如对于电影对象,则根据待推荐电影m′的过滤系数Y,判断推荐条件:若Y≥λ,则表示待推荐电影m′满足推荐条件,并向组G予以推荐;反之不予以推荐,这里λ=0.5,过滤系数Y为:
Y=0.5377≥0.5,
所以待推荐电影m′满足推荐条件,向组G予以推荐该电影。
对于论文对象,则根据待推荐论文m′的过滤系数Y,判断推荐条件:若Y≥λ,则表示待推荐论文m′满足推荐条件,并向组G予以推荐;反之不予以推荐,这里λ=0.5,过滤系数Y为:
Y=0.3019≤0.5,
所以待推荐论文m′不满足推荐条件,不向组G予以推荐该论文。
以上仅为本发明的两个具体实例,不构成对本发明的任何限制,显然用本发明方法可针对不同的领域,仅需修改获取其领域内关键字向量的方法,即可应用到网络上的不同领域,实现对不同领域对象的推荐。
Claims (3)
1.一种基于偏好模型的社会化过滤方法,包括如下步骤:
(1)从网页配置文件中获取一个组G={u1,u2,…,ug},ul为组员,1≤l≤g,g为组G中组员的个数;再从组内获取所有组员喜好对象的列表M={m1,m2,…,mp},mi为组员喜好对象,1≤i≤p,p为列表M中对象的个数;
(3)使用关键字表示组员喜好对象mi,得到组员喜好对象mi的关键字向量Wi={w1,w2,…,wn},wq为组员喜好对象mi的关键字,1≤q≤n,n为组员喜好对象mi的关键字个数;
(4)将对象列表M的关键字向量表示为W={W1,W2,…,Wp},Wi表示组员喜好对象mi的关键字向量,1≤i≤p;
(6)输入待分析对象m′,并使用关键字表示待分析对象m′,得到待分析对象m′的关键字向量W′={w′1,w′2,…,w′k},其中w′r为待分析对象m′的关键字,1≤r≤k,k为待分析对象m′的关键字个数;
(7)根据步骤(6)中所述待分析对象m′的关键字向量W′和步骤(5)中所述组G的加权影响向量计算待分析对象m′的过滤系数Y:
(8)根据步骤(7)中所述待分析对象m′的过滤系数Y,判断推荐条件:若Y≥λ,则表示待分析对象m′满足推荐条件,并向组G予以推荐;反之不予以推荐,λ为推荐***预设的阈值,0≤λ≤1。
2.根据权利要求1所述的基于偏好模型的社会化过滤方法,其中步骤(1)所述的喜好对象,是指组员在其网页上显示其喜好的对象信息;所述的喜好对象列表,是取每个组员所喜好对象的一个并集。
3.根据权利要求1所述的基于偏好模型的社会化过滤方法,所述步骤(2)中计算组员ul和组员喜好对象mi对组G的影响因子,包括如下步骤:
(2c)根据组员ul对组G的影响因子和组员喜好对象mi对组G的影响因子,计算组员喜好对象mi对组G的加权影响因子xi:
(2d)使用得到的加权影响因子xi,表示加权影响因子向量X={x1,x2,…,xp},对加权影响因子向量X进行归一化处理,得到加权影响向量
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201210000228 CN102521420B (zh) | 2012-01-04 | 2012-01-04 | 基于偏好模型的社会化过滤方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201210000228 CN102521420B (zh) | 2012-01-04 | 2012-01-04 | 基于偏好模型的社会化过滤方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102521420A true CN102521420A (zh) | 2012-06-27 |
CN102521420B CN102521420B (zh) | 2013-06-26 |
Family
ID=46292333
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201210000228 Expired - Fee Related CN102521420B (zh) | 2012-01-04 | 2012-01-04 | 基于偏好模型的社会化过滤方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102521420B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102799671A (zh) * | 2012-07-17 | 2012-11-28 | 西安电子科技大学 | 基于PageRank算法的网络个性化推荐方法 |
CN102929919A (zh) * | 2012-09-20 | 2013-02-13 | 西北工业大学 | 社交网络弱连接检测方法 |
CN103248626A (zh) * | 2013-05-07 | 2013-08-14 | 中国科学技术大学 | 一种信息传播方法及*** |
CN104376083A (zh) * | 2014-11-18 | 2015-02-25 | 电子科技大学 | 一种基于关注关系和多用户行为的图推荐方法 |
CN105608111A (zh) * | 2015-12-11 | 2016-05-25 | ***股份有限公司 | 向终端用户推荐对象的方法及*** |
CN106157150A (zh) * | 2015-03-30 | 2016-11-23 | 联想(北京)有限公司 | 信息处理方法与信息处理装置 |
CN106339483A (zh) * | 2016-08-30 | 2017-01-18 | 电子科技大学 | 一种移动社交网络中的社交活动推荐算法 |
CN108596695A (zh) * | 2018-05-15 | 2018-09-28 | 口口相传(北京)网络技术有限公司 | 实体推送方法及*** |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853470A (zh) * | 2010-05-28 | 2010-10-06 | 浙江大学 | 一种基于社会化标签的协同过滤方法 |
-
2012
- 2012-01-04 CN CN 201210000228 patent/CN102521420B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853470A (zh) * | 2010-05-28 | 2010-10-06 | 浙江大学 | 一种基于社会化标签的协同过滤方法 |
Non-Patent Citations (1)
Title |
---|
MUKUND DESHPANDE EL AT.: "《Item-based top-N recommendation algorithms》", 《ACM DIGITAL LIBRARY》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102799671A (zh) * | 2012-07-17 | 2012-11-28 | 西安电子科技大学 | 基于PageRank算法的网络个性化推荐方法 |
CN102799671B (zh) * | 2012-07-17 | 2015-04-29 | 西安电子科技大学 | 基于PageRank算法的网络个性化推荐方法 |
CN102929919A (zh) * | 2012-09-20 | 2013-02-13 | 西北工业大学 | 社交网络弱连接检测方法 |
CN102929919B (zh) * | 2012-09-20 | 2016-02-24 | 西北工业大学 | 社交网络弱连接检测方法 |
CN103248626A (zh) * | 2013-05-07 | 2013-08-14 | 中国科学技术大学 | 一种信息传播方法及*** |
CN103248626B (zh) * | 2013-05-07 | 2016-06-08 | 中国科学技术大学 | 一种信息传播方法及*** |
CN104376083A (zh) * | 2014-11-18 | 2015-02-25 | 电子科技大学 | 一种基于关注关系和多用户行为的图推荐方法 |
CN104376083B (zh) * | 2014-11-18 | 2017-06-27 | 电子科技大学 | 一种基于关注关系和多用户行为的图推荐方法 |
CN106157150A (zh) * | 2015-03-30 | 2016-11-23 | 联想(北京)有限公司 | 信息处理方法与信息处理装置 |
CN106157150B (zh) * | 2015-03-30 | 2019-12-24 | 联想(北京)有限公司 | 信息处理方法与信息处理装置 |
CN105608111A (zh) * | 2015-12-11 | 2016-05-25 | ***股份有限公司 | 向终端用户推荐对象的方法及*** |
CN105608111B (zh) * | 2015-12-11 | 2019-02-15 | ***股份有限公司 | 向终端用户推荐对象的方法及*** |
CN106339483A (zh) * | 2016-08-30 | 2017-01-18 | 电子科技大学 | 一种移动社交网络中的社交活动推荐算法 |
CN106339483B (zh) * | 2016-08-30 | 2020-04-21 | 电子科技大学 | 一种移动社交网络中的社交活动推荐方法 |
CN108596695A (zh) * | 2018-05-15 | 2018-09-28 | 口口相传(北京)网络技术有限公司 | 实体推送方法及*** |
CN108596695B (zh) * | 2018-05-15 | 2021-04-27 | 口口相传(北京)网络技术有限公司 | 实体推送方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN102521420B (zh) | 2013-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102521420B (zh) | 基于偏好模型的社会化过滤方法 | |
CN102799671B (zh) | 基于PageRank算法的网络个性化推荐方法 | |
CN104966125B (zh) | 一种社交网络的物品评分及推荐方法 | |
CN107833117B (zh) | 一种考虑标签信息的贝叶斯个性化排序推荐方法 | |
CN107341687B (zh) | 一种基于多维标签与分类排序的推荐算法 | |
CN107092929B (zh) | 基于聚类技术的刑事犯罪案件关联串并方法及*** | |
Liu et al. | Disentangled multimodal representation learning for recommendation | |
CN106874374A (zh) | 一种基于用户历史行为交互分析的推荐推送方法 | |
CN110674407A (zh) | 基于图卷积神经网络的混合推荐方法 | |
CN105550211A (zh) | 一种融合社交网络和项目内容的协同推荐*** | |
CN109947987B (zh) | 一种交叉协同过滤推荐方法 | |
CN105843860B (zh) | 一种基于并行item-based协同过滤算法的微博关注推荐方法 | |
CN103970866B (zh) | 基于微博文本的微博用户兴趣发现方法及*** | |
CN106874355A (zh) | 同时融入社交关系和用户相似度的协同过滤方法 | |
CN102789499A (zh) | 基于物品间情景化隐式关系的协同过滤方法 | |
CN106157156A (zh) | 一种基于用户社区的协作推荐*** | |
CN101957968A (zh) | 基于Hadoop的网上交易服务聚合方法 | |
Kavinkumar et al. | A hybrid approach for recommendation system with added feedback component | |
CN105740387B (zh) | 一种基于作者频繁模式的科技文献推荐方法 | |
CN105844302A (zh) | 基于深度学习的自动计算商品潮流指数的方法 | |
Prando et al. | Content-based Recommender System using Social Networks for Cold-start Users. | |
CN110990670A (zh) | 一种成长激励型图书推荐方法及推荐*** | |
CN111026976B (zh) | 微博特定事件关注群体识别方法 | |
Wang et al. | An enhanced multi-modal recommendation based on alternate training with knowledge graph representation | |
Vishwakarma et al. | A comparative study of K-means and K-medoid clustering for social media text mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130626 Termination date: 20190104 |
|
CF01 | Termination of patent right due to non-payment of annual fee |