CN106610970A - 基于协同过滤的内容推荐***与方法 - Google Patents

基于协同过滤的内容推荐***与方法 Download PDF

Info

Publication number
CN106610970A
CN106610970A CN201510688543.1A CN201510688543A CN106610970A CN 106610970 A CN106610970 A CN 106610970A CN 201510688543 A CN201510688543 A CN 201510688543A CN 106610970 A CN106610970 A CN 106610970A
Authority
CN
China
Prior art keywords
project
scoring
algorithm
similarity
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510688543.1A
Other languages
English (en)
Inventor
许颖浩
袁政
陆伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WENGUANG INTERDYANMIC TV CO Ltd SHANGHAI
Original Assignee
WENGUANG INTERDYANMIC TV CO Ltd SHANGHAI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WENGUANG INTERDYANMIC TV CO Ltd SHANGHAI filed Critical WENGUANG INTERDYANMIC TV CO Ltd SHANGHAI
Priority to CN201510688543.1A priority Critical patent/CN106610970A/zh
Publication of CN106610970A publication Critical patent/CN106610970A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于协同过滤的内容推荐***及方法,该***包括依次连接的数据预处理模块、算法混合模块、结果生成模块。其中,算法混合模块进一步包括算法选择单元、基于加权相似度的协作推荐算法单元、基于平衡评分预测机制的协作推荐算法单元、基于评分填充的混合推荐算法单元、利用评分时间特性的协作推荐算法单元。算法混合模块将预处理的数据分别输入基于加权相似度的协作推荐算法单元、基于平衡评分预测机制的协作推荐算法单元、基于评分填充的混合推荐算法单元、利用评分时间特性的协作推荐算法单元,算法选择单元选择最匹配的算法结果,并将算法结果输出至结果生成模块。本发明较好地解决了推荐***中的稀疏性问题和概念漂移问题。

Description

基于协同过滤的内容推荐***与方法
技术领域
本发明涉及推荐算法及其***,更具体地说,涉及一种基于协同过滤的内容推荐***与方法。
背景技术
随着互联网技术的流行,人们的生活越来越离不开网络,越来越多的人选择在网络上进行娱乐或购物。面对日益扩大的用户需求,以及越来越丰富的资源,如何能够充分理解用户的需求,快捷地为用户找到自己需要的资源,成为吸引用户的一个有力手段。基于此需求,个性化推荐技术渐渐受到重视,如今已经进入一个成熟发展的阶段。
个性化推荐技术,是用户行为分析技术的一个重要方面,简单的说,它就是一个为用户找到他可能感兴趣的资源的过程。为了实现个性化的资源推荐,必须“懂”用户、“懂”资源。通过对用户资料及大量历史行为的分析,从中得出用户的兴趣知识,然后以一种合理的方式来表示用户兴趣。同时对资源进行组织,选取合理表达方式来表达资源特征。然后采用恰当的推荐算法,匹配用户兴趣与资源特征,完成推荐。
基于内容的信息推荐方法的理论依据主要来自于信息检索和信息过滤,所谓的基于内容的推荐方法就是根据用户过去的浏览记录来向用户推荐用户没有接触过的推荐项。主要是从两个方法来描述基于内容的推荐方法:启发式的方法和基于模型的方法。启发式的方法就是用户凭借经验来定义相关的计算公式,然后再根据公式的计算结果和实际的结果进行验证,然后再不断修改公式以达到最终目的。而对于模型的方法就是根据以往的数据作为数据集,然后根据这个数据集来学习出一个模型。
一般的推荐***中运用到的启发式的方法就是使用tf-idf的方法来计算,跟还有tf-idf的方法计算出这个文档中出现权重比较高的关键字作为描述用户特征,并使用这些关键字作为描述用户特征的向量;然后再根据被推荐项中的权重高的关键字来作为推荐项的属性特征,然后再将这个两个向量最相近的(与用户特征的向量计算得分最高)的项推荐给用户。在计算用户特征向量和被推荐项的特征向量的相似性时,一般使用的是cosine方法,计算两个向量之间夹角的cosine值。
然而,推荐***在发展和应用的过程中,受到了各种问题不同程度的影响,特别是稀疏性问题和概念漂移问题已成为影响推荐质量的最主要问题。
发明内容
针对现有技术中存在的稀疏性问题和概念漂移问题,本发明的目的是提供一种基于协同过滤的内容推荐***与方法。
为实现上述目的,本发明采用如下技术方案:
一种基于协同过滤的内容推荐***,包括依次连接的数据预处理模块、算法混合模块、结果生成模块。其中,算法混合模块进一步包括算法选择单元、基于加权相似度的协作推荐算法单元、基于平衡评分预测机制的协作推荐算法单元、基于评分填充的混合推荐算法单元、利用评分时间特性的协作推荐算法单元。算法混合模块将预处理的数据分别输入基于加权相似度的协作推荐算法单元、基于平衡评分预测机制的协作推荐算法单元、基于评分填充的混合推荐算法单元、利用评分时间特性的协作推荐算法单元,算法选择单元选择最匹配的算法结果,并将算法结果输出至结果生成模块。
根据本发明的一实施例,基于加权相似度的协作推荐算法单元执行以下操作:计算项目评分重合因子和基于项目的加权相似度;选择邻居项目;基于项目评分进行推荐预测。
根据本发明的一实施例,基于平衡评分预测机制的协作推荐算法单元执行以下操作:计算基于项目的相似度;统计项目评分的中位数和权重平衡参数;选择邻居项目;基于项目评分进行推荐预测。
根据本发明的一实施例,基于评分填充的混合推荐算法单元执行以下操作:表示推荐项目内容;基于内容用户模型进行学习;计算基于内容的相似度;基于CBF的评分预测与填充;计算基于评分的相似度;选择邻居项目;基于项目评分进行推荐预测。
根据本发明的一实施例,利用评分时间特性的协作推荐算法单元执行以下操作:计算项目评分排序和时间权重;计算项目间基于时间的加权相似度;选择邻居项目;基于项目的加权评分进行推荐预测。
为实现上述目的,本发明采用如下技术方案:
一种基于协同过滤的内容推荐方法,包括以下步骤:数据预处理;将预处理的数据分别进行基于加权相似度的协作推荐算法、基于平衡评分预测机制的协作推荐算法、基于评分填充的混合推荐算法、利用评分时间特性的协作推荐算法;选择最匹配的算法结果,并将算法结果作为推荐内容。
根据本发明的一实施例,基于加权相似度的协作推荐算法包括以下步骤:计算项目评分重合因子和基于项目的加权相似度;选择邻居项目;基于项目评分进行推荐预测。
根据本发明的一实施例,基于平衡评分预测机制的协作推荐算法包括以下步骤:计算基于项目的相似度;统计项目评分的中位数和权重平衡参数;选择邻居项目;基于项目评分进行推荐预测。
根据本发明的一实施例,基于评分填充的混合推荐算法包括以下步骤:表示推荐项目内容;基于内容用户模型进行学习;计算基于内容的相似度;基于CBF的评分预测与填充;计算基于评分的相似度;选择邻居项目;基于项目评分进行推荐预测。
根据本发明的一实施例,利用评分时间特性的协作推荐算法包括以下步骤:计算项目评分排序和时间权重;计算项目间基于时间的加权相似度;选择邻居项目;基于项目的加权评分进行推荐预测。
在上述技术方案中,本发明的基于协同过滤的内容推荐***与方法较好地解决了推荐***中的稀疏性问题和概念漂移问题,使得结果与实际情况的匹配度更高。
附图说明
图1是本发明基于协同过滤的内容推荐***的结构示意图;
图2是评分时间权重衰减曲线示意图。
具体实施方式
下面结合附图和实施例进一步说明本发明的技术方案。
参照图1,本发明公开一种基于协同过滤的内容推荐***及其对应的方法。如图1所示,本发明的***包括依次连接的数据预处理模块1、算法混合模块2、结果生成模块3,并且算法混合模块2进一步包括算法选择单元21、基于加权相似度的协作推荐算法单元22、基于平衡评分预测机制的协作推荐算法单元23、基于评分填充的混合推荐算法单元24、利用评分时间特性的协作推荐算法单元25。
根据图1所示的结构,算法混合模块2将预处理的数据分别输入基于加权相似度的协作推荐算法单元22、基于平衡评分预测机制的协作推荐算法单元23、基于评分填充的混合推荐算法单元24、利用评分时间特性的协作推荐算法单元25,而算法选择单元21选择最匹配的算法结果,并将算法结果输出至结果生成模块3。
下面来进一步详细说明上述各个单元所执行的算法。
1.基于加权相似度的协作推荐算法单元22:
本发明针对稀疏性问题,通过对推荐的各执行过程的相似性计算进行必要修正克服和缓解稀疏性问题的影响,提出了基于加权相似度的协作推荐算法,引用了适应不同项目评分数量分布的重合因子(Overlap Factor),并通过重合因子实现对传统相似度计算的修正和改进。
重合因子从数量上度量了项目间公共评分在项目全局评分中所占比重,刻划了项目间公共评分的重合程度,强调了公共评分重合度在相似性度量中的重要性,通过将其作用于基于项目的相似度,可以从评分重合的角度区分相似度计算结果的可信度,即评分重合程度越高,则计算得到的相似度就越能反映项目间的真实相关性,反之,相似度计算的可信度则越低。对于参加项目间相似度计算的任意两项目ti和tj,已分别对两项目进行过评分的用户集合为Ui={uc|uc∈U∧rci≠0}和Uj={u|uc∈U∧rcj≠0},则评分重合因子可形式化为
式2-1
不同于显著性权重只与公共评分的绝对数量相关,通过公式2-1计算获得的重合因子不仅正比于两项目的公共评分数量,还反比于两项目各自的用户评分数量,保证评分重合因子可以适应不同项目的评分数量分布。通过使用重合因子可对传统相似度进行修正,形成对应的加权夹角余弦相似度(Weighted COsine SIMilarity,WCOSIM)和加权皮尔逊相关系数(Weighted Pearson Correlation Coefficient,WPCC),二者形式上可表示为传统相似度与重合因子的乘积,如公式所示。
式2-2
式2-3
需要注意,本发明提出的重合因子都是全局相似度修正方案,是对CF中的所有项目间相似度进行的整体调整,而非局部独立相似度的修正,这种全局修正相似度只在整体使用时有意义。在此基础之上,通过将上述加权相似度集成到传统IBCF推荐过程中,本发明提出了基于加权相似度的协作推荐算法WSBCF(Weighted Similarity-Boosted Collaborative Filtering),WSBCF算法的执行过程可分为以下3步:
(1)项目评分重合因子和基于项目的加权相似度计算
根据评分矩阵按照公式2-1计算任意项目ti和tj之间的重合因子,并通过公式计算任意项目间的加权相似度。
(2)邻居项目选择
针对目标用户uc的任意未访问项目根据步骤(1)获得的项目间加权相似度,对用户uc的已访问项目进行降序排序,并根据相对邻居选择阈值参数θ,选择top-θ部分项目作为项目ti的邻居集合Tci
(3)基于项目的评分预测
针对目标用户uc的任意未访问项目根据目标用户uc的已有评分、项目ti的邻居项目集合Tci及相似度sim,采用如下公式对项目ti进行评分预测
式2-4
WSBCF算法在评分预测过程中,采用了传统加权评分聚合方法,根据目标用户的已有评分和目标项目的邻居,以邻居与目标项目的相似度为权重,通过加权求和实现对目标项目的评分预测。WSBCF的总时间复杂度为O(mn)+O(mn2)+O(n),这对传统IBCF的时间复杂度O(mn2)的影响有限。
2.基于平衡评分预测机制的协作推荐算法单元23:
为了从评分预测角度减少稀疏性问题对IBCF推荐算法的影响,可在个性化评分与全局评分之间建立一种动态平衡。本发明建立了一种结合个性化评分与全局评分的动态平衡评分预测机制,并提出了一种基于平衡评分预测机制的协作推荐算法。
为使两类评分在基于项目的评分预测中都能发挥各自的作用,本发明提出的动态平衡评分预测机制是一种关于两类评分的线性组合。同时,为了保持两类评分的动态平衡,可通过权重的变化来动态调整二者所发挥的作用,而将全局评分数据的分布特性作为权重动态调整的主要依据。针对推荐***的任意用户uc及其未访问项目ti,集成两类评分的动态平衡评分预测可形式化为
式2-5
其中,表示针对目标项目ti基于项目的个性化评分,该个性化评分采用了公式2-12所描述的IBCF评分预测方法,gi为目标项目的全局评分,而αi为个性化评分与全局评分之间的权重平衡参数。
针对稀疏性问题对评分预测过程的影响,结合上述动态平衡评分预测机制,通过对传统IBCF评分预测过程进行必要的修正,形成一种基于平衡评分预测机制的协作推荐算法IBCFBP(Item-Based Collaborative Filteringintegrating Balanced Prediction),该算法的执行过程主要包括以下4步:
(1)基于项目的相似度计算
基于已有评分数据,通过基于项目的相似度计算方法度量项目之间的相似度,对于任意项目ti和tj,基于项目的COSIM相似度可表示为
式2-6
或者采用基于项目的PCC相似度,可表示为
式2-7
(2)统计项目评分中位数和权重平衡参数
根据任意项目ti已获得的评分数据,统计该项目的全局评分中位数gi,并采用公式2-5、2-6或者2-7之一统计该项目全局评分数据的分散性,以表示平衡评分预测机制的权重平衡参数αi
(3)邻居项目选择
针对目标用户uc的任意未访问项目ti,根据该用户对已访问项目的评分,结合步骤(1)计算获得的项目间相似度,对用户uc的已访问项目进行降序排序,并选择top-θ部分项目作为项目ti的邻居项目集合Tci
(4)基于项目的评分预测
针对用户uc的任意未访问项目ti,根据该用户的已有评分、项目ti的邻居项目集合Tci以及相关相似度,采用公式对项目ti进行平衡评分预测。
IBCFBP的总时间复杂度为O(n)+O(mn2)+O(n),与传统协作推荐算法的时间复杂度O(mn2)相当,而且项目中位数和权重平衡参数的计算均可离线完成,所以二者对推荐的计算效率影响基本可以忽略。
3.基于评分填充的混合推荐算法单元24:
本发明提出了一种基于评分填充的混合推荐算法HRRF(HybridRecommendation based on Rating Filling),该算法可根据用户已访问项目的信息内容实现自动化用户建模,并将基于内容的用户模型用于实现对用户未访问项目的个性化评分填充,提高了评分矩阵的整体密度,进而基于经填充处理的评分矩阵,采用IBCF推荐框架实现评分的预测,HRRF从评分填充的角度,减少了稀疏性问题通过评分矩阵对CF相似度计算和评分预测过程的影响。
基于内容的用户模型是HRRF实现评分填充的依据,HRRF基于内容的用户模型在本质上起到了Filterbot的作用,但不同于Filterbot人工构造的方式,HRRF的用户模型是通过机器学习自动构造的。将用户模型的构造理解为一种基于机器学习的文本分类任务,根据已访问项目的内容信息,通过一定的机器学习算法可以自动训练针对不同用户的分类模型,并将该模型作为相应的用户描述,HRRF采用了Rocchio学习算法来实现基于内容的用户建模,也可以根据实际推荐环境选择其他机器学习算法来训练用户模型。
HRRF混合推荐算法的整体执行过程可以描述为以下7个步骤:
(1)推荐项目内容表示
因为HRRF的用户模型是建立在推荐对象的内容基础上的,所以首先需要对信息对象的内容进行表示,HRRF采用了传统的VSM模型表示推荐对象的内容,设推荐***包含由n个推荐项目构成的项目集合T={ts|1≤s≤n},用于描述项目内容的特征空间为X={x1,x2,...,xd},推荐对象ti的特征向量为其中特征分量表示特征xj对于项目ti的权重。设表示特征xj在项目ti内容中出现的词频,而dfj表示包含特征xj的项目个数,则特征权重可表示为
式2-8
(2)基于内容用户模型的学习
HRRF的用户模型使用了与推荐项目相同的特征空间X={x1,x2,...,xd},设推荐***的用户集合U={uc|1≤c≤m},用户ui基于内容的用户模型表示为根据用户已有正例评分项目集合T+和负例评分项目集合T-,评分分类的阈值选择该目标用户的评分均值,根据Rocchio学习算法训练用户模型的特征权重可表示为
式2-9
由于Rocchio学习算法是一种批学习算法(Batch Learning),所以用户模型必须进行周期性更新,但模型的更新可以离线完成,不会对推荐***的在线计算性能造太大影响。
(3)基于内容的相似度计算
根据步骤(2)所获得的基于内容的用户模型,针对推荐***中的任意用户ui,通过传统基于内容的相似度计算方法度量该用户与其任意未评分项目tj在内容上的相似度,例如,可以采用公式2-10的COSIM相似度计算形式。
式2-10
(4)基于CBF的评分预测与填充
为了提高评分矩阵的整体密度,根据步骤(3)获得的用户模型与未评分项目间的相似度,采用传统CBF对用户的未访问项目进行评分预测,并使用预测评分填充相应的评分矩阵位置,形成用户-项目评分全矩阵。在评分值域范围为[min,max]的推荐***中,对于用户ui以及其任意未访问项目tj,则预测评分值为
r′ij=min+s(i,j)|max-min| 式2-11
(5)基于评分的相似度计算
通过步骤(1)-(4)的处理,原始稀疏用户评分矩阵已得到了填充处理,后续步骤将采用IBCF算法实现推荐,对于任意项目ti和tj,二者间基于项目的COSIM相似度为
式2-12
注意,需要根据用户是否已访问过项目ti,决定选择基于内容的填充评分值r′ci或原始评分值rci来表示公式2-12中的评分r″ci,即
式2-13
(6)邻居项目选择
针对目标项目ti,根据步骤(5)获得的项目间相似度,对所有其他项目进行降序排序,并选择最相似的k个项目构成项目ti的邻居集合Ti
(7)基于项目的评分预测
针对目标用户ui的任意未访问项目tj,通过IBCF方法进行该项目的评分预测。鉴于通过CBF生成的填充评分在可信度上要低于真实评分,在评分预测过程中,通过适当缩小相似度来降低评分填充值在评分预测中的作用,评分预测的计算可表示为
式2-14
TIBCF算法只在相似度计算和评分预测过程中引入了时间权重,从计算量上来看,时间权重的加入对推荐的整体计算复杂度影响有限。
4.利用评分时间特性的协作推荐算法单元25:
目前的推荐算法没有建立感知用户兴趣变化的动态机制,所形成的用户兴趣模型是一种静态模型,随着概念漂移的发生,推荐***的推荐质量将表现的不稳定,特别是用户兴趣发生突变时,推荐的准确性将急剧恶化。因此,发明针对时漂移问题,发明提出了一种利用评分时间特性的协作推荐算法TIBCF(Temporal Item-Based Collaborative Filtering,TIBCF)。
本发明提出的TIBCF算法在克服概念漂移的过程中,需要根据评分的生成时间对评分的重要性进行区分。因此,TIBCF算法对传统评分矩阵进行了必要的完善,除记录评分数值外,还记录了评分的产生时间信息,TIBCF算法中的用户-项目评分矩阵可表示为:
R(m×n)={<rij,dij>|(ui∈U)∧(tj∈T)∧(0≤rij≤q)∧(dij=NULL∨dij∈DateTime)}
用户ui针对项目tj的评分信息在评分矩阵R(m×n)表示为二元组<rij,dij>,rij和dij分别对应评分值和评分时间。为了在相似度计算和评分预测中从时间角度区分评分的重要性,TIBCF算法引入了时间权重的概念,为不同时间产生的评分赋予相应的时间权重。针对用户ui在时间dij对项目tj所产生的评分rij,TIBCF根据公式的指数衰减函数形式计算该评分的时间权重w(i,j)。
式2-15
其中,Ri为用户ui的历史评分有序集合,RK函数表示评分rij在Ri中的位置编号。结合文献中AWS的方法,TIBCF设置评分权重的半衰期(Half-Life Span)为λ/log(|Ri|),其既与用户的评分数量相关,又与衰减参数λ相关。通过衰减参数λ可以调整半衰期的长度,λ的选择与具体应用的评分分布有关,可以通过实验获得,也可依据推荐***准确性的变化而动态调整。对于具有500个评分的用户,图2展示了λ=300和λ=500时评分权重衰减曲线的示例。
在根据公式计算获得用不同评分的时间权重后,TIBCF在传统IBCF算法的相似度计算和评分预测中都集成了该权重,从而分别实现相应基于时间的加权相似度计算和加权评分预测,通过对IBCF两个关键过程进行基于时间的修正,可以最大限度地减少概念漂移问题对推荐的影响。TIBCF推荐算法的执行过程可以分为以下4个步骤:
(1)项目评分排序和时间权重计算
针对任意用户按照该用户已有评分的产生时间由近至远,对其所有历史评分进行按时间的排序生成历史评分有序集合Ri,计算用户ui的任意历史评分rij的时间权重w(i,j)。
(2)项目间基于时间的加权相似度计算
通过步骤(1)获得所有评分的时间权重后,对***中的任意两项目ti和tj,按照公式2-15或2-16计算二者间基于时间的加权皮尔逊相关系数(Temporal Pearson Correlation Coefficient,TPCC)或基于时间的加权夹角余弦相似度(Temporal COsine SIMilarity,TCOSIM)。
式2-16
式2-17
(3)邻居项目选择
针对目标用户uc的任意未访问项目ti,根据步骤(2)获得的项目间相似度,对用户uc的所有已访问项目进行降序排序,并选择top-θ部分项目作为项目ti的邻居项目集合Tci
(4)基于项目的加权评分预测
针对目标用户uc的任意未访问项目ti,根据用户uc的已有评分、ti的邻居项目集合Tci、评分时间权重w及相应加权相似度sim,通过如下公式对项目ti进行评分预测
式2-18
TIBCF算法只在相似度计算和评分预测过程中引入了时间权重,从计算量上来看,时间权重的加入对推荐的整体计算复杂度影响有限,仍可以保持与传统IBCF算法O(mn2)相当的计算时间复杂度水平。
本技术领域中的普通技术人员应当认识到,以上的实施例仅是用来说明本发明,而并非用作为对本发明的限定,只要在本发明的实质精神范围内,对以上所述实施例的变化、变型都将落在本发明的权利要求书范围内。

Claims (10)

1.一种基于协同过滤的内容推荐***,其特征在于,包括:
依次连接的数据预处理模块、算法混合模块、结果生成模块;
其中,算法混合模块进一步包括算法选择单元、基于加权相似度的协作推荐算法单元、基于平衡评分预测机制的协作推荐算法单元、基于评分填充的混合推荐算法单元、利用评分时间特性的协作推荐算法单元;
所述算法混合模块将预处理的数据分别输入基于加权相似度的协作推荐算法单元、基于平衡评分预测机制的协作推荐算法单元、基于评分填充的混合推荐算法单元、利用评分时间特性的协作推荐算法单元,所述算法选择单元选择最匹配的算法结果,并将所述算法结果输出至结果生成模块。
2.如权利要求1所述的基于协同过滤的内容推荐***,其特征在于,所述基于加权相似度的协作推荐算法单元执行以下操作:
计算项目评分重合因子和基于项目的加权相似度;
选择邻居项目;
基于项目评分进行推荐预测。
3.如权利要求1所述的基于协同过滤的内容推荐***,其特征在于,所述基于平衡评分预测机制的协作推荐算法单元执行以下操作:
计算基于项目的相似度;
统计项目评分的中位数和权重平衡参数;
选择邻居项目;
基于项目评分进行推荐预测。
4.如权利要求1所述的基于协同过滤的内容推荐***,其特征在于,所述基于评分填充的混合推荐算法单元执行以下操作:
表示推荐项目内容;
基于内容用户模型进行学习;
计算基于内容的相似度;
基于CBF的评分预测与填充;
计算基于评分的相似度;
选择邻居项目;
基于项目评分进行推荐预测。
5.如权利要求1所述的基于协同过滤的内容推荐***,其特征在于,所述利用评分时间特性的协作推荐算法单元执行以下操作:
计算项目评分排序和时间权重;
计算项目间基于时间的加权相似度;
选择邻居项目;
基于项目的加权评分进行推荐预测。
6.一种基于协同过滤的内容推荐方法,其特征在于,包括以下步骤:
数据预处理;
将预处理的数据分别进行基于加权相似度的协作推荐算法、基于平衡评分预测机制的协作推荐算法、基于评分填充的混合推荐算法、利用评分时间特性的协作推荐算法;
选择最匹配的算法结果,并将所述算法结果作为推荐内容。
7.如权利要求6所述的基于协同过滤的内容推荐方法,其特征在于,基于加权相似度的协作推荐算法包括以下步骤:
计算项目评分重合因子和基于项目的加权相似度;
选择邻居项目;
基于项目评分进行推荐预测。
8.如权利要求6所述的基于协同过滤的内容推荐方法,其特征在于,所述基于平衡评分预测机制的协作推荐算法包括以下步骤:
计算基于项目的相似度;
统计项目评分的中位数和权重平衡参数;
选择邻居项目;
基于项目评分进行推荐预测。
9.如权利要求6所述的基于协同过滤的内容推荐方法,其特征在于,所述基于评分填充的混合推荐算法包括以下步骤:
表示推荐项目内容;
基于内容用户模型进行学习;
计算基于内容的相似度;
基于CBF的评分预测与填充;
计算基于评分的相似度;
选择邻居项目;
基于项目评分进行推荐预测。
10.如权利要求6所述的基于协同过滤的内容推荐方法,其特征在于,所述利用评分时间特性的协作推荐算法包括以下步骤:
计算项目评分排序和时间权重;
计算项目间基于时间的加权相似度;
选择邻居项目;
基于项目的加权评分进行推荐预测。
CN201510688543.1A 2015-10-21 2015-10-21 基于协同过滤的内容推荐***与方法 Pending CN106610970A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510688543.1A CN106610970A (zh) 2015-10-21 2015-10-21 基于协同过滤的内容推荐***与方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510688543.1A CN106610970A (zh) 2015-10-21 2015-10-21 基于协同过滤的内容推荐***与方法

Publications (1)

Publication Number Publication Date
CN106610970A true CN106610970A (zh) 2017-05-03

Family

ID=58611410

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510688543.1A Pending CN106610970A (zh) 2015-10-21 2015-10-21 基于协同过滤的内容推荐***与方法

Country Status (1)

Country Link
CN (1) CN106610970A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107230002A (zh) * 2017-06-09 2017-10-03 天津大学 基于项目的评分矩阵预测算法
CN107491557A (zh) * 2017-09-06 2017-12-19 徐州医科大学 一种基于差分隐私的TopN协同过滤推荐方法
CN108228745A (zh) * 2017-12-19 2018-06-29 北京荣之联科技股份有限公司 一种基于协同过滤优化的推荐算法和装置
CN108810640A (zh) * 2018-06-15 2018-11-13 重庆知遨科技有限公司 一种电视节目的推荐方法
CN108875045A (zh) * 2018-06-28 2018-11-23 第四范式(北京)技术有限公司 针对文本分类来执行机器学习过程的方法及其***
CN109933717A (zh) * 2019-01-17 2019-06-25 华南理工大学 一种基于混合推荐算法的学术会议推荐***
CN110580311A (zh) * 2019-06-21 2019-12-17 东华大学 动态时间感知协同过滤方法
CN111339434A (zh) * 2018-12-03 2020-06-26 阿里巴巴集团控股有限公司 信息推荐方法、装置、电子设备及计算机存储介质
CN111400591A (zh) * 2020-03-11 2020-07-10 腾讯科技(北京)有限公司 资讯信息推荐方法、装置、电子设备及存储介质
CN112748941A (zh) * 2020-08-06 2021-05-04 腾讯科技(深圳)有限公司 基于反馈信息的目标应用程序的更新方法和装置
CN113256387A (zh) * 2021-06-15 2021-08-13 杭州魔点科技有限公司 项目物品的个性化推荐方法、电子设备和存储介质
US11727312B2 (en) 2019-09-03 2023-08-15 International Business Machines Corporation Generating personalized recommendations to address a target problem

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663128A (zh) * 2012-04-24 2012-09-12 南京师范大学 一种大规模协同过滤的推荐***
CN102880691A (zh) * 2012-09-19 2013-01-16 北京航空航天大学深圳研究院 一种基于用户亲密度的混合推荐***及方法
CN103578007A (zh) * 2012-07-20 2014-02-12 三星电子(中国)研发中心 用于智能设备的混合推荐***及其方法
CN103617540A (zh) * 2013-10-17 2014-03-05 浙江大学 一种追踪用户兴趣变化的电子商务推荐方法
CN105354720A (zh) * 2014-09-18 2016-02-24 中南大学 一种基于可视聚类对消费地点进行混合推荐的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663128A (zh) * 2012-04-24 2012-09-12 南京师范大学 一种大规模协同过滤的推荐***
CN103578007A (zh) * 2012-07-20 2014-02-12 三星电子(中国)研发中心 用于智能设备的混合推荐***及其方法
CN102880691A (zh) * 2012-09-19 2013-01-16 北京航空航天大学深圳研究院 一种基于用户亲密度的混合推荐***及方法
CN103617540A (zh) * 2013-10-17 2014-03-05 浙江大学 一种追踪用户兴趣变化的电子商务推荐方法
CN105354720A (zh) * 2014-09-18 2016-02-24 中南大学 一种基于可视聚类对消费地点进行混合推荐的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
任磊: ""推荐***关键技术研究"", 《中国博士学位论文全文数据库•信息科技辑》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107230002A (zh) * 2017-06-09 2017-10-03 天津大学 基于项目的评分矩阵预测算法
CN107491557A (zh) * 2017-09-06 2017-12-19 徐州医科大学 一种基于差分隐私的TopN协同过滤推荐方法
CN108228745A (zh) * 2017-12-19 2018-06-29 北京荣之联科技股份有限公司 一种基于协同过滤优化的推荐算法和装置
CN108810640B (zh) * 2018-06-15 2020-12-18 浙江广业软件科技有限公司 一种电视节目的推荐方法
CN108810640A (zh) * 2018-06-15 2018-11-13 重庆知遨科技有限公司 一种电视节目的推荐方法
CN108875045A (zh) * 2018-06-28 2018-11-23 第四范式(北京)技术有限公司 针对文本分类来执行机器学习过程的方法及其***
CN111339434A (zh) * 2018-12-03 2020-06-26 阿里巴巴集团控股有限公司 信息推荐方法、装置、电子设备及计算机存储介质
CN111339434B (zh) * 2018-12-03 2023-04-28 阿里巴巴集团控股有限公司 信息推荐方法、装置、电子设备及计算机存储介质
CN109933717A (zh) * 2019-01-17 2019-06-25 华南理工大学 一种基于混合推荐算法的学术会议推荐***
CN109933717B (zh) * 2019-01-17 2021-05-14 华南理工大学 一种基于混合推荐算法的学术会议推荐***
CN110580311A (zh) * 2019-06-21 2019-12-17 东华大学 动态时间感知协同过滤方法
CN110580311B (zh) * 2019-06-21 2023-08-01 东华大学 动态时间感知协同过滤方法
US11727312B2 (en) 2019-09-03 2023-08-15 International Business Machines Corporation Generating personalized recommendations to address a target problem
CN111400591A (zh) * 2020-03-11 2020-07-10 腾讯科技(北京)有限公司 资讯信息推荐方法、装置、电子设备及存储介质
CN111400591B (zh) * 2020-03-11 2023-04-07 深圳市雅阅科技有限公司 资讯信息推荐方法、装置、电子设备及存储介质
CN112748941A (zh) * 2020-08-06 2021-05-04 腾讯科技(深圳)有限公司 基于反馈信息的目标应用程序的更新方法和装置
CN112748941B (zh) * 2020-08-06 2023-12-12 腾讯科技(深圳)有限公司 基于反馈信息的目标应用程序的更新方法和装置
CN113256387A (zh) * 2021-06-15 2021-08-13 杭州魔点科技有限公司 项目物品的个性化推荐方法、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN106610970A (zh) 基于协同过滤的内容推荐***与方法
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及***
CN103514304B (zh) 一种项目推荐方法和装置
CN111444395B (zh) 获取实体间关系表达的方法、***和设备、广告召回***
CN104063481A (zh) 一种基于用户实时兴趣向量的电影个性化推荐方法
CN109325146A (zh) 一种视频推荐方法、装置、存储介质和服务器
CN111444304A (zh) 搜索排序的方法和装置
CN113569129A (zh) 点击率预测模型处理方法、内容推荐方法、装置及设备
CN103559303A (zh) 一种对数据挖掘算法的评估与选择方法
CN109816015B (zh) 一种基于材料数据的推荐方法及***
CN106846029B (zh) 基于遗传算法和新型相似度计算策略的协同过滤推荐算法
CN107016566A (zh) 基于本体的用户模型构建方法
CN110264277A (zh) 由计算设备执行的数据处理方法及装置、介质和计算设备
Du et al. Pcard: Personalized restaurants recommendation from card payment transaction records
Fu et al. Collaborative filtering recommendation algorithm towards intelligent community
CN116244513A (zh) 随机群组poi推荐方法、***、设备及存储介质
CN107305559A (zh) 一种应用推荐方法和装置
Wei et al. Online education recommendation model based on user behavior data analysis
CN112464106B (zh) 对象推荐方法及装置
CN105279699A (zh) 一种基于协同过滤并结合多类别非信任关系的推荐方法
CN116957128A (zh) 业务指标预测方法、装置、设备和存储介质
Li et al. Collaborative filtering recommendation algorithm based on user characteristics and user interests
CN110766488A (zh) 一种自动确定主题场景的方法和装置
CN117132323A (zh) 推荐内容的分析方法、装置、设备、介质及程序产品
CN113657766A (zh) 一种基于游客多元数据的旅游景区欢乐指数的计量方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170503

WD01 Invention patent application deemed withdrawn after publication