CN109711912A

CN109711912A - 一种融合FP-growth算法和Slope-One算法的混合推荐模型

Info

Publication number: CN109711912A
Application number: CN201711004573.1A
Authority: CN
Inventors: 崔忠伟; 牛俊洁; 左羽; 于国龙; 赵勇
Original assignee: Guizhou Education University
Current assignee: Guizhou Education University
Priority date: 2017-10-25
Filing date: 2017-10-25
Publication date: 2019-05-03

Abstract

本发明公开了一种融合FP‑growth算法和Slope One算法的混合推荐模型，该模型采用FP‑growth算法和Slope One算法使得推荐结果更加准确。

Description

一种融合FP-growth算法和Slope-One算法的混合推荐模型

技术领域

本发明涉及推荐算法领域，尤其涉及一种融合FP-growth算法和Slope One算法的混合推荐模型。

背景技术

2005年Lemire教授提出了Slope One算法，其核心思想是：线性回归f(x)＝x+b。借助大量用户对item的评分，可以得到任意两个item的回归直线。未评分item的评分(值根据已评分item评分值计算，根据计算出的评分值排序做Top-N推荐。它的优点是算法简单，容易实现，可扩展性也不错，但必须基于评分，如果没有评分，需要构造评分。并给出了Weighted-Slope One算法模型修正Slope One未考虑对物品产生行为的用户数对偏差的贡献度不同，但Weighted-Slope One不具有解释性，推荐结构不够精确。

目前对Slope One算法改进一般使用聚类方法提高其精度，比如使用改进的 K-means方法聚类用户后，利用User-CF搜索最近邻居，结合Slope One为目标用户推荐对应的产品。又比如融合领近项目的Slope One算法，基于项目属性相似和MapReduce 并行化的Slope One算法。这些混合算法都是在提高算法的精度上做出了一定的贡献，但其关联性和可解释性相对较差。

发明内容

本发明的主要目的在于提供一种融合FP-growth算法和Slope One算法的混合推荐模型，能够是推荐结构更加的准确。

为达到以上目的，本发明采用的技术方案为：一种融合FP-growth算法和SlopeOne 算法的混合推荐模型，通过以下步骤实现：

1)输入推荐参数：数据集和最小支持度；

2)对数据集在数据库中进行第一次扫描，获得频繁项的集合F和其中每个频繁项的支持度，并对F中的所有频繁项按其支持度进行降序排序，得到频繁项表L，移除头指针表中不满足最小支持度的元素项；

3)再次扫描数据库，由每个事务不断构建FP-Tree，同时对每个数据集中的项集初始化空FP树；

4)根据已经构造好的FP-Tree、项集α、最小支持度对每个项集进行过滤和重排序；

5)使用步骤4中的项集更新FP树；

6)根据得到的数据集D中的频繁项集L，构建频繁项集与未评分项集构造轻量级矩阵；根据频繁项集数据，构建self.diffs/self.freqs字典；

7)计算与目标项的评分偏差dev；

8)对得到的评分偏差dev采用Weighted-Slope One算法进行修正。

优选地，步骤7中采用以下公式进行计算：

其中，S_j，i( )统计在同一时间对物品i和j的评分的所有用户的集合。

与现有技术相比，本发明的推荐模型的推荐结果更加的准确。

附图说明

图1是根据本发明的一个优选实施例的原理图

具体实施方式

以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例，本领域技术人员可以想到其他显而易见的变型。

如图1所示的一种融合FP-growth算法和Slope One算法的混合推荐模型，通过以下步骤实现：

1)输入推荐参数：数据集和最小支持度；

2)对数据集在数据库中进行第一次扫描，获得频繁项的集合F和其中每个频繁项的支持度，并对F中的所有频繁项按其支持度进行降序排序，结果为频繁项表L；移除头指针表中不满足最小支持度的元素项；

3)再次扫描数据库，由每个事务不断构建FP-Tree。对每个数据集中的项集：初始化空FP树，使FP-Tree的根节点为null，同时从数据库中取出事务，按照L排序，然后把每个项逐个添加到FP-Tree的分枝上去，得到FP树和头指针表。FP-Tree的根节点作用是将所有相同的项链接起来，这样更容易遍历。

4)根据已经构造好的FP-Tree、项集α(初值为空)、最小支持度min_sup对每个项集进行过滤和重排序；

5)使用这些项集更新FP树，从FP树的根节点开始：L初值为空，if Tree只包含单个路径P则遍历路径P中节点的每个组合(记为β)do，产生项目集α∪β，其支持度等于β中节点的最小支持度数；eturn(return？)L＝L∪支持度数大于min_sup 的项目集β∪α；

if Tree包含多个路径P则遍历Tree的头表中的每个频繁项αf do；产生一个项目集β＝αf∪α，其支持度等于αf的支持度；构造β的条件模式基B，并根据该条件模式基B构造β的条件FP-树Treeβ；if Treeβ≠Φthen，递归调用 FP-Growth(Treeβ,β)；如果当前项集的第一个元素项存在于FP树当前节点的子节点中，则更新这个子节点的计数值。

7)通过以下公式计算与目标项的评分偏差dev：

其中，用S_j，i( )统计在同一时间对物品i和j的评分的所有用户的集合，另外，S_j，i( )所包含的元素总数则由card( )表示。通过对item i相对于item j的平均偏差的定义，可得到用户u对item j的预测值，而此功能将由P(u)_j，i＝dev_j，i+u_i实现。假设数据集数据比较稠密，使用近似作简化：

当把所有这种可能的预测平均起来，可以预测出用户u对物品j的评分。其中，R_j表示所有用户u已经给予评分且满足条件(i≠j且S_j，i非空)的item集合：

所以对最终的平均使用加权进行一个修正，这也就是推荐更为合理的 Weighted-Slope One推荐算法。

对新的用户偏好，根据self.diffs/self.freqs对新用户进行评分预测。推算出对其它Items的可能Rating值:public IDictionary<int,float>Predict(IDictionary<int,float> userRatings)两重循环,外层循环遍历_Items中所有的Items；内层遍历userRatings,用此用户的ratings结合第一步得到的矩阵,推算此用户对***中每个项目的Rating在返回结果之前，进行过滤返回一个带权重预测值的新字典结果中除去了用户已经评分过的内容和物品计数为零的内容。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是本发明的原理，在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。

Claims

1.一种融合FP-growth算法和Slope-One算法的混合推荐模型，通过以下步骤实现：

1)输入推荐参数：数据集和最小支持度；

5)使用步骤4中的项集更新FP树；

7)计算与目标项的评分偏差dev；

8)对得到的评分偏差dev采用Weighted-Slope-One算法进行修正。

2.根据权利要求1所述的一种融合FP-growth算法和Slope-One算法的混合推荐模型，其特征在于，步骤7中采用以下公式进行计算：

其中，统计在同一时间对物品和的评分的所有用户的集合。