CN108921670A

CN108921670A - 一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法

Info

Publication number: CN108921670A
Application number: CN201810724191.4A
Authority: CN
Inventors: 冯永; 王亚男; 王亚清; 魏然; 尚家兴
Original assignee: Chongqing Medical Data Mdt Infotech Ltd; Chongqing University
Current assignee: Chongqing Medical Data Mdt Infotech Ltd; Chongqing University
Priority date: 2018-07-04
Filing date: 2018-07-04
Publication date: 2018-11-30
Anticipated expiration: 2038-07-04
Also published as: CN108921670B

Abstract

本发明公开了一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法，包括从电商平台的数据集中获取用户购买药品的购买记录数据，并对购买记录数据进行整理得到用户‑药品评分矩阵；基于购买记录数据中相似用户的购买记录建立用户潜在兴趣模型，并基于用户潜在兴趣模型获取用户潜在兴趣数据；将用户潜在兴趣数据合并到用户‑药品评分矩阵；基于购买记录数据中用户购买过的药品所属类别的流行度和用户对该类别的偏爱建立类别相关模型；对合并了用户潜在兴趣数据的用户‑药品评分矩阵进行矩阵分解，并将分解得到的用户偏好预测矩阵和类别相关模型进行线性融合生成推荐列表。本发明有效解决了现有技术中评分矩阵稀疏性对推荐效率造成影响的问题。

Description

一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法

技术领域

本发明涉及计算机技术领域，尤其涉及一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法。

背景技术

近年来，电子商务随着互联网和信息技术的发展日趋活跃，越来越多的消费者开始网上购物。电子商务不仅开拓了新的商业盈利渠道，还颠覆了传统的销售模式，从空间上、时间上赋予交易双方更多的便利性、自主性。其中，医药，作为日常生活必需品，近几年也开始逐渐进入电商领域，越来越多的医药企业获得了建立医药电子商务平台的资格，医药行业的电子商务发展前途一片光明。

由于医药电商平台包含多种类，大数量的药品，用户需要花费大量的时间和精力去筛选出需要的药品，极大的降低了平台的用户体验。为了解决用户在海量药品中耗费过多时间导致用户体验差的问题，将个性化推荐技术引入到医药电商平台中是必要的。

在医药电商平台中，由于药品的特殊性，用户对药品的评分数量会远低于传统推荐中用户对物品(音乐、电影)的评分数量，用户-药品评分矩阵十分稀疏，医药电商平台的推荐面临着比传统推荐更为严重的数据冷启动问题。

面对医药电商领域海量且多样化的药品，如何设计优秀的推荐算法为用户提供精确的推荐是一个值得深思的问题。目前，该领域已经存在一些推荐算法，但是这些算法大多是在原始用户-药品评分矩阵上进行的，受该评分矩阵稀疏性影响很大。

因此，如何有效的缓解评分矩阵稀疏性对推荐效率造成的影响是一项亟待解决的问题。

发明内容

有鉴于此，本发明提供了一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法，通过用户的历史购买数据学习到用户潜在兴趣，然后将用户潜在兴趣填充进用户-药品评分矩阵，有效解决了现有技术中评分矩阵稀疏性对推荐效率造成影响的问题。

为了实现本发明的上述目的，本发明提供了一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法，所述方法包括如下步骤：

S1，从电商平台的数据集中获取用户购买药品的购买记录数据，并对购买记录数据进行整理得到用户-药品评分矩阵；

S2，基于购买记录数据中相似用户的购买记录建立用户潜在兴趣模型，并基于用户潜在兴趣模型得到用户潜在兴趣数据；

S3，将用户潜在兴趣数据合并到用户-药品评分矩阵；缓解矩阵稀疏度对推荐结果造成的影响，提高推荐效率；

S4，基于购买记录数据中用户购买过的药品所属类别的流行度和用户对该类别的偏爱建立类别相关模型；

S5，对合并了用户潜在兴趣数据的用户-药品评分矩阵进行矩阵分解，并将分解得到的用户偏好预测矩阵和步骤S4中的类别相关模型进行线性融合生成推荐列表。

优选地，所述步骤S1包括如下步骤：

S1-1，整理用户的购买记录数据，购买记录数据包括用户对购买的药品的评分、购买时间、药品种类，得到用户集合U＝{u₁,u₂,...,u_i...,u_n}和药品集合D＝{d₁,d₂,...,d_j...,d_m}，其中，u表示用户，i代表用户的ID；d表示药品，j代表药品的ID；

S1-2，统计每个用户购买并且评分的药品数量，若用户购买并评分的药品数量低于预设值，则把这种用户删除；以获得包含足够用户信息的用户；

S1-3，统计每一种药品被购买并评分的次数，若药品被购买的频次低于预设值，则把这种药品的相关记录删除；因数据的缺失，容易出现噪声；

S1-4，基于整理好的购买记录数据得到原始用户-药品评分矩阵。

优选地，所述步骤S2包括如下步骤：

S2-1，合并时间因素的相似用户集合F_i：

1)采用把时间离散化的方法，把一年分为T个离散时段，把步骤S1中原始的用户-药品评分矩阵按照购买评分时间分成T个时段-用户-药品评分矩阵；

2)给定目标用户i,定义用户i在时段t(t∈T)的评分向量为：r_i,t＝{r_i,t,1,r_i,t,2,..r_i,t,m}，其中，r_i,t,m表示用户i在时段t对药品m的评分值。对于用户i，计算该用户在任意两个时段t_p和t_q的评分向量和的余弦相似性，然后取所有用户在这两个时段的余弦相似值的平均值作为这两个时段相似度，从而得到离散时段中任意两个时段之间的用户的相似度；

3)把离散时段中任意两个时段之间的所有用户的相似度表示为一个时段相似度矩阵TS，并利用时段相似矩阵TS来对时段-用户-药品评分矩阵进行平移，具体平移公式如下：

其中，是平移之后获得的将用于计算的新的时段-用户-药品评分矩阵；是表示时段t和t^*的时段相似度，t^*∈[1,T]；是用户i在时段t*对药品j的评分；

然后利用平移之后的矩阵进行用户相似度计算，对于用户i获得s个相似度最高的用户作为相似用户F_i；

S2-2，基于相似用户F_i获得用户潜在兴趣数据：

对于用户i，把步骤是S2-1中该用户的相似用户F_i购买过但是用户i没有购买过的药品作为用户i的备用潜在感兴趣药品，并建立用户潜在兴趣模型来学习用户潜在兴趣，从而得到用户的潜在兴趣数据。

优选地，所述步骤S3包括如下步骤：

S3-1，将用户潜在兴趣数据填充进步骤S1中原始的用户-药品评分矩阵，对于每个用户i，把药品分为三类：D_i是用户购买过的药品的集合；P_i是用户潜在购买药品集合；U_i是用户没有购买过并且非潜在购买药品的集合，则原始用户-药品评分矩阵化为新的评分矩阵和权重矩阵：

其中，NewR为新的评分矩阵，NewR_i,j表示用户i对药品j的评分；NewW为新的权重矩阵，NewW_i,j为用户i对药品j的偏好；是当药品是用户的潜在购买药品时候，用户对该药品的评分，是0到1之间的数值；μ是调节参数，这里取0.3，*为乘号。

优选地，所述步骤S4包括如下步骤：

S4-1，通过用户对药品的评分矩阵和药品的种类，建立一个用户对某一个药品类别的评分矩阵B_N,|C|，其中N是用户数量，|C|是药品种类数量，评分矩阵中的每个元素表示用户对于购买过的药品所属的类别的评分；

S4-2，构建一个药品流行度矩阵P_|C|,M，其中|C|是药品种类数量，M是药品数量，药品流行度矩阵中的每个元素表示该药品在所属类别的流行度，使用某一类别中某药品被购买的次数来表示该药品在该类别的流行度；

S4-3，获得用户购买药品的类别相关模型如下：

其中，y_i,j表示在类别模型下，用户i对药品j的评分；B_i,c∈B_N,|C|，P_c,j∈P_|C|,M。

优选地，所述步骤S5包括以下几个步骤：

S5-1，使用矩阵分解算法对获得的新的评分矩阵和权重矩阵进行分解，分解过程中误差函数如下所示：

其中，i表示用户，j表示药品，N表示用户数量，M表示药品数量，是用户隐因子矩阵和药品隐因子矩阵向量的乘积，表示用户i对药品j的评分；γ表示用户和药品的权重；|U|表示用户隐因子矩阵，|D|表示药品隐因子矩阵，表示用户隐因子矩阵的弗罗贝尼乌斯范数的平方，表示药品隐因子矩阵的弗罗贝尼乌斯范数的平方；

S5-2，新的评分矩阵和权重矩阵分解后得到用户隐特征矩阵和药品隐特征矩阵，把分解后得到的两个矩阵相乘获得用户偏好预测矩阵，再将用户偏好预测矩阵和类别相关模型进行合并，得到最终的推荐模型如下：

其中，是用户i对药品j的评分；是更新之后的用户隐因子矩阵和药品隐因子矩阵向量的乘积，表示用户i对药品j的预测评分；y_i,j表示在类别模型下，用户i对药品j的评分；∝表示成正比；*表示乘法。

S5-3，根据评分值的大小进行排序，然后选择评分值从大到小排在前k的药品生成推荐列表，推荐给用户。

综上所述，本发明公开了一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法，首先从电商平台的数据集中获取用户购买药品的购买记录数据，并对购买记录数据进行整理得到用户-药品评分矩阵；接着基于购买记录数据中相似用户的购买记录建立用户潜在兴趣模型，并基于用户潜在兴趣模型得到用户潜在兴趣数据；然后将用户潜在兴趣数据合并到用户-药品评分矩阵；进而基于购买记录数据中用户购买过的药品所属类别的流行度和用户对该类别的偏爱建立类别相关模型；最后对合并了用户潜在兴趣数据的用户-药品评分矩阵进行矩阵分解，并将分解得到的用户偏好预测矩阵和类别相关模型进行线性融合生成推荐列表。本发明通过用户的历史购买数据学习到用户潜在兴趣，然后将用户潜在兴趣填充进用户-药品评分矩阵，有效解决了现有技术中评分矩阵稀疏性对推荐效率造成影响的问题。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1为本发明公开的一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法的基本流程图；

图2为本发明公开的用户潜在兴趣学习算法示意图；

图3为本发明公开的类别相关模型的建立过程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要理解的是，术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

在本发明的描述中，除非另有规定和限定，需要说明的是，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是机械连接或电连接，也可以是两个元件内部的连通，可以是直接相连，也可以通过中间媒介间接相连，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

本发明提供了一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法，如图1-3所示，包括如下步骤：

优选地，步骤S1包括如下步骤：

优选地，步骤S2包括如下步骤：

S2-1，合并时间因素的相似用户集合F_i：

2)给定目标用户i,定义用户i在时段t(t∈T)的评分向量为：r_i,t＝{r_i,t,1,r_i,t,2,..r_i,t,m}，其中r_i,t,m表示用户i在时段t对药品m的评分值。对于用户i，计算该用户在任意两个时段t_p和t_q的评分向量和的余弦相似性，然后取所有用户在这两个时段的余弦相似值的平均值作为这两个时段相似度，从而得到离散时段中任意两个时段之间的用户的相似度；

其中，是平移之后获得的将用于计算的新的时段-用户-药品评分矩阵；是表示时段t和t^*的时段相似度，t^*∈[1,T]；是用户i在时段t*对药品j的评分。

S2-2，基于相似用户F_i获得用户潜在兴趣数据：

优选地，步骤S3包括如下步骤：

优选地，步骤S4包括如下步骤：

S4-3，获得用户购买药品的类别相关模型如下：

优选地，步骤S5包括以下几个步骤：

其中，i表示用户，j表示药品，N表示用户数量，M表示药品数量，是用户隐因子矩阵和药品隐因子矩阵向量的乘积，表示用户i对药品j的评分；γ表示用户和药品的权重；|U|表示用户隐因子矩阵，|D|表示药品隐因子矩阵，，表示用户隐因子矩阵的弗罗贝尼乌斯范数的平方，表示药品隐因子矩阵的弗罗贝尼乌斯范数的平方。

S5-3，根据评分值的大小进行排序，然后选择评分值从大到小排在前k的药品生成推荐列表。

具体的，在上述实施例中，步骤S2-2中建立用户潜在兴趣模型来学习用户潜在兴趣，具体可以通过以下两种选择算法来学习用户潜在兴趣：

第一种选择算法是最大值选择策略，使用购买过药品j的目标用户i的相似用户中和目标用户相似度最大的来代表用户的偏好，该线性模型表示如下：

其中，pr_i,j表示用户i对药品j的评分，是用户i和其相关用户就药品j偏好的相似性，f∈F_i是用户i的相关用户。

第二种选择算法是元路径选择策略，在异构网络G<V,E,A>中，V是节点集合，E是边的集合，A是节点种类集合。元路径定义为如下形式的路径其中，A_i∈A,R_i表示节点之间存在的关系，R_i∈{U-U,U-D,D-D}。则对于该元路径P，若存在实例路径p＝{v₁,v₂...v_n+1}是该元路径的实例，把所有这类实例路径定义为元路径P的实例路径P’。对于每一条实例路径，论文定义一个特征值概念用来描述节点v₁和v_n+1的相关性，表示为cor(p)，那么元路径的特征值就是所有实例路径特征值的和，表示为：

对实例路径p＝{a₁,a₂...a_n+1}，a₁∈U是用户节点，a_n+1∈D是药品节点，其他a_i是实例路径中的一个中间节点。表示路径p起始节点之间的关联度cor(p)是采用的随机漫步的思想,假设一个物体从节点a₁出发，在网络中随机漫步，定义cor(p)为物体按照实例路径p游走到节点a_n+1的概率，由于随机漫步中每一步漫步都假设是相互独立的，因此。物体按照p漫步的概率等于每一步漫步的概率之积，计算公式如下

其中Pro(a_i,a_i+1)表示随机游走过程中从节点a_i直接到节点a_i+1的概率。在异构网络中，其公式被定义为：

其中N(a_i)表示的是和a_i+1类型一致的节点类型。

最终用户兴趣表示为:

pr_i,j＝Eig(P_i,j)

最后获得目标用户的潜在兴趣点。

具体的，在上述实施例中，步骤S5-1中的矩阵分解算法采用如下隐矩阵学习算法伪代码：

需要说明的是，本发明图1-图3中所示的***结构或方法流程只是本发明的一些优选实施方式，在此示出只是便于理解本发明而不能理解为对本发明的限制，在本发明的思想指导下，根据本发明的技术方案实施得出的结构或方法均在本发明的保护范围之内，在此不作赘述。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

Claims

1.一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法，其特征在于，所述方法包括如下步骤：

S3，将用户潜在兴趣数据合并到用户-药品评分矩阵；

2.根据权利要求1所述的融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法，其特征在于，所述步骤S1包括如下步骤：

S1-2，统计每个用户购买并且评分的药品数量，若用户购买并评分的药品数量低于预设值，则把这种用户删除；

S1-3，统计每一种药品被购买并评分的次数，若药品被购买的频次低于预设值，则把这种药品的相关记录删除；

S1-4，基于整理好的购买记录数据得到用户-药品评分矩阵。

3.根据权利要求1所述的融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法，其特征在于，所述步骤S2包括如下步骤：

S2-1，合并时间因素的相似用户集合F_i：

2)给定目标用户i,定义用户i在时段t(t∈T)的评分向量为：r_i,t＝{r_i,t,1,r_i,t,2,..r_i,t,m}，其中r_i,t,m表示用户i在时段t对药品m的评分值，对于用户i，计算该用户在任意两个时段t_p和t_q的评分向量和的余弦相似性，然后取所有用户在这两个时段的余弦相似值的平均值作为这两个时段相似度，从而得到离散时段中任意两个时段之间的用户的相似度；

3)把离散时段中任意两个时段之间的所有用户的相似度表示为一个时段相似度矩阵TS，并利用时段相似度矩阵TS来对时段-用户-药品评分矩阵进行平移，具体平移公式如下：

S2-2，基于相似用户F_i获得用户潜在兴趣数据：

4.根据权利要求1所述的融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法，所述步骤S3包括如下步骤：

S3-1，将用户潜在兴趣数据填充进步骤S1中的用户-药品评分矩阵，对于每个用户i，把药品分为三类：D_i是用户购买过的药品的集合；P_i是用户潜在购买药品集合；U_i是用户没有购买过并且非潜在购买药品的集合，则原始用户-药品评分矩阵化为新的评分矩阵和权重矩阵：

其中，NewR为新的评分矩阵，NewR_i,j表示用户i对药品j的评分；NewW为新的权重矩阵，NewW_i,j为用户i对药品j的偏好；是当药品是用户的潜在购买药品时候，用户对该药品的评分，是0到1之间的数值；μ是调节参数。

5.根据权利要求1所述的融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法，其特征在于，所述步骤S4包括如下步骤：

S4-1，通过用户对药品的评分矩阵和药品的种类，建立一个用户对某一个药品类别的评分矩阵B_N,|C|,其中N是用户数量，|C|是药品种类数量，评分矩阵中的每个元素表示用户对于购买过的药品所属的类别的评分；

S4-3，获得用户购买药品的类别相关模型如下：

6.根据权利要求1所述的融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法，所述步骤S5包括以下几个步骤：

其中，是用户i对药品j的评分；是更新之后的用户隐因子矩阵和药品隐因子矩阵向量的乘积，表示用户i对药品j的预测评分；y_i,j表示在类别模型下，用户i对药品j的评分；∝表示成正比；*表示乘法；