CN108921670B - 一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法 - Google Patents

一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法 Download PDF

Info

Publication number
CN108921670B
CN108921670B CN201810724191.4A CN201810724191A CN108921670B CN 108921670 B CN108921670 B CN 108921670B CN 201810724191 A CN201810724191 A CN 201810724191A CN 108921670 B CN108921670 B CN 108921670B
Authority
CN
China
Prior art keywords
user
medicine
matrix
drug
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810724191.4A
Other languages
English (en)
Other versions
CN108921670A (zh
Inventor
冯永
王亚男
王亚清
魏然
尚家兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Medical Data & Info Tech Co ltd
Chongqing University
Original Assignee
Chongqing Medical Data & Info Tech Co ltd
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Medical Data & Info Tech Co ltd, Chongqing University filed Critical Chongqing Medical Data & Info Tech Co ltd
Priority to CN201810724191.4A priority Critical patent/CN108921670B/zh
Publication of CN108921670A publication Critical patent/CN108921670A/zh
Application granted granted Critical
Publication of CN108921670B publication Critical patent/CN108921670B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Development Economics (AREA)
  • Mathematical Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Computational Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法,包括从电商平台的数据集中获取用户购买药品的购买记录数据,并对购买记录数据进行整理得到用户‑药品评分矩阵;基于购买记录数据中相似用户的购买记录建立用户潜在兴趣模型,并基于用户潜在兴趣模型获取用户潜在兴趣数据;将用户潜在兴趣数据合并到用户‑药品评分矩阵;基于购买记录数据中用户购买过的药品所属类别的流行度和用户对该类别的偏爱建立类别相关模型;对合并了用户潜在兴趣数据的用户‑药品评分矩阵进行矩阵分解,并将分解得到的用户偏好预测矩阵和类别相关模型进行线性融合生成推荐列表。本发明有效解决了现有技术中评分矩阵稀疏性对推荐效率造成影响的问题。

Description

一种融合用户潜在兴趣、时空数据和类别流行度的药品交易 推荐方法
技术领域
本发明涉及计算机技术领域,尤其涉及一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法。
背景技术
近年来,电子商务随着互联网和信息技术的发展日趋活跃,越来越多的消费者开始网上购物。电子商务不仅开拓了新的商业盈利渠道,还颠覆了传统的销售模式,从空间上、时间上赋予交易双方更多的便利性、自主性。其中,医药,作为日常生活必需品,近几年也开始逐渐进入电商领域,越来越多的医药企业获得了建立医药电子商务平台的资格,医药行业的电子商务发展前途一片光明。
由于医药电商平台包含多种类,大数量的药品,用户需要花费大量的时间和精力去筛选出需要的药品,极大的降低了平台的用户体验。为了解决用户在海量药品中耗费过多时间导致用户体验差的问题,将个性化推荐技术引入到医药电商平台中是必要的。
在医药电商平台中,由于药品的特殊性,用户对药品的评分数量会远低于传统推荐中用户对物品(音乐、电影)的评分数量,用户-药品评分矩阵十分稀疏,医药电商平台的推荐面临着比传统推荐更为严重的数据冷启动问题。
面对医药电商领域海量且多样化的药品,如何设计优秀的推荐算法为用户提供精确的推荐是一个值得深思的问题。目前,该领域已经存在一些推荐算法,但是这些算法大多是在原始用户-药品评分矩阵上进行的,受该评分矩阵稀疏性影响很大。
因此,如何有效的缓解评分矩阵稀疏性对推荐效率造成的影响是一项亟待解决的问题。
发明内容
有鉴于此,本发明提供了一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法,通过用户的历史购买数据学习到用户潜在兴趣,然后将用户潜在兴趣填充进用户-药品评分矩阵,有效解决了现有技术中评分矩阵稀疏性对推荐效率造成影响的问题。
为了实现本发明的上述目的,本发明提供了一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法,所述方法包括如下步骤:
S1,从电商平台的数据集中获取用户购买药品的购买记录数据,并对购买记录数据进行整理得到用户-药品评分矩阵;
S2,基于购买记录数据中相似用户的购买记录建立用户潜在兴趣模型,并基于用户潜在兴趣模型得到用户潜在兴趣数据;
S3,将用户潜在兴趣数据合并到用户-药品评分矩阵;缓解矩阵稀疏度对推荐结果造成的影响,提高推荐效率;
S4,基于购买记录数据中用户购买过的药品所属类别的流行度和用户对该类别的偏爱建立类别相关模型;
S5,对合并了用户潜在兴趣数据的用户-药品评分矩阵进行矩阵分解,并将分解得到的用户偏好预测矩阵和步骤S4中的类别相关模型进行线性融合生成推荐列表。
优选地,所述步骤S1包括如下步骤:
S1-1,整理用户的购买记录数据,购买记录数据包括用户对购买的药品的评分、购买时间、药品种类,得到用户集合U={u1,u2,...,ui...,un}和药品集合D={d1,d2,...,dj...,dm},其中,u表示用户,i代表用户的ID;d表示药品,j代表药品的ID;
S1-2,统计每个用户购买并且评分的药品数量,若用户购买并评分的药品数量低于预设值,则把这种用户删除;以获得包含足够用户信息的用户;
S1-3,统计每一种药品被购买并评分的次数,若药品被购买的频次低于预设值,则把这种药品的相关记录删除;因数据的缺失,容易出现噪声;
S1-4,基于整理好的购买记录数据得到原始用户-药品评分矩阵。
优选地,所述步骤S2包括如下步骤:
S2-1,合并时间因素的相似用户集合Fi
1)采用把时间离散化的方法,把一年分为T个离散时段,把步骤S1中原始的用户-药品评分矩阵按照购买评分时间分成T个时段-用户-药品评分矩阵;
2)给定目标用户i,定义用户i在时段t(t∈T)的评分向量为:ri,t={ri,t,1,ri,t,2,..ri,t,m},其中,ri,t,m表示用户i在时段t对药品m的评分值。对于用户i,计算该用户在任意两个时段tp和tq的评分向量
Figure BDA0001719237180000031
Figure BDA0001719237180000032
的余弦相似性,然后取所有用户在这两个时段的余弦相似值的平均值作为这两个时段相似度,从而得到离散时段中任意两个时段之间的用户的相似度;
3)把离散时段中任意两个时段之间的所有用户的相似度表示为一个时段相似度矩阵TS,并利用时段相似矩阵TS来对时段-用户-药品评分矩阵进行平移,具体平移公式如下:
Figure BDA0001719237180000033
其中,
Figure BDA0001719237180000034
是平移之后获得的将用于计算的新的时段-用户-药品评分矩阵;
Figure BDA0001719237180000035
是表示时段t和t*的时段相似度,t*∈[1,T];
Figure BDA0001719237180000036
是用户i在时段t*对药品j的评分;
然后利用平移之后的矩阵进行用户相似度计算,对于用户i获得s个相似度最高的用户作为相似用户Fi
S2-2,基于相似用户Fi获得用户潜在兴趣数据:
对于用户i,把步骤是S2-1中该用户的相似用户Fi购买过但是用户i没有购买过的药品作为用户i的备用潜在感兴趣药品,并建立用户潜在兴趣模型来学习用户潜在兴趣,从而得到用户的潜在兴趣数据。
优选地,所述步骤S3包括如下步骤:
S3-1,将用户潜在兴趣数据填充进步骤S1中原始的用户-药品评分矩阵,对于每个用户i,把药品分为三类:Di是用户购买过的药品的集合;Pi是用户潜在购买药品集合;Ui是用户没有购买过并且非潜在购买药品的集合,则原始用户-药品评分矩阵化为新的评分矩阵和权重矩阵:
Figure BDA0001719237180000041
Figure BDA0001719237180000042
其中,NewR为新的评分矩阵,NewRi,j表示用户i对药品j的评分;NewW为新的权重矩阵,NewWi,j为用户i对药品j的偏好;
Figure BDA0001719237180000043
是当药品是用户的潜在购买药品时候,用户对该药品的评分,是0到1之间的数值;μ是调节参数,这里取0.3,*为乘号。
优选地,所述步骤S4包括如下步骤:
S4-1,通过用户对药品的评分矩阵和药品的种类,建立一个用户对某一个药品类别的评分矩阵BN,|C|,其中N是用户数量,|C|是药品种类数量,评分矩阵中的每个元素表示用户对于购买过的药品所属的类别的评分;
S4-2,构建一个药品流行度矩阵P|C|,M,其中|C|是药品种类数量,M是药品数量,药品流行度矩阵中的每个元素表示该药品在所属类别的流行度,使用某一类别中某药品被购买的次数来表示该药品在该类别的流行度;
S4-3,获得用户购买药品的类别相关模型如下:
Figure BDA0001719237180000044
其中,yi,j表示在类别模型下,用户i对药品j的评分;Bi,c∈BN,|C|,Pc,j∈P|C|,M
优选地,所述步骤S5包括以下几个步骤:
S5-1,使用矩阵分解算法对获得的新的评分矩阵和权重矩阵进行分解,分解过程中误差函数如下所示:
Figure BDA0001719237180000045
其中,i表示用户,j表示药品,N表示用户数量,M表示药品数量,
Figure BDA0001719237180000046
是用户隐因子矩阵和药品隐因子矩阵向量的乘积,表示用户i对药品j的评分;γ表示用户和药品的权重;|U|表示用户隐因子矩阵,|D|表示药品隐因子矩阵,
Figure BDA0001719237180000051
表示用户隐因子矩阵的弗罗贝尼乌斯范数的平方,
Figure BDA0001719237180000052
表示药品隐因子矩阵的弗罗贝尼乌斯范数的平方;
S5-2,新的评分矩阵和权重矩阵分解后得到用户隐特征矩阵和药品隐特征矩阵,把分解后得到的两个矩阵相乘获得用户偏好预测矩阵,再将用户偏好预测矩阵和类别相关模型进行合并,得到最终的推荐模型如下:
Figure BDA0001719237180000053
其中,
Figure BDA0001719237180000054
是用户i对药品j的评分;
Figure BDA0001719237180000055
是更新之后的用户隐因子矩阵和药品隐因子矩阵向量的乘积,表示用户i对药品j的预测评分;yi,j表示在类别模型下,用户i对药品j的评分;∝表示成正比;*表示乘法。
S5-3,根据
Figure BDA0001719237180000056
评分值的大小进行排序,然后选择评分值从大到小排在前k的药品生成推荐列表,推荐给用户。
综上所述,本发明公开了一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法,首先从电商平台的数据集中获取用户购买药品的购买记录数据,并对购买记录数据进行整理得到用户-药品评分矩阵;接着基于购买记录数据中相似用户的购买记录建立用户潜在兴趣模型,并基于用户潜在兴趣模型得到用户潜在兴趣数据;然后将用户潜在兴趣数据合并到用户-药品评分矩阵;进而基于购买记录数据中用户购买过的药品所属类别的流行度和用户对该类别的偏爱建立类别相关模型;最后对合并了用户潜在兴趣数据的用户-药品评分矩阵进行矩阵分解,并将分解得到的用户偏好预测矩阵和类别相关模型进行线性融合生成推荐列表。本发明通过用户的历史购买数据学习到用户潜在兴趣,然后将用户潜在兴趣填充进用户-药品评分矩阵,有效解决了现有技术中评分矩阵稀疏性对推荐效率造成影响的问题。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明公开的一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法的基本流程图;
图2为本发明公开的用户潜在兴趣学习算法示意图;
图3为本发明公开的类别相关模型的建立过程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,除非另有规定和限定,需要说明的是,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
本发明提供了一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法,如图1-3所示,包括如下步骤:
S1,从电商平台的数据集中获取用户购买药品的购买记录数据,并对购买记录数据进行整理得到用户-药品评分矩阵;
S2,基于购买记录数据中相似用户的购买记录建立用户潜在兴趣模型,并基于用户潜在兴趣模型得到用户潜在兴趣数据;
S3,将用户潜在兴趣数据合并到用户-药品评分矩阵;缓解矩阵稀疏度对推荐结果造成的影响,提高推荐效率;
S4,基于购买记录数据中用户购买过的药品所属类别的流行度和用户对该类别的偏爱建立类别相关模型;
S5,对合并了用户潜在兴趣数据的用户-药品评分矩阵进行矩阵分解,并将分解得到的用户偏好预测矩阵和步骤S4中的类别相关模型进行线性融合生成推荐列表。
优选地,步骤S1包括如下步骤:
S1-1,整理用户的购买记录数据,购买记录数据包括用户对购买的药品的评分、购买时间、药品种类,得到用户集合U={u1,u2,...,ui...,un}和药品集合D={d1,d2,...,dj...,dm},其中,u表示用户,i代表用户的ID;d表示药品,j代表药品的ID;
S1-2,统计每个用户购买并且评分的药品数量,若用户购买并评分的药品数量低于预设值,则把这种用户删除;以获得包含足够用户信息的用户;
S1-3,统计每一种药品被购买并评分的次数,若药品被购买的频次低于预设值,则把这种药品的相关记录删除;因数据的缺失,容易出现噪声;
S1-4,基于整理好的购买记录数据得到原始用户-药品评分矩阵。
优选地,步骤S2包括如下步骤:
S2-1,合并时间因素的相似用户集合Fi
1)采用把时间离散化的方法,把一年分为T个离散时段,把步骤S1中原始的用户-药品评分矩阵按照购买评分时间分成T个时段-用户-药品评分矩阵;
2)给定目标用户i,定义用户i在时段t(t∈T)的评分向量为:ri,t={ri,t,1,ri,t,2,..ri,t,m},其中ri,t,m表示用户i在时段t对药品m的评分值。对于用户i,计算该用户在任意两个时段tp和tq的评分向量
Figure BDA0001719237180000071
Figure BDA0001719237180000072
的余弦相似性,然后取所有用户在这两个时段的余弦相似值的平均值作为这两个时段相似度,从而得到离散时段中任意两个时段之间的用户的相似度;
3)把离散时段中任意两个时段之间的所有用户的相似度表示为一个时段相似度矩阵TS,并利用时段相似矩阵TS来对时段-用户-药品评分矩阵进行平移,具体平移公式如下:
Figure BDA0001719237180000081
其中,
Figure BDA0001719237180000082
是平移之后获得的将用于计算的新的时段-用户-药品评分矩阵;
Figure BDA0001719237180000083
是表示时段t和t*的时段相似度,t*∈[1,T];
Figure BDA0001719237180000084
是用户i在时段t*对药品j的评分。
然后利用平移之后的矩阵进行用户相似度计算,对于用户i获得s个相似度最高的用户作为相似用户Fi
S2-2,基于相似用户Fi获得用户潜在兴趣数据:
对于用户i,把步骤是S2-1中该用户的相似用户Fi购买过但是用户i没有购买过的药品作为用户i的备用潜在感兴趣药品,并建立用户潜在兴趣模型来学习用户潜在兴趣,从而得到用户的潜在兴趣数据。
优选地,步骤S3包括如下步骤:
S3-1,将用户潜在兴趣数据填充进步骤S1中原始的用户-药品评分矩阵,对于每个用户i,把药品分为三类:Di是用户购买过的药品的集合;Pi是用户潜在购买药品集合;Ui是用户没有购买过并且非潜在购买药品的集合,则原始用户-药品评分矩阵化为新的评分矩阵和权重矩阵:
Figure BDA0001719237180000085
Figure BDA0001719237180000086
其中,NewR为新的评分矩阵,NewRi,j表示用户i对药品j的评分;NewW为新的权重矩阵,NewWi,j为用户i对药品j的偏好;
Figure BDA0001719237180000087
是当药品是用户的潜在购买药品时候,用户对该药品的评分,是0到1之间的数值;μ是调节参数,这里取0.3,*为乘号。
优选地,步骤S4包括如下步骤:
S4-1,通过用户对药品的评分矩阵和药品的种类,建立一个用户对某一个药品类别的评分矩阵BN,|C|,其中N是用户数量,|C|是药品种类数量,评分矩阵中的每个元素表示用户对于购买过的药品所属的类别的评分;
S4-2,构建一个药品流行度矩阵P|C|,M,其中|C|是药品种类数量,M是药品数量,药品流行度矩阵中的每个元素表示该药品在所属类别的流行度,使用某一类别中某药品被购买的次数来表示该药品在该类别的流行度;
S4-3,获得用户购买药品的类别相关模型如下:
Figure BDA0001719237180000091
其中,yi,j表示在类别模型下,用户i对药品j的评分;Bi,c∈BN,|C|,Pc,j∈P|C|,M
优选地,步骤S5包括以下几个步骤:
S5-1,使用矩阵分解算法对获得的新的评分矩阵和权重矩阵进行分解,分解过程中误差函数如下所示:
Figure BDA0001719237180000092
其中,i表示用户,j表示药品,N表示用户数量,M表示药品数量,
Figure BDA0001719237180000093
是用户隐因子矩阵和药品隐因子矩阵向量的乘积,表示用户i对药品j的评分;γ表示用户和药品的权重;|U|表示用户隐因子矩阵,|D|表示药品隐因子矩阵,,
Figure BDA0001719237180000094
表示用户隐因子矩阵的弗罗贝尼乌斯范数的平方,
Figure BDA0001719237180000095
表示药品隐因子矩阵的弗罗贝尼乌斯范数的平方。
S5-2,新的评分矩阵和权重矩阵分解后得到用户隐特征矩阵和药品隐特征矩阵,把分解后得到的两个矩阵相乘获得用户偏好预测矩阵,再将用户偏好预测矩阵和类别相关模型进行合并,得到最终的推荐模型如下:
Figure BDA0001719237180000096
其中,
Figure BDA0001719237180000101
是用户i对药品j的评分;
Figure BDA0001719237180000102
是更新之后的用户隐因子矩阵和药品隐因子矩阵向量的乘积,表示用户i对药品j的预测评分;yi,j表示在类别模型下,用户i对药品j的评分;∝表示成正比;*表示乘法。
S5-3,根据
Figure BDA0001719237180000103
评分值的大小进行排序,然后选择评分值从大到小排在前k的药品生成推荐列表。
综上所述,本发明公开了一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法,首先从电商平台的数据集中获取用户购买药品的购买记录数据,并对购买记录数据进行整理得到用户-药品评分矩阵;接着基于购买记录数据中相似用户的购买记录建立用户潜在兴趣模型,并基于用户潜在兴趣模型得到用户潜在兴趣数据;然后将用户潜在兴趣数据合并到用户-药品评分矩阵;进而基于购买记录数据中用户购买过的药品所属类别的流行度和用户对该类别的偏爱建立类别相关模型;最后对合并了用户潜在兴趣数据的用户-药品评分矩阵进行矩阵分解,并将分解得到的用户偏好预测矩阵和类别相关模型进行线性融合生成推荐列表。本发明通过用户的历史购买数据学习到用户潜在兴趣,然后将用户潜在兴趣填充进用户-药品评分矩阵,有效解决了现有技术中评分矩阵稀疏性对推荐效率造成影响的问题。
具体的,在上述实施例中,步骤S2-2中建立用户潜在兴趣模型来学习用户潜在兴趣,具体可以通过以下两种选择算法来学习用户潜在兴趣:
第一种选择算法是最大值选择策略,使用购买过药品j的目标用户i的相似用户中和目标用户相似度最大的来代表用户的偏好,该线性模型表示如下:
Figure BDA0001719237180000104
其中,pri,j表示用户i对药品j的评分,
Figure BDA0001719237180000105
是用户i和其相关用户就药品j偏好的相似性,f∈Fi是用户i的相关用户。
第二种选择算法是元路径选择策略,在异构网络G<V,E,A>中,V是节点集合,E是边的集合,A是节点种类集合。元路径定义为如下形式的路径
Figure BDA0001719237180000106
其中,Ai∈A,Ri表示节点之间存在的关系,Ri∈{U-U,U-D,D-D}。则对于该元路径P,若存在实例路径p={v1,v2...vn+1}是该元路径的实例,把所有这类实例路径定义为元路径P的实例路径P’。对于每一条实例路径,论文定义一个特征值概念用来描述节点v1和vn+1的相关性,表示为cor(p),那么元路径的特征值就是所有实例路径特征值的和,表示为:
Figure BDA0001719237180000111
对实例路径p={a1,a2...an+1},a1∈U是用户节点,an+1∈D是药品节点,其他ai是实例路径中的一个中间节点。表示路径p起始节点之间的关联度cor(p)是采用的随机漫步的思想,假设一个物体从节点a1出发,在网络中随机漫步,定义cor(p)为物体按照实例路径p游走到节点an+1的概率,由于随机漫步中每一步漫步都假设是相互独立的,因此。物体按照p漫步的概率等于每一步漫步的概率之积,计算公式如下
Figure BDA0001719237180000112
其中Pro(ai,ai+1)表示随机游走过程中从节点ai直接到节点ai+1的概率。在异构网络中,其公式被定义为:
Figure BDA0001719237180000113
其中N(ai)表示的是和ai+1类型一致的节点类型。
最终用户兴趣表示为:
pri,j=Eig(Pi,j)
最后获得目标用户的潜在兴趣点。
具体的,在上述实施例中,步骤S5-1中的矩阵分解算法采用如下隐矩阵学习算法伪代码:
Figure BDA0001719237180000114
Figure BDA0001719237180000121
需要说明的是,本发明图1-图3中所示的***结构或方法流程只是本发明的一些优选实施方式,在此示出只是便于理解本发明而不能理解为对本发明的限制,在本发明的思想指导下,根据本发明的技术方案实施得出的结构或方法均在本发明的保护范围之内,在此不作赘述。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (5)

1.一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法,其特征在于,所述方法包括如下步骤:
S1,从电商平台的数据集中获取用户购买药品的购买记录数据,并对购买记录数据进行整理得到用户-药品评分矩阵;
S2,基于购买记录数据中相似用户的购买记录建立用户潜在兴趣模型,并基于用户潜在兴趣模型得到用户潜在兴趣数据;
S2-1,合并时间因素的相似用户集合Fi
1)采用把时间离散化的方法,把一年分为T个离散时段,把步骤S1中原始的用户-药品评分矩阵按照购买评分时间分成T个时段-用户-药品评分矩阵;
2)给定目标用户i,定义用户i在时段t(t∈T)的评分向量为:ri,t={ri,t,1,ri,t,2,..ri,t,m},其中ri,t,m表示用户i在时段t对药品m的评分值,对于用户i,计算该用户在任意两个时段tp和tq的评分向量
Figure FDA0003630451950000011
Figure FDA0003630451950000012
的余弦相似性,然后取所有用户在这两个时段的余弦相似值的平均值作为这两个时段相似度,从而得到离散时段中任意两个时段之间的用户的相似度;
3)把离散时段中任意两个时段之间的所有用户的相似度表示为一个时段相似度矩阵TS,并利用时段相似度矩阵TS来对时段-用户-药品评分矩阵进行平移,具体平移公式如下:
Figure FDA0003630451950000013
其中,
Figure FDA0003630451950000014
是平移之后获得的将用于计算的新时段-用户-药品评分矩阵;
Figure FDA0003630451950000015
是表示时段t和t*的时段相似度,t*∈[1,T];
Figure FDA0003630451950000016
是用户i在时段t*对药品j的评分;
然后利用平移之后的矩阵进行用户相似度计算,对于用户i获得s个相似度最高的用户作为相似用户Fi
S2-2,基于相似用户Fi获得用户潜在兴趣数据:
对于用户i,把步骤S2-1中该用户的相似用户Fi购买过但是用户i没有购买过的药品作为用户i的备用潜在感兴趣药品,并建立用户潜在兴趣模型来学习用户潜在兴趣,从而得到用户的潜在兴趣数据;
S3,将用户潜在兴趣数据合并到用户-药品评分矩阵;
S4,基于购买记录数据中用户购买过的药品所属类别的流行度和用户对该类别的偏爱建立类别相关模型;
S5,对合并了用户潜在兴趣数据的用户-药品评分矩阵进行矩阵分解,并将分解得到的用户偏好预测矩阵和步骤S4中的类别相关模型进行线性融合生成推荐列表。
2.根据权利要求1所述的融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法,其特征在于,所述步骤S1包括如下步骤:
S1-1,整理用户的购买记录数据,购买记录数据包括用户对购买的药品的评分、购买时间、药品种类,得到用户集合U={u1,u2,...,ui...,un}和药品集合D={d1,d2,...,dj...,dm},其中,u表示用户,i代表用户的ID;d表示药品,j代表药品的ID;
S1-2,统计每个用户购买并且评分的药品数量,若用户购买并评分的药品数量低于预设值,则把这种用户删除;
S1-3,统计每一种药品被购买并评分的次数,若药品被购买的频次低于预设值,则把这种药品的相关记录删除;
S1-4,基于整理好的购买记录数据得到用户-药品评分矩阵。
3.根据权利要求1所述的融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法,所述步骤S3包括如下步骤:
S3-1,将用户潜在兴趣数据填充进步骤S1中的用户-药品评分矩阵,对于每个用户i,把药品分为三类:Di是用户购买过的药品的集合;Pi是用户潜在购买药品集合;Ui是用户没有购买过并且非潜在购买药品的集合,则原始用户-药品评分矩阵化为新的评分矩阵和权重矩阵:
Figure FDA0003630451950000021
Figure FDA0003630451950000022
其中,NewR为新的评分矩阵,NewRi,j表示用户i对药品j的评分;NewW为新的权重矩阵,NewWi,j为用户i对药品j的偏好;
Figure FDA0003630451950000031
是当药品是用户的潜在购买药品时候,用户对该药品的评分,是0到1之间的数值;μ是调节参数。
4.根据权利要求1所述的融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法,其特征在于,所述步骤S4包括如下步骤:
S4-1,通过用户对药品的评分矩阵和药品的种类,建立一个用户对某一个药品类别的评分矩阵BN,|C|,其中N是用户数量,|C|是药品种类数量,评分矩阵中的每个元素表示用户对于购买过的药品所属的类别的评分;
S4-2,构建一个药品流行度矩阵P|C|,M,其中|C|是药品种类数量,M是药品数量,药品流行度矩阵中的每个元素表示该药品在所属类别的流行度,使用某一类别中某药品被购买的次数来表示该药品在该类别的流行度;
S4-3,获得用户购买药品的类别相关模型如下:
Figure FDA0003630451950000032
其中,yi,j表示在类别模型下,用户i对药品j的评分;Bi,c∈BN,|C|,Pc,j∈P|C|,M
5.根据权利要求3所述的融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法,所述步骤S5包括以下几个步骤:
S5-1,使用矩阵分解算法对获得的新的评分矩阵和权重矩阵进行分解,分解过程中误差函数如下所示:
Figure FDA0003630451950000033
其中,i表示用户,j表示药品,N表示用户数量,M表示药品数,
Figure FDA0003630451950000034
是用户隐因子矩阵和药品隐因子矩阵向量的乘积,表示用户i对药品j的评分;γ表示用户和药品的权重;|U|表示用户隐因子矩阵,|D|表示药品隐因子矩阵,
Figure FDA0003630451950000035
表示用户隐因子矩阵的弗罗贝尼乌斯范数的平方,
Figure FDA0003630451950000036
表示药品隐因子矩阵的弗罗贝尼乌斯范数的平方;
S5-2,新的评分矩阵和权重矩阵分解后得到用户隐特征矩阵和药品隐特征矩阵,把分解后得到的两个矩阵相乘获得用户偏好预测矩阵,再将用户偏好预测矩阵和类别相关模型进行合并,得到最终的推荐模型如下:
Figure FDA0003630451950000041
其中,
Figure FDA0003630451950000042
是用户i对药品j的评分;
Figure FDA0003630451950000043
是更新之后的用户隐因子矩阵和药品隐因子矩阵向量的乘积,表示用户i对药品j的预测评分;yi,j表示在类别模型下,用户i对药品j的评分;∝表示成正比;*表示乘法;
S5-3,根据
Figure FDA0003630451950000044
的大小进行排序,然后选择评分值从大到小排在前k的药品生成推荐列表。
CN201810724191.4A 2018-07-04 2018-07-04 一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法 Active CN108921670B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810724191.4A CN108921670B (zh) 2018-07-04 2018-07-04 一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810724191.4A CN108921670B (zh) 2018-07-04 2018-07-04 一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法

Publications (2)

Publication Number Publication Date
CN108921670A CN108921670A (zh) 2018-11-30
CN108921670B true CN108921670B (zh) 2022-06-14

Family

ID=64424469

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810724191.4A Active CN108921670B (zh) 2018-07-04 2018-07-04 一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法

Country Status (1)

Country Link
CN (1) CN108921670B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111325419A (zh) * 2018-12-13 2020-06-23 北京沃东天骏信息技术有限公司 一种识别黑名单用户的方法和装置
CN110085292B (zh) * 2019-04-28 2022-07-26 广东技术师范大学 药品推荐方法、装置及计算机可读存储介质
CN110442797B (zh) * 2019-08-19 2022-02-08 重庆华医康道科技有限公司 一种互联网医院产品配置优化方法
CN111311324B (zh) * 2020-02-18 2022-05-20 电子科技大学 基于稳定神经协同过滤的用户-商品偏好预测***和方法
CN111564201A (zh) * 2020-05-08 2020-08-21 深圳市万佳安人工智能数据技术有限公司 一种基于粒子群优化的儿童饮食智能预测方法和装置
CN111815351B (zh) * 2020-05-29 2024-06-21 杭州览众数据科技有限公司 一种基于协同过滤与关联规则的服装推荐方法
CN113221000B (zh) * 2021-05-17 2023-02-28 上海博亦信息科技有限公司 一种人才数据智能检索及推荐方法
CN113449210B (zh) * 2021-07-01 2023-01-31 深圳市数字尾巴科技有限公司 基于时空特征的个性化推荐方法、装置、电子设备及存储介质
CN113569155B (zh) * 2021-07-30 2022-05-03 西南大学 一种基于改进循环神经网络算法的推荐召回方法及***
CN114881689A (zh) * 2022-04-26 2022-08-09 驰众信息技术(上海)有限公司 基于矩阵分解的楼宇推荐方法和***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106339502A (zh) * 2016-09-18 2017-01-18 电子科技大学 一种基于用户行为数据分片聚类的建模推荐方法
CN107463645A (zh) * 2017-07-21 2017-12-12 雷锤智能科技南京有限公司 基于用户属性评分导向的个性化推荐***及其推荐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10657574B2 (en) * 2016-09-13 2020-05-19 Adobe Inc. Item recommendation techniques

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106339502A (zh) * 2016-09-18 2017-01-18 电子科技大学 一种基于用户行为数据分片聚类的建模推荐方法
CN107463645A (zh) * 2017-07-21 2017-12-12 雷锤智能科技南京有限公司 基于用户属性评分导向的个性化推荐***及其推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于用户兴趣模型的个性推荐算法;郁钢等;《智能计算机与应用》;20180428(第02期);全文 *

Also Published As

Publication number Publication date
CN108921670A (zh) 2018-11-30

Similar Documents

Publication Publication Date Title
CN108921670B (zh) 一种融合用户潜在兴趣、时空数据和类别流行度的药品交易推荐方法
CN111259133B (zh) 一种融合多信息的个性化推荐方法
CN111259263B (zh) 一种物品推荐方法、装置、计算机设备及存储介质
Alkahtani et al. E-agricultural supply chain management coupled with blockchain effect and cooperative strategies
Nyamabo et al. Drug–drug interaction prediction with learnable size-adaptive molecular substructures
CN103329151B (zh) 基于话题聚类的推荐
CN108920527A (zh) 一种基于知识图谱的个性化推荐方法
CN109508419A (zh) 一种基于知识学习的推荐方法和***
CN106354862A (zh) 一种异构网络中多维个性化推荐方法
Hu et al. Movie collaborative filtering with multiplex implicit feedbacks
CN108959603A (zh) 基于深度神经网络的个性化推荐***及方法
CN104462385A (zh) 一种基于用户兴趣模型的电影个性化相似度计算方法
CN106570008A (zh) 推荐方法及装置
CN106845645A (zh) 用于用户驱动的语义网络和媒体合成的动态产生的方法、***和计算机程序
CN103425763B (zh) 基于sns的用户推荐方法及装置
CN103353880B (zh) 一种利用相异度聚类和关联的数据挖掘方法
CN109543840A (zh) 一种基于多维分类强化学习的动态推荐***设计方法
Yan et al. Attention-aware metapath-based network embedding for HIN based recommendation
CN109034960A (zh) 一种基于用户节点嵌入的多属性推断的方法
Aharon et al. Off-set: one-pass factorization of feature sets for online recommendation in persistent cold start settings
CN112559878B (zh) 一种基于图神经网络的序列推荐***及推荐方法
CN106202281A (zh) 一种多模态数据表示学习方法及***
CN109597899A (zh) 媒体个性化推荐***的优化方法
Zhang et al. Micro-blog topic recommendation based on knowledge flow and user selection
CN115860875A (zh) 一种基于双线性池化的多模态知识融合的商品推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant