CN112101984A - 一种融合用户微观行为和知识图谱的会话推荐模型 - Google Patents

一种融合用户微观行为和知识图谱的会话推荐模型 Download PDF

Info

Publication number
CN112101984A
CN112101984A CN202010822297.5A CN202010822297A CN112101984A CN 112101984 A CN112101984 A CN 112101984A CN 202010822297 A CN202010822297 A CN 202010822297A CN 112101984 A CN112101984 A CN 112101984A
Authority
CN
China
Prior art keywords
representation
user
model
sequence
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010822297.5A
Other languages
English (en)
Inventor
阳德青
孟文静
肖仰华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fudan University
Original Assignee
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fudan University filed Critical Fudan University
Priority to CN202010822297.5A priority Critical patent/CN112101984A/zh
Publication of CN112101984A publication Critical patent/CN112101984A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Biomedical Technology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Animal Behavior & Ethology (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Machine Translation (AREA)

Abstract

本发明属于人工智能与信息检索技术领域,具体为一种融合用户微观行为和知识图谱的会话推荐模型,简称MKM‑SR。本发明模型首先使用不同的深度学习模型对用户的交互操作序列和交互物品序列分别进行编码,并将操作和物品的嵌入表示向量组合成用户的微观行为表示(向量),再采用注意力机制基于的用户的微观行为表示生成会话的综合表示(向量),从而实现对下一个交互物品的准确预测。此外,本模型还基于TransH知识表示模型调优物品表示,将其与会话推荐任务共同融入多任务学习框架,从而进一步提升会话推荐的效果,并有效缓解用户历史交互数据稀疏带来的问题。

Description

一种融合用户微观行为和知识图谱的会话推荐模型
技术领域
本发明属于人工智能与信息检索技术领域,具体涉及一种基于用户微观行为和知识图谱的会话推荐模型。
背景技术
在大数据时代,用户可以自由从海量的商品和服务做出选择,但是其中裹挟着不可避免的信息过载问题。推荐模型应运而生,个性化推荐模型根据用户的兴趣和行为特点,给用户推荐其可能感兴趣的信息和商品,帮助用户节省时间,挖掘用户潜在兴趣,还能提高商品的交互率,提高用户对平台的满意度和忠实度,为平台带来巨大的经济利益,因此一跃成为可以帮助用户做出合理的决策和选择的基础性工具。
会话推荐(session-based recommendation,简称SR)是指只利用用户在最近一段时期(会话)内的交互物品序列去预测用户下一个可能交互的物品,会话内的交互物品序列可准确捕捉用户的短期偏好,对于当前时间点的推荐具有重要意义。具体来说,“会话”用来指代一段指定时间内产生的“用户-物品”交互行为集合,交互可指购买商品,或者是点击广告、收看视频等行为。基于会话的推荐模型,能够刻画用户多元且动态变化的喜好以准确表示用户的短期偏好,具有较高的实用价值,引起了学术界和工业界越来越多的关注。随着深度神经网络的发展,很多人士通过用循环神经网络(简称RNN)、卷积神经网络(简称CNN)对会话建模,来捕捉用户动态偏好的方法已经越来越普遍,尽管取得了较好的效果,但是还存在如下一些待解决的问题:
问题一:忽视了用户与物品交互中的微观行为
现有研究大多从宏观角度看待会话,即只是把会话看作一些用户交互过的物品序列,而不考虑用户到底对这些物品具体进行了什么类型的操作。实际上,即使两个用户交互的是同一个物品,但如果具体交互的操作类型不同也会反映用户不同的偏好。
以图1为例,图中绿色虚线框中的内容可视为一个会话。会话s1的用户首先搜索了乐队Maroon 5的一首hip-pop歌曲i1,然后依次将其加入歌单和喜欢的歌曲列表,接着通过‘Artist More’这个操作搜索了Maroon 5乐队的更多作品,发现了歌曲i2,并加入喜欢的歌曲列表。然后再通过‘Artist More’发现了歌曲i3,尽管i3还是Maroon 5的作品,但可能不是hip-pop风格。会话s2中的用户也先通过搜索发现了歌曲i1,然后通过‘GenreMore’操作搜到了更多hip-pop风格的歌曲,从而发现了歌曲i2,并将其加入喜欢的歌曲列表。接着再通过‘Genre More’发现了歌曲i4,因为它也是hip-pop风格,但不是Maroon 5的作品。
对于传统的基于用户宏观行为的会话推荐,其算法的基本原理是根据最近会话中交互过的物品(即歌曲i1和i2)来预测用户下一个可能交互的物品。根据这一原理,两个会话s1和s2中的交互歌曲是一样的,那么模型预测的下一个交互歌曲也会是一样的。但实际上从微观的用户操作类型层面看,两个会话内部的传递机制并不相同,s1中的i1是通过‘ArtistMore’到i2,而s2中的i1则是通过‘Genre More’到i2。据此预测用户下一个要交互的歌曲也应该是不同的,即应该分别推荐i3和i4。在此,将用户对交互物品所进行的具体操作视为用户的微观行为,用“物品-操作”对来表示用户的一个微观行为(图中红色虚线框所示)。
问题二:对物品知识的利用不够充分
大多数会话推荐模型只基于以往交互过的物品来推断用品的偏好,因此当交互记录稀疏时,推荐效果较差。针对这类数据稀疏问题(包括冷启动),本发明模型中,有关物品的知识(例如商品所属的目录、品牌等)被作为辅助信息用来增强推荐效果。另外,物品知识也可以在一定程度上反映用户微观行为之间的转移机制。例如,图1的s1用户从交互i2转换到i3的原因可以从两条知识三元组<i1,song-artist,Maroon 5>和<i2,song-artist,Maroon 5>中找到。由此可见物品知识对于基于用户微观行为的会话建模具有重要价值。
因此,本发明主要从两方面提出创新技术以增强会话推荐的效果,一是引入用户对物品的具体操作类型,从用户微观行为的视角对会话建模,使得用户的偏好表示力度更细、更精准;二是将物品知识的表示学习作为会话推荐的一个辅助(子)任务加入到多任务学习的框架中,有助于习得更优的物品表示向量,从而进一步提升会话推荐的效果。
发明内容
本发明的目的在于提供一种能够增强会话推荐效果的基于用户微观行为和知识图谱的会话推荐模型。
本发明提供的基于用户微观行为和知识图谱的会话推荐模型,简称MKM-SR,其架构图如图2所示,该模型的输入为一个给定的会话s和一个候选的物品i,以及包含物品及其属性特征的知识图谱
Figure BDA0002634927580000022
输出为该会话与候选物品的匹配分数
Figure BDA0002634927580000021
即将该物品预测为该会话的用户在下一时刻会交互的物品概率;该模型包括:门控图神经网络(简称GGNN)模型,门控循环单元(简称GRU)模型,软注意力机制模型,多层感知机,Softmax函数;TransH模型;其中,会话的内容包括会话中用户交互过的物品序列及相应的用户操作序列,这是与其他会话推荐模型最大的区别之处。其中:
所述输入模型的会话,其信息可表示为会话中的交互物品序列和用户操作序列,且都以用户的一个操作为单位,而用户的一个操作与其操作的对象(物品)则构成一个微观行为。例如,假设一个用户在浏览了商品A的评论后将其加入购物车,则在此产生的交互物品序列为“商品A、商品A”,操作序列为“浏览评论、加入购物车”,该用户的微观行为序列为“商品A-浏览评论、商品A-加入购物车”,这些序列的长度都为2。因此,同一个物品在交互物品序列中可能会重复出现多次。
对于会话中的用户交互物品序列和操作序列,采用不同的深度学习模型来学习得到相应的嵌入表示(向量),并组成用户的微观行为表示(向量)序列,实现过程如下:
(1)对于用户交互物品序列,首先构建一个有向的交互物品图
Figure BDA0002634927580000037
对该图采用门控图神经网络(简称GGNN)模型[2],习得每个交互物品的嵌入表示(向量);
(2)对于用户操作序列,采用门控循环单元(简称GRU)模型[1],习得每个操作的嵌入表示;
(3)将每个交互物品的表示和其对应的操作表示串联组成一个微观行为表示。
根据得到的用户微观行为表示序列,采用软注意力机制[4]生成会话的综合表示(向量)。然后,将会话综合表示(向量)与候选物品的表示(向量)输入多层感知机[5],再利用Softmax函数计算出匹配分值
Figure BDA0002634927580000031
对于输入模型的物品知识图谱
Figure BDA0002634927580000032
采用TransH模型[3],产生物品的知识嵌入表示(向量),将该向量的训练作为辅助任务,与会话推荐的主任务(即
Figure BDA0002634927580000033
的计算)一起构建多任务学习框架,从而习得更优的物品表示,并提升会话推荐的准确率。
本发明中,所述的利用GGNN模型习得交互物品的表示,具体地,先基于交互物品序列构建一个有向的交互物品图
Figure BDA0002634927580000034
该图
Figure BDA0002634927580000035
的结构特点为:每个节点对序列中的一个物品,每条边连接的则是序列中紧挨着的两个交互物品。因为交互物品序列中的前后两个成员可能是同一个物品,因此图
Figure BDA0002634927580000036
中可能存在节点有一条指向自己的边(自环)。每条边带权重,值为归一化的出度。
下面分别详细阐述模型各部分的实现细节,其中,粗体小写字母表示向量,粗体大写字母表示矩阵)。
(1)关于物品表示的学习
考虑到会话中的交互物品序列中,不只是后面交互的物品与前面交互的物品有关联,前面的物品也会依赖于后面的物品,体现的是双向的传递影响。因此,RNN的模型(如GRU[1])因其只对单向传递影响建模并不适用,因此,本发明采用门控图神经网络(简称GGNN)模型[2]来对交互物品序列建模,以学出物品表示(向量)。
所述构建的有向的交互物品图
Figure BDA0002634927580000041
图中每个节点代表交互物品序列中的一个物品,每条边连接的是序列中紧挨着的两个交互物品,且边带权重,值为归一化的出度。请注意,一个交互物品序列中同一个物品可能重复出现,例如图1中会话s1的交互物品序列是{i1,i1,i1,i2,i2},故该序列对应的有向图中节点i1和i2都有指向自己的边。
所述对图
Figure BDA0002634927580000042
应用GGNN模型以习得图中每个节点(即每个物品)的嵌入表示(向量),具体的学习过程如下:首先通过查询(lookup)所有物品的嵌入表示矩阵,得到每个节点的初始嵌入表示,并用下面的公式进行更新:
Figure BDA0002634927580000043
Figure BDA0002634927580000044
Figure BDA0002634927580000045
Figure BDA0002634927580000046
Figure BDA0002634927580000047
上述公式中,A+和A-分别是图
Figure BDA0002634927580000048
的入度矩阵和出度矩阵,⊙是哈达玛乘积。
Figure BDA0002634927580000049
是计算过程的中间向量,
Figure BDA00026349275800000410
Figure BDA00026349275800000411
分别是第h步的重设门(向量)与更新门(向量),
Figure BDA00026349275800000412
则是第h步的候选状态(向量),最后的
Figure BDA00026349275800000413
是更新h步后节点v的嵌入表示。假设更新H步后的节点嵌入表示是对应物品的最终嵌入表示,整个序列的最终物品嵌入表示为
Figure BDA00026349275800000414
根据图
Figure BDA00026349275800000415
的结构特点,一个会话中每个交互物品习得的嵌入表示是唯一的。
(2)关于操作表示学习
前述的GGNN模型并不适用于用户操作序列的建模,原因有二:首先,用户操作类型非常有限,所以对于一个会话而言,其中的操作大多是重复的,那么也构造同样的的
Figure BDA00026349275800000416
话构使得图中节点大多拥有同样的邻居,经过GGNN习得的各节点嵌入表示大都比较相似,没有区分度;其次,两个连续的操作之间通常有固定的单向传递机制,例如用户在阅读某个商品品的介绍或评论后,才有可能将其加入购物车,然后才会下单购买。因此,本发明采用门控循环单元(简称GRU)对操作序列建模更加合适;具体做法是:先通过查询所有操作的嵌入表示矩阵得到每个操作的初始嵌入(操作序列中排在第k位的操作初始嵌入表示为
Figure BDA00026349275800000417
),并按以下按公式更新:
Figure BDA0002634927580000051
上式中,GRU(·)表示一个GRU单元的操作(具体参见[1]),ΦGRU表示GRU单元的参数。
Figure BDA0002634927580000052
是第k-1位的状态(向量),即操作序列中排在第k-1位的操作嵌入表示。通过GRU得到的操作序列最终表示为
Figure BDA0002634927580000053
请注意,根据GRU的学习机制,一个操作如果出现在序列中不同的位置,则其对应的嵌入表示也不同。
(3)关于会话表示
用户的一个微观行为由交互的物品和其对应的操作组成,因此将习得的序列中每个物品和其对应的操作表示串联,组成用户的一个微观行为表示(向量):
Figure BDA0002634927580000054
考虑到每个微观行为对用户偏好建模的影响不同,本发明模型还采用软注意力机制[4]来生成更好的会话表示向量s,具体计算公式如下:
αt=βTσ(W1mL+W2mt+bα), (8)
Figure BDA0002634927580000055
s=W3[mL;sg]; (10)
其中,mt是微观行为(表示)序列中第t个行为的表示,mL是序列中最后(最近)一个微观行为的表示。αt是第k个微观行为的注意力值(权重),而W1~3和bα都是模型的待训练参数。
(4)关于模型预测
给定一个会话的表示s和一个候选物品的表示ij,模型进一步利用多层感知机(简称MLP)和Softmax函数计算两者的匹配分值:
Figure BDA0002634927580000056
上式中,MLP(·)表示多层感知机的相关操作,具体参见[5]。
该会话推荐任务的损失函数采用如下的二元交叉熵函数:
Figure BDA0002634927580000057
上式中,ysj是从训练集中可以观察到s与j的匹配情况。当物品j是会话s的用户下一时刻交互的物品,有ysj=1,否则ysj=0。
(5)关于知识表示学习
本发明模型为了进一步提升会话推荐的效果,还利用与物品有关的知识图谱,通过学习图谱中实体节点的嵌入表示来优化物品的嵌入表示。该图谱中包含物品这一大类实体,也包含物品的各属性所关联的实体,例如电影的演员、商品的厂商等。鉴于物品与其属性实体之间包含很多的多对一、多对多关系(例如多部电影有共同的导演,一部电影有多个演员,一个演员又会参演多部电影),本发明直接利用TransH模型[3]来学习相关的知识(实体)表示,知识表示学习的目标函数定义为:
Figure BDA0002634927580000061
其中,K是所有整个模型中所有知识三元组的集合,i是物品实体i的表示,a是物品属性实体a的表示,dr是关系r的表示,wr是待训练参数。
(6)关于多任务学习框架
本发明模型的主任务是会话推荐,即公式(12)所示的目标,而公式(13)的知识表示学习目标则作为辅助任务,一起组成如下的综合(多任务)学习目标函数:
Figure BDA0002634927580000062
上式中的Φ表示模型所有待训练参数集合。通过对比实验发现,对于公式(14)的多任务学习目标采用如下交替训练方式效果更好:
Figure BDA0002634927580000063
本发明引入了用户与物品交互的具体操作类型,提出了用户微观行为的概念,使得模型能够捕获会话中更加细粒度的用户行为模式,从而实现精准的会话推荐。
根据会话中的用户交互物品序列和操作序列的不同特点,分别采用不同的模型(GGNN和GRU)来对两种序列建模。
采用软注意力机制进行基于物品嵌入表示和操作嵌入表示生成会话的综合表示。
引入知识图谱,利用知识表示学习来优化物品的嵌入表示,并将其与会话推荐的主任务一同加入多任务学习框架进行交替训练。
与现有技术相比,本发明的技术优点在于:
1、引入用户操作类型,提出从微观行为层面进行会话建模,用更一种细粒度的表示对会话中的用户行为模式进行刻画,从而提升会话推荐的准确率;
2、引入包含物品知识的知识图谱,采用多任务学习框架来将知识表示学习作为会话推荐的辅助任务一起进行交替训练,不仅能够缓解会话推荐中的数据稀疏问题,还进一步优化了物品表示,从而提升模型性能。
附图说明
图1为会话中的用户微观行为图示。
图2为本发明的推荐模型框架图示。
图3为在数据集上MMR@20训练、交替训练、联合训练的学习曲线。
具体实施方式
下面通过具体实施的例子和对比实验进一步介绍本发明的优越性。
1、超参数设置。本发明的MKM-SR模型和其他对比模型都相同的嵌入表示(向量)维度,即100维。所有的嵌入表示都通过0均值0.1标准差的高斯分布进行初始化。设置GGNN的迭代次数为1。MKM-SR及其变种(弱化)模型的多任务学习采用交替训练方式。此外,实验采用Adam优化器对模型中的参数进行学习,学习批次(batch-size)大小设为128,公式3中知识学习的权重λ1设为0.001。
2、对比实验结果及分析。基于两个数据集KKBOX和JDATA进行对比实验,评测指标采用Hit@k和MRR@k。另外,为了验证模型在交互数据稀疏场景下的性能,对数据集做了两种人工改动,一是保留了只出现在测试集中的物品(用(N)标识),这些物品可视为冷启动物品;二是模拟稀疏的JDATA数据集,即只保留最早的1%的用户行为,其中包含很多冷启动物品,命名为Demo数据集。对比实验结果如下表1所示,表明作者提出的MKM-SR在各数据集(包括稀疏场景数据集)上都具有明显的优势。表中下半部分的模型是MKM-SR的弱化变种,以验证MKM-SR模型不同部分设计的必要性和有效性。
图3中展示了在数据集上MMR@20训练、交替训练、联合训练的学***等的地位;但是联合训练中,高频物品的知识学习反复出现,即知识会对高频物品造成非常大的影响。需要注意的是,首先主要任务为推荐,高频物品通过会话信息的学习已经能够获得比较好的物品表示,不太需要知识信息的补足;此外用户和高频物品进行交互的原因往往和物品本身的属性关联性比较小,而是更多受到潮流、社交等原因的影响,所以知识的过学习会造成负迁移。因此,交替学习是在本实验场景下是一个更优的学习策略。
表1
Figure BDA0002634927580000081
参考文献:
[1]Kyunghyun Cho,Bart Van Merrienboer,DzmitryBahdanau,andYoshuaBengio.On the Properties of NeuralMachine Translation:Encoder-DecoderApproaches.In Computer Science,2014.
[2]Yujia Li,Richard Zemel,Marc Brockschmidt,and DanielTarlow.GATEDGRAPH SEQUENCE NEURAL NETWORKS.In Proceedings of ICLR,2016.
[3]Zhen Wang,Jianwen Zhang,Jianlin Feng,and Zheng Chen.Knowledgegraphembedding by translating on hyperplanes.In Twenty-Eighth AAAI conferenceonartificial intelligence,2014.
[4]Kelvin Xu,Jimmy Ba,Ryan Kiros,Kyunghyun Cho,Aaron C.Courville,RuslanSalakhutdinov,Richard S.Zemel,and YoshuaBengio:Show,Attend andTell:Neural Image Caption Generation with Visual Attention.In Proc.of ICML,2015.
[5]M.W Gardner et al.Artificial neural networks(the multilayerperceptron)—a review of applications in the atmospheric sciences.InAtmospheric Environment,1998.。

Claims (6)

1.一种基于用户微观行为和知识图谱的会话推荐模型,简称MKM-SR,其特征在于,该模型的输入为一个给定的会话s和一个候选的物品i,以及包含物品及其属性特征的知识图谱
Figure FDA0002634927570000011
输出为该会话与候选物品的匹配分数
Figure FDA0002634927570000012
即将该物品预测为该会话的用户在下一时刻会交互的物品概率;该模型包括:门控图神经网络模型,门控循环单元模型,软注意力机制模型,多层感知机,Softmax函数;TransH模型;其中:
(一)所述会话,其信息表示为会话中的交互物品序列和用户操作序列,且都以用户的一个操作为单位,而用户的一个操作与其操作的对象即物品构成一个微观行为;
对于会话中的用户交互物品序列和操作序列,采用深度学习模型,通过学习得到用户的微观行为表示(向量)的序列,实现过程如下:
(1)对于用户交互物品序列,首先构建一个有向的交互物品图
Figure FDA0002634927570000013
对该图采用门控图神经网络模型,通过学习得到每个交互物品的嵌入表示(向量);
(2)对于用户操作序列,采用门控循环单元模型,通过学习得到每个操作的嵌入表示;
(3)将每个交互物品的表示和其对应的操作表示串联组成一个微观行为表示;
根据得到的用户微观行为表示序列,采用软注意力机制生成会话的综合表示(向量);然后,将会话综合表示(向量)与候选物品的表示(向量)输入多层感知机,再利用Softmax函数计算出匹配分值
Figure FDA0002634927570000014
(二)对于物品知识图谱
Figure FDA0002634927570000015
采用TransH模型,产生物品的知识嵌入表示(向量),将该向量的训练作为辅助任务,与会话推荐的主任务即
Figure FDA0002634927570000016
的计算,一起构建多任务学习框架,从而学习得到更优的物品表示,并提升会话推荐的准确率。
2.根据权利要求1所述的基于用户微观行为和知识图谱的会话推荐模型,其特征在于,所述对有向的交互物品图
Figure FDA0002634927570000017
采用门控图神经网络模型,通过学习得到每个交互物品的嵌入表示(向量),其中,图
Figure FDA0002634927570000018
的结构特点为:每个节点对序列中的一个物品,每条边连接的则是序列中紧挨着的两个交互物品;因为交互物品序列中的前后两个成员可能是同一个物品,因此图
Figure FDA0002634927570000019
中可能存在节点有一条指向自己的边;每条边带权重,值为归一化的出度;
具体的学习过程如下:首先通过查询所有物品的嵌入表示矩阵,得到每个节点的初始嵌入表示,并用下面的公式进行更新:
Figure FDA00026349275700000110
Figure FDA0002634927570000021
Figure FDA0002634927570000022
Figure FDA0002634927570000023
Figure FDA0002634927570000024
上述公式中,A+和A-分别是图
Figure FDA0002634927570000025
的入度矩阵和出度矩阵,⊙是哈达玛乘积,
Figure FDA0002634927570000026
是更新h步后节点v的嵌入表示;假设更新H步后的节点嵌入表示是对应物品的最终嵌入表示,整个序列的最终物品嵌入表示为
Figure FDA0002634927570000027
根据图
Figure FDA0002634927570000028
的结构特点,一个会话中每个交互物品习得的嵌入表示是唯一的。
3.根据权利要求2所述的基于用户微观行为和知识图谱的会话推荐模型,其特征在于,所述对于用户操作序列,采用门控循环单元模型,通过学习得到每个操作的嵌入表示,具体过程如下:
先通过查询所有操作的嵌入表示矩阵得到每个操作的初始嵌入
Figure FDA0002634927570000029
并按以下按公式更新:
Figure FDA00026349275700000210
得到的操作序列最终表示为
Figure FDA00026349275700000211
根据GRU的学习机制,一个操作如果出现在序列中不同的位置,则其对应的嵌入表示也不同。
4.根据权利要求3所述的基于用户微观行为和知识图谱的会话推荐模型,其特征在于,所述将每个交互物品的表示和其对应的操作表示串联组成一个微观行为表示;具体算式为:
Figure FDA00026349275700000212
5.根据权利要求4所述的基于用户微观行为和知识图谱的会话推荐模型,其特征在于,所述将会话综合表示(向量)与候选物品的表示(向量)输入多层感知机,再利用Softmax函数计算出匹配分值
Figure FDA00026349275700000213
具体计算公式如下:
αt=βTσ(W1mL+W2mt+bα), (8)
Figure FDA00026349275700000214
s=W3[mL;sg]; (10)
其中,mL是序列中最后一个微观行为表示;
给定一个会话的表示s和一个候选物品的表示ij,利用多层感知机和Softmax函数计算两者的匹配分值:
Figure FDA0002634927570000031
该会话推荐任务的损失函数采用如下的二元交叉熵函数:
Figure FDA0002634927570000032
6.根据权利要求5所述的基于用户微观行为和知识图谱的会话推荐模型,其特征在于,所述对于物品知识图谱
Figure FDA0002634927570000033
采用TransH模型,产生物品的知识嵌入表示(向量)中,知识表示学习的目标函数定义为:
Figure FDA0002634927570000034
其中,K是整个模型中所有知识三元组的集合,实体表示i即物品表示;
公式(12)所示的目标,公式(13)的知识表示学习目标则作为辅助任务,一起组成如下的综合即多任务学习目标函数:
Figure FDA0002634927570000035
对于公式(14)的多任务学习目标采用如下交替训练方式:
Figure FDA0002634927570000036
CN202010822297.5A 2020-08-16 2020-08-16 一种融合用户微观行为和知识图谱的会话推荐模型 Pending CN112101984A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010822297.5A CN112101984A (zh) 2020-08-16 2020-08-16 一种融合用户微观行为和知识图谱的会话推荐模型

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010822297.5A CN112101984A (zh) 2020-08-16 2020-08-16 一种融合用户微观行为和知识图谱的会话推荐模型

Publications (1)

Publication Number Publication Date
CN112101984A true CN112101984A (zh) 2020-12-18

Family

ID=73753777

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010822297.5A Pending CN112101984A (zh) 2020-08-16 2020-08-16 一种融合用户微观行为和知识图谱的会话推荐模型

Country Status (1)

Country Link
CN (1) CN112101984A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112733018A (zh) * 2020-12-31 2021-04-30 哈尔滨工程大学 一种基于图神经网络gnn和多任务学习的会话推荐方法
CN112800207A (zh) * 2021-01-13 2021-05-14 桂林电子科技大学 一种商品信息推荐方法、装置及存储介质
CN112950321A (zh) * 2021-03-10 2021-06-11 北京汇钧科技有限公司 一种物品推荐方法和装置
CN113569143A (zh) * 2021-07-20 2021-10-29 上海明略人工智能(集团)有限公司 推荐结果的生成方法、装置、电子设备和计算机可读介质
CN114925270A (zh) * 2022-05-09 2022-08-19 华南师范大学 一种会话推荐方法和模型
CN117094387A (zh) * 2023-10-19 2023-11-21 成都市智慧蓉城研究院有限公司 基于大数据的知识图谱构建方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180068371A1 (en) * 2016-09-08 2018-03-08 Adobe Systems Incorporated Learning Vector-Space Representations of Items for Recommendations using Word Embedding Models
CN110275964A (zh) * 2019-06-26 2019-09-24 程淑玉 基于知识图谱与循环神经网络的推荐模型
CN110955826A (zh) * 2019-11-08 2020-04-03 上海交通大学 基于改进型循环神经网络单元的推荐***
CN111080400A (zh) * 2019-11-25 2020-04-28 中山大学 一种基于门控图卷积网络的商品推荐方法及***、存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180068371A1 (en) * 2016-09-08 2018-03-08 Adobe Systems Incorporated Learning Vector-Space Representations of Items for Recommendations using Word Embedding Models
CN110275964A (zh) * 2019-06-26 2019-09-24 程淑玉 基于知识图谱与循环神经网络的推荐模型
CN110955826A (zh) * 2019-11-08 2020-04-03 上海交通大学 基于改进型循环神经网络单元的推荐***
CN111080400A (zh) * 2019-11-25 2020-04-28 中山大学 一种基于门控图卷积网络的商品推荐方法及***、存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
WENJING MENG: "Incorporating User Micro-behaviors and Item Knowledge into Multi-task Learning for Session-based Recommendation", 《SIGIR "20: PROCEEDINGS OF THE 43RD INTERNATIONAL ACM SIGIR CONFERENCE ON RESEARCH AND DEVELOPMENT IN INFORMATION》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112733018A (zh) * 2020-12-31 2021-04-30 哈尔滨工程大学 一种基于图神经网络gnn和多任务学习的会话推荐方法
CN112733018B (zh) * 2020-12-31 2022-12-06 哈尔滨工程大学 一种基于图神经网络gnn和多任务学习的会话推荐方法
CN112800207A (zh) * 2021-01-13 2021-05-14 桂林电子科技大学 一种商品信息推荐方法、装置及存储介质
CN112800207B (zh) * 2021-01-13 2022-05-13 桂林电子科技大学 一种商品信息推荐方法、装置及存储介质
CN112950321A (zh) * 2021-03-10 2021-06-11 北京汇钧科技有限公司 一种物品推荐方法和装置
CN113569143A (zh) * 2021-07-20 2021-10-29 上海明略人工智能(集团)有限公司 推荐结果的生成方法、装置、电子设备和计算机可读介质
CN113569143B (zh) * 2021-07-20 2024-02-27 上海明略人工智能(集团)有限公司 推荐结果的生成方法、装置、电子设备和计算机可读介质
CN114925270A (zh) * 2022-05-09 2022-08-19 华南师范大学 一种会话推荐方法和模型
CN117094387A (zh) * 2023-10-19 2023-11-21 成都市智慧蓉城研究院有限公司 基于大数据的知识图谱构建方法及***
CN117094387B (zh) * 2023-10-19 2023-12-19 成都市智慧蓉城研究院有限公司 基于大数据的知识图谱构建方法及***

Similar Documents

Publication Publication Date Title
CN111523047B (zh) 基于图神经网络的多关系协同过滤算法
Liu et al. Deep reinforcement learning based recommendation with explicit user-item interactions modeling
CN112101984A (zh) 一种融合用户微观行为和知识图谱的会话推荐模型
Guo et al. Streaming session-based recommendation
Liu et al. State representation modeling for deep reinforcement learning based recommendation
CN112364976B (zh) 基于会话推荐***的用户偏好预测方法
Tao et al. Multi-modal knowledge-aware reinforcement learning network for explainable recommendation
Zhang et al. Neural time-aware sequential recommendation by jointly modeling preference dynamics and explicit feature couplings
CN110910218A (zh) 一种基于深度学习的多行为迁移推荐方法
CN111241394B (zh) 数据处理方法、装置、计算机可读存储介质及电子设备
Guo et al. Intention modeling from ordered and unordered facets for sequential recommendation
Wong et al. Improving conversational recommender system by pretraining billion-scale knowledge graph
Chen et al. Dig users’ intentions via attention flow network for personalized recommendation
Zarzour et al. RecDNNing: a recommender system using deep neural network with user and item embeddings
CN116071128A (zh) 一种基于多行为特征提取与自监督学习的多任务推荐方法
Xu et al. A survey on sequential recommendation
CN113704438B (zh) 一种基于分层注意力机制的异构图的会话推荐方法
CN113344648B (zh) 一种基于机器学习的广告推荐方法及***
Chen et al. Integrating user-group relationships under interest similarity constraints for social recommendation
CN114169968A (zh) 一种融合用户兴趣状态的多粒度会话推荐方法
Niu et al. Deep recommendation model combining long-and short-term interest preferences
WO2023185320A1 (zh) 冷启动对象推荐方法、装置、计算机设备和存储介质
Wong et al. Improving conversational recommendation system by pretraining on billions scale of knowledge graph
CN113704439B (zh) 一种基于多来源信息异构图的会话推荐方法
Lu Design of a music recommendation model on the basis of multilayer attention representation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20201218

WD01 Invention patent application deemed withdrawn after publication