CN114428912A - 一种基于捕捉用户长短期兴趣异构超图的会话推荐方法 - Google Patents

一种基于捕捉用户长短期兴趣异构超图的会话推荐方法 Download PDF

Info

Publication number
CN114428912A
CN114428912A CN202210177770.8A CN202210177770A CN114428912A CN 114428912 A CN114428912 A CN 114428912A CN 202210177770 A CN202210177770 A CN 202210177770A CN 114428912 A CN114428912 A CN 114428912A
Authority
CN
China
Prior art keywords
user
vector
session
article
edge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210177770.8A
Other languages
English (en)
Inventor
顾盼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Jiliang University
Original Assignee
China Jiliang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Jiliang University filed Critical China Jiliang University
Priority to CN202210177770.8A priority Critical patent/CN114428912A/zh
Publication of CN114428912A publication Critical patent/CN114428912A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于捕捉用户长短期兴趣异构超图的会话推荐方法,基于用户所有会话中的交互物品序列,给用户推荐下一个感兴趣的物品。本发明的向前传播部分主要由五个部分组成。第一部分是从所有用户的会话序列中构建包含用户超边和会话超边的异构超图;第二部分是利用异构超图神经网络得到物品向量、会话向量和用户向量;第三部分是根据用户当前会话,基于门循环单元网络得到用户当前兴趣;第四部分是结合用户当前兴趣、会话向量和用户向量,得到用户兴趣;第五部分是根据用户兴趣,给用户推荐物品。

Description

一种基于捕捉用户长短期兴趣异构超图的会话推荐方法
技术领域
本发明属于互联网服务技术领域,尤其是涉及一种基于捕捉用户长短期兴趣异构超图的会话推荐方法。
背景技术
会话(session)指一段时间内用户交互的物品序列,一般通过用户行为之间的时间间隔进行划分。会话推荐方法(session-based recommendation)是指基于会话中的物品序列,对用户兴趣进行建模,给用户推荐下一个感兴趣的物品。会话推荐方法被分为单会话推荐方法(single-session based recommendation models) 和多会话推荐方法(multi-session based recommendation models)。单会话推荐方法指只利用当前会话中的物品序列,捕捉用户当前兴趣,并进行推荐。多会话推荐方法把用户历史上所有的物品序列,划分成若干个会话,不仅使用当前的会话对用户当前兴趣进行建模,还利用用户之前发生的会话对用户长期兴趣进行建模,本方法是一种多会话推荐方法。
多会话推荐方法既可以捕捉到用户当前的兴趣,又可以捕捉到用户长期的静态兴趣,有效地缓解了推荐场景的数据稀疏性。现有的会话推荐方法在从当前会话中抽取用户当前兴趣时,有的认为会话内的物品序列是有序的,因此采用循环神经网络这一类有序序列建模方法对会话进行建模;有的不考虑会话内物品序列之间的时间先后性,采用注意力机制这类基于集合的方法对会话进行建模。本方法认为,不同用户在不同会话中的行为模式不同,当用户抱着随便逛逛的心态且目的性不强时,会话中的物品序列较长、物品种类更为丰富,使用基于集合的方法进行建模较为合适。当用户购买意愿较为强烈、时间较少时,会话中的物品序列较短,物品种类更为单一,转移规律更明显,采用基于有序序列的方法进行建模更为合适。因此,本方法同时基于有序序列建模方法和集合建模方法两种方法,对用户当前兴趣进行建模。
现有的捕捉用户长短期兴趣的会话推荐方法,采用两个独立的模块分别对用户的长期和短期兴趣进行建模。而同一用户的长期兴趣和短期兴趣是有联系的,单独对用户的长期和短期兴趣建模,无法捕捉两者的联系。因此,本方法在统一的框架里对用户和会话进行建模,对用户进行建模是为了捕捉用户的长期兴趣,对会话进行建模是为了捕捉用户的短期兴趣。本方法采用超图来同时对用户的长期和短期兴趣进行建模。超图(hypergraph)是普通图(normal graph)的更一般化的表示。在普通图中,一个边只能连接两个节点,而超图中的超边(hyperedge)可以连接两个或者两个以上的节点(node)。本方法中,超图的节点是物品。超图的超边有两种,分别是用户超边和会话超边。用户超边代表用户的长期兴趣,会话超边代表用户的短期兴趣。本方法中的超图含有两种类型的超边,因此是一种异构超图。现有的超图神经网络方法采用“节点-超边-节点”这样的信息传输方式,先把节点的信息传递给包含该节点的超边,再把超边的信息传递给被该超边包含的节点。而本方法中的异构超图的超边有两种,分别是会话超边和用户超边,当这两种超边传递信息给物品节点时,传递的信息语义不同,重要程度不同,且两种超边的个数也不同。会话代表了用户短时间内较为单一的兴趣,因此传递信息和物品更为接近;而用户代表的兴趣更为丰富且稳定,因此传递给物品的信息更为多样。且会话的数量比用户的数量多。平衡不同类型的超边信息是异构超图神经网络的重点。本方法采用基于目标物品节点的注意力机制对会话超边和用户超边这两种不同类型信息进行选择。本方法通过异构超图神经网络得到物品向量、会话向量和用户向量后,再采用有序序列建模方式对用户当前会话建模,得到用户当前兴趣。最后结合用户当前兴趣、会话向量和用户向量给用户推荐物品。
发明内容
本方法的问题定义为基于用户所有会话中的交互物品序列,给用户推荐下一个感兴趣的物品。也就是,基于用户ui的历史会话序列
Figure BDA0003521010030000011
和当前会话
Figure BDA0003521010030000012
预测用户下一个交互物品。其中,历史会话序列是按照时间先后顺序排序的,用户ui的当前会话
Figure BDA0003521010030000013
下标
Figure BDA0003521010030000014
是会话
Figure BDA0003521010030000015
内物品序列的长度,vj是用户ui在会话
Figure BDA0003521010030000016
内第j个交互的物品。现有的工作忽略了不同用户在不同会话中行为模式的差异性,统一采用基于有序序列的模型或者基于集合的模型来对会话进行建模,且忽略了用户的长期兴趣和短期兴趣之间的联系。为此,本发明采用以下技术方案:
一种基于捕捉用户长短期兴趣异构超图的会话推荐方法,包括以下步骤:
从所有用户的会话序列中构建包含用户超边和会话超边的异构超图。对于用户ui的当前会话
Figure BDA0003521010030000021
Figure BDA0003521010030000022
下标
Figure BDA0003521010030000023
是会话
Figure BDA0003521010030000024
内物品序列的长度,vj是用户ui在会话
Figure BDA0003521010030000025
内第j个交互的物品。会话
Figure BDA0003521010030000026
内的所有物品
Figure BDA0003521010030000027
构成异构超图的物品节点,会话
Figure BDA0003521010030000028
构成异构超图中的会话超边
Figure BDA0003521010030000029
且会话超边
Figure BDA00035210100300000210
连接会话
Figure BDA00035210100300000211
内的所有物品。***中所有会话都采用同样的方式在异构超图中构建会话超边和物品节点。用户ui的所有会话序列是
Figure BDA00035210100300000212
该会话序列包含了历史会话序列和当前会话,将用户ui作为异构超图中的用户超边
Figure BDA00035210100300000213
用户超边
Figure BDA00035210100300000214
连接用户ui交互过的物品。
利用异构超图神经网络得到物品向量、会话向量和用户向量。本方法中,物品根据物品ID被初始化为d维向量,对于物品vj,初始向量为
Figure BDA00035210100300000215
异构超图神经网络会经过很多层的信息传递,通过每一层的信息传递,节点学习到距离更远的其他节点信息。经过l层的信息传递后,物品vj的向量是
Figure BDA00035210100300000216
为了描述方便,把异构超图中的会话超边和用户超边统一用ei表示,而超边ei经过l层的信息传递后,向量是
Figure BDA00035210100300000217
异构超图神经网络传递的层数由模型超参数L控制,由异构超图神经网络更新L层后,最终得到物品vj的向量是
Figure BDA00035210100300000218
超边ei的向量是
Figure BDA00035210100300000219
用户ui构成的用户超边
Figure BDA00035210100300000220
是超边的一种,用户ui最终的向量表示为
Figure BDA00035210100300000221
会话
Figure BDA00035210100300000222
构成的会话超边
Figure BDA00035210100300000223
是超边的一种,会话
Figure BDA00035210100300000224
最终的向量表示为
Figure BDA00035210100300000225
超边ei包含的物品节点集合用B(ei)表示,包含物品节点vj的用户超边集合用Eu(vj)表示,包含物品节点vj的会话超边集合用Es(vj)表示。以下是异构超图中超边和物品节点的信息传递过程:
Figure BDA00035210100300000226
Figure BDA00035210100300000227
其中,
Figure BDA00035210100300000228
函数将超图中物品节点的信息聚集到超边中,
Figure BDA00035210100300000229
函数采用自注意力机制来实现。
Figure BDA00035210100300000230
函数具体公式如下:
Figure BDA00035210100300000231
Figure BDA00035210100300000232
其中,a1是模型向量,W1是转移矩阵,a1和W1在模型训练时更新。σ是sigmoid激活函数,tanh是tanh激活函数。在计算l层超边ei的向量
Figure BDA00035210100300000233
时,给B(ei)内的任一物品vk计算注意力值αik,αik表示物品vk的重要程度。
Figure BDA00035210100300000234
函数将超图中超边的信息聚集到物品节点中,
Figure BDA00035210100300000235
函数包含了两层结构,会话超边和用户超边代表两种类型的语义信息,先分别聚集会话超边和用户超边中的信息,再根据聚集之后的会话超边和用户超边信息和目标节点之间的相关性,将两种语义信息融合并传递给物品节点。采用基于目标物品节点的注意力机制来聚集用户超边集合Eu(vj)内的信息得到
Figure BDA00035210100300000236
并同时采用基于目标物品节点的注意力机制来聚集会话超边集合Es(vj)内的信息得到
Figure BDA00035210100300000237
再对两个语义进行选择,给其分配不同的重要性,并进行信息融合,最终得到物品vj第l层的向量
Figure BDA00035210100300000238
Figure BDA00035210100300000239
融合了用户超边集合Eu(vj)和会话超边集合Es(vj) 内的信息。
Figure BDA00035210100300000240
函数具体公式如下:
Figure BDA00035210100300000241
Figure BDA00035210100300000242
Figure BDA0003521010030000031
Figure BDA0003521010030000032
Figure BDA0003521010030000033
Figure BDA0003521010030000034
其中,a2、a3和q是模型向量,W1、W2和W3是转移矩阵。σ是sigmoid激活函数,tanh是tanh激活函数,[·]是向量连接操作。
Figure BDA0003521010030000035
是用户超边集合Eu(vj)内用户超边ek的注意力值,代表了超边ek对于物品vj的重要程度,使用用户超边ek的注意力值乘以对应超边向量,得到Eu(vj)传递给物品vj的信息
Figure BDA0003521010030000036
Figure BDA0003521010030000037
是会话超边集合Es(vj)内会话超边eτ的注意力值,代表了超边eτ对于物品vj的重要程度,用会话超边eτ的注意力值乘以对应超边向量,得到Es(vj)传递给物品vj的信息
Figure BDA0003521010030000038
再采用基于物品vj的加法注意力机制对
Figure BDA0003521010030000039
Figure BDA00035210100300000310
进行融合,也就是模型学习
Figure BDA00035210100300000311
Figure BDA00035210100300000312
与物品vj第l-1层向量
Figure BDA00035210100300000313
之间的相关度,公式中γu代表从用户超边集合聚集的
Figure BDA00035210100300000314
和物品vj的相关度,1-γu代表从会话超边集合聚集的
Figure BDA00035210100300000315
和物品vj的相关度。使用公式
Figure BDA00035210100300000316
融合两种信息,得到物品vj第l层的向量
Figure BDA00035210100300000317
根据用户当前会话,基于门循环单元网络得到用户当前兴趣。用户ui的当前会话
Figure BDA00035210100300000318
Figure BDA00035210100300000319
由异构超图神经网络得到任一物品vj的向量是
Figure BDA00035210100300000320
本方法采用传统的门循环单元网络GRU对当前会话建模,得到用户当前兴趣zl
Figure BDA00035210100300000321
结合用户当前兴趣、会话向量和用户向量,得到用户兴趣。用户ui的当前会话
Figure BDA00035210100300000322
Figure BDA00035210100300000323
由异构超图神经网络得到用户ui的向量为
Figure BDA00035210100300000324
会话
Figure BDA00035210100300000325
向量为
Figure BDA00035210100300000326
用户ui的向量
Figure BDA00035210100300000327
代表了用户稳定的长期兴趣,会话向量
Figure BDA00035210100300000328
代表了采用集合的建模方式得到的用户当前兴趣,用户当前兴趣zl代表了采用有序序列的建模方式得到的用户当前兴趣。结合
Figure BDA00035210100300000329
zl
Figure BDA00035210100300000330
计算用户兴趣:
Figure BDA00035210100300000331
其中,W4和W5是转移矩阵,在模型训练时更新。[·]是向量连接操作。
根据用户兴趣,给用户推荐物品。将物品集合中的物品vτ的向量
Figure BDA00035210100300000332
乘以用户兴趣zS,再应用softmax函数计算出物品vτ的分数:
Figure BDA00035210100300000333
其中,zS代表用户兴趣,
Figure BDA00035210100300000334
是物品vτ的向量,
Figure BDA00035210100300000335
表示物品vτ成为下一个交互物品的可能性。损失函数为:
Figure BDA00035210100300000336
其中,yτ代表物品vτ的one-hot编码。
Figure BDA0003521010030000041
函数用梯度下降法来最优化。
本发明的有益技术效果如下:
(1)本发明考虑到现有的工作忽略了不同用户在不同会话中行为模式的差异性,本方法同时采用基于有序序列的模型以及基于集合的模型来对用户的会话进行建模,捕捉用户的兴趣。
(2)本发明考虑到现有工作忽略了用户的长期兴趣和短期兴趣之间的联系,本方法将用户长期兴趣和短期兴趣用统一的异构超图来建模,学习两者的联系。
附图说明
图1为本发明一种基于捕捉用户长短期兴趣异构超图的会话推荐方法的流程示意图;
图2为本发明一种基于捕捉用户长短期兴趣异构超图的会话推荐方法的模型框架图。
具体实施方式
为了进一步理解本发明,下面结合具体实施方式对本发明提供的一种基于捕捉用户长短期兴趣异构超图的会话推荐方法进行具体描述,但本发明并不限于此,该领域技术人员在本发明核心指导思想下做出的非本质改进和调整,仍然属于本发明的保护范围。
本方法的问题定义为基于用户所有会话中的交互物品序列,给用户推荐下一个感兴趣的物品。也就是,基于用户ui的历史会话序列
Figure BDA0003521010030000042
和当前会话
Figure BDA0003521010030000043
预测用户下一个交互物品。其中,历史会话序列是按照时间先后顺序排序的,用户ui的当前会话
Figure BDA0003521010030000044
下标
Figure BDA0003521010030000045
是会话
Figure BDA0003521010030000046
内物品序列的长度,vj是用户ui在会话
Figure BDA0003521010030000047
内第j个交互的物品。一种基于捕捉用户长短期兴趣异构超图的会话推荐方法的向前传播部分主要由五个部分组成。第一部分是从所有用户的会话序列中构建包含用户超边和会话超边的异构超图;第二部分是利用异构超图神经网络得到物品向量、会话向量和用户向量;第三部分是根据用户当前会话,基于门循环单元网络得到用户当前兴趣;第四部分是结合用户当前兴趣、会话向量和用户向量,得到用户兴趣;第五部分是根据用户兴趣,给用户推荐物品。
如图1所示,按照本发明的一个实施例,本方法包括如下步骤:
S100,从所有用户的会话序列中构建包含用户超边和会话超边的异构超图。对于用户ui的当前会话
Figure BDA0003521010030000048
下标
Figure BDA0003521010030000049
是会话
Figure BDA00035210100300000410
内物品序列的长度,vj是用户ui在会话
Figure BDA00035210100300000411
内第j个交互的物品。会话
Figure BDA00035210100300000412
内的所有物品
Figure BDA00035210100300000413
构成异构超图的物品节点,会话
Figure BDA00035210100300000414
构成异构超图中的会话超边
Figure BDA00035210100300000415
且会话超边
Figure BDA00035210100300000416
连接会话
Figure BDA00035210100300000417
内的所有物品。***中所有会话都采用同样的方式在异构超图中构建会话超边和物品节点。用户ui的所有会话序列是
Figure BDA00035210100300000418
该会话序列包含了历史会话序列和当前会话,将用户ui作为异构超图中的用户超边
Figure BDA00035210100300000419
用户超边
Figure BDA00035210100300000420
连接用户ui交互过的物品。如图2所示,基于用户u1的会话
Figure BDA00035210100300000421
Figure BDA00035210100300000422
以及u2的会话
Figure BDA00035210100300000423
构建了异构超图。
S200,利用异构超图神经网络得到物品向量、会话向量和用户向量。本方法中,物品根据物品ID被初始化为d维向量,对于物品vj,初始向量为
Figure BDA00035210100300000424
异构超图神经网络会经过很多层(layer)的信息传递,通过每一层的信息传递,节点学习到距离更远的其他节点信息。经过l层的信息传递后,物品vj的向量是
Figure BDA00035210100300000425
为了描述方便,把异构超图中的会话超边和用户超边统一用ei表示,而超边ei经过l层的信息传递后,向量是
Figure BDA00035210100300000426
异构超图神经网络传递的层数由模型超参数L控制,由异构超图神经网络更新L层后,最终得到物品 vj的向量是
Figure BDA00035210100300000427
超边ei的向量是
Figure BDA00035210100300000428
用户ui构成的用户超边
Figure BDA00035210100300000429
是超边的一种,用户ui最终的向量表示为
Figure BDA00035210100300000430
会话
Figure BDA00035210100300000431
构成的会话超边
Figure BDA00035210100300000432
是超边的一种,会话
Figure BDA00035210100300000433
最终的向量表示为
Figure BDA00035210100300000434
在本实验中L=2。超边ei包含的物品节点集合用B(ei)表示,包含物品节点vj的用户超边集合用Eu(vj)表示,包含物品节点vj的会话超边集合用Es(vj)表示。以下是异构超图中超边和物品节点的信息传递过程:
Figure BDA00035210100300000435
Figure BDA00035210100300000436
其中,
Figure BDA0003521010030000051
函数将超图中物品节点的信息聚集到超边中,
Figure BDA0003521010030000052
函数采用自注意力机制来实现。
Figure BDA0003521010030000053
函数具体公式如下:
Figure BDA0003521010030000054
Figure BDA0003521010030000055
其中,a1是模型向量,W1是转移矩阵,a1和W1在模型训练时更新。σ是sigmoid激活函数,tanh是tanh 激活函数。在计算l层超边ei的向量
Figure BDA0003521010030000056
时,给B(ei)内的任一物品vk计算注意力值αik,αik表示物品vk的重要程度。
Figure BDA0003521010030000057
函数将超图中超边的信息聚集到物品节点中,
Figure BDA0003521010030000058
函数包含了两层结构,会话超边和用户超边代表两种类型的语义信息,先分别聚集会话超边和用户超边中的信息,再根据聚集之后的会话超边和用户超边信息和目标节点之间的相关性,将两种语义信息融合并传递给物品节点。采用基于目标物品节点的注意力机制来聚集用户超边集合Eu(vj)内的信息得到
Figure BDA0003521010030000059
并同时采用基于目标物品节点的注意力机制来聚集会话超边集合Es(vj)内的信息得到
Figure BDA00035210100300000510
再对两个语义进行选择,给其分配不同的重要性,并进行信息融合,最终得到物品vj第l层的向量
Figure BDA00035210100300000511
Figure BDA00035210100300000512
融合了用户超边集合Eu(vj)和会话超边集合Es(vj) 内的信息。
Figure BDA00035210100300000513
函数具体公式如下:
Figure BDA00035210100300000514
Figure BDA00035210100300000515
Figure BDA00035210100300000516
Figure BDA00035210100300000517
Figure BDA00035210100300000518
Figure BDA00035210100300000519
其中,a2、a3和q是模型向量,W1、W2和W3是转移矩阵。σ是sigmoid激活函数,tanh是tanh激活函数,[·]是向量连接操作。
Figure BDA00035210100300000520
是用户超边集合Eu(vj)内用户超边ek的注意力值,代表了超边ek对于物品vj的重要程度,使用用户超边ek的注意力值乘以对应超边向量,得到Eu(vj)传递给物品vj的信息
Figure BDA00035210100300000521
Figure BDA00035210100300000522
是会话超边集合Es(vj)内会话超边eτ的注意力值,代表了超边eτ对于物品vj的重要程度,用会话超边eτ的注意力值乘以对应超边向量,得到Es(vj)传递给物品vj的信息
Figure BDA00035210100300000523
再采用基于物品vj的加法注意力机制对
Figure BDA00035210100300000524
Figure BDA00035210100300000525
进行融合,也就是模型学习
Figure BDA00035210100300000526
Figure BDA00035210100300000527
与物品vj第l-1层向量
Figure BDA00035210100300000528
之间的相关度,公式中γu代表从用户超边集合聚集的
Figure BDA0003521010030000061
和物品vj的相关度,1-γu代表从会话超边集合聚集的
Figure BDA0003521010030000062
和物品vj的相关度。使用公式
Figure BDA0003521010030000063
融合两种信息,得到物品vj第l层的向量
Figure BDA0003521010030000064
S300,根据用户当前会话,基于门循环单元网络得到用户当前兴趣。用户ui的当前会话
Figure BDA0003521010030000065
Figure BDA0003521010030000066
由异构超图神经网络得到任一物品vj的向量是
Figure BDA0003521010030000067
本方法采用传统的门循环单元网络GRU对当前会话建模,得到用户当前兴趣zl
Figure BDA0003521010030000068
S400,结合用户当前兴趣、会话向量和用户向量,得到用户兴趣。用户ui的当前会话
Figure BDA0003521010030000069
Figure BDA00035210100300000610
由异构超图神经网络得到用户ui的向量为
Figure BDA00035210100300000611
会话
Figure BDA00035210100300000612
向量为
Figure BDA00035210100300000613
用户ui的向量
Figure BDA00035210100300000614
代表了用户稳定的长期兴趣,会话向量
Figure BDA00035210100300000615
代表了采用集合的建模方式得到的用户当前兴趣,用户当前兴趣zl代表了采用有序序列的建模方式得到的用户当前兴趣。结合
Figure BDA00035210100300000616
zl
Figure BDA00035210100300000617
计算用户兴趣:
Figure BDA00035210100300000618
其中,W4和W5是转移矩阵,在模型训练时更新。[·]是向量连接操作。
S500,根据用户兴趣,给用户推荐物品。将物品集合中的物品vτ的向量
Figure BDA00035210100300000619
乘以用户兴趣zS,再应用 softmax函数计算出物品vτ的分数:
Figure BDA00035210100300000620
其中,zS代表用户兴趣,
Figure BDA00035210100300000621
是物品vτ的向量,
Figure BDA00035210100300000622
表示物品vτ成为下一个交互物品的可能性。损失函数为:
Figure BDA00035210100300000623
其中,yτ代表物品vτ的one-hot编码。
Figure BDA00035210100300000624
函数用梯度下降法来最优化。
上述对实施例的描述是为方便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。

Claims (1)

1.一种基于捕捉用户长短期兴趣异构超图的会话推荐方法,其特征在于:
从所有用户的会话序列中构建包含用户超边和会话超边的异构超图;对于用户ui的当前会话
Figure FDA0003521010020000011
Figure FDA0003521010020000012
下标
Figure FDA0003521010020000013
是会话
Figure FDA0003521010020000014
内物品序列的长度,vj是用户ui在会话
Figure FDA0003521010020000015
内第j个交互的物品;会话
Figure FDA0003521010020000016
内的所有物品
Figure FDA0003521010020000017
构成异构超图的物品节点,会话
Figure FDA0003521010020000018
构成异构超图中的会话超边
Figure FDA0003521010020000019
且会话超边
Figure FDA00035210100200000110
连接会话
Figure FDA00035210100200000111
内的所有物品;***中所有会话都采用同样的方式在异构超图中构建会话超边和物品节点;用户ui的所有会话序列是
Figure FDA00035210100200000112
将用户ui作为异构超图中的用户超边
Figure FDA00035210100200000113
用户超边
Figure FDA00035210100200000114
连接用户ui交互过的物品;
利用异构超图神经网络得到物品向量、会话向量和用户向量;本方法中,物品根据物品ID被初始化为d维向量,对于物品vj,初始向量为
Figure FDA00035210100200000115
异构超图神经网络会经过很多层的信息传递,通过每一层的信息传递,节点学习到距离更远的其他节点信息;经过l层的信息传递后,物品vj的向量是
Figure FDA00035210100200000116
为了描述方便,把异构超图中的会话超边和用户超边统一用ei表示,而超边ei经过l层的信息传递后,向量是
Figure FDA00035210100200000117
异构超图神经网络传递的层数由模型超参数L控制,由异构超图神经网络更新L层后,最终得到物品vj的向量是
Figure FDA00035210100200000118
超边ei的向量是
Figure FDA00035210100200000119
用户ui构成的用户超边
Figure FDA00035210100200000120
是超边的一种,用户ui最终的向量表示为
Figure FDA00035210100200000121
会话
Figure FDA00035210100200000122
构成的会话超边
Figure FDA00035210100200000123
是超边的一种,会话
Figure FDA00035210100200000124
最终的向量表示为
Figure FDA00035210100200000125
超边ei包含的物品节点集合用B(ei)表示,包含物品节点vj的用户超边集合用Eu(vj)表示,包含物品节点vj的会话超边集合用Es(vj)表示;以下是异构超图中超边和物品节点的信息传递过程:
Figure FDA00035210100200000126
Figure FDA00035210100200000127
其中,
Figure FDA00035210100200000128
函数将超图中物品节点的信息聚集到超边中,
Figure FDA00035210100200000129
函数采用自注意力机制来实现;
Figure FDA00035210100200000130
函数具体公式如下:
Figure FDA00035210100200000131
Figure FDA00035210100200000132
其中,a1是模型向量,W1是转移矩阵,a1和W1在模型训练时更新;σ是sigmoid激活函数,tanh是tanh激活函数;在计算l层超边ei的向量
Figure FDA00035210100200000133
时,给B(ei)内的任一物品vk计算注意力值αik,αik表示物品vk的重要程度;
Figure FDA00035210100200000134
函数将超图中超边的信息聚集到物品节点中,
Figure FDA00035210100200000135
函数包含了两层结构,会话超边和用户超边代表两种类型的语义信息,先分别聚集会话超边和用户超边中的信息,再根据聚集之后的会话超边和用户超边信息和目标节点之间的相关性,将两种语义信息融合并传递给物品节点;具体做法是:采用基于目标物品节点的注意力机制来聚集用户超边集合Eu(vj)内的信息得到
Figure FDA00035210100200000136
并同时采用基于目标物品节点的注意力机制来聚集会话超边集合Es(vj)内的信息得到
Figure FDA00035210100200000137
再对两个语义进行选择,给其分配不同的重要性,并进行信息融合,最终得到物品vj第l层的向量
Figure FDA00035210100200000138
Figure FDA00035210100200000139
融合了用户超边集合Eu(vj)和会话超边集合Es(vj)内的信息;
Figure FDA00035210100200000140
函数具体公式如下:
Figure FDA00035210100200000141
Figure FDA0003521010020000021
Figure FDA0003521010020000022
Figure FDA0003521010020000023
Figure FDA0003521010020000024
Figure FDA0003521010020000025
其中,a2、a3和q是模型向量,W1、W2和W3是转移矩阵;σ是sigmoid激活函数,tanh是tanh激活函数,[·]是向量连接操作;
Figure FDA0003521010020000026
是用户超边集合Eu(vj)内用户超边ek的注意力值,代表了超边ek对于物品vj的重要程度,使用用户超边ek的注意力值乘以对应超边向量,得到Eu(vj)传递给物品vj的信息
Figure FDA0003521010020000027
Figure FDA0003521010020000028
是会话超边集合Es(vj)内会话超边eτ的注意力值,代表了超边eτ对于物品vj的重要程度,用会话超边eτ的注意力值乘以对应超边向量,得到Es(vj)传递给物品vj的信息
Figure FDA0003521010020000029
再采用基于物品vj的加法注意力机制对
Figure FDA00035210100200000210
Figure FDA00035210100200000211
进行融合,也就是学习
Figure FDA00035210100200000212
Figure FDA00035210100200000213
与物品vj第l-1层向量
Figure FDA00035210100200000214
之间的相关度,公式中γu代表从用户超边集合聚集的
Figure FDA00035210100200000215
和物品vj的相关度,1-γu代表从会话超边集合聚集的
Figure FDA00035210100200000216
和物品vj的相关度;使用公式
Figure FDA00035210100200000217
融合两种信息,得到物品vj第l层的向量
Figure FDA00035210100200000218
根据用户当前会话,基于门循环单元网络得到用户当前兴趣;用户ui的当前会话
Figure FDA00035210100200000219
Figure FDA00035210100200000220
由异构超图神经网络得到任一物品vj的向量是
Figure FDA00035210100200000221
本方法采用传统的门循环单元网络GRU对当前会话建模,得到用户当前兴趣zl
Figure FDA00035210100200000222
结合用户当前兴趣、会话向量和用户向量,得到用户兴趣;用户ui的当前会话
Figure FDA00035210100200000223
Figure FDA00035210100200000224
由异构超图神经网络得到用户ui的向量为
Figure FDA00035210100200000225
会话
Figure FDA00035210100200000226
的向量为
Figure FDA00035210100200000227
用户ui的向量
Figure FDA00035210100200000228
代表了用户稳定的长期兴趣,会话向量
Figure FDA00035210100200000229
代表了采用集合的建模方式得到的用户当前兴趣,用户当前兴趣zl代表了采用有序序列的建模方式得到的用户当前兴趣;结合
Figure FDA00035210100200000230
zl
Figure FDA00035210100200000231
计算用户兴趣:
Figure FDA00035210100200000232
其中,W4和W5是转移矩阵,在模型训练时更新;[·]是向量连接操作;
根据用户兴趣,给用户推荐物品;将物品集合中的物品vτ的向量
Figure FDA00035210100200000233
乘以用户兴趣zS,再应用softmax函数计算出物品vτ的分数:
Figure FDA00035210100200000234
其中,zS代表用户兴趣,
Figure FDA00035210100200000235
是物品vτ的向量,
Figure FDA00035210100200000236
表示物品vτ成为下一个交互物品的可能性;损失函数为:
Figure FDA0003521010020000031
其中,yτ代表物品vτ的one-hot编码;
Figure FDA0003521010020000032
函数用梯度下降法来最优化。
CN202210177770.8A 2022-02-25 2022-02-25 一种基于捕捉用户长短期兴趣异构超图的会话推荐方法 Withdrawn CN114428912A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210177770.8A CN114428912A (zh) 2022-02-25 2022-02-25 一种基于捕捉用户长短期兴趣异构超图的会话推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210177770.8A CN114428912A (zh) 2022-02-25 2022-02-25 一种基于捕捉用户长短期兴趣异构超图的会话推荐方法

Publications (1)

Publication Number Publication Date
CN114428912A true CN114428912A (zh) 2022-05-03

Family

ID=81313277

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210177770.8A Withdrawn CN114428912A (zh) 2022-02-25 2022-02-25 一种基于捕捉用户长短期兴趣异构超图的会话推荐方法

Country Status (1)

Country Link
CN (1) CN114428912A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116595157A (zh) * 2023-07-17 2023-08-15 江西财经大学 基于用户意图融合的动态兴趣转移型会话推荐方法与***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116595157A (zh) * 2023-07-17 2023-08-15 江西财经大学 基于用户意图融合的动态兴趣转移型会话推荐方法与***
CN116595157B (zh) * 2023-07-17 2023-09-19 江西财经大学 基于用户意图融合的动态兴趣转移型会话推荐方法与***

Similar Documents

Publication Publication Date Title
CN111125537B (zh) 一种基于图表征的会话推荐方法
CN111222054B (zh) 一种基于上下文邻居关系建模的会话社交推荐方法
CN111160954B (zh) 基于图卷积网络模型的面向群组对象的推荐方法
CN111460331B (zh) 一种基于时空图的会话推荐方法
CN109241440A (zh) 一种基于深度学习的面向隐式反馈推荐方法
WO2023108324A1 (zh) 对比学习增强的双流模型推荐***及算法
CN110795619A (zh) 一种融合多目标的教育资源个性化推荐***及方法
CN112685657B (zh) 一种基于多模态交叉融合图网络的会话社交推荐方法
CN112528165A (zh) 一种基于动态路由图网络的会话社交推荐方法
CN112765461A (zh) 一种基于多兴趣胶囊网络的会话推荐方法
CN112256916B (zh) 一种基于图胶囊网络的短视频点击率预测方法
CN113704438B (zh) 一种基于分层注意力机制的异构图的会话推荐方法
CN115660147A (zh) 一种基于传播路径间与传播路径内影响力建模的信息传播预测方法及***
CN114428912A (zh) 一种基于捕捉用户长短期兴趣异构超图的会话推荐方法
CN112559904B (zh) 一种基于门机制和多模态图网络的会话社交推荐方法
CN114595383A (zh) 一种基于会话序列的海洋环境数据推荐方法及***
CN113868537B (zh) 一种基于多行为会话图融合的推荐方法
CN113590958B (zh) 基于样本回放的序列推荐模型的持续学习方法
CN114528490A (zh) 一种基于用户长短期兴趣的自监督序列推荐方法
CN112256918A (zh) 一种基于多模态动态路由的短视频点击率预测方法
CN113704439B (zh) 一种基于多来源信息异构图的会话推荐方法
CN116304289A (zh) 基于图神经网络的供应链的信息链推荐方法及装置
CN114036400B (zh) 一种基于超图的协同会话推荐方法
CN114036408A (zh) 一种基于社交关系和协同关系的会话推荐方法
CN112307257A (zh) 一种基于多信息节点图网络的短视频点击率预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20220503

WW01 Invention patent application withdrawn after publication