CN113704439B - 一种基于多来源信息异构图的会话推荐方法 - Google Patents
一种基于多来源信息异构图的会话推荐方法 Download PDFInfo
- Publication number
- CN113704439B CN113704439B CN202111035961.2A CN202111035961A CN113704439B CN 113704439 B CN113704439 B CN 113704439B CN 202111035961 A CN202111035961 A CN 202111035961A CN 113704439 B CN113704439 B CN 113704439B
- Authority
- CN
- China
- Prior art keywords
- session
- current
- neighbor
- conversation
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 239000013598 vector Substances 0.000 claims abstract description 72
- 238000012546 transfer Methods 0.000 claims abstract description 63
- 230000007246 mechanism Effects 0.000 claims abstract description 20
- 238000012512 characterization method Methods 0.000 claims abstract description 15
- 239000011159 matrix material Substances 0.000 claims description 29
- 238000013528 artificial neural network Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 17
- 230000002159 abnormal effect Effects 0.000 claims description 14
- 230000000306 recurrent effect Effects 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 8
- 230000005540 biological transmission Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000002452 interceptive effect Effects 0.000 claims description 4
- 239000002131 composite material Substances 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 239000004973 liquid crystal related substance Substances 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 239000000203 mixture Substances 0.000 abstract description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000004576 sand Substances 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于多来源信息异构图的会话推荐方法。该方法根据匿名用户当前会话,对用户的兴趣进行建模,来推荐用户在下一步最可能感兴趣的物品。主要由四个部分组成:第一部分是计算当前会话和会话集合中的会话之间的相似度,召回相似的邻居会话集合,再对邻居会话集合中的物品转移进行整理和过滤,过滤掉出现次数较少的物品转移关系,再结合当前会话构建两种语义边的异构图;第二部分是采用多来源信息门机制在异构图中对节点的两种语义邻居节点信息进行选择和融合,得到当前会话中物品的向量表征;第三部分是对当前会话中的物品序列进行表征,得到当前用户兴趣表征;第四部分是根据用户兴趣表征,预测用户在下一步最可能感兴趣的物品。
Description
技术领域
本发明属于互联网服务技术领域,尤其是涉及一种基于多来源信息异构图的会话推荐方法。
背景技术
会话(Session)是一个时间段内用户的交互行为,基于会话的推荐是基于当前会话推荐用户下一个点击的物品。在实际场景中,有些用户是匿名登录,无法获取该用户的历史交互行为数据以及用户详细信息。因此,只能基于该匿名用户的当前会话给用户推荐感兴趣的物品。传统的会话推荐方法有基于物品的协同过滤(Item-KNN)推荐方法,该方法通过计算候选集中的物品和当前会话中物品的相似度,来给用户推荐最相似的物品。近些年出现了基于会话的协同过滤方法(Session-KNN),该方法将会话作为一个整体,通过计算会话之间的相似度来推荐。协同过滤算法忽略了会话中的物品转移关系,因此近些年更多的会话推荐方法中采用循环神经网络(RNN)或者循环神经网络(RNN)的变种,来学习会话中的物品序列信息。而基于循环神经网络的方法只能学习到会话中紧邻着的上一个物品到下一个物品的转移关系,而忽视了在同一个会话中物品的上下文关系。因此中科院的学者在2019年提出把当前会话建立为一个图(Graph),来捕捉更当前会话中更丰富的物品转移关系,该方法名为用图神经网络进行会话推荐(SR-GNN)。但是该方法的图只是基于当前会话建立的,一个会话中物品的个数以及同一物品重复出现的次数都限制了该方法的效果。
因此,本方法提出一种基于多来源信息异构图的会话推荐方法。本方法基于当前会话,从最近会话序列中抽取较相似的邻居会话集合。然后,对邻居会话集合中的物品转移关系进行整理和过滤,过滤掉出现次数较少的物品转移关系,得到物品的普遍转移关系。再结合当前会话构建异构图。异构图中的节点是当前会话和邻居会话集合中出现的物品,而边有两种类型:一种边来源于当前会话中物品转移关系,也就是代表当前用户的兴趣转移。另外一种边是邻居会话中的转移关系,代表着物品的普遍转移规律。也就是这两种边的数据来源不同,代表的语义也不同。构建好异构图后,在异构图中进行节点的信息传递,得到物品表征。该异构图中两种语义的边数量差异较大,代表物品普遍转移关系的边的数量往往比代表当前会话中物品转移关系的数量多,这给图中的节点信息传递带来了困难。本方法采用多来源信息门机制来处理不同来源的信息传递,最终得到物品的向量表征。异构图中的多来源信息门机制既解决异构图中两种语义的不均衡分布,又能将两种语义信息融合到异构图中的物品节点内。最后再用循环神经网络对当前会话进行表征,得到用户的兴趣表征,并进行物品推荐。该方法通过构建异构图,充分地挖掘出物品之间的转移关系。
发明内容
本发明所要解决的技术问题是给定用户的当前会话,对用户的兴趣进行建模,来推荐用户在下一步最可能感兴趣的物品。在实际推荐场景中,往往会遇到匿名用户登录并浏览的行为。此时,用户的个人信息和用户历史浏览的记录都缺失,推荐方法只能基于当前会话进行推荐。因此,训练数据极为稀疏。为了缓解会话推荐过程中的数据稀疏问题,本方法通过会话相似度计算,召回***中和当前会话相似的邻居会话。捕捉邻居会话和当前会话中物品转移关系,来提高推荐方法的表现。为此,本发明采用以下技术方案:
一种基于多来源信息异构图的会话推荐方法,包括以下步骤:
根据用户当前会话中的物品序列,召回邻居会话集合。本方法采用记忆矩阵M存储最近发生的会话。基于当前会话s={v1,v2,…,v|s|},从记忆矩阵M中找出最相似的k个会话作为当前会话s的邻居会话集合Ns。本方法通过计算当前会话和记忆矩阵M中的候选会话之间的cosine相似度,筛选出邻居会话集合Ns,相似度计算公式如下:
其中,sj是记忆矩阵M中存储的任一会话。是会话s的二进制向量表示,如果一个物品出现在会话中,那么s中对应位置为1,否则为0。同理,是会话sj的二进制向量表示。l(s)和l(sj)分别代表了会话s和sj的长度。对于记忆矩阵M中存储的所有会话,用公式sim(s,sj)计算出和当前会话s的cosine相似度,把相似度低于阈值simthre的会话过滤掉,再按照cosine相似度由高到低排序,找出前k个会话作为当前会话s的邻居会话集合Ns。simthre设置小数值,可以增加推荐物品的多样性,simthre设置大数值,可以过滤掉更多的噪音。
对邻居会话集合进行处理,并结合用户当前会话构建异构图。异构图G中的节点为当前会话s和邻居会话集合Ns中出现的物品集合的并集。异构图G中的边是无向边,且存在两种语义的边:一种边来源于当前会话中物品转移关系,代表当前用户的兴趣转移。另外一种边来源于邻居会话中的物品转移关系,代表着物品的普遍转移规律。这两种边的数据来源不同,因此代表的语义也不同。当前会话s={v1,v2,…,v|s|}中的(vj-1,vj)为异构图G的边,表示点击物品vj-1之后,点击物品vj。同理,邻居会话集合Ns中的会话中也可以构建出异构图G的另一种语义的边。先对邻居会话集合Ns中会话里出现的所有边的次数进行统计,过滤掉出现次数小于ε的边。出现次数小于ε的边被认为不能代表物品的普遍转移关系。此时,异构图G中存在两种来源的边,在异构图的表示中,边使用标志φ∈{inner,outer}进行区分,分别表示来源为当前会话内部(inner session)和邻居会话集合(也就是当前会话外部outer session),代表的语义分别是当前用户兴趣转移和普遍物品转移规律。
基于异构图,采用多来源信息门机制得到当前会话中的物品向量表征。异构图中代表当前用户兴趣转移和代表普遍物品转移规律的边分布非常不均(imbalanced)。因此传统的图神经网络方法,如:GraphSAGE等无法应用在该场景下。如果将传统的图神经网络方法直接应用在该场景下,代表当前用户兴趣转移的边的影响会覆盖代表普遍物品转移规律的边的影响。并且传统的图神经网络方法,没法对这两种语义的边进行区分处理。这里,采用基于多来源信息门机制来进行异构图中的节点信息更新。异构图中有两种语义的边存在,因此对于目标物品节点vi,存在两种语义邻居节。采用多来源信息门机制对目标物品节点vi的两种语义邻居节点进行选择和汇集到目标物品节点vi中。注意,这里的目标物品节点vi属于当前会话中出现的物品,也就是只需要对出现在当前会话中的物品节点进行向量更新。目标物品节点vi的最终向量表征xi更新公式如下:
其中,ci表示物品节点vi的下标,矩阵存放所有物品的向量表征,所以通过获得物品节点vi的向量表征vi。和分别代表两种语义下的转换矩阵。将目标物品节点vi的两种语义下的邻居节点集合和分别汇聚成两种语义下的邻居信息向量和和分别表示集合和集合的个数。然后用基于和vi的多来源信息门机制得到门向量gi,门向量gi控制代表当前用户兴趣转移语义下的邻居信息向量向量1-gi控制普遍物品转移语义下的邻居信息向量得到这里,和Wg是转换矩阵,sigmoid是sigmoid函数。也就是,不同语义下的邻居节点信息的传递采用多来源信息门机制来控制,而多来源信息门机制的信息输入是不同语义下的邻居和目标节点本身。最后,和目标节点的原来向量表征vi进行连接,并采用转换矩阵Wx转化成新的目标节点向量xi,这里||表示向量的连接操作。
根据用户当前会话中物品序列,获得用户兴趣表征。得到所有物品的向量表征之后,采用门控制循环神经网络(GRU)对用户当前会话s={v1,v2,…,v|s|}进行表征,得到会话表征,即用户当前兴趣表征:
zi=σ(Wxz·xi+Whz·hi-1)
ri=σ(Wxr·xi+Whr·hi-1)
其中,ri是重置门(resetgate),zi为更新门(update gate),这两个门控向量决定了哪些信息能作为门控循环单元的输出。是当前记忆内容。xi是当前层的节点输入。Wxz、Whz、Wxr和Whr分别是控制更新门zi和重置门ri的参数。Wxh和Whh是控制前记忆内容的参数。⊙是元素级别的矩阵相乘,σ是sigmoid函数。门控制循环神经网络(GRU)的最后一个隐藏层的输出h|s|就是该会话表征,即用户当前兴趣表征p。
根据用户兴趣表征,推荐物品。将物品vj的向量vj乘以用户兴趣向量p,再应用softmax函数计算出物品vj的分数:
本发明的有益技术效果如下:
(1)本发明基于当前会话,找出和当前会话相似的邻居会话集合。并从中挖掘出和当前会话中物品相关的普遍物品转移关系。在一定程度上缓解了数据的稀疏性,提升了推荐的准确度。
本发明基于当前会话中的物品转移关系和邻居会话中的物品普遍转移关系,构建出包含两种语义边的异构图。并在对图结构信息建模时,采用多来源信息门机构对两种语义信息进行控制。既解决异构图中两种语义的不均衡分布,又能将两种语义信息融合到异构图中的物品节点内。
附图说明
图1为本发明一种基于多来源信息异构图的会话推荐方法的流程示意图;
图2为本发明一种基于多来源信息异构图的会话推荐方法的模型框架图。
具体实施方式
为了进一步理解本发明,下面结合具体实施方式对本发明提供的一种基于多来源信息异构图的会话推荐方法进行具体描述,但本发明并不限于此,该领域技术人员在本发明核心指导思想下做出的非本质改进和调整,仍然属于本发明的保护范围。
首先,需要对用到的变量和公式给出相关定义。
定义1.V:物品集合,且V={v1,v2,…,v|V|},|V|代表物品集合中物品的数量。
定义2.s:当前会话,会话是一个时间段里的物品集合s={v1,v2,…,v|s|},|s|代表会话中物品的数量。
定义3.S:***中的会话集合,S={s1,s2,…,s|S|},|S|代表会话集合中会话的数量。
定义4.Ns:会话s的邻居会话集合。
定义5.G:基于用户当前会话s和邻居会话集合Ns,构造出的异构图。
定义8.P:当前会话的向量表征,也代表着用户兴趣向量表征。
结合以上变量定义,将最终的问题定义为:给定用户的当前会话s,会话推荐方法对用户的兴趣进行建模,来推荐用户在下一步最可能感兴趣的物品,物品是集合V的子集。
为此,本发明提出了一种基于多来源信息异构图的会话推荐方法。模型如图2所示,模型主要由四个模块组成。第一个模块是构建异构图,先计算当前会话和会话集合中的会话之间的相似度,召回相似的邻居会话集合。再对邻居会话集合中的物品转移关系进行整理和过滤,过滤掉出现次数较少的物品转移关系。然后结合当前会话构建异构图。异构图中的图节点是当前会话和邻居会话集合中出现的物品,而边有两种类型:一种边来源于当前会话中物品转移关系,也就是代表当前用户的兴趣转移。另外一种边是邻居会话中的转移关系,代表着物品的普遍转移规律。也就是这两种边的数据来源不同,因此代表的语义也不同。第二个模块是在异构图中进行节点的信息传递,从而得到物品表征。该异构图中的两种来源的边数量差异较大,代表物品普遍转移关系的边的数量往往比代表当前会话中物品转移关系的数量多,这给图中的节点信息传递带来了困难。本模块采用门机制来处理不同来源的信息传递,最终得到物品的向量表征。第三个模块是兴趣抽取模块,得到物品向量表征之后,本方法采用循环神经网络对当前会话中的物品序列进行表征,得到会话的向量表征,也就是当前用户的兴趣表征。最后一个模块是根据得到的用户兴趣表征进行物品推荐。
如图1所示,本发明的一个实施例包括如下步骤:
S100,根据用户当前会话中的物品序列,召回邻居会话集合。根据研究表明,最近发生的会话信息价值最高,比如电商场景中服饰、水果等都和时间有密切联系。本方法采用记忆矩阵M存储最近发生的会话,在本方法综合考虑算法效果和存储压力,设置记忆矩阵M存储的会话序列个数为10000。基于当前会话s={v1,v2,…,v|s|},从记忆矩阵M中找出最相似的k个会话作为当前会话s的邻居会话集合Ns。其中,k的取值为256。本方法通过计算当前会话和记忆矩阵M中的候选会话之间的cosine相似度,筛选出邻居会话集合Ns,相似度计算公式如下:
其中,sj是记忆矩阵M中存储的任一会话。是会话s的二进制向量表示,如果一个物品出现在会话中,那么s中对应位置为1,否则为0。同理,是会话sj的二进制向量表示。l(s)和l(sj)分别代表了会话s和sj的长度。对于记忆矩阵M中存储的所有会话,用公式sim(s,sj)计算出和当前会话s的cosine相似度,把相似度低于阈值simthre的会话过滤掉,再按照cosine相似度由高到低排序,找出前k个会话作为当前会话s的邻居会话集合Ns。simthre设置小数值,可以增加推荐物品的多样性,simthre设置大数值,可以过滤掉更多的噪音。这里,simthre设置为0.3,k设置为256。
S200,对邻居会话集合进行处理,并结合用户当前会话构建异构图。从上一步骤中,已经得到用户当前会话s的邻居会话集合Ns。异构图G中的节点为当前会话s和邻居会话集合Ns中出现的物品集合的并集。异构图G中的边是无向边,且存在两种语义的边:一种边来源于当前会话中物品转移关系,代表当前用户的兴趣转移。另外一种边来源于邻居会话中的物品转移关系,代表着物品的普遍转移规律。这两种边的数据来源不同,因此代表的语义也不同。当前会话s={v1,v2,…,v|s|}中的(vj-1,vj)为异构图G的边,表示点击物品vj-1之后,点击物品vj。同理,邻居会话集合Ns中的会话中也可以构建出异构图G的另一种语义的边。先对邻居会话集合Ns中的会话中出现的所有边出现的次数进行统计,过滤掉出现次数小于ε的边。出现次数小于ε的边被认为不能代表物品的普遍转移关系。这里ε设置为5。此时,异构图G中存在两种来源的边,在异构图的表示中,边使用标志φ∈{inner,outer}进行区分,分别表示来源为当前会话内部(inner session)和邻居会话集合(也就是当前会话外部outer session),代表的语义分别是当前用户兴趣转移和普遍物品转移规律。
S300,基于异构图,采用多来源信息的门机制得到当前会话中的物品向量表征。异构图中代表当前用户兴趣转移和代表普遍物品转移规律的边分布非常不均(imbalanced)。因此传统的图神经网络方法,如:GraphSAGE等无法应用在该场景下。如果将传统的图神经网络方法直接应用在该场景下,代表当前用户兴趣转移的边的影响会覆盖代表普遍物品转移规律的边的影响。并且传统的图神经网络方法,没法对这两种语义的边进行区分处理。这里,采用基于多来源信息的门机制来进行异构图中的节点信息更新。目标节点vi的最终向量表征聚集(aggregate)了两种语义边连接的邻居节点的信息,而两种语义的邻居节点的信息传递由多来源信息的门机制来控制。注意,这里的目标节点vi属于当前会话中出现的物品,也就是只需要对出现在当前会话中的物品节点进行向量更新。目标节点vi的最终向量表征xi更新公式如下:
其中,ci表示物品节点vi的下标,矩阵存放所有物品的向量表征,所以通过获得物品节点vi的向量表征vi。和分别代表两种语义下的转换矩阵。将目标物品节点vi的两种语义下的邻居节点集合和分别汇聚成两种语义下的邻居信息向量和和分别表示集合和集合的个数。然后用基于和vi的多来源信息门机制得到门向量gi,门向量gi控制代表当前用户兴趣转移语义下的邻居信息向量向量1-gi控制普遍物品转移语义下的邻居信息向量得到这里,和Wa是转换矩阵,sigmoid是sigmoid函数。也就是,不同语义下的邻居节点信息的传递采用多来源信息门机制来控制,而多来源信息门机制的信息输入是不同语义下的邻居和目标节点本身。最后,和目标节点的原来向量表征vi进行连接,并采用转换矩阵Wx转化成新的目标节点向量xi,这里||表示向量的连接操作。
S400,根据用户当前会话中物品序列,获得用户兴趣表征。得到所有物品的向量表征之后,采用门控制循环神经网络(GRU)对用户当前会话s={v1,v2,…,v|s|}进行表征,得到会话表征,即用户当前兴趣表征:
zi=σ(Wxz·xi+Whz·hi-1)
ri=σ(Wxr·xi+Whr·hi-1)
其中,ri是重置门(resetgate),zi为更新门(update gate),这两个门控向量决定了哪些信息能作为门控循环单元的输出。是当前记忆内容。xi是当前层的节点输入。Wxz、Whz、Wxr和Whr分别是控制更新门zi和重置门ri的参数。Wxh和Whh是控制前记忆内容的参数。⊙是元素级别的矩阵相乘,σ是sigmoid函数。门控制循环神经网络(GRU)的最后一个隐藏层的输出h|s|就是该会话表征,即用户当前兴趣表征p。
S500,根据用户兴趣表征,推荐物品。将物品vj的向量vj乘以用户兴趣向量p,再应用soffmax函数计算出物品vj的分数:
上述对实施例的描述是为方便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。
Claims (2)
1.一种基于多来源信息异构图的会话推荐方法,其特征在于:
根据用户当前会话中的物品序列,召回邻居会话集合;本方法采用记忆矩阵M存储最近发生的会话;基于当前会话s={v1,v2,…,v|s|},从记忆矩阵M中用cosine相似度找出最相似的k个会话作为当前会话s的邻居会话集合Ns,cosine相似度计算公式如下:
其中,sj是记忆矩阵M中存储的任一会话;是会话s的二进制向量表示,如果一个物品出现在会话中,那么s中对应位置为1,否则为0;同理,是会话sj的二进制向量表示;l(s)和l(sj)分别代表了会话s和sj的长度;对于记忆矩阵M中存储的所有会话,用公式sim(s,sj)计算出和当前会话s的cosine相似度,把相似度低于阈值simthre的会话过滤掉,再按照cosine相似度由高到低排序,找出前k个会话作为当前会话s的邻居会话集合Ns;simthre设置小数值,可以增加推荐物品的多样性,simthre设置大数值,可以过滤掉更多的噪音;
对邻居会话集合进行处理,并结合用户当前会话构建异构图;异构图G中的节点为当前会话s和邻居会话集合Ns中出现的物品集合的并集;异构图G中的边是无向边,且存在两种语义的边:一种边来源于当前会话中物品转移关系,代表当前用户的兴趣转移;另外一种边来源于邻居会话中的物品转移关系,代表着物品的普遍转移规律;这两种边的数据来源不同,因此代表的语义也不同;当前会话s={v1,v2,…,v|s|}中的(vj-1,vj)为异构图G的边,表示点击物品vj-1之后,点击物品vj;同理,邻居会话集合Ns中的会话中也可以构建出异构图G的另一种语义的边;先对邻居会话集合Ns中会话里出现的所有边的次数进行统计,过滤掉出现次数小于ε的边;出现次数小于ε的边被认为不能代表物品的普遍转移关系;此时,异构图G中存在两种来源的边,在异构图的表示中,边使用标志φ∈{inner,outer}进行区分,分别表示来源为当前会话内部和邻居会话集合,代表的语义分别是当前用户兴趣转移和普遍物品转移规律;
基于异构图,采用多来源信息门机制得到当前会话中的物品向量表征;异构图中有两种语义的边存在,因此对于目标物品节点vi,存在两种语义邻居节点;采用多来源信息门机制对目标物品节点vi的两种语义邻居节点进行选择和汇集到目标物品节点vi中;注意,这里的目标物品节点vi属于当前会话中出现的物品,也就是只需要对出现在当前会话中的物品节点进行向量更新;目标节点vi的最终向量表征xi更新公式如下:
其中,ci表示物品节点vi的下标,矩阵存放所有物品的向量表征,所以通过获得物品节点vi的向量表征vi;和分别代表两种语义下的转换矩阵;将目标物品节点vi的两种语义下的邻居节点集合和分别汇聚成两种语义下的邻居信息向量和和分别表示集合和集合的个数;然后用基于和vi的多来源信息门机制得到门向量gi,门向量gi控制代表当前用户兴趣转移语义下的邻居信息向量向量1-gi控制普遍物品转移语义下的邻居信息向量得到这里,和Wg是转换矩阵,sigmoid是sigmoid函数;也就是,不同语义下的邻居节点信息的传递采用多来源信息门机制来控制,而多来源信息门机制的信息输入是不同语义下的邻居和目标节点本身;最后,和目标节点的原来向量表征vi进行连接,并采用转换矩阵Wx转化成新的目标节点向量xi,这里||表示向量的连接操作;
根据用户当前会话中物品序列,获得用户兴趣表征;得到所有物品的向量表征之后,采用门控制循环神经网络(GRU)对用户当前会话s={v1,v2,…,v|s|}进行表征,得到会话表征,即用户当前兴趣表征p;
根据用户兴趣表征,推荐物品;将物品vj的向量vj乘以用户兴趣向量p,再应用softmax函数计算出物品vj的分数:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111035961.2A CN113704439B (zh) | 2021-09-06 | 2021-09-06 | 一种基于多来源信息异构图的会话推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111035961.2A CN113704439B (zh) | 2021-09-06 | 2021-09-06 | 一种基于多来源信息异构图的会话推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113704439A CN113704439A (zh) | 2021-11-26 |
CN113704439B true CN113704439B (zh) | 2022-02-22 |
Family
ID=78660120
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111035961.2A Active CN113704439B (zh) | 2021-09-06 | 2021-09-06 | 一种基于多来源信息异构图的会话推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113704439B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114036400B (zh) * | 2021-12-07 | 2022-04-08 | 中国计量大学 | 一种基于超图的协同会话推荐方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110008408A (zh) * | 2019-04-12 | 2019-07-12 | 山东大学 | 一种会话推荐方法、***、设备及介质 |
CN113222700A (zh) * | 2021-05-17 | 2021-08-06 | 中国人民解放军国防科技大学 | 基于会话的推荐方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102387305B1 (ko) * | 2017-11-17 | 2022-04-29 | 삼성전자주식회사 | 멀티모달 데이터 학습 방법 및 장치 |
-
2021
- 2021-09-06 CN CN202111035961.2A patent/CN113704439B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110008408A (zh) * | 2019-04-12 | 2019-07-12 | 山东大学 | 一种会话推荐方法、***、设备及介质 |
CN113222700A (zh) * | 2021-05-17 | 2021-08-06 | 中国人民解放军国防科技大学 | 基于会话的推荐方法及装置 |
Non-Patent Citations (2)
Title |
---|
A Session-Based Customer Preference Learning;JENHUI CHEN等;《IEEE Access》;20190129;第7卷;第17750-17759页 * |
基于门循环单元神经网络的中文分词法;李雪莲等;《厦门大学学报(自然科学版)》;20170331;第56卷(第2期);第237-243页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113704439A (zh) | 2021-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111523047B (zh) | 基于图神经网络的多关系协同过滤算法 | |
CN111310063B (zh) | 基于神经网络的记忆感知门控因子分解机物品推荐方法 | |
CN111797321B (zh) | 一种面向不同场景的个性化知识推荐方法及*** | |
CN110910218B (zh) | 一种基于深度学习的多行为迁移推荐方法 | |
CN106897404B (zh) | 一种基于多gru层神经网络的推荐方法与*** | |
CN111881342A (zh) | 一种基于图孪生网络的推荐方法 | |
CN111932336A (zh) | 一种基于长短期兴趣偏好的商品列表推荐方法 | |
CN112967112B (zh) | 一种自注意力机制和图神经网络的电商推荐方法 | |
CN110532471A (zh) | 基于门控循环单元神经网络的主动学习协同过滤方法 | |
WO2023065859A1 (zh) | 物品推荐方法、装置及存储介质 | |
CN112950324B (zh) | 一种知识图谱辅助的成对排序个性化电商推荐方法及*** | |
CN112765461A (zh) | 一种基于多兴趣胶囊网络的会话推荐方法 | |
CN112819575B (zh) | 一种考虑重复购买行为的会话推荐方法 | |
CN113704438B (zh) | 一种基于分层注意力机制的异构图的会话推荐方法 | |
CN112632296B (zh) | 基于知识图谱具有可解释性的论文推荐方法及***、终端 | |
CN113918832A (zh) | 基于社交关系的图卷积协同过滤推荐*** | |
CN112396492A (zh) | 基于图注意力网络和双向长短期记忆网络的会话推荐方法 | |
CN114896517A (zh) | 一种商品推荐方法、***、设备及存储介质 | |
CN113590976A (zh) | 一种空间自适应图卷积网络的推荐方法 | |
CN111949885A (zh) | 一种面向旅游景点的个性化推荐方法 | |
CN113918834A (zh) | 融合社交关系的图卷积协同过滤推荐方法 | |
CN113704439B (zh) | 一种基于多来源信息异构图的会话推荐方法 | |
CN117216281A (zh) | 一种基于知识图谱的用户兴趣扩散推荐方法及*** | |
CN114169968A (zh) | 一种融合用户兴趣状态的多粒度会话推荐方法 | |
WO2023185320A1 (zh) | 冷启动对象推荐方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231013 Address after: Room 407-10, floor 4, building 2, Haichuang science and technology center, Cangqian street, Yuhang District, Hangzhou City, Zhejiang Province, 311100 Patentee after: Zhejiang Zhiduo Network Technology Co.,Ltd. Address before: 310018, No. 258, source street, Xiasha Higher Education Park, Hangzhou, Zhejiang Patentee before: China Jiliang University |