CN115293812A - 一种基于长短期兴趣的电商平台会话感知推荐预测方法 - Google Patents

一种基于长短期兴趣的电商平台会话感知推荐预测方法 Download PDF

Info

Publication number
CN115293812A
CN115293812A CN202210967561.3A CN202210967561A CN115293812A CN 115293812 A CN115293812 A CN 115293812A CN 202210967561 A CN202210967561 A CN 202210967561A CN 115293812 A CN115293812 A CN 115293812A
Authority
CN
China
Prior art keywords
user
term
long
item
short
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210967561.3A
Other languages
English (en)
Inventor
肖云鹏
黄于洋
李暾
王蓉
贾朝龙
陶禹冲
朱宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202210967561.3A priority Critical patent/CN115293812A/zh
Publication of CN115293812A publication Critical patent/CN115293812A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于互联网应用技术领域,具体涉及一种基于长短期兴趣的电商平台会话感知推荐预测方法,包括获取在线数据,数据包括用户的基本信息、物品的基本信息以及用户行为的会话序列;通过获取的在线数据,提取用户行为和用户偏好,并构建用户长期兴趣集;通过兴趣匹配从用户长期兴趣集中获取用户在当前阶段的短期兴趣;构建预测模型,将用户在一个会话的点击序列,即物品输入,以及用户在当前阶段的短期兴趣作为输入,预测模型输出预测物品并进行推荐;本发明不仅能够有效挖掘用户行为序列中的用户长短期兴趣信息,更精确的表达用户兴趣偏好,同时能够提升电商平台的推荐准确性。

Description

一种基于长短期兴趣的电商平台会话感知推荐预测方法
技术领域
本发明属于互联网应用技术领域,具体涉及一种基于长短期兴趣的电商平台会话感知推荐预测方法。
背景技术
近年来,随着人工智能技术的蓬勃发展,使推荐更有趣和有用的是“智能”因素。智能是个性化的关键核心,它可以了解用户的偏好、预测用户未知的喜好,并最终通过匹配查询和内容来提供超越简单搜索的推荐。推荐***研究结合了多种人工智能(AI)技术,包括机器学习、数据挖掘、用户建模和基于案例的推理等。拥有一个可以像人类一样思考和学习的智能***的想法导致了更人性化的技术,称为计算智能(CI)。CI是AI的一个分支,它探索自适应机制,以在复杂和不断变化的环境中实现智能操作。这种智能“推荐”可以来自多种因素,包括用户的数字习惯,以及类似用户的历史、偏好、兴趣和行为。推荐***已迅速成为现代电子商务网站以及任何拥有大量内容和用户的网站最重要的流量中心之一。简而言之,推荐***是一个复杂的过滤***,可以在数字环境中预测消费者的喜好。
在推荐***发明之初,发现人和产品的显式相似性是很容易的,但推荐******已经使用了通过使用矩阵分解查看潜在属性的相似性的方式。简单地说,一个项目或一个客户的所有属性都以一种揭示尚未实现的关系的方式组合在一起,但是这种方式的局限性很大,人工智能的出现使得推荐***可以发现更多的潜在属性和隐藏关系。
虽然众多学者对会话感知推荐模型进行了大量的研究,可以最大限度的减少现有推荐模型由于忽略短期事务而造成的信息损失,但仍存在一些挑战:
1.用户的兴趣随时间推移动态演变。电商平台下用户对物品的偏好通常是动态变化的而非静止的,会随着时间的变化发生显著或缓慢的转变。
2.用户对物品的选择不仅依赖于长期形成的偏好,而且也依赖于短期的最近偏好。用户的长期兴趣和短期兴趣都很重要,如何同时区分和利用这两种兴趣显然是个问题。
3.不同兴趣的影响意义不同。仅仅是连续且均等的利用用户兴趣,会使得模型不具备真实性,影响推荐结果的准确性。
发明内容
针对以上问题,本申请提出一种基于长短期兴趣的电商平台会话感知推荐预测方法,具体包括以下步骤:
获取在线数据,包括用户的基本信息、物品的基本信息以及用户行为的会话序列;
通过获取的在线数据,提取用户行为和用户偏好,并构建用户长期兴趣集;
通过兴趣匹配从用户长期兴趣集中获取用户在当前阶段的短期兴趣;
构建预测模型,将用户在一个会话的点击序列,即物品输入,以及用户在当前阶段的短期兴趣作为输入,预测模型输出预测物品并进行推荐。
进一步的,构建用户长期兴趣集包括:根据历史用户行为的会话序列获取其历史物品矩阵,利用多个不同尺度的卷积核对该历史物品矩阵进行卷积计算,每个卷积核对应得到一个用户的偏好特征映射,将所有偏好进行拼接后经过一个全连接层转化为用户的长期兴趣,用户所有会话得到的长期兴趣构成长期兴趣集合。
进一步的,若使用τ个卷积核对历史物品矩阵分别进行卷积运算,卷积核矩阵表示为Ω={ω12,…,ωτ},则第i个会话时得到的用户的长期兴趣表示为:
Figure BDA0003795294370000021
其中,ReLU()表示ReLU激活函数;concat()表示拼接操作;H为历史物品矩阵,表示为H=[v1,v2,…,vi,…]T,vi表示表示第i个子会话映射的交互物品向量,Wl为全连接层的权重矩阵,b为全连接层的偏置项。
进一步的,对于历史物品矩阵中的值,以一定概率将该值强制设置为0,该概率表示为:
Figure BDA0003795294370000031
其中,O表示将历史物品矩阵中的某一个值设置为0的概率;Uu为用户向量表示;Vv为物品向量表示;
Figure BDA0003795294370000032
表示从用户与物品的交互学习得到的用户向量表示;
Figure BDA0003795294370000033
表示从用户与物品的交互学习得到的物品向量表示。
进一步的,用户与物品的交互学习得到的用户向量表示和物品向量表示的过程中是令损失函数逐渐变小知道直到达到设定阈值的过程,损失函数表示为:
Figure BDA0003795294370000034
其中,l为损失函数;y∈{0,1},当y=1时表示用户与当前物品进行过交互,当y=0时表示用户没有与当前用户进行过交互;
Figure BDA0003795294370000035
表示从用户与物品的交互学***均停留时长;
Figure BDA0003795294370000036
表示从用户与物品的交互学***均停留时长。
进一步的,通过兴趣匹配从用户长期兴趣集中获取用户在当前阶段的短期兴趣,表示为:
Figure BDA0003795294370000037
其中,
Figure BDA0003795294370000038
为在第s个会话过程中第n个阶段的短期兴趣,用户在一次会话中可能交互多个物品,此处规定用户在该次会话中每与一个物品进行交互即为一个阶段;
Figure BDA0003795294370000039
表示第i个会话时得到的长期兴趣;M表示长期兴趣集中元素的数量;Ns为阶段数量,
Figure BDA00037952943700000310
表示第s个会话过程中第n个阶段的短期兴趣的权重。
进一步的,通过注意力机制计算从用户长期兴趣集中匹配得到的一个向量
Figure BDA00037952943700000311
Figure BDA00037952943700000312
的影响力,从用户长期兴趣集中匹配得到的一个向量
Figure BDA00037952943700000313
表示为:
Figure BDA00037952943700000314
其中,
Figure BDA0003795294370000041
表示用户长期兴趣集中的嵌入向量与将当前用户行为的会话序列
Figure BDA0003795294370000042
投影到嵌入空间向量的差值;
Figure BDA0003795294370000043
表示第i个会话时得到的长期兴趣;
Figure BDA0003795294370000044
表示量化后的
Figure BDA0003795294370000045
<,>表示求内积,w()表示权重函数;
Figure BDA0003795294370000046
表示求
Figure BDA0003795294370000047
取值在集合Q范围内的平均值;Q表示当前会话内用户的所有前驱行为。
进一步的,基于门控循环单元构建预测模型,将门控循环单元输出门的输出通过softmax函数层预测各个物品被点击的概率,按照概率从高到低向用户推荐物品,该过程表示为:
Figure BDA0003795294370000048
Figure BDA0003795294370000049
Figure BDA00037952943700000410
Figure BDA00037952943700000411
Figure BDA00037952943700000412
Figure BDA00037952943700000413
其中,
Figure BDA00037952943700000414
为物品输入向量;
Figure BDA00037952943700000415
为用户短期兴趣,
Figure BDA00037952943700000416
为中间隐状态,
Figure BDA00037952943700000417
为隐状态,
Figure BDA00037952943700000418
为更新门,
Figure BDA00037952943700000419
为重置门,
Figure BDA00037952943700000420
为输出向量;Wp、Wq、Wh表示GRU单元的转换矩阵,W1、W2、W3表示GRU单元的权值矩阵;σ表示sigmoid激活函数,⊙表示按位相乘操作;
Figure BDA00037952943700000421
表示物品集合V中第|V|个物品被点击的概率,|V|表示物品集合V中的物品的数量,W表示隐藏层连接到输出层的权重矩阵。
本发明不仅能够有效挖掘用户行为序列中的用户长短期兴趣信息,更精确的表达用户兴趣偏好,同时能够提升电商平台的推荐准确性。
附图说明
图1为本发明基于长短期兴趣的会话感知推荐预测模型流程图;
图2为本发明会话内每一阶段预测购买物品概率模型示意图;
图3为本发明CNN卷积网络示意图;
图4为本发明SiM算法计算短期兴趣偏好示意图;
图5为本发明长期兴趣演化模型示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种基于长短期兴趣的电商平台会话感知推荐预测方法,包括以下步骤:
获取在线数据,包括用户的基本信息、物品的基本信息以及用户行为的会话序列;
通过获取的在线数据,提取用户行为和用户偏好,并构建用户长期兴趣集;
通过兴趣匹配从用户长期兴趣集中获取用户在当前阶段的短期兴趣;
构建预测模型,将用户在一个会话的点击序列,即物品输入,以及用户在当前阶段的短期兴趣作为输入,预测模型输出预测物品并进行推荐。
本实施例提供一种具体的实施方式,在本实施例中,如图1,进行推荐预测主要包括以下步骤:
S1:在线获取数据。获取数据的方式可以是从公开的数据集网站,或者是直接查询企业提供数据库中的实时销售数据。这里需要获取的是用户的基本信息、物品的基本信息和用户行为的会话序列,会话序列中包含多个元素,将会话序列转换为固定长度,并对数据进行预处理。
S2:提取相关属性。根据获取的电商平台下的用户基本信息、物品基本信息和用户历史会话序列来提取相关属性。并从用户长期兴趣和用户短期兴趣两个角度融合特征刻画用户偏好。
S3:建立模型。构建预测模型,预测得到候选物品序列,并将该序列推送给用户。
本实施例提供一种获取数据源的具体方法,主要包括以下步骤:
S11:获取原始数据。通过企业数据库实时查询或公开的数据集网站都可以得到原始数据。
S12:简单的数据清洗。通常获取的原始数据都是非结构化的,不能直接用于数据分析。通过简单的数据清洗可以使大部分非结构化数据结构化。例如,删除重复数据、清理无效信息等。
S13:数据存储。通过简单数据清洗后的数据使用数据库进行存储,通过表结构对数据进行进一步的规范化,并且通过数据库也能够极大的提高数据的检索效率以及表间关系的映射。
在电商平台中,用户对营销活动的下单行为受多方面因素影响,比如:用户的兴趣爱好、相似用户的参与活动行为和营销活动奖励机制对用户冲动消费的影响等等。基于此,本实施例从内部和外部因素两个方面,提取影响用户行为的因子,即要提取用户行为作为外部因子,提取用户偏好作为内部因子,本实施例给出一种具体提取的过程,包括:
S21:提取用户行为。
S211:用户会话集合E
用户和物品之间的每条交互记录都关联了一个会话编号s,使用es来表示一个给定用户在第s个会话内交互过的所有物品的集合,包括以及当前会话s在内的所有交互信息表示为E={e1,e2,…,es}。
S212:用户物品交互矩阵T
用户集合和物品集合分别表示为U={u1,u2,…}和V={v1,v2,…},根据用户对物品的隐式反馈定义一个用户和物品之间的交互矩阵T={tuv|u∈U,v∈V},即如果用户u点击过物品v,那么tuv=1,否则tuv=0。
S22:提取用户偏好。
S221:用户物品关注度Attention
用户对物品的关注度可以由用户在物品页的停留时间t,点击次数Num(click)两个条件决定所决定,表示为Attention=t*Num(click)。
S222:用户长期兴趣集P
通过前s-1个会话,我们为每个用户准备了一个长期兴趣集P,用来刻画该用户的长期兴趣偏好。长期兴趣集P为一个用户存储了m个隐偏好向量,表示为
Figure BDA0003795294370000071
S223:用户短期兴趣
Figure BDA0003795294370000072
用户在第s个会话前的长期兴趣集表示为
Figure BDA0003795294370000073
用户的短期兴趣通过在第s个会话内的每个阶段n,匹配用户前趋行为
Figure BDA0003795294370000074
与长期兴趣集P得到,可以定义为
Figure BDA0003795294370000075
本实施构建的预测模型对用户长期兴趣进行挖掘并记忆,基于用户兴趣演化预估候选物品序列,包括以下步骤:
从会话中的用户行为序列挖掘细粒度的用户长期兴趣,并存储用户行为序列到长期兴趣集;
通过设计SiM(Short-interest Match)兴趣匹配方法进一步从用户的长期兴趣集里面匹配出用户在当前阶段的短期兴趣动态表征;
通过GRU实现构建随着时间推移产生的用户兴趣变化的过程;
引入了门控循环神经网络,对用户在一个会话的点击序列进行建模,预估候选物品序列。
在获取用户长期兴趣集的过程中,为每一个用户在s个会话内定义了一个长期兴趣集模块P,从特征层级出发,通过对用户交互过的历史物品进行特征提取并存储m个隐兴趣向量,用以描述每个用户的偏好特征,如图3,具体包括以下步骤:
根据用户的历史会话序列输入嵌入层得到历史物品矩阵H=[v1,v2,…,vi,…]T,其中
Figure BDA0003795294370000076
将多个卷积核
Figure BDA0003795294370000077
在矩阵H上进行卷积计算,每个卷积核可得到一个用户的偏好特征映射pi,即:
Figure BDA0003795294370000078
其中,wt表示卷积核ω中下标为t的元素,Ht,i表示矩阵中第t行第i列的元素,
Figure BDA0003795294370000081
为上述函数的偏置项;nI为嵌入向量的维度;vi表示第i个子会话映射的交互物品向量,该向量包括L个特征,每个特征为该向量中的一个元素。
通过使用多个卷积核来生成不同的用户偏好特征映射,设Ω和τ为卷积核矩阵和数量,则根据卷积核数量可得到τ个用户的偏好特征映射p,并将它们进行拼接,之后再经过一个全连接层转化成用户的长期兴趣,计算如下:
Figure BDA0003795294370000082
其中*和concat分别表示卷积计算和向量拼接操作,
Figure BDA0003795294370000083
是全连接层的权重矩阵,
Figure BDA0003795294370000084
为全连接层的偏置项,
Figure BDA0003795294370000085
表示用户的长期兴趣。卷积神经网络可以捕捉用户行为中相同维度特征之间的全局关系,能有效提取用户长期兴趣。
由于用户的长期兴趣是随着用户的行为数据不断增长的,因此在每一次会话结束后我们写入用户偏好特征,进一步丰富推荐***的准确性。同时又为了防止过拟合,本实施例引入了Dropout降低模型对于噪音的敏感度。比如,用户有时候会不小心点击了某些用户并不感兴趣的物品,模型也会因为这部分的噪音数据而过拟合。具体来说,就是通过对输入的物品特征按照一定的概率强行置为0,该概率表示为:
Figure BDA0003795294370000086
其中,
Figure BDA0003795294370000087
是模型学习到的用户向量表示,
Figure BDA0003795294370000088
是模型学习到的物品向量表示,Uu和Vv分别是外部输入的、作为监督信号的用户和物品向量表示;
Figure BDA0003795294370000089
为预测用户的向量;
Figure BDA00037952943700000810
为预测物品的向量;
Figure BDA00037952943700000811
为用户点击的概率;
Figure BDA00037952943700000812
为物品被点击的概率;u表示用户的取值范围;v表示物品的取值范围;T表示矩阵行列转置的操作。
为了简化训练流程,本实施例将用户与物品的交互时长作为监督信号,如果用户在该物品的停留时间超过平均时间,则该用户与物品构成正样本;那些没有超过平均时长的构建成为负样本。通过损失函数的设计,可以使模型学习到正样本的用户长期兴趣更精确,损失函数如下:
Figure BDA0003795294370000091
其中,l为损失函数;y∈{0,1},当y=1时表示用户与当前物品进行过交互,当y=0时表示用户没有与当前用户进行过交互;
Figure BDA0003795294370000092
表示从用户与物品的交互学***均停留时长;
Figure BDA0003795294370000093
表示从用户与物品的交互学***均停留时长;v+表示用户停留该物品的时长超过平均时长的物品;v-表示用户停留该物品的时长没有超过平均时长的物品。
引入用户长期兴趣集有两个目的:其中一个是在一个会话的每个阶段,长期兴趣集可以通过SiM匹配出用户的短期兴趣,匹配出的短期兴趣向量会结合用户当前的隐状态,更细粒度的描述用户的当前行为,另一个是在一个会话结束后,长期兴趣集会存储用户在该会话中的信息,并通过循环神经网络的序列学习能力实现对用户的长期兴趣演化的建模。
在用户与平台的交互过程中,用户通过当前点击物品给模型传达了一个很聚焦很明确的意图,所以推荐的相关结果不能肆意泛化;但同时,一味的聚集又会降低分发的效能,使得用户在浏览过程中产生疲劳感,因而应当遵循“意图明确,适度发散”的策略。
给定一个用户在第s个会话内的长期兴趣集P,本实施例的任务是通过该会话内的前序行为从长期兴趣集里面抽取出用户这个阶段的短期兴趣,将该操作抽象成为匹配(Match)操作:
Figure BDA0003795294370000094
其中,
Figure BDA0003795294370000095
表示的是该用户在第s个会话内中的第n个阶段的短期兴趣。一个常见做法是通过将该用户的所有兴趣向量求平均值:
Figure BDA0003795294370000096
其中,Ns为阶段的数量,也是当前会话中与物品交互的次数。
采用平均值会导致得到的短期兴趣在整个会话内是静态不变的。为了更加真实的模拟现实场景中的用户当前偏好,我们需要得到更细粒度的短期兴趣偏好。因此我们在模型中设计了一个基于用户长期兴趣匹配用户短期兴趣的模块,将用户前序行为序列
Figure BDA0003795294370000101
与用户的长期兴趣集P进行高效的向量相似性搜索(ScaNN),即如图4所示的操作。具体包括以下步骤:
先将
Figure BDA0003795294370000102
映射到嵌入空间,然后在所有P嵌入向量中找到最接近查询的嵌入向量;向量查找的过程是:
假设有两个嵌入向量x1和x2,将每个量化到两个中心之一c1或c2
将每个xi量化为
Figure BDA0003795294370000103
以使内积
Figure BDA0003795294370000104
尽可能接近原始内积<q,xi>,可将此过程可视化为使
Figure BDA0003795294370000105
在q上的投影幅度尽可能类似于xi在q上的投影幅度;
在传统的量化方法中,为每个xi选择最近的中心,这将导致两个点的相对排名不正确:
Figure BDA0003795294370000106
大于
Figure BDA0003795294370000107
但是实际上<q,x1>小于<q,x2>。因此采用各向异性向量量化,将x1赋给c1,将将x2赋给c2,降低了内积误差、提高了精度,表示如下:
Figure BDA0003795294370000108
其中,h||(w,||xi||)、h(w,||xi||)表示xi的刻度参数;
Figure BDA0003795294370000109
表示xi
Figure BDA00037952943700001010
的并行残差;
Figure BDA00037952943700001011
表示xi
Figure BDA00037952943700001012
的正交残差;||||表计算向量模长。
本实施例中,将
Figure BDA00037952943700001013
作为嵌入向量,将
Figure BDA00037952943700001014
作为差值,找到最匹配长期兴趣集中的用户兴趣向量,即找到差值
Figure BDA00037952943700001015
最小的向量,
Figure BDA00037952943700001016
表示:
Figure BDA00037952943700001017
最后,使用fatt作为注意力函数,以及softmax函数来计算归一化的影响值:
Figure BDA00037952943700001018
注意力函数fatt读取一个从用户长期兴趣集中匹配得到的一个向量
Figure BDA00037952943700001019
Figure BDA00037952943700001020
作为输入,并输出他们之间的影响力值,α值越大表示该兴趣在当前阶段对用户会产生更主要的影响。用户的短期兴趣可以表示为按照α值加权平均:
Figure BDA0003795294370000111
一个用户的兴趣通常会在不同的会话间发生变化,为了模拟出这种兴趣演化的现象,提出了兴趣演化模块,其优点在于即可以通过兴趣演化模块为最终的兴趣表征提供更多的历史相关信息,同时通过兴趣演化的趋势可以更好的进行用户点击物品序列预测。
由于用户的长期兴趣在进化的过程中会存在以下两个特点:其中一个是随着兴趣的多样性增加,用户兴趣会漂移,兴趣漂移会对用户行为产生一定的影响;另一个是尽管用户兴趣可能会互相影响,但每种兴趣都有自己的演变过程,所以本实施例只关注与目标项目有关的发展过程。如图5,在兴趣演化模块,采用了Attention机制来克服兴趣漂移的现象,表示为:
Figure BDA0003795294370000112
其中,ea为候选物品的向量表示,
Figure BDA0003795294370000113
是权重矩阵,计算得到的at为不同兴趣对候选物品的权重值;nA为嵌入维度,即物品向量的大小;nH为隐藏层的度。
在加入了Attention机制之后,通过Attention Score来控制更新门的权重。既保留了原始的更新方向,又能根据与候选物品的相关程度来控制隐层状态的更新力度。通过这种方式,准确控制什么时候更新、更新的程度和方向可以解决直接把Attention Score乘在每个兴趣向量上作为下一层普通GRU的输入这种方式造成的信息损失问题,表示为:
u′t=ut*at
Figure BDA0003795294370000114
在AUGRU中,计算得到的更新因子ut需要乘以一个at权重因子,作为最终的更新因子ut′。其中
Figure BDA0003795294370000115
为AUGRU的隐状态,⊙是按位相乘操作。
在该模型中,选择GRU作为RNN的实现,对用户在一个会话的点击序列进行建模。由于其独特的门单元设计,GRU是一种可以从拥有长距离依赖关系的时间序列中高效抽取信息的RNN结构。具体包括:
定义在输入序列的第n个阶段(n=1,2,…,Ns)的GRU单元为:物品输入
Figure BDA0003795294370000121
用户短期兴趣输入
Figure BDA0003795294370000122
中间隐状态
Figure BDA0003795294370000123
隐状态
Figure BDA0003795294370000124
更新门
Figure BDA0003795294370000125
重置门
Figure BDA0003795294370000126
输出向量
Figure BDA0003795294370000127
其中门向量
Figure BDA0003795294370000128
Figure BDA0003795294370000129
的取值区间为[1,0],GRU单元的转移方程如下所示:
Figure BDA00037952943700001210
Figure BDA00037952943700001211
Figure BDA00037952943700001212
Figure BDA00037952943700001213
Figure BDA00037952943700001214
其中Wp,Wq,Wh表示GRU单元的转换矩阵,W1,W2和W3是用来计算输出值的矩阵;σ是sigmoid激活函数,⊙是按位相乘操作。
如图2,本实施例采用的GRU单元与传统的GRU单元不同有三处,具体包括以下:
GRU的初始状态值
Figure BDA00037952943700001215
是由兴趣演化模块赋值的,其包含了用户在上一个会话的兴趣信息,即长期兴趣集,因此可以减轻传统GRU的冷启动问题;
每个GRU单元都有一个额外的输入监督信号,该监督信号指用户短期兴趣输入
Figure BDA00037952943700001216
和传统GRU将隐状态直接作为输出不同,额外使用了
Figure BDA00037952943700001217
Figure BDA00037952943700001218
来构建输出向量;
通过实验结果表明,与传统模型相比,经过以上改进,本申请提出的模型可以有效地提高模型的性能。
在得到第n个阶段的输出值
Figure BDA00037952943700001219
之后,使用一个softmax函数层来计算所有候选物品的预测概率值:
Figure BDA00037952943700001220
其中,|V|为物品集合V中物品的数量;
Figure BDA0003795294370000131
就是预测的第s个会话中第n个阶段中物品i被点击概率,根据该概率值的大小降序排列后将物品因此推荐给用户。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (8)

1.一种基于长短期兴趣的电商平台会话感知推荐预测方法,其特征在于,包括以下步骤:
获取在线数据,包括用户的基本信息、物品的基本信息以及用户行为的会话序列;
通过获取的在线数据,提取用户行为和用户偏好,并构建用户长期兴趣集;
通过兴趣匹配从用户长期兴趣集中获取用户在当前阶段的短期兴趣;
构建预测模型,将用户在一个会话的点击序列,即物品输入,以及用户在当前阶段的短期兴趣作为输入,预测模型输出预测物品并进行推荐。
2.根据权利要求1所述的一种基于长短期兴趣的电商平台会话感知推荐预测方法,其特征在于,构建用户长期兴趣集包括:根据历史用户行为的会话序列获取其历史物品矩阵,利用多个不同尺度的卷积核对该历史物品矩阵进行卷积计算,每个卷积核对应得到一个用户的偏好特征映射,将所有偏好进行拼接后经过一个全连接层转化为用户的长期兴趣,用户所有会话得到的长期兴趣构成长期兴趣集合。
3.根据权利要求2所述的一种基于长短期兴趣的电商平台会话感知推荐预测方法,其特征在于,若使用τ个卷积核对历史物品矩阵分别进行卷积运算,卷积核矩阵表示为Ω={ω12,…,ωτ},则第i个会话时得到的用户的长期兴趣表示为:
Figure FDA0003795294360000011
其中,ReLU()表示ReLU激活函数;concat()表示拼接操作;H为历史物品矩阵,表示为H=[v1,v2,…,vi,…]T,vi表示表示第i个子会话映射的交互物品向量,Wl为全连接层的权重矩阵,b为全连接层的偏置项。
4.根据权利要求2所述的一种基于长短期兴趣的电商平台会话感知推荐预测方法,其特征在于,对于历史物品矩阵中的值,以一定概率将该值强制设置为0,该概率表示为:
Figure FDA0003795294360000021
其中,O表示将历史物品矩阵中的某一个值设置为0的概率;Uu为用户向量表示;Vv为物品向量表示;
Figure FDA0003795294360000022
表示从用户与物品的交互学习得到的用户向量表示;
Figure FDA0003795294360000023
表示从用户与物品的交互学习得到的物品向量表示。
5.根据权利要求3所述的一种基于长短期兴趣的电商平台会话感知推荐预测方法,其特征在于,用户与物品的交互学习得到的用户向量表示和物品向量表示的过程中是令损失函数逐渐变小直到达到设定阈值的过程,损失函数表示为:
Figure FDA0003795294360000024
其中,l为损失函数;y∈{0,1},当y=1时表示用户与当前物品进行过交互,当y=0时表示用户没有与当前用户进行过交互;
Figure FDA0003795294360000025
表示从用户与物品的交互学***均停留时长;
Figure FDA0003795294360000026
表示从用户与物品的交互学***均停留时长。
6.根据权利要求1所述的一种基于长短期兴趣的电商平台会话感知推荐预测方法,其特征在于,通过兴趣匹配从用户长期兴趣集中获取用户在当前阶段的短期兴趣,表示为:
Figure FDA0003795294360000027
其中,
Figure FDA0003795294360000028
为在第s个会话过程中第n个阶段的短期兴趣;
Figure FDA0003795294360000029
表示第i个会话时得到的长期兴趣;M表示长期兴趣集中元素的数量;Ns为阶段数量,
Figure FDA00037952943600000210
表示第s个会话过程中第n个阶段的短期兴趣的权重。
7.根据权利要求5所述的一种基于长短期兴趣的电商平台会话感知推荐预测方法,其特征在于,通过注意力机制计算从用户长期兴趣集中匹配得到的一个向量
Figure FDA00037952943600000211
Figure FDA00037952943600000212
的影响力,从用户长期兴趣集中匹配得到的一个向量
Figure FDA00037952943600000213
表示为:
Figure FDA00037952943600000214
其中,
Figure FDA0003795294360000031
表示用户长期兴趣集中的嵌入向量与将当前用户行为的会话序列
Figure FDA0003795294360000032
投影到嵌入空间向量的差值;
Figure FDA0003795294360000033
表示第i个会话时得到的长期兴趣;
Figure FDA0003795294360000034
表示量化后的
Figure FDA0003795294360000035
<,>表示求内积,w()表示权重函数;
Figure FDA0003795294360000036
表示求
Figure FDA0003795294360000037
取值在集合Q范围内的平均值;Q表示当前会话内用户的所有前驱行为。
8.根据权利要求1所述的一种基于长短期兴趣的电商平台会话感知推荐预测方法,其特征在于,基于门控循环单元构建预测模型,将门控循环单元输出门的输出通过softmax函数层预测各个物品被点击的概率,按照概率从高到低向用户推荐物品,该过程表示为:
Figure FDA0003795294360000038
Figure FDA0003795294360000039
Figure FDA00037952943600000310
Figure FDA00037952943600000311
Figure FDA00037952943600000312
Figure FDA00037952943600000313
其中,
Figure FDA00037952943600000314
为物品输入向量;
Figure FDA00037952943600000315
为用户短期兴趣,
Figure FDA00037952943600000316
为中间隐状态,
Figure FDA00037952943600000317
为隐状态,
Figure FDA00037952943600000318
为更新门,
Figure FDA00037952943600000319
为重置门,
Figure FDA00037952943600000320
为输出向量;Wp、Wq、Wh表示GRU单元的转换矩阵,W1、W2、W3表示GRU单元的权值矩阵;σ表示sigmoid激活函数,⊙表示按位相乘操作;
Figure FDA00037952943600000321
表示物品集合V中第|V|个物品被点击的概率,|V|表示物品集合V中的物品的数量,W表示隐藏层连接到输出层的权重矩阵。
CN202210967561.3A 2022-08-12 2022-08-12 一种基于长短期兴趣的电商平台会话感知推荐预测方法 Pending CN115293812A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210967561.3A CN115293812A (zh) 2022-08-12 2022-08-12 一种基于长短期兴趣的电商平台会话感知推荐预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210967561.3A CN115293812A (zh) 2022-08-12 2022-08-12 一种基于长短期兴趣的电商平台会话感知推荐预测方法

Publications (1)

Publication Number Publication Date
CN115293812A true CN115293812A (zh) 2022-11-04

Family

ID=83828588

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210967561.3A Pending CN115293812A (zh) 2022-08-12 2022-08-12 一种基于长短期兴趣的电商平台会话感知推荐预测方法

Country Status (1)

Country Link
CN (1) CN115293812A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117455629A (zh) * 2023-11-24 2024-01-26 美服数字科技(广州)有限公司 一种直播带货智能推送方法及***

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117455629A (zh) * 2023-11-24 2024-01-26 美服数字科技(广州)有限公司 一种直播带货智能推送方法及***

Similar Documents

Publication Publication Date Title
Wu et al. Session-based recommendation with graph neural networks
Pan et al. Study on convolutional neural network and its application in data mining and sales forecasting for E-commerce
CN110717098B (zh) 基于元路径的上下文感知用户建模方法、序列推荐方法
CN113590900A (zh) 一种融合动态知识图谱的序列推荐方法
CN111737578B (zh) 一种推荐方法及***
CN115082147A (zh) 一种基于超图神经网络的序列推荐方法及装置
CN111581520A (zh) 基于会话中物品重要性的物品推荐方法和***
CN112712418B (zh) 推荐商品信息的确定方法和装置、存储介质及电子设备
CN111144933A (zh) 商品推荐方法、装置、电子设备及存储介质
CN112258262A (zh) 一种基于卷积自注意力网络的会话推荐方法
Wu et al. Leveraging neighborhood session information with dual attentive neural network for session-based recommendation
CN111506821A (zh) 推荐模型、方法、装置、设备及存储介质
Liang et al. BA-GNN: Behavior-aware graph neural network for session-based recommendation
CN115293812A (zh) 一种基于长短期兴趣的电商平台会话感知推荐预测方法
Li et al. Session Recommendation Model Based on Context‐Aware and Gated Graph Neural Networks
CN118043802A (zh) 一种推荐模型训练方法及装置
CN116910357A (zh) 一种数据处理方法及相关装置
CN116484092A (zh) 基于用户长短期偏好的分层注意力网络序列推荐方法
CN115525835A (zh) 一种长短期注意力循环网络推荐方法
Duan et al. Context-aware short-term interest first model for session-based recommendation
CN116263794A (zh) 对比学习增强的双流模型推荐***及算法
CN114117233A (zh) 一种基于用户隐式反馈的会话新闻推荐方法及推荐***
Yang et al. Wgin: A session-based recommendation model considering the repeated link effect
Sridhar et al. Extending Deep Neural Categorisation Models for Recommendations by Applying Gradient Based Learning
CN114329193B (zh) 基于时间感知兴趣演化的点击率预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination