CN112528161A - 一种基于物品点击序列优化的会话推荐方法 - Google Patents

一种基于物品点击序列优化的会话推荐方法 Download PDF

Info

Publication number
CN112528161A
CN112528161A CN202110178084.8A CN202110178084A CN112528161A CN 112528161 A CN112528161 A CN 112528161A CN 202110178084 A CN202110178084 A CN 202110178084A CN 112528161 A CN112528161 A CN 112528161A
Authority
CN
China
Prior art keywords
user
item
interest
sequence
click
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110178084.8A
Other languages
English (en)
Other versions
CN112528161B (zh
Inventor
刘峤
蓝天
吴祖峰
代婷婷
宋明慧
周乐
曾义夫
孙建强
曾维智
张志鹏
李银强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202110178084.8A priority Critical patent/CN112528161B/zh
Publication of CN112528161A publication Critical patent/CN112528161A/zh
Application granted granted Critical
Publication of CN112528161B publication Critical patent/CN112528161B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Probability & Statistics with Applications (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种基于物品点击序列优化的会话推荐方法,属于会话推荐技术领域。本发明所述方法利用最短路径方法提炼用户最感兴趣的物品序列,能够剔除长序列中多条兴趣路径对用户兴趣表征的干扰;本发明所述方法从最短路径物品序列的长度分布与用户点击的兴趣强弱出发,定义了三种用户兴趣类型,能够捕获不同类型下物品点击行为随时间变化的用户兴趣,可有效建模长序列的用户兴趣。

Description

一种基于物品点击序列优化的会话推荐方法
技术领域
本发明属于会话推荐技术领域,具体涉及一种基于物品点击序列优化的会话推荐方法。
背景技术
随着互联网的快速发展和各种电子产品的普及,京东、拼多多等电商平台走进大众视野,实现了消费模式由传统的实体店购买到线上的转变,为市民生活提供了便捷服务。对电商企业而言,电商平台物品数量庞大,不同用户间的消费兴趣迥异,如何提升用户购买率以提升收益是当前面临的一个挑战。学术界将其归纳为一个基于序列学***台会自动推荐鼠标、键盘等物品的目的。
目前会话推荐主要存在两个技术问题,一是用户通常是匿名的,仅通过当前会话很难获得足够的上下文信息对用户兴趣进行建模;二是数据中不包含用户对物品的主观意见(如评分),因此只能通过历史行为数据对用户兴趣进行间接推测。文献 “NeuralAttentive Session-based Recommendation[C]//Proceedings of the 17th ACM CIKMon Conference on Information and Knowledge Management, Singapore, ACM Press,2017,1419-1428”和“Session-Based Recommendation with Graph Neural Networks[C]//Proceedings of the 33th AAAI Conference on Artificial Intelligence,Hawaii, USA, AAAI Press,2019, 346-353”先后把循环神经网络、注意力机制以及图神经网络应用于推荐***用于提取用户兴趣特征。然而上述现有技术在对物品点击序列提取用户兴趣特征时,侧重于强调序列最后一个物品对预测结果的重要性,而忽视了对具有动态变化特点的用户兴趣建模,直接影响预测准确率。
发明内容
本发明的目的是克服上述现有技术的缺陷,提供一种基于物品点击序列优化的会话推荐方法。
本发明所提出的技术问题是这样解决的:
一种基于物品点击序列优化的会话推荐方法,包括以下步骤:
步骤1. 根据用户物品点击序列,构建物品字典、物品集合、物品邻接矩阵与有向物品关联图;
步骤2. 对物品字典进行初始化,形成物品字典和物品集合的高维空间表示,利用门控图卷积神经网络建模物品邻接矩阵,更新物品集合的高维空间表示,形成用户物品点击序列的高维空间表示;
步骤3. 利用最短路径算法优化用户物品点击序列,提取最短路径序列;
步骤4. 定义初始兴趣、直接兴趣和动态兴趣三种用户兴趣类型,利用用户物品点击序列的最短路径序列长度判定用户兴趣类型,并计算对应用户兴趣类型的高维空间表示;
步骤5. 基于三种用户兴趣类型的条件概率,采用全概率公式对用户物品点击序列进行建模,并用负对数似然损失函数进行模型优化,取概率最大值对应的物品作为会话推荐的下一时刻点击推荐的物品。
进一步的,步骤1的具体过程为:、
用户物品点击序列为
Figure 334304DEST_PATH_IMAGE001
Figure 913053DEST_PATH_IMAGE002
为用户第p次点击的物品,
Figure 691653DEST_PATH_IMAGE003
Figure 90274DEST_PATH_IMAGE004
为用户点击的物品数量,用户物品点击序列的物品集合为V,物品集合为 物品字典的子集,物品集合中物品个数为
Figure 612522DEST_PATH_IMAGE005
Figure 717881DEST_PATH_IMAGE006
,物品邻接矩阵为
Figure 27902DEST_PATH_IMAGE007
,有向物品关 联图为
Figure 851502DEST_PATH_IMAGE008
,其中
Figure 646282DEST_PATH_IMAGE009
代表用户点击物品
Figure 199623DEST_PATH_IMAGE010
后再点击
Figure 116764DEST_PATH_IMAGE011
Figure 99763DEST_PATH_IMAGE012
Figure 88448DEST_PATH_IMAGE013
Figure 371662DEST_PATH_IMAGE014
Figure 459703DEST_PATH_IMAGE015
Figure 54633DEST_PATH_IMAGE016
进一步的,步骤2的具体过程为:
步骤2-1. 采用方差为0.01均值为0的方式对物品字典进行初始化,得到物品字典 的高维空间表示
Figure 519112DEST_PATH_IMAGE017
,提取物品集合的高维空间表示
Figure 391253DEST_PATH_IMAGE018
Figure 650196DEST_PATH_IMAGE019
为 物品集合中第k个物品的高维空间表示,
Figure 233887DEST_PATH_IMAGE020
Figure 502057DEST_PATH_IMAGE021
Figure 228704DEST_PATH_IMAGE022
维矩阵,d为物品高维 空间表示的维度;
步骤2-2. 利用门控图卷积神经网络建模物品邻接矩阵,更新物品集合的高维空 间表示,更新后的物品集合的高维空间表示为
Figure 986445DEST_PATH_IMAGE023
Figure 493650DEST_PATH_IMAGE024
为更新后 的第k个物品的高维空间表示;
Figure 503194DEST_PATH_IMAGE025
其中,gatedGNN为门控图卷积神经网络函数,GRU为门控循环单元函数;
步骤2-3.将用户物品点击序列
Figure 208982DEST_PATH_IMAGE026
中的所有物品用
Figure 278569DEST_PATH_IMAGE027
代替,形成用户物品点击序 列的高维空间表示
Figure 7490DEST_PATH_IMAGE028
Figure 679780DEST_PATH_IMAGE029
为用户第p次点击的物品的高 维空间表示,
Figure 177758DEST_PATH_IMAGE030
Figure 152667DEST_PATH_IMAGE031
维矩阵。
进一步的,步骤3的具体过程为:
利用最短路径算法获取用户物品点击序列中第一个物品
Figure 368885DEST_PATH_IMAGE032
到最后一个物品
Figure 346330DEST_PATH_IMAGE033
的最短路径序列
Figure 902076DEST_PATH_IMAGE034
,实现用户物品点击序列优化;
Figure 110204DEST_PATH_IMAGE035
其中,
Figure 876035DEST_PATH_IMAGE036
为迪杰斯特拉函数。
进一步的,步骤4的具体过程为:
当用户物品点击序列的最短路径序列长度为1时,用户兴趣类型为初始兴趣,建立初始兴趣ini,初始兴趣的高维空间表示为:
Figure 827810DEST_PATH_IMAGE037
当用户物品点击序列的最短路径序列长度为2时,用户兴趣类型为直接兴趣,建立直接兴趣dir,直接兴趣的高维空间表示为:
Figure 238063DEST_PATH_IMAGE038
其中,
Figure 617092DEST_PATH_IMAGE039
为平均池化函数;
当用户物品点击序列的最短路径序列长度大于2时,用户兴趣类型为动态兴趣,统 计用户物品点击序列中物品的点击频次,选择出现频次最多的前两个物品
Figure 870218DEST_PATH_IMAGE040
Figure 360106DEST_PATH_IMAGE041
作 为用户最感兴趣的物品,然后再分别计算用户最感兴趣的两个物品与用户物品点击序列中 最后一个物品之间的最短距离
Figure 890444DEST_PATH_IMAGE042
Figure 502691DEST_PATH_IMAGE043
Figure 180797DEST_PATH_IMAGE044
Figure 412058DEST_PATH_IMAGE045
建立动态兴趣dyn,动态兴趣的高维空间表示为:
Figure 859220DEST_PATH_IMAGE046
其中,
Figure 143833DEST_PATH_IMAGE047
Figure 43656DEST_PATH_IMAGE048
分别为
Figure 813029DEST_PATH_IMAGE049
Figure 380276DEST_PATH_IMAGE050
的高维空间表 示。
进一步的,步骤5的具体过程为:
由用户物品点击序列
Figure 334326DEST_PATH_IMAGE051
预测下一个点击物品的概率
Figure 721445DEST_PATH_IMAGE052
的具体计算方法 如下:
Figure 294509DEST_PATH_IMAGE053
Figure 44159DEST_PATH_IMAGE054
Figure 106793DEST_PATH_IMAGE055
Figure 918891DEST_PATH_IMAGE056
分别为用户物品点击序列
Figure 92383DEST_PATH_IMAGE057
中用户兴趣类 型分别为初始兴趣、直接兴趣和动态兴趣的概率,具体计算方法如下:
Figure 430961DEST_PATH_IMAGE058
Figure 664496DEST_PATH_IMAGE059
Figure 963890DEST_PATH_IMAGE060
Figure 941074DEST_PATH_IMAGE061
其中,softmax和tanh为激活函数,
Figure 635622DEST_PATH_IMAGE062
为激活函数softmax的学习参数,
Figure 40059DEST_PATH_IMAGE063
Figure 92329DEST_PATH_IMAGE064
Figure 935520DEST_PATH_IMAGE065
Figure 920793DEST_PATH_IMAGE066
Figure 433814DEST_PATH_IMAGE067
为激活函数tanh的学习参数,上标T表示转置;
Figure 770118DEST_PATH_IMAGE068
Figure 151420DEST_PATH_IMAGE069
Figure 256780DEST_PATH_IMAGE070
分别为用户物品点击序 列
Figure 940702DEST_PATH_IMAGE071
中用户兴趣类型分别为初始兴趣、直接兴趣和动态兴趣情形时的物品推荐概率,具体 计算方法如下:
若用户物品点击序列的最短路径序列长度为1,
Figure 764301DEST_PATH_IMAGE072
Figure 949295DEST_PATH_IMAGE073
,否则,
Figure 846844DEST_PATH_IMAGE074
若用户物品点击序列的最短路径序列长度为2,
Figure 29564DEST_PATH_IMAGE075
Figure 638662DEST_PATH_IMAGE076
,否则,
Figure 299450DEST_PATH_IMAGE077
若用户物品点击序列的最短路径序列长度大于2,
Figure 317085DEST_PATH_IMAGE078
Figure 405126DEST_PATH_IMAGE079
,否则,
Figure 56DEST_PATH_IMAGE080
其中,
Figure 649823DEST_PATH_IMAGE081
Figure 584281DEST_PATH_IMAGE082
Figure 780907DEST_PATH_IMAGE083
Figure 800815DEST_PATH_IMAGE084
Figure 131303DEST_PATH_IMAGE085
Figure 857950DEST_PATH_IMAGE086
Figure 881270DEST_PATH_IMAGE087
Figure 388475DEST_PATH_IMAGE088
Figure 866860DEST_PATH_IMAGE089
Figure 775911DEST_PATH_IMAGE090
为激活函数tanh的学习参数;
取概率
Figure 438973DEST_PATH_IMAGE091
中最大值对应的物品作为会话推荐的下一时刻点击推荐的物 品。
本发明的有益效果是:
本发明所述方法利用最短路径方法提炼用户最感兴趣的物品序列,能够剔除长序列中多条兴趣路径对用户兴趣表征的干扰;本发明所述方法从最短路径物品序列的长度分布与用户点击的兴趣强弱出发,定义了三种用户兴趣类型,能够捕获不同类型下物品点击行为随时间变化的用户兴趣,可有效建模长序列的用户兴趣。
具体实施方式
下面结合实施例对本发明进行进一步的说明。
本实施例提供一种基于物品点击序列优化的会话推荐方法,包括以下步骤:
步骤1. 用户物品点击序列(即一条会话)为
Figure 433474DEST_PATH_IMAGE001
Figure 715551DEST_PATH_IMAGE092
为 用户第p次点击的物品,
Figure 308468DEST_PATH_IMAGE093
Figure 345694DEST_PATH_IMAGE094
为用户点击的物品数量,用户物品点击序列的物 品集合为V,物品集合为物品字典的子集,物品集合中物品个数为
Figure 499595DEST_PATH_IMAGE095
,且一般地
Figure 647680DEST_PATH_IMAGE096
, 物品邻接矩阵为
Figure 328060DEST_PATH_IMAGE097
,有向物品关联图为
Figure 536187DEST_PATH_IMAGE098
,其中
Figure 177384DEST_PATH_IMAGE009
代表用户 点击物品
Figure 863580DEST_PATH_IMAGE010
后再点击
Figure 929625DEST_PATH_IMAGE011
Figure 246337DEST_PATH_IMAGE012
Figure 437147DEST_PATH_IMAGE013
Figure 989351DEST_PATH_IMAGE014
Figure 316427DEST_PATH_IMAGE015
Figure 804041DEST_PATH_IMAGE016
步骤2-1. 采用方差为0.01均值为0的方式对物品字典进行初始化,得到物品字典 的高维空间表示
Figure 482147DEST_PATH_IMAGE099
,提取物品集合的高维空间表示
Figure 339506DEST_PATH_IMAGE100
Figure 786668DEST_PATH_IMAGE101
为物品集合中第k个物品的高维空间表示,
Figure 445183DEST_PATH_IMAGE102
Figure 672902DEST_PATH_IMAGE103
Figure 504591DEST_PATH_IMAGE104
维矩阵,
Figure 9522DEST_PATH_IMAGE105
为物品 高维空间表示的维度;
步骤2-2. 利用门控图卷积神经网络建模物品邻接矩阵,更新物品集合的高维空 间表示,更新后的物品集合的高维空间表示为
Figure 635676DEST_PATH_IMAGE106
Figure 350691DEST_PATH_IMAGE107
为更新后 的第k个物品的高维空间表示;
Figure 986071DEST_PATH_IMAGE108
其中,gatedGNN(gated graph neural network,gatedGNN)为门控图卷积神经网络函数,GRU(Gated Recurrent Unit,GRU)为门控循环单元函数;
步骤2-3.将用户物品点击序列
Figure 345509DEST_PATH_IMAGE109
中的所有物品用
Figure 470459DEST_PATH_IMAGE110
代替,形成用户物品点击序 列的高维表示
Figure 344874DEST_PATH_IMAGE111
Figure 721629DEST_PATH_IMAGE112
为用户第p次点击的物品的高维空 间表示,
Figure 997890DEST_PATH_IMAGE113
Figure 795207DEST_PATH_IMAGE114
维矩阵;
步骤3. 利用最短路径算法获取用户物品点击序列中第一个物品
Figure 156918DEST_PATH_IMAGE115
到最后一个物 品
Figure 71784DEST_PATH_IMAGE116
的最短路径序列
Figure 530447DEST_PATH_IMAGE117
,实现用户物品点击序列优化;
Figure 934884DEST_PATH_IMAGE118
其中,
Figure 721574DEST_PATH_IMAGE119
为迪杰斯特拉函数;
步骤4. 当用户物品点击序列的最短路径序列长度为1时,用户兴趣类型为初始兴趣,建立初始兴趣ini,初始兴趣的高维空间表示为:
Figure 236869DEST_PATH_IMAGE120
当用户物品点击序列的最短路径序列长度为2时,用户兴趣类型为直接兴趣,建立直接兴趣dir,直接兴趣的高维空间表示为:
Figure 550039DEST_PATH_IMAGE121
其中,
Figure 125377DEST_PATH_IMAGE122
为平均池化函数;
当用户物品点击序列的最短路径序列长度大于2时,用户兴趣类型为动态兴趣,统 计用户物品点击序列中物品的点击频次,选择出现频次最多的前两个物品
Figure 399363DEST_PATH_IMAGE123
Figure 718349DEST_PATH_IMAGE124
作 为用户最感兴趣的物品,然后再分别计算用户最感兴趣的两个物品与用户物品点击序列中 最后一个物品之间的最短距离
Figure 886025DEST_PATH_IMAGE125
Figure 835527DEST_PATH_IMAGE126
Figure 393547DEST_PATH_IMAGE127
Figure 80006DEST_PATH_IMAGE128
建立动态兴趣dyn,动态兴趣的高维空间表示为:
Figure 39871DEST_PATH_IMAGE129
其中,
Figure 894695DEST_PATH_IMAGE130
Figure 205591DEST_PATH_IMAGE131
分别为
Figure 928696DEST_PATH_IMAGE132
Figure 743068DEST_PATH_IMAGE133
的高维空间 表示;
步骤5. 基于三种用户兴趣类型的条件概率,采用全概率公式对用户物品点击序列进行建模,并用负对数似然损失函数进行模型优化,取概率最大值对应的物品作为会话推荐的下一时刻点击推荐的物品;
由用户物品点击序列
Figure 299951DEST_PATH_IMAGE134
预测下一个点击物品的概率
Figure 894881DEST_PATH_IMAGE135
的具体计算方 法如下:
Figure 359360DEST_PATH_IMAGE136
Figure 965922DEST_PATH_IMAGE137
Figure 490444DEST_PATH_IMAGE138
Figure 572670DEST_PATH_IMAGE139
分别为用户物品点击序列
Figure 778523DEST_PATH_IMAGE140
中用户兴趣类 型分别为初始兴趣、直接兴趣和动态兴趣的概率,具体计算方法如下:
Figure 567488DEST_PATH_IMAGE141
Figure 826693DEST_PATH_IMAGE142
Figure 68318DEST_PATH_IMAGE143
Figure 812284DEST_PATH_IMAGE144
其中,softmax和tanh为激活函数,
Figure 49230DEST_PATH_IMAGE145
为激活函数softmax的学习参数,
Figure 649975DEST_PATH_IMAGE146
Figure 582159DEST_PATH_IMAGE147
Figure 926553DEST_PATH_IMAGE148
Figure 752427DEST_PATH_IMAGE149
Figure 524073DEST_PATH_IMAGE150
为激活函数tanh的学习参数,上标T表示转置;
Figure 943554DEST_PATH_IMAGE151
Figure 419534DEST_PATH_IMAGE152
Figure 37597DEST_PATH_IMAGE153
分别为用户物品点击序 列
Figure 448987DEST_PATH_IMAGE154
中用户兴趣类型分别为初始兴趣、直接兴趣和动态兴趣情形时的物品推荐概率,具体 计算方法如下:
若用户物品点击序列的最短路径序列长度为1,
Figure 716283DEST_PATH_IMAGE155
Figure 402479DEST_PATH_IMAGE156
,否则,
Figure 78311DEST_PATH_IMAGE157
若用户物品点击序列的最短路径序列长度为2,
Figure 519657DEST_PATH_IMAGE158
Figure 710466DEST_PATH_IMAGE159
,否则,
Figure 138037DEST_PATH_IMAGE160
若用户物品点击序列的最短路径序列长度大于2,
Figure 730692DEST_PATH_IMAGE161
Figure 342939DEST_PATH_IMAGE162
,否则,
Figure 21045DEST_PATH_IMAGE163
其中,
Figure 986727DEST_PATH_IMAGE164
Figure 433889DEST_PATH_IMAGE165
Figure 217037DEST_PATH_IMAGE083
Figure 585702DEST_PATH_IMAGE084
Figure 417391DEST_PATH_IMAGE085
Figure 271123DEST_PATH_IMAGE086
Figure 162855DEST_PATH_IMAGE087
Figure 18816DEST_PATH_IMAGE088
Figure 450934DEST_PATH_IMAGE089
Figure 872688DEST_PATH_IMAGE090
为激活函数tanh的学习参数;
取概率
Figure 873005DEST_PATH_IMAGE091
中最大值对应的物品作为会话推荐的下一时刻点击推荐的物 品。

Claims (6)

1.一种基于物品点击序列优化的会话推荐方法,其特征在于,包括以下步骤:
步骤1. 根据用户物品点击序列,构建物品字典、物品集合、物品邻接矩阵与有向物品关联图;
步骤2. 对物品字典进行初始化,形成物品字典和物品集合的高维空间表示,利用门控图卷积神经网络建模物品邻接矩阵,更新物品集合的高维空间表示,形成用户物品点击序列的高维空间表示;
步骤3. 利用最短路径算法优化用户物品点击序列,提取最短路径序列;
步骤4. 定义初始兴趣、直接兴趣和动态兴趣三种用户兴趣类型,利用用户物品点击序列的最短路径序列长度判定用户兴趣类型,并计算对应用户兴趣类型的高维空间表示;
步骤5. 基于三种用户兴趣类型的条件概率,采用全概率公式对用户物品点击序列进行建模,并用负对数似然损失函数进行模型优化,取概率最大值对应的物品作会话推荐的为下一时刻点击推荐的物品。
2.根据权利要求1所述的基于物品点击序列优化的会话推荐方法,其特征在于,步骤1的具体过程为:
用户物品点击序列为
Figure 811904DEST_PATH_IMAGE001
Figure 454238DEST_PATH_IMAGE002
为用户第p次点击的物品,
Figure 294280DEST_PATH_IMAGE003
Figure 731078DEST_PATH_IMAGE004
为用户点击的物品数量,用户物品点击序列的物品集合为V,物品集合为 物品字典的子集,物品集合中物品个数为
Figure 420685DEST_PATH_IMAGE005
Figure 335552DEST_PATH_IMAGE006
,物品邻接矩阵为
Figure 59794DEST_PATH_IMAGE007
,有向物品 关联图为
Figure 667493DEST_PATH_IMAGE008
,其中
Figure 516500DEST_PATH_IMAGE009
代表用户点击物品
Figure 359691DEST_PATH_IMAGE010
后再点击
Figure 813806DEST_PATH_IMAGE011
Figure 206786DEST_PATH_IMAGE012
Figure 480773DEST_PATH_IMAGE013
Figure 127655DEST_PATH_IMAGE014
Figure 436276DEST_PATH_IMAGE015
Figure 182516DEST_PATH_IMAGE016
3.根据权利要求2所述的基于物品点击序列优化的会话推荐方法,其特征在于,步骤2的具体过程为:
步骤2-1. 采用方差为0.01均值为0的方式对物品字典进行初始化,得到物品字典的高 维空间表示
Figure 68432DEST_PATH_IMAGE017
,提取物品集合的高维空间表示
Figure 394371DEST_PATH_IMAGE018
Figure 416554DEST_PATH_IMAGE019
为物品 集合中第k个物品的高维空间表示,
Figure 536956DEST_PATH_IMAGE020
Figure 677213DEST_PATH_IMAGE021
Figure 338001DEST_PATH_IMAGE022
维矩阵,d为物品高维空 间表示的维度;
步骤2-2. 利用门控图卷积神经网络建模物品邻接矩阵,更新物品集合的高维空间表 示,更新后的物品集合的高维空间表示为
Figure 355636DEST_PATH_IMAGE023
Figure 37153DEST_PATH_IMAGE025
为更新后的第k 个物品的高维空间表示;
Figure 507449DEST_PATH_IMAGE026
其中,gatedGNN为门控图卷积神经网络函数,GRU为门控循环单元函数;
步骤2-3.将用户物品点击序列
Figure 34245DEST_PATH_IMAGE027
中的所有物品用
Figure 171965DEST_PATH_IMAGE028
代替,形成用户物品点击序列的 高维空间表示
Figure 24384DEST_PATH_IMAGE029
Figure 981975DEST_PATH_IMAGE030
为用户第p次点击的物品的高维空间 表示,
Figure 250146DEST_PATH_IMAGE031
Figure 868471DEST_PATH_IMAGE032
维矩阵。
4.根据权利要求3所述的基于物品点击序列优化的会话推荐方法,其特征在于,步骤3的具体过程为:
利用最短路径算法获取用户物品点击序列中第一个物品
Figure 501578DEST_PATH_IMAGE033
到最后一个物品
Figure 336679DEST_PATH_IMAGE034
的最 短路径序列
Figure 346223DEST_PATH_IMAGE035
,实现用户物品点击序列优化;
Figure 317590DEST_PATH_IMAGE036
其中,
Figure 387177DEST_PATH_IMAGE037
为迪杰斯特拉函数。
5.根据权利要求4所述的基于物品点击序列优化的会话推荐方法,其特征在于,步骤4的具体过程为:
当用户物品点击序列的最短路径序列长度为1时,用户兴趣类型为初始兴趣,建立初始兴趣ini,初始兴趣的高维空间表示为:
Figure 178416DEST_PATH_IMAGE038
当用户物品点击序列的最短路径序列长度为2时,用户兴趣类型为直接兴趣,建立直接兴趣dir,直接兴趣的高维空间表示为:
Figure 991651DEST_PATH_IMAGE039
其中,
Figure 584568DEST_PATH_IMAGE040
为平均池化函数;
当用户物品点击序列的最短路径序列长度大于2时,用户兴趣类型为动态兴趣,统计用 户物品点击序列中物品的点击频次,选择出现频次最多的前两个物品
Figure 356215DEST_PATH_IMAGE041
Figure 41275DEST_PATH_IMAGE042
作为用户 最感兴趣的物品,然后再分别计算用户最感兴趣的两个物品与用户物品点击序列中最后一 个物品之间的最短距离
Figure 251676DEST_PATH_IMAGE043
Figure 73002DEST_PATH_IMAGE044
Figure 343446DEST_PATH_IMAGE045
Figure 250222DEST_PATH_IMAGE046
建立动态兴趣dyn,动态兴趣的高维空间表示为:
Figure 201998DEST_PATH_IMAGE047
其中,
Figure 2463DEST_PATH_IMAGE048
Figure 584754DEST_PATH_IMAGE049
分别为
Figure 604925DEST_PATH_IMAGE050
Figure 32495DEST_PATH_IMAGE051
的高维空间表 示。
6.根据权利要求5所述的基于物品点击序列优化的会话推荐方法,其特征在于,步骤5的具体过程为:
由用户物品点击序列
Figure 953047DEST_PATH_IMAGE052
预测下一个点击物品的概率
Figure 706239DEST_PATH_IMAGE053
的具体计算方法如 下:
Figure 446662DEST_PATH_IMAGE054
Figure 943503DEST_PATH_IMAGE055
Figure 718561DEST_PATH_IMAGE056
Figure 642654DEST_PATH_IMAGE057
分别为用户物品点击序列
Figure 808056DEST_PATH_IMAGE058
中用户兴趣类型分 别为初始兴趣、直接兴趣和动态兴趣的概率,具体计算方法如下:
Figure 469107DEST_PATH_IMAGE059
Figure 708459DEST_PATH_IMAGE060
Figure 928087DEST_PATH_IMAGE061
Figure 518469DEST_PATH_IMAGE062
其中,softmax和tanh为激活函数,
Figure 481745DEST_PATH_IMAGE063
为激活函数softmax的学习参数,
Figure 903500DEST_PATH_IMAGE064
Figure 169396DEST_PATH_IMAGE065
Figure 106128DEST_PATH_IMAGE066
Figure 482882DEST_PATH_IMAGE067
Figure 588504DEST_PATH_IMAGE068
为激活函数tanh的学习参数,上标T表示转置;
Figure 25302DEST_PATH_IMAGE069
Figure 714909DEST_PATH_IMAGE070
Figure 895355DEST_PATH_IMAGE071
分别为用户物品点击序列
Figure 619597DEST_PATH_IMAGE072
中 用户兴趣类型分别为初始兴趣、直接兴趣和动态兴趣情形时的物品推荐概率,具体计算方 法如下:
若用户物品点击序列的最短路径序列长度为1,
Figure 24033DEST_PATH_IMAGE073
Figure 138620DEST_PATH_IMAGE074
, 否则,
Figure 122756DEST_PATH_IMAGE075
若用户物品点击序列的最短路径序列长度为2,
Figure 202970DEST_PATH_IMAGE076
Figure 981570DEST_PATH_IMAGE077
,否则,
Figure 380191DEST_PATH_IMAGE078
若用户物品点击序列的最短路径序列长度大于2,
Figure 902439DEST_PATH_IMAGE079
Figure 335694DEST_PATH_IMAGE080
,否则,
Figure 285196DEST_PATH_IMAGE081
其中,
Figure 436691DEST_PATH_IMAGE082
Figure 497051DEST_PATH_IMAGE083
Figure 722496DEST_PATH_IMAGE084
Figure 293216DEST_PATH_IMAGE085
Figure 869691DEST_PATH_IMAGE086
Figure 530480DEST_PATH_IMAGE087
Figure 813693DEST_PATH_IMAGE088
Figure 229631DEST_PATH_IMAGE089
Figure 965506DEST_PATH_IMAGE090
Figure 492302DEST_PATH_IMAGE091
为激活函数tanh的学习参数;
取概率
Figure 630023DEST_PATH_IMAGE092
中最大值对应的物品作为会话推荐的下一时刻点击推荐的物品。
CN202110178084.8A 2021-02-07 2021-02-07 一种基于物品点击序列优化的会话推荐方法 Active CN112528161B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110178084.8A CN112528161B (zh) 2021-02-07 2021-02-07 一种基于物品点击序列优化的会话推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110178084.8A CN112528161B (zh) 2021-02-07 2021-02-07 一种基于物品点击序列优化的会话推荐方法

Publications (2)

Publication Number Publication Date
CN112528161A true CN112528161A (zh) 2021-03-19
CN112528161B CN112528161B (zh) 2021-04-30

Family

ID=74975539

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110178084.8A Active CN112528161B (zh) 2021-02-07 2021-02-07 一种基于物品点击序列优化的会话推荐方法

Country Status (1)

Country Link
CN (1) CN112528161B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326425A (zh) * 2021-04-20 2021-08-31 中国电子科技集团公司第五十四研究所 一种基于结构和语义注意力堆叠的会话推荐方法及***
CN113688315A (zh) * 2021-08-19 2021-11-23 电子科技大学 一种基于无信息损失图编码的序列推荐方法
CN117436550A (zh) * 2023-12-15 2024-01-23 深圳须弥云图空间科技有限公司 推荐模型训练方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020198882A1 (en) * 2001-03-29 2002-12-26 Linden Gregory D. Content personalization based on actions performed during a current browsing session
US7676400B1 (en) * 2005-06-03 2010-03-09 Versata Development Group, Inc. Scoring recommendations and explanations with a probabilistic user model
CN108334646A (zh) * 2018-04-11 2018-07-27 焦点科技股份有限公司 一种基于频繁浏览序列的网站结构优化方法
US20190079957A1 (en) * 2017-09-12 2019-03-14 Linkedin Corporation Centralized feature management, monitoring and onboarding
CN109635204A (zh) * 2018-12-21 2019-04-16 上海交通大学 基于协同过滤和长短记忆网络的在线推荐***
CN109816101A (zh) * 2019-01-31 2019-05-28 中科人工智能创新技术研究院(青岛)有限公司 一种基于图卷积神经网络的会话序列推荐方法及***
CN109960759A (zh) * 2019-03-22 2019-07-02 中山大学 基于深度神经网络的推荐***点击率预测方法
CN110162690A (zh) * 2018-10-23 2019-08-23 腾讯科技(深圳)有限公司 确定用户对物品的兴趣度的方法与装置、设备和存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020198882A1 (en) * 2001-03-29 2002-12-26 Linden Gregory D. Content personalization based on actions performed during a current browsing session
US7676400B1 (en) * 2005-06-03 2010-03-09 Versata Development Group, Inc. Scoring recommendations and explanations with a probabilistic user model
US20190079957A1 (en) * 2017-09-12 2019-03-14 Linkedin Corporation Centralized feature management, monitoring and onboarding
CN108334646A (zh) * 2018-04-11 2018-07-27 焦点科技股份有限公司 一种基于频繁浏览序列的网站结构优化方法
CN110162690A (zh) * 2018-10-23 2019-08-23 腾讯科技(深圳)有限公司 确定用户对物品的兴趣度的方法与装置、设备和存储介质
CN109635204A (zh) * 2018-12-21 2019-04-16 上海交通大学 基于协同过滤和长短记忆网络的在线推荐***
CN109816101A (zh) * 2019-01-31 2019-05-28 中科人工智能创新技术研究院(青岛)有限公司 一种基于图卷积神经网络的会话序列推荐方法及***
CN109960759A (zh) * 2019-03-22 2019-07-02 中山大学 基于深度神经网络的推荐***点击率预测方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
JENHUI CHEN 等: "A Session-Based Customer Preference Learning Method by Using the Gated Recurrent Units With Attention Function", 《IEEE ACCESS》 *
MUHAMMAD FIQRI 等: "Graph-based domain model for adaptive learning path recommendation", 《2017 IEEE GLOBAL ENGINEERING EDUCATION CONFERENCE (EDUCON)》 *
QING YANG 等: "Feature-Level Attentive Neural Model for Session-Based Recommendation", 《IEEE ACCESS》 *
刘阳: "基于时序门控图神经网络的可解释序列推荐", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
曾义夫 等: "基于图表示学习的会话感知推荐模型", 《计算机研究与发展》 *
李赵宁: "基于多场景会话数据的推荐技术研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326425A (zh) * 2021-04-20 2021-08-31 中国电子科技集团公司第五十四研究所 一种基于结构和语义注意力堆叠的会话推荐方法及***
CN113688315A (zh) * 2021-08-19 2021-11-23 电子科技大学 一种基于无信息损失图编码的序列推荐方法
CN113688315B (zh) * 2021-08-19 2023-04-18 电子科技大学 一种基于无信息损失图编码的序列推荐方法
CN117436550A (zh) * 2023-12-15 2024-01-23 深圳须弥云图空间科技有限公司 推荐模型训练方法及装置
CN117436550B (zh) * 2023-12-15 2024-04-16 深圳须弥云图空间科技有限公司 推荐模型训练方法及装置

Also Published As

Publication number Publication date
CN112528161B (zh) 2021-04-30

Similar Documents

Publication Publication Date Title
CN112528161B (zh) 一种基于物品点击序列优化的会话推荐方法
CN105046515B (zh) 广告排序方法及装置
CN112364976B (zh) 基于会话推荐***的用户偏好预测方法
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及***
CN112115377B (zh) 一种基于社交关系的图神经网络链路预测推荐方法
CN110796313B (zh) 一种基于带权图卷积和项目吸引力模型的会话推荐方法
CN108648038B (zh) 一种基于子图挖掘的信用炒作与恶意评价识别方法
CN111737578A (zh) 一种推荐方法及***
CN111681084B (zh) 一种基于社交关系影响因素的电商平台推荐方法
CN112396492A (zh) 基于图注意力网络和双向长短期记忆网络的会话推荐方法
CN110197404A (zh) 可降低流行度偏差的个性化长尾商品推荐方法和***
CN116431931A (zh) 实时增量数据统计分析方法
WO2023284516A1 (zh) 基于知识图谱的信息推荐方法、装置、设备、介质及产品
CN115829683A (zh) 一种基于逆奖赏学习优化的电力积分商品推荐方法及***
CN116842267A (zh) 基于深度学习的个性化装修方案推荐方法、***及介质
CN114840766A (zh) 一种用户画像构建方法、***、设备及存储介质
CN114529077A (zh) 一种基于会话内异构行为的点击率预测方法
CN113344648A (zh) 一种基于机器学习的广告推荐方法及***
CN117408735A (zh) 一种基于物联网的客户管理方法及***
CN110555719B (zh) 一种基于深度学习的商品点击率预测方法
CN112232388A (zh) 基于elm-rfe的购物意图关键因素识别方法
CN116757747A (zh) 基于行为序列和特征重要性的点击率预测方法
CN115392975A (zh) 一种基于Canopy模糊聚类和奇异值分解的个性化推荐方法
CN110751180B (zh) 一种基于谱聚类的虚假评论群组划分方法
CN112529414B (zh) 基于多任务神经协同过滤网络的物品评分方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant