CN115357783B - 一种基于结构化多兴趣协同的企业服务快讯推荐方法 - Google Patents

一种基于结构化多兴趣协同的企业服务快讯推荐方法 Download PDF

Info

Publication number
CN115357783B
CN115357783B CN202210918943.7A CN202210918943A CN115357783B CN 115357783 B CN115357783 B CN 115357783B CN 202210918943 A CN202210918943 A CN 202210918943A CN 115357783 B CN115357783 B CN 115357783B
Authority
CN
China
Prior art keywords
interest
word
ith
quick
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210918943.7A
Other languages
English (en)
Other versions
CN115357783A (zh
Inventor
王英龙
张洪彪
舒明雷
陈达
刘丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qilu University of Technology
Shandong Computer Science Center National Super Computing Center in Jinan
Shandong Institute of Artificial Intelligence
Original Assignee
Qilu University of Technology
Shandong Computer Science Center National Super Computing Center in Jinan
Shandong Institute of Artificial Intelligence
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qilu University of Technology, Shandong Computer Science Center National Super Computing Center in Jinan, Shandong Institute of Artificial Intelligence filed Critical Qilu University of Technology
Priority to CN202210918943.7A priority Critical patent/CN115357783B/zh
Publication of CN115357783A publication Critical patent/CN115357783A/zh
Application granted granted Critical
Publication of CN115357783B publication Critical patent/CN115357783B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于结构化多兴趣协同的企业服务快讯推荐方法,通过附加选择器以增强快讯的特征,有效增强了最终的企业服务快讯表示;本发明提出的用户兴趣表示学习方法通过构建用户兴趣结构无向图,利用图注意力网络可以一种显示的方式结构化编码用户的多种潜在兴趣,这可以提取更加精确的用户兴趣表示;本发明提出的用户兴趣表示学习方法充分考虑了用户多种潜在兴趣之间的相互作用,利用自注意力网络模拟兴趣之间的作用关系有效增强了用户兴趣表示;本发明得益于良好的企业服务快讯表示学习方法和用户兴趣表示学习方法,有效提高了企业服务快讯推荐的准确性。

Description

一种基于结构化多兴趣协同的企业服务快讯推荐方法
技术领域
本发明涉及个性化服务快讯推荐技术领域,具体涉及一种基于结构化多兴趣协同的企业服务快讯推荐方法。
背景技术
随着中小微企业综合质量服务平台的快速发展,平台每天发布数以万计的企业服务快讯,由于激增的快讯数量与人们有限的阅读时间之间的矛盾导致用户几乎不可能阅读所有的快讯信息。个性化企业服务快讯推荐可以帮助用户在海量服务快讯当中找到他们感兴趣的服务快讯,其作为缓解信息过载的有效手段在中小微综合质量服务平台上扮演着越来越重要的角色。
企业服务快讯具有比较强的时效性,基于协同过滤(CF)的推荐算法在解决企业服务快讯推荐问题时面临着严重的冷启动。如何从快讯和用户自身拥有的特征出发构建企业快讯推荐方案是急需解决的问题。虽然推荐技术取得了较大进步,但企业服务快讯推荐仍面临着以下的问题。首先,为企业服务快讯学习一个良好的嵌入表示是做好企业服务快讯推荐的前提,但是手工从企业服务快讯中提取特征的方法可能无法精准的建模快讯的语义信息。其次,先前工作通常将用户点击历史视为一个连续的序列,无法以一种显式的方式结构化提取用户兴趣,这可能无法精准的建模用户多样化兴趣。
发明内容
本发明为了克服以上技术的不足,提供了一种提高快讯推荐效果的基于结构化多兴趣协同的企业服务快讯推荐方法。
本发明克服其技术问题所采用的技术方案是:
一种基于结构化多兴趣协同的企业服务快讯推荐方法,包括如下步骤:
a)获取用户的历史点击快讯序列数据V=[v1,v2,...,vi,...,vN]和候选快讯序列数据V′=[v1′,v2′,...,vi′,...,v′M],其中vi为第i个历史点击的快讯,i∈{1,...N},N为历史点击的快讯数量,vi′为第i个候选快讯,i∈{1,...M},M为候选快讯的数量,获取快讯的服务类型数量S;
b)使用分词工具将历史点击快讯序列中每条快讯标题转换为分词序列[x1,x2,...,xi,...,xF],将候选快讯序列中的每条快讯标题转换为分词序列[x′1,x′2,...,x′i,...,x′F],其中xi及x′i均为第i个分词,i∈{1,...F},F为快讯标题单词截取的最大长度,将分词序列[x1,x2,...,xi,...,xF]映射为词嵌入序列[e1,e2,...,ei,...,eF],将分词序列[x′1,x′2,...,x′i,...,x′F]映射为词嵌入序列[e′1,e′2,...,e′i,...,e′F],其中ei及e′i均为第i个词嵌入;
c)将词嵌入序列[e1,e2,...,ei,...,eF]及[e′1,e′2,...,e′i,...,e′F]分别输入到两个并行的双向GRU中进行语义理解,建模快讯标题的双向顺序性特征,分别得到融合双向语义的词嵌入序列[h1,h2,...,hi,...,hF]和[h′1,h′2,...,h′i,...,h′F],其中hi及h′i均为第i个融合双向语义的单词;
d)使用附加选择器分别应用于融合双向语义的词嵌入序列[h1,h2,...,hi,...,hF]和[h′1,h′2,...,h′i,...,h′F],分别得到特征增强后的词嵌入序列
Figure GDA0004217916300000021
和/>
Figure GDA0004217916300000022
其中/>
Figure GDA0004217916300000023
及/>
Figure GDA0004217916300000024
均为第i个的增强后的词嵌入;
e)使用词注意力网络为历史点击快讯序列中每条快讯标题分词分配一个权重,第i个单词的权重为αi,为候选快讯序列中的每条快讯标题转换为分词分配一个权重,第i个单词的权重为α′i
f)通过公式
Figure GDA0004217916300000025
计算得到第x个历史点击快讯的标题词嵌入的加权和cx,通过公式/>
Figure GDA0004217916300000026
计算得到第x个候选快讯的标题词嵌入的加权和c′x,x∈{1,...N},建立得到历史点击表示序列C=[c1,c2,...,cx,...,cN]和候选快讯表示序列C′=[c′1,c′2,...,c′x,...,c′N];
g)创建与快讯的服务类型数量S相同个数的兴趣代理节点Vp=[vp,1,vp,2,…,vp,i,…,vp,S],其中vp,i为用户对第i种服务类型快讯的兴趣,i∈{1,...,S},构建用户兴趣结构无向图G=(Vst,Est),式中Vst为兴趣代理节点Vp和历史点击快讯序列数据V中每条快讯为节点在内的节点集合,Est为图的边集合,Est∈<vi,vi+1>∪<vi,vp,j>,<vi,vi+1>为用户点击历史中第i个快讯vi和第i+1个快讯vi+1的无向边,<vi,vp,j>为用户点击历史中第i个快讯vi和其所属服务类型的兴趣代理节点vp,j的无向边;
h)使用图注意力网络GAT将用户兴趣结构无向图G中相同服务类型的快讯聚合到对应的兴趣代理节点Vp中,得到结构化后的兴趣代理节点表示
Figure GDA0004217916300000031
其中/>
Figure GDA0004217916300000032
为第i个结构化后的兴趣代理节点,i∈{1,...S};
i)将结构化后的兴趣代理节点表示
Figure GDA0004217916300000033
输入到多头自注意力网络的兴趣协同层中,得到增强后的兴趣节点表示/>
Figure GDA0004217916300000034
式中/>
Figure GDA0004217916300000035
为第i个增强后的兴趣节点,i∈{1,...S};
j)通过公式
Figure GDA0004217916300000036
计算得到第i个兴趣代理节点的归一化注意力权重αp,i,式中ap.i为第i个兴趣代理节点的权重,/>
Figure GDA0004217916300000037
qp为兴趣查询向量,T为转置,Dp为兴趣查询向量长度,Dp=200,Wp及bp均为用户兴趣注意力网络中可学习参数;
k)通过公式
Figure GDA0004217916300000041
计算得到所有兴趣协同增强后的代理节点的加权和u;/>
l)通过公式y=uTc′x计算得到用户和每一个候选快讯的点击概率y,选取概率最大的5个候选快讯推荐给用户。
优选的,步骤a)中N取值为128,M取值为32。
优选的,步骤b)中分词工具为jieba分词工具,使用预训练的300维Glove中文词嵌入将历史点击快讯标题的分词序列[x1,x2,...,xi,...,xF]映射为词嵌入序列[e1,e2,...,ei,...,eF],将候选快讯标题的分词序列[x′1,x′2,...,x′i,...,x′F]映射为词嵌入序列[e′1,e′2,...,e′i,...,e′F],F取值为32。
进一步的,步骤c)包括如下步骤:
c-1)中通过公式
Figure GDA0004217916300000042
计算得到hi,式中/>
Figure GDA0004217916300000043
Figure GDA0004217916300000044
Figure GDA0004217916300000045
为拼接操作,GRU(·)为GRU网络,/>
Figure GDA0004217916300000046
为正向门控循环单元中的上一时刻的隐藏状态,/>
Figure GDA0004217916300000047
为反向门控循环单元中的上一时刻的隐藏状态;
c-2)中通过公式
Figure GDA0004217916300000048
计算得到h′i,式中/>
Figure GDA0004217916300000049
Figure GDA00042179163000000410
Figure GDA00042179163000000411
为拼接操作,GRU(·)为GRU网络,/>
Figure GDA00042179163000000412
为正向门控循环单元中的上一时刻的隐藏状态,/>
Figure GDA00042179163000000413
为反向门控循环单元中的上一时刻的隐藏状态。
进一步的,步骤d)附加选择器应用于融合双向语义的词嵌入序列[h1,h2,...,hi,...,hF]和[h′1,h′2,...,h′i,...,h′F]的方法为:
d-1)通过公式
Figure GDA00042179163000000414
计算得到第i个的增强后的词嵌入/>
Figure GDA00042179163000000415
式中⊙为逐点元素相乘,Slti=σslt(Wslthi+bslt),Wslt及bslt为可学习参数,σslt(·)为RELU非线性激活函数;
d-2)通过公式
Figure GDA0004217916300000051
计算得到第i个的增强后的词嵌入/>
Figure GDA0004217916300000052
式中⊙为逐点元素相乘,Slt′i=σslt(W′slth′i+b′slt),W′slt及b′slt为可学习参数,σslt(·)为RELU非线性激活函数。
进一步的,步骤e)使用词注意力网络为每条快讯标题分配一个权重的方法为:
e-1)通过公式
Figure GDA0004217916300000053
计算得到i个单词的归一化注意力权重为αi,式中/>
Figure GDA0004217916300000054
Wt及bt均为注意力网络中可学习的参数,qt为词查询向量,T为转置,αj为第j个单词的权重,j∈{1,...F},Dt为词查询向量长度,Dt=200;
e-2)通过公式
Figure GDA0004217916300000055
计算得到i个单词的归一化注意力权重为α′i,式中/>
Figure GDA0004217916300000056
W′t及b′t均为注意力网络中可学习的参数,q′t为词查询向量,α′j为第j个单词的权重,j∈{1,...F},D′t为词查询向量长度,D′t=200。
进一步的,步骤h)中通过公式
Figure GDA0004217916300000057
计算得到第i个兴趣代理节点在第k个图注意力头中的表示/>
Figure GDA0004217916300000058
k∈{1,...K},K为图注意力头的总数,式中/>
Figure GDA0004217916300000059
为可学习的线性投影参数,/>
Figure GDA00042179163000000510
为第i个兴趣代理节点vp,i的一阶邻居集合,/>
Figure GDA0004217916300000061
为第k个图注意力头中第j个一阶邻居对兴趣代理节点vp,i的重要性参数,/>
Figure GDA0004217916300000062
式中σgat为负斜率为0.2的LeakyRELU非线性激活函数,f(·)为单层前馈神经网络,vp,i′为第i个兴趣代理节点vp,i的原始向量表示,通过公式/>
Figure GDA0004217916300000063
计算得到第i个兴趣代理点所有图注意力头产生表示的拼接/>
Figure GDA0004217916300000064
为拼接操作。
优选的,K取值为20。
进一步的,步骤i)中通过公式
Figure GDA0004217916300000065
计算得到第i个兴趣代理节点在第l个自注意力头中的表示/>
Figure GDA0004217916300000066
式中/>
Figure GDA0004217916300000067
为在第l个自注意力头中第i个兴趣代理节点和第j个兴趣代理节点之间的协同作用参数,/>
Figure GDA0004217916300000068
Figure GDA0004217916300000069
Figure GDA00042179163000000610
均为l个自注意力头中可学习的线性投影参数,T为转置,/>
Figure GDA00042179163000000611
为第j个结构化后的兴趣代理节点,j∈{1,...S},通过公式/>
Figure GDA00042179163000000612
计算得到第i个增强后的兴趣节点/>
Figure GDA00042179163000000613
为拼接操作,L为自注意力中注意力头的总数。
优选的,L取值为20。
本发明的有益效果是:充分考虑了快讯的双向语义信息,无需大量特征工程,并设计了一种附加选择器以增强快讯的特征,有效增强了最终的企业服务快讯表示;本发明提出的用户兴趣表示学习方法通过构建用户兴趣结构无向图,利用图注意力网络可以一种显示的方式结构化编码用户的多种潜在兴趣,这可以提取更加精确的用户兴趣表示;本发明提出的用户兴趣表示学习方法充分考虑了用户多种潜在兴趣之间的相互作用,利用自注意力网络模拟兴趣之间的作用关系有效增强了用户兴趣表示;本发明得益于良好的企业服务快讯表示学习方法和用户兴趣表示学习方法,有效提高了企业服务快讯推荐的准确性。
附图说明
图1为本发明的模型结构图。
具体实施方式
下面结合附图1对本发明做进一步说明。
一种基于结构化多兴趣协同的企业服务快讯推荐方法,该方法提出利用并行的GRU网络建模企业服务快讯(以下简称为“快讯”)标题双向语义信息,进一步结合提出的附加选择器有效增强快讯的表示效果。该方法提出将用户点击历史和兴趣代理节点相结合构建用户兴趣结构图,通过图注意力网络显式提取用户结构化的多兴趣,并利用自注意力网络建模兴趣之间的相互作用关系以有效增强用户兴趣表示的效果。最终在良好表示基础上有效提高快讯推荐效果。具体的包括如下步骤:
a)获取用户的历史点击快讯序列数据V=[v1,v2,...,vi,...,vN]和候选快讯序列数据V′=[v′1,v′2,...,v′i,...,v′M],其中vi为第i个历史点击的快讯,i∈{1,...N},N为历史点击的快讯数量,v′i为第i个候选快讯,i∈{1,...M},M为候选快讯的数量,获取快讯的服务类型数量S。
b)使用分词工具将历史点击快讯序列中每条快讯标题转换为分词序列[x1,x2,...,xi,...,xF],将候选快讯序列中的每条快讯标题转换为分词序列[x′1,x′2,...,x′i,...,x′F],其中xi及x′i均为第i个分词,i∈{1,...F},F为快讯标题单词截取的最大长度,将分词序列[x1,x2,...,xi,...,xF]映射为词嵌入序列[e1,e2,...,ei,...,eF],将分词序列[x′1,x′2,...,x′i,...,x′F]映射为词嵌入序列[e′1,e′2,...,e′i,...,e′F],其中ei及e′i均为第i个词嵌入。
c)将词嵌入序列[e1,e2,...,ei,...,eF]及[e′1,e′2,...,e′i,...,e′F]分别输入到两个并行的双向GRU中进行语义理解,建模快讯标题的双向顺序性特征,分别得到融合双向语义的词嵌入序列[h1,h2,...,hi,...,hF]和[h′1,h′2,...,h′i,...,h′F],其中hi及h′i均为第i个融合双向语义的单词。
d)使用附加选择器分别应用于融合双向语义的词嵌入序列[h1,h2,...,hi,...,hF]和[h′1,h′2,...,h′i,...,h′F],分别得到特征增强后的词嵌入序列
Figure GDA0004217916300000081
和/>
Figure GDA0004217916300000082
其中/>
Figure GDA0004217916300000083
及/>
Figure GDA0004217916300000084
均为第i个的增强后的词嵌入。
e)使用词注意力网络为历史点击快讯序列中每条快讯标题分词分配一个权重,第i个单词的权重为αi,为候选快讯序列中的每条快讯标题转换为分词分配一个权重,第i个单词的权重为α′i
f)通过公式
Figure GDA0004217916300000085
计算得到第x个历史点击快讯的标题词嵌入的加权和cx,通过公式/>
Figure GDA0004217916300000086
计算得到第x个候选快讯的标题词嵌入的加权和c′x,x∈{1,...N},建立得到历史点击表示序列C=[c1,c2,...,cx,...,cN]和候选快讯表示序列C′=[c′1,c′2,...,c′x,...,c′N]。/>
g)创建与快讯的服务类型数量S相同个数的兴趣代理节点Vp=[vp,1,vp,2,...,vp,i,...,vp,S],其中vp,i为用户对第i种服务类型快讯的兴趣,i∈{1,...,S},构建用户兴趣结构无向图G=(Vst,Est),式中Vst为兴趣代理节点Vp和历史点击快讯序列数据V中每条快讯为节点(重复快讯视为不同节点)在内的节点集合,Est为图的边集合,Est∈<vi,vi+1>∪<vi,vp,j>,<vi,vi+1>为用户点击历史中第i个快讯vi和第i+1个快讯vi+1的无向边,即用户在点击了快讯vi之后点击了快讯vi+1,<vi,vp,j>为用户点击历史中第i个快讯vi和其所属服务类型的兴趣代理节点vp,j的无向边,即用户点击的快讯vi的服务类型为j。
h)使用图注意力网络(GAT)将用户兴趣结构无向图G中相同服务类型的快讯聚合到对应的兴趣代理节点Vp中,得到结构化后的兴趣代理节点表示
Figure GDA0004217916300000091
每一个兴趣代理节点代表了用户对该类型快讯的兴趣,其中
Figure GDA0004217916300000092
为第i个结构化后的兴趣代理节点,i∈{1,...S}。
i)用户兴趣之间并不是孤立存在的,用户兴趣之间的协同作用对于学习用户兴趣表示十分重要,因此将结构化后的兴趣代理节点表示
Figure GDA0004217916300000093
输入到多头自注意力网络的兴趣协同层中,得到增强后的兴趣节点表示/>
Figure GDA0004217916300000094
式中/>
Figure GDA0004217916300000095
为第i个增强后的兴趣节点,i∈{1,...S}。兴趣协同层是由多头自注意力网络建模兴趣代理节点之间的协同关系。
j)通过公式
Figure GDA0004217916300000096
计算得到第i个兴趣代理节点的归一化注意力权重αp,i,式中ap.i为第i个兴趣代理节点的权重,/>
Figure GDA0004217916300000097
qp为兴趣查询向量,T为转置,Dp为兴趣查询向量长度,Dp=200,Wp及bp均为用户兴趣注意力网络中可学习参数。k)通过公式/>
Figure GDA0004217916300000101
计算得到所有兴趣协同增强后的代理节点的加权和u。
l)通过公式y=uTc′x计算得到用户和每一个候选快讯的点击概率y,点击概率y表示用户对第i个候选快讯点击概率大小,y越大则点击概率越大,选取概率最大的5个候选快讯推荐给用户。
充分考虑了快讯的双向语义信息,无需大量特征工程,并设计了一种附加选择器以增强快讯的特征,有效增强了最终的企业服务快讯表示;本发明提出的用户兴趣表示学习方法通过构建用户兴趣结构无向图,利用图注意力网络可以一种显示的方式结构化编码用户的多种潜在兴趣,这可以提取更加精确的用户兴趣表示;
本发明提出的用户兴趣表示学习方法充分考虑了用户多种潜在兴趣之间的相互作用,利用自注意力网络模拟兴趣之间的作用关系有效增强了用户兴趣表示;本发明得益于良好的企业服务快讯表示学习方法和用户兴趣表示学习方法,有效提高了企业服务快讯推荐的准确性。
实施例1:
优选的,步骤a)中N取值为128,M取值为32。
实施例2:
步骤b)中分词工具为jieba分词工具,使用预训练的300维Glove中文词嵌入将历史点击快讯标题的分词序列[x1,x2,...,xi,...,xF]映射为词嵌入序列[e1,e2,...,ei,...,eF],将候选快讯标题的分词序列[x′1,x′2,...,x′i,...,x′F]映射为词嵌入序列[e′1,e′2,...,e′i,...,e′F],F取值为32。
实施例3:
步骤c)包括如下步骤:
c-1)中通过公式
Figure GDA0004217916300000102
计算得到hi,式中/>
Figure GDA0004217916300000103
Figure GDA0004217916300000104
Figure GDA0004217916300000105
为拼接操作,GRU(·)为GRU网络,/>
Figure GDA0004217916300000106
为正向门控循环单元中的上一时刻的隐藏状态,/>
Figure GDA0004217916300000111
为反向门控循环单元中的上一时刻的隐藏状态。
c-2)中通过公式
Figure GDA0004217916300000112
计算得到h′i,式中/>
Figure GDA0004217916300000113
Figure GDA0004217916300000114
Figure GDA0004217916300000115
为拼接操作,GRU(·)为GRU网络,/>
Figure GDA0004217916300000116
为正向门控循环单元中的上一时刻的隐藏状态,/>
Figure GDA0004217916300000117
为反向门控循环单元中的上一时刻的隐藏状态。
实施例4:
步骤d)附加选择器应用于融合双向语义的词嵌入序列[h1,h2,...,hi,...,hF]和[h′1,h′2,...,h′i,...,h′F]的方法为:
d-1)通过公式
Figure GDA0004217916300000118
计算得到第i个的增强后的词嵌入/>
Figure GDA0004217916300000119
式中⊙为逐点元素相乘,Slti=σslt(Wslthi+bslt),Wslt及bslt为可学习参数,σslt(·)为RELU非线性激活函数。
d-2)通过公式
Figure GDA00042179163000001110
计算得到第i个的增强后的词嵌入/>
Figure GDA00042179163000001111
式中⊙为逐点元素相乘,Slt′i=σslt(W′slth′i+b′slt),W′slt及b′slt为可学习参数,σslt(·)为RELU非线性激活函数。
实施例5:
步骤e)使用词注意力网络为每条快讯标题分配一个权重的方法为:
e-1)通过公式
Figure GDA00042179163000001112
计算得到i个单词的归一化注意力权重为αi,式中/>
Figure GDA00042179163000001113
Wt及bt均为注意力网络中可学习的参数,qt为词查询向量,T为转置,αj为第j个单词的权重,j∈{1,...F},Dt为词查询向量长度,Dt=200。/>
e-2)通过公式
Figure GDA0004217916300000121
计算得到i个单词的归一化注意力权重为α′i,式中/>
Figure GDA0004217916300000122
Wt′及b′t均为注意力网络中可学习的参数,q′t为词查询向量,α′j为第j个单词的权重,j∈{1,...F},D′t为词查询向量长度,D′t=200。
实施例6:
步骤h)中通过公式
Figure GDA0004217916300000123
计算得到第i个兴趣代理节点在第k个图注意力头中的表示/>
Figure GDA0004217916300000124
k∈{1,...K},K为图注意力头的总数,式中/>
Figure GDA0004217916300000125
为可学习的线性投影参数,/>
Figure GDA0004217916300000126
为第i个兴趣代理节点vp,i的一阶邻居集合,/>
Figure GDA0004217916300000127
为第k个图注意力头中第j个一阶邻居对兴趣代理节点vp,i的重要性参数,/>
Figure GDA0004217916300000128
式中σgat为负斜率为0.2的LeakyRELU非线性激活函数,f(·)为单层前馈神经网络,vp,i′为第i个兴趣代理节点vp,i的原始向量表示,通过公式/>
Figure GDA0004217916300000129
计算得到第i个兴趣代理点所有图注意力头产生表示的拼接/>
Figure GDA00042179163000001210
为拼接操作。
实施例7:
K取值为20。
实施例8:
步骤i)中通过公式
Figure GDA0004217916300000131
计算得到第i个兴趣代理节点在第l个自注意力头中的表示/>
Figure GDA0004217916300000132
式中/>
Figure GDA0004217916300000133
为在第l个自注意力头中第i个兴趣代理节点和第j个兴趣代理节点之间的协同作用参数,/>
Figure GDA0004217916300000134
Figure GDA0004217916300000135
及/>
Figure GDA0004217916300000136
均为l个自注意力头中可学习的线性投影参数,T为转置,/>
Figure GDA0004217916300000137
为第j个结构化后的兴趣代理节点,j∈{1,...S},通过公式/>
Figure GDA0004217916300000138
计算得到第i个增强后的兴趣节点/>
Figure GDA0004217916300000139
为拼接操作,L为自注意力中注意力头的总数。
实施例9:
L取值为20。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于结构化多兴趣协同的企业服务快讯推荐方法,其特征在于,包括如下步骤:
a)获取用户的历史点击快讯序列数据V=[v1,v2,...,vi,...,vN]和候选快讯序列数据V′=[v′1,v′2,...,v′i,...,v′M],其中vi为第i个历史点击的快讯,i∈{1,...N},N为历史点击的快讯数量,v′i为第i个候选快讯,i∈{1,...M},M为候选快讯的数量,获取快讯的服务类型数量S;
b)使用分词工具将历史点击快讯序列中每条快讯标题转换为分词序列[x1,x2,...,xi,...,xF],将候选快讯序列中的每条快讯标题转换为分词序列[x′1,x′2,...,x′i,...,x′F],其中xi及x′i均为第i个分词,i∈{1,...F},F为快讯标题单词截取的最大长度,将分词序列[x1,x2,...,xi,...,xF]映射为词嵌入序列[e1,e2,...,ei,...,eF],将分词序列[x′1,x′2,...,x′i,...,x′F]映射为词嵌入序列[e′1,e′2,...,e′i,...,e′F],其中ei及e′i均为第i个词嵌入;
c)将词嵌入序列[e1,e2,...,ei,...,eF]及[e′1,e′2,...,e′i,...,e′F]分别输入到两个并行的双向GRU中进行语义理解,建模快讯标题的双向顺序性特征,分别得到融合双向语义的词嵌入序列[h1,h2,...,hi,...,hF]和[h′1,h′2,...,h′i,...,h′F],其中hi及h′i均为第i个融合双向语义的单词;
d)使用附加选择器分别应用于融合双向语义的词嵌入序列[h1,h2,...,hi,...,hF]和[h′1,h′2,...,h′i,...,h′F],分别得到特征增强后的词嵌入序列
Figure FDA0004217916290000011
Figure FDA0004217916290000012
其中/>
Figure FDA0004217916290000013
及/>
Figure FDA0004217916290000014
均为第i个的增强后的词嵌入;
e)使用词注意力网络为历史点击快讯序列中每条快讯标题分词分配一个权重,第i个单词的权重为αi,为候选快讯序列中的每条快讯标题转换为分词分配一个权重,第i个单词的权重为α′i
f)通过公式
Figure FDA0004217916290000029
计算得到第x个历史点击快讯的标题词嵌入的加权和cx,通过公式/>
Figure FDA0004217916290000022
计算得到第x个候选快讯的标题词嵌入的加权和c′x,x∈{1,...N},建立得到历史点击表示序列C=[c1,c2,...,cx,...,cN]和候选快讯表示序列C′=[c′1,c′2,...,c′x,...,c′N];
g)创建与快讯的服务类型数量S相同个数的兴趣代理节点Vp=[vp,1,vp,2,...,vp,i,...,vp,S],其中vp,i为用户对第i种服务类型快讯的兴趣,i∈{1,...,S},构建用户兴趣结构无向图G=(Vst,Est),式中Vst为兴趣代理节点Vp和历史点击快讯序列数据V中每条快讯为节点在内的节点集合,Est为图的边集合,Est∈<vi,vi+1>∪<vi,vp,j>,<vi,vi+1>为用户点击历史中第i个快讯vi和第i+1个快讯vi+1的无向边,<vi,vp,j>为用户点击历史中第i个快讯vi和其所属服务类型的兴趣代理节点vp,j的无向边;
h)使用图注意力网络GAT将用户兴趣结构无向图G中相同服务类型的快讯聚合到对应的兴趣代理节点Vp中,得到结构化后的兴趣代理节点表示
Figure FDA0004217916290000023
其中/>
Figure FDA0004217916290000024
为第i个结构化后的兴趣代理节点,i∈{1,...S};
i)将结构化后的兴趣代理节点表示
Figure FDA0004217916290000025
输入到多头自注意力网络的兴趣协同层中,得到增强后的兴趣节点表示/>
Figure FDA0004217916290000026
式中/>
Figure FDA0004217916290000027
为第i个增强后的兴趣节点,i∈{1,...S};
j)通过公式
Figure FDA0004217916290000028
计算得到第i个兴趣代理节点的归一化注意力权重αp,i,式中ap.i为第i个兴趣代理节点的权重,/>
Figure FDA0004217916290000031
qp为兴趣查询向量,T为转置,Dp为兴趣查询向量长度,Dp=200,Wp及bp均为用户兴趣注意力网络中可学习参数;
k)通过公式
Figure FDA0004217916290000032
计算得到所有兴趣协同增强后的代理节点的加权和u;
l)通过公式y=uTc′x计算得到用户和每一个候选快讯的点击概率y,选取概率最大的5个候选快讯推荐给用户。
2.根据权利要求1所述的基于结构化多兴趣协同的企业服务快讯推荐方法,其特征在于:步骤a)中N取值为128,M取值为32。
3.根据权利要求1所述的基于结构化多兴趣协同的企业服务快讯推荐方法,其特征在于:步骤b)中分词工具为jieba分词工具,使用预训练的300维Glove中文词嵌入将历史点击快讯标题的分词序列[x1,x2,...,xi,...,xF]映射为词嵌入序列[e1,e2,...,ei,...,eF],将候选快讯标题的分词序列[x′1,x′2,...,x′i,...,x′F]映射为词嵌入序列[e′1,e′2,...,e′i,...,e′F],F取值为32。
4.根据权利要求1所述的基于结构化多兴趣协同的企业服务快讯推荐方法,其特征在于,步骤c)包括如下步骤:
c-1)中通过公式
Figure FDA0004217916290000033
计算得到hi,式中/>
Figure FDA0004217916290000034
Figure FDA0004217916290000035
Figure FDA0004217916290000036
为拼接操作,GRU(·)为GRU网络,/>
Figure FDA0004217916290000037
为正向门控循环单元中的上一时刻的隐藏状态,
Figure FDA0004217916290000038
为反向门控循环单元中的上一时刻的隐藏状态;
c-2)中通过公式
Figure FDA0004217916290000041
计算得到h′i,式中/>
Figure FDA0004217916290000042
Figure FDA0004217916290000043
Figure FDA0004217916290000044
为拼接操作,GRU(·)为GRU网络,/>
Figure FDA0004217916290000045
为正向门控循环单元中的上一时刻的隐藏状态,
Figure FDA0004217916290000046
为反向门控循环单元中的上一时刻的隐藏状态。
5.根据权利要求1所述的基于结构化多兴趣协同的企业服务快讯推荐方法,其特征在于,步骤d)附加选择器应用于融合双向语义的词嵌入序列[h1,h2,...,hi,...,hF]和[h′1,h′2,...,h′i,...,h′F]的方法为:
d-1)通过公式
Figure FDA0004217916290000047
计算得到第i个的增强后的词嵌入/>
Figure FDA0004217916290000048
式中⊙为逐点元素相乘,Slti=σslt(Wslthi+bslt),Wslt及bslt为可学习参数,σslt(·)为RELU非线性激活函数;
d-2)通过公式
Figure FDA0004217916290000049
计算得到第i个的增强后的词嵌入/>
Figure FDA00042179162900000410
式中⊙为逐点元素相乘,Slt′i=σslt(W′slth′i+b′slt),W′slt及b′slt为可学习参数,σslt(·)为RELU非线性激活函数。
6.根据权利要求1所述的基于结构化多兴趣协同的企业服务快讯推荐方法,其特征在于,步骤e)使用词注意力网络为每条快讯标题分配一个权重的方法为:
e-1)通过公式
Figure FDA00042179162900000411
计算得到i个单词的归一化注意力权重为αi,式中
Figure FDA00042179162900000412
Wt及bt均为注意力网络中可学习的参数,qt为词查询向量,T为转置,αj为第j个单词的权重,j∈{1,...F},Dt为词查询向量长度,Dt=200;
e-2)通过公式
Figure FDA00042179162900000413
计算得到i个单词的归一化注意力权重为α′i,式中
Figure FDA0004217916290000051
W′t及b′t均为注意力网络中可学习的参数,q′t为词查询向量,α′j为第j个单词的权重,j∈{1,...F},D′t为词查询向量长度,D′t=200。
7.根据权利要求1所述的基于结构化多兴趣协同的企业服务快讯推荐方法,其特征在于:步骤h)中通过公式
Figure FDA0004217916290000052
计算得到第i个兴趣代理节点在第k个图注意力头中的表示/>
Figure FDA0004217916290000053
K为图注意力头的总数,式中/>
Figure FDA0004217916290000054
为可学习的线性投影参数,/>
Figure FDA0004217916290000055
为第i个兴趣代理节点vp,i的一阶邻居集合,/>
Figure FDA0004217916290000056
为第k个图注意力头中第j个一阶邻居对兴趣代理节点vp,i的重要性参数,/>
Figure FDA0004217916290000057
式中σgat为负斜率为0.2的LeakyRELU非线性激活函数,f(·)为单层前馈神经网络,vp,i′为第i个兴趣代理节点vp,i的原始向量表示,通过公式/>
Figure FDA0004217916290000058
计算得到第i个兴趣代理点所有图注意力头产生表示的拼接/>
Figure FDA0004217916290000059
Figure FDA00042179162900000510
为拼接操作。
8.根据权利要求7所述的基于结构化多兴趣协同的企业服务快讯推荐方法,其特征在于:K取值为20。
9.根据权利要求1所述的基于结构化多兴趣协同的企业服务快讯推荐方法,其特征在于:步骤i)中通过公式
Figure FDA0004217916290000061
计算得到第i个兴趣代理节点在第l个自注意力头中的表示/>
Figure FDA0004217916290000062
式中/>
Figure FDA0004217916290000063
为在第l个自注意力头中第i个兴趣代理节点和第j个兴趣代理节点之间的协同作用参数,/>
Figure FDA0004217916290000064
Figure FDA0004217916290000065
及/>
Figure FDA0004217916290000066
均为l个自注意力头中可学习的线性投影参数,T为转置,/>
Figure FDA0004217916290000067
为第j个结构化后的兴趣代理节点,j∈{1,...S},通过公式/>
Figure FDA0004217916290000068
计算得到第i个增强后的兴趣节点
Figure FDA0004217916290000069
Figure FDA00042179162900000610
为拼接操作,L为自注意力中注意力头的总数。
10.根据权利要求9所述的基于结构化多兴趣协同的企业服务快讯推荐方法,其特征在于:L取值为20。
CN202210918943.7A 2022-08-01 2022-08-01 一种基于结构化多兴趣协同的企业服务快讯推荐方法 Active CN115357783B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210918943.7A CN115357783B (zh) 2022-08-01 2022-08-01 一种基于结构化多兴趣协同的企业服务快讯推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210918943.7A CN115357783B (zh) 2022-08-01 2022-08-01 一种基于结构化多兴趣协同的企业服务快讯推荐方法

Publications (2)

Publication Number Publication Date
CN115357783A CN115357783A (zh) 2022-11-18
CN115357783B true CN115357783B (zh) 2023-06-06

Family

ID=84031325

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210918943.7A Active CN115357783B (zh) 2022-08-01 2022-08-01 一种基于结构化多兴趣协同的企业服务快讯推荐方法

Country Status (1)

Country Link
CN (1) CN115357783B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254782A (zh) * 2021-06-15 2021-08-13 济南大学 问答社区专家推荐方法及***
CN113254803A (zh) * 2021-06-24 2021-08-13 暨南大学 一种基于多特征异质图神经网络的社交推荐方法
CN113590970A (zh) * 2021-08-11 2021-11-02 东北林业大学 一种基于读者偏好的个性化数字图书推荐***、方法、计算机及存储介质
WO2022007526A1 (zh) * 2020-07-07 2022-01-13 云境商务智能研究院南京有限公司 一种基于多视图注意力机制的旅游包推荐方法
CN114625954A (zh) * 2020-12-11 2022-06-14 阿里巴巴集团控股有限公司 信息推荐、模型训练、信息表征方法、装置及设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022007526A1 (zh) * 2020-07-07 2022-01-13 云境商务智能研究院南京有限公司 一种基于多视图注意力机制的旅游包推荐方法
CN114625954A (zh) * 2020-12-11 2022-06-14 阿里巴巴集团控股有限公司 信息推荐、模型训练、信息表征方法、装置及设备
CN113254782A (zh) * 2021-06-15 2021-08-13 济南大学 问答社区专家推荐方法及***
CN113254803A (zh) * 2021-06-24 2021-08-13 暨南大学 一种基于多特征异质图神经网络的社交推荐方法
CN113590970A (zh) * 2021-08-11 2021-11-02 东北林业大学 一种基于读者偏好的个性化数字图书推荐***、方法、计算机及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于异构图卷积网络的推荐算法研究";熊丽雯;《中国优秀硕士学位论文全文数据库 (信息科技辑)》;2022年(第05期);I138-1139 *

Also Published As

Publication number Publication date
CN115357783A (zh) 2022-11-18

Similar Documents

Publication Publication Date Title
Xu et al. Adapting user preference to online feedback in multi-round conversational recommendation
Lei et al. Estimation-action-reflection: Towards deep interaction between conversational and recommender systems
Zhou et al. Personalized learning full-path recommendation model based on LSTM neural networks
Ou et al. Asymmetric transitivity preserving graph embedding
Gerede et al. Automated composition of e-services: Lookaheads
Ghosal et al. DeepSentiPeer: Harnessing sentiment in review texts to recommend peer review decisions
US20140270497A1 (en) Accurate text classification through selective use of image data
CN113961759B (zh) 基于属性图表示学习的异常检测方法
Wen et al. Neural attention model for recommendation based on factorization machines
Rahmani et al. Category-aware location embedding for point-of-interest recommendation
CN112016002A (zh) 融合评论文本层级注意力和时间因素的混合推荐方法
CN113486190A (zh) 一种融合实体图像信息和实体类别信息的多模态知识表示方法
Jin et al. Task-oriented web user modeling for recommendation
CN112417063B (zh) 一种基于异构关系网络的相容功能项推荐方法
WO2023115884A1 (zh) 有序分类标签确定方法、装置、电子设备及存储介质
Shahmohammadi et al. Identification of System Software Components Using Clustering Approach.
Li et al. Learning dynamic user interest sequence in knowledge graphs for click-through rate prediction
Yao et al. RLPS: A reinforcement learning–based framework for personalized search
Rostami et al. A deep learning-based expert finding method to retrieve agile software teams from CQAs
Magdum et al. Mining online reviews and tweets for predicting sales performance and success of movies
CN115357783B (zh) 一种基于结构化多兴趣协同的企业服务快讯推荐方法
CN117112794A (zh) 一种基于知识增强的多粒度政务服务事项推荐方法
Yang et al. Personalized recommendation based on collaborative filtering in social network
Liu et al. FedFV: federated face verification via equivalent class embeddings
Xiao et al. Rtn-gnnr: Fusing review text features and node features for graph neural network recommendation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant