CN115630153A - 一种基于大数据技术的研究生文献资源推荐方法 - Google Patents

一种基于大数据技术的研究生文献资源推荐方法 Download PDF

Info

Publication number
CN115630153A
CN115630153A CN202211409115.7A CN202211409115A CN115630153A CN 115630153 A CN115630153 A CN 115630153A CN 202211409115 A CN202211409115 A CN 202211409115A CN 115630153 A CN115630153 A CN 115630153A
Authority
CN
China
Prior art keywords
user
information
item
learning
project
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211409115.7A
Other languages
English (en)
Inventor
师娇
许勇
李中行
吴小坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202211409115.7A priority Critical patent/CN115630153A/zh
Publication of CN115630153A publication Critical patent/CN115630153A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于大数据技术的研究生文献资源推荐方法,包括:基于相似度的预推荐方法和基于深度学习的个性化推荐方法;基于相似度的预推荐方法初步衡量用户感兴趣文献,为用户生成推荐表,通过用户反馈收集用户‑项目交互信息;基于深度学习的个性化推荐方法首先生成个性化用户及项目表示,采用图神经网络构建用户‑项目交互关联,利用可学习超图网络建立用户‑用户、项目‑项目全局关联,结合预推荐方法生成标签优化推荐策略。本发明根据研究生研究性学习活动规律,引进个性化推荐策略,通过采用大数据信息技术,实现了以研究生个性化研究性学习需求驱动为中心的精准文献资源推荐。

Description

一种基于大数据技术的研究生文献资源推荐方法
技术领域
本发明涉及个性化文献资源推荐领域,尤其涉及一种基于大数据技术的研究生文献资源推荐方法。
背景技术
随着互联网技术的飞速发展,以网络作为媒介进行在线文献检索和学习已经成为研究人员获取学术信息并及时了解研究进展与前沿的常态化活动。然而学术搜索引擎上海量的文献资源也带来了严重的信息过载和不对称问题,以及学习迷航问题。引入个性化推荐策略正是解决上述问题的有效策略。文献资源个性化推荐的实现依赖对用户,即文献资源使用者的研究人员需求的分析和建模。相较于经验老道的研究人员,研究生群体属于科研新手,其科研活动经验有限,发表的论文数量可能较少甚至没有,根据已有科研活动和研究成果来分析其研究兴趣的传统建模分析模式很难适应研究生群体的实际。研究生的研究课题主要来源于其导师或团队,导师或团队已有的研究基础是研究生开展课题研究的重要依托,在文献检索时除关注研究领域的前沿动态,同时也关注相同或相近课题团队的研究进展。目前尚没有针对研究生群体的文献资源推荐方法。对此,发明人设计了以研究生研究性学习活动规律为依据,依托大数据技术的文献资源个性化推荐方法。
发明内容
本发明实施例提供一种基于大数据技术的研究生文献资源推荐方法,根据不同研究生基本信息和文献阅读规律个性化推荐其感兴趣文献,提高研究生文献检索效率与学习效率。
本发明实施例提供了一种基于大数据技术的研究生文献资源推荐方法,包括:
获取用户感兴趣研究领域信息;
基于相似度的预推荐方法,将用户感兴趣研究领域信息和预设文献类型进行匹配,得到相似度;
将相似度按照由高到低的顺序对文献类型进行排列,得到初步用户文献推荐表;
获取用户反馈信息;
根据用户反馈信息和初步用户文献推荐表,得到用户-项目交互信息;
基于深度学习的个性化推荐方法,根据用户-项目交互信息,将文献资源按照模块进行分别推荐;
所述基于深度学习的个性化推荐方法:搭建自监督深度学习网格,包括:用户/项目个性化表示模块;用户-项目交互表示模块;用户- 用户、项目-项目全局关联模块;自监督增强学习模块以及迭代式更新模块。
本方案中,所述基于相似度的预推荐方法,还包括:
获取用户的表征文本信息;
基于预设向量空间模型(VSM),将用户的表征从文本形式映射到高维向量空间中(用户);
将不同文献类型映射到相同空间中(项目);
将用户-项目两类向量在对应空间进行匹配,得到相似度;
通过判断用户-项目两类向量在该空间的相似度是否大于预设相似度阈值,若是,则将对应文献类型设为对应用户感兴趣的类型文献;若否,则不感兴趣。
本方案中,所述基于相似度的预推荐方法,还包括:
将文献按照相似度从高到低进行排序;
获取用户端对所推荐的文献资源与其现阶段研究需求匹配情况进行的二分类判断信息;
根据所述用户端对所推荐的文献资源与其现阶段研究需求匹配情况进行的二分类判断信息,得到下一次推荐文献资源信息和用户- 项目交互表。
本方案中,所述用户/项目个性化表示模块,具体为:
获取用户信息;
基于融合用户多信息的方式,得到用户个性化表示信息;
将用户信息发送至预设嵌入层,得到用户信息生成嵌入表示信息;
根据注意力网络衡量不同特征对推荐任务的影响权重,并利用全连接网络层融合不同权值特征,得到用户初级表征信息;
根据预设嵌入层为不同文献类型生成嵌入表示,得到项目初级表征信息。
本方案中,所述用户-项目交互表示模块,具体为:
根据预设的图卷积网络的消息传递机制,得到更新用户/项目表示信息;
将项目-交互表信息发送至预设的图卷积网络,得到用户-项目交互图;
通过聚合邻接节点表示学习用户-项目局部交互关系,得到第一对比学习视图。
本方案中,所述用户-用户、项目-项目全局关联模块,具体为:
采用可学习超图结构进行关联学习;
所述可学习超图结构由一组可学习超边组成,不同的用户/项目作为不同节点,每条可学习超边作为信息枢纽,以不同的权重连接所有的用户/项目,从全局的视角中聚集所有用户/项目的信息以更新自身节点的嵌入表示,得到第二对比学习视图;
不同的超边作为不同的通道从多个的语义维度捕获用户-用户、项目-项目之间的复杂连接关系。
本方案中,所述可学习超图网络结构,具体为:
通过低秩分解的方法生成可学习超图参数矩阵;
根据权利要求4所述的用户初级表征与项目初级表征,结合可学习多层感知机网络,生成可学习超图结构。
本方案中,所述自监督增强学习模块,具体为:
采用对比学习方法,将不同视图作为对比学习对象,利用互信息最大化机制优化模型梯度;
将权利要求5所述的第一对比学习视图与权利要求6所述的第二对比学习视图进行对比学习;将不同视图下相同用户/项目作为正例对;将不同视图下不同用户/项目作为负例对,以互信息最大化函数作为优化方程,得到具有辨别性的用户/项目表征。
本方案中,所述自监督增强学习模块,还包括:
将用户数据通过数据增强缓解数据噪声;
将用户-项目交互图进行随机掩码并发送至图卷积网络,得到第三对比学习视图;
将第三对比学习视图与第一对比学习视图进行协同监督。
本方案中,所述迭代式更新模块,具体为:采用迭代式更新策略,对用户-项目交互表以及模型参数进行周期性更新。
本发明通过采用自监督增强学***滑的问题。特别地,对于数据稀疏问题,采用局部-全局特征对比学***滑的问题,通过设计可学***滑问题。
另一方面,本发明通过预推荐策略收集用户-项目交互信息,为后续个性化推荐算法生成可监督标签。传统方法在无监督条件下仅根据研究生所属研究领域等单一信息进行粗略推荐,无法进一步捕获研究生的文献阅读规律。通过设计个性化推荐算法,深入挖掘研究生的文献阅读偏好和阅读兴趣,为其推荐更具价值的文献,减少文献检索时间,提高学习效率。
附图说明
图1示出了本发明一种基于大数据技术的研究生文献资源推荐方法的流程图;
图2示出了本发明提供的一种基于大数据技术的研究生文献资源推荐方法架构图;
图3示出了本发明提供的一种基于深度学习的个性化推荐方法架构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
特别的,一种基于大数据技术的研究生文献资源推荐方法,可视为研究生文献推荐***。在本发明描述中,按照一般推荐***的描述惯例,将研究生描述为用户,将文献类型描述为项目。设用户集合 U={u1,u2,u3,…,uj,…,uJ},项目集合I={i1,i2,i3,…,ik,…,iK}。
图1示出了本发明一种基于大数据技术的研究生文献资源推荐方法的流程图。
如图1所示,本发明公开了一种基于大数据技术的研究生文献资源推荐方法,包括:
S102,获取用户感兴趣研究领域信息;
S104,基于相似度的预推荐方法,将用户感兴趣研究领域信息和预设文献类型进行匹配,得到相似度;
S106,将相似度按照由高到低的顺序对文献类型进行排列,得到初步用户文献推荐表;
S108,获取用户反馈信息;
S110,根据用户反馈信息和初步用户文献推荐表,得到用户-项目交互信息;
S112,基于深度学习的个性化推荐方法,根据用户-项目交互信息,将文献资源按照模块进行分别推荐。
需要说明的是,提取用户感兴趣研究领域信息中的关键词,并将所述关键词设为用户“标签”。将和用户感兴趣研究领域信息相似度最高的文献优先排列,按照相似度由高到低的顺序,得到初步用户文献推荐表并反馈至用户端,获取用户对初步用户文献推荐表的反馈信息,比如:对甲文献不满意,对乙文献满意。根据所述反馈信息和初步用户文献推荐表,得到用户-项目交互信息。所述基于深度学习的个性化推荐方法需要搭建自监督深度学习网格,包括:用户/项目个性化表示模块;用户-项目交互表示模块;用户-用户、项目-项目全局关联模块;自监督增强学习模块以及迭代式更新模块。
根据本发明实施例,所述基于相似度的预推荐方法,还包括:
获取用户的表征文本信息;
基于预设向量空间模型(VSM),将用户的表征从文本形式映射到高维向量空间中(用户);
将不同文献类型映射到相同空间中(项目);
将用户-项目两类向量在对应空间进行匹配,得到相似度;
通过判断用户-项目两类向量在该空间的相似度是否大于预设相似度阈值,若是,则将对应文献类型设为对应用户感兴趣的类型文献;若否,则不感兴趣。
需要说明的是,基于相似度的预推荐方法,采用向量空间模型 (VSM)将每用户和项目从文本形式映射到高维向量空间中(用户);类似地,再次采用向量空间模型将不同文献类型映射到相同空间中 (项目);通过判断用户-项目两类向量在该空间的相似度,初步为用户推荐可能感兴趣的类型文献。比如:预设相似度阈值为80,则当用户-项目两类向量在对应空间的相似度大于80时,对应文献类型为该用户可能感兴趣的类型文献。
根据本发明实施例,所述基于相似度的预推荐方法,还包括:
将文献按照相似度从高到低进行排序;
获取用户端对所推荐的文献资源与其现阶段研究需求匹配情况进行的二分类判断信息;
根据所述用户端对所推荐的文献资源与其现阶段研究需求匹配情况进行的二分类判断信息,得到下一次推荐文献资源信息和用户- 项目交互表。
需要说明的是,所述基于相似度的预推荐方法,将文献按照相似度从高到低进行排序,每次为用户推荐n篇最相关文献,n表示大于 0的自然整数,比如n=20。用户可对所推荐文献资源与其现阶段研究需求匹配情况进行二分类判断(满意与否),并在用户判断完成后自动生成下一次推荐。
特别的,所述文献采用所述向量空间模型将文献题目及关键字映射到所述高维向量空间,与项目(文献类型)进行相关度匹配。所述最相关文献,首先从第一相关项目中选取相关度最高的前n篇文献,如果用户对所推荐文献判断为满意,则继续从所述最相关项目中按照相关度选取第n+1-2n篇文献;如果用户判断为不满意,则从第二相关项目中选取相关度最高的前n篇文献进行推荐,依次类推。
通过迭代进行上述操作采集用户-项目交互表,为所述基于深度学习的个性化推荐方法生成标签数据。即如果用户对所推荐文献判断为满意,则令该用户对该项目交互数加1,反之则不操作。
根据本发明实施例,所述用户/项目个性化表示模块,具体为:
获取用户信息;
基于融合用户多信息的方式,得到用户个性化表示信息;
将用户信息发送至预设嵌入层,得到用户信息生成嵌入表示信息;
根据注意力网络衡量不同特征对推荐任务的影响权重,并利用全连接网络层融合不同权值特征,得到用户初级表征信息;
根据预设嵌入层为不同文献类型生成嵌入表示,得到项目初级表征信息。
需要说明的是,所述用户信息包括:用户的注册信息等,比如哪个学院、什么专业等信息。所述用户/项目个性化表示模块,通过融合用户多信息的方式,生成用户个性化表示。采用多个嵌入层为每个用户uj的每个基础信息f(如专业,研究兴趣等)生成嵌入表示,类似的,为每个项目ik生成嵌入表示,如式(1)所示:
Figure BDA0003937843180000081
其中
Figure BDA0003937843180000082
分别表示用户uj和项目ik的第f个基础信息的嵌入表示的嵌入表示;
Figure BDA0003937843180000083
分别表示用户和项目的嵌入层可学习参数,d表示嵌入维度数量。对于用户多个信息的嵌入表示,采用向量拼接的方式进行融合
Figure BDA0003937843180000084
Figure BDA0003937843180000085
其中F表示用户基础信息个数。在此之上,通过注意力网络衡量不同特征对推荐任务的影响权重。特别的,自注意力网络为用户初级表示
Figure BDA0003937843180000086
生成三个矩阵,分别为查询
Figure BDA0003937843180000087
Figure BDA0003937843180000088
和值
Figure BDA0003937843180000089
Q,K和V被用于自注意力机制运算,将
Figure BDA00039378431800000810
映射成三个不同维度的潜入表示。具体的,Q,K和V由三个可学习权重
Figure BDA00039378431800000811
Figure BDA00039378431800000812
得到,如式(2)所示:
Figure BDA0003937843180000091
其中Q,K用于计算注意力权重,运算结果通过与V进行矩阵相乘运算,实现对不同信息特征对推荐任务的影响的计算,生成用户初级表征z(u),如式(3)所示:
Figure BDA0003937843180000092
z(u)=Attention(Q,K)V (3)
其中,Attention表示注意力权重的计算方式,softmax表示非线性激活函数,类似地,采用嵌入层为不同文献类型生成嵌入表示,生成项目初级表征z(i)
根据本发明实施例,所述用户-项目交互表示模块,具体为:
根据预设的图卷积网络的消息传递机制,得到更新用户/项目表示信息;
将项目-交互表信息发送至预设的图卷积网络,得到用户-项目交互图;
通过聚合邻接节点表示学习用户-项目局部交互关系,得到第一对比学习视图。
需要说明的是,所述用户-项目交互表示模块,利用图卷积网络的消息传递机制更新用户/项目表示。所述图卷积网络根据所述用户- 项目交互表生成用户-项目交互图,通过聚合邻接节点表示学习用户- 项目局部交互关系,生成第一对比学习视图;
其中,所述用户-项目交互表记录了用户和项目的交互情况,所述用户-项目交互图表示为
Figure BDA0003937843180000093
如果用户uj曾与项目ik发生交互,则Aj,k=1;反之,Aj,k=0。所述图卷积网络以式(4)形式进行消息传递:
Figure BDA0003937843180000094
其中,
Figure BDA0003937843180000095
Figure BDA0003937843180000096
分别表示从相邻项目/用户到中心节点uj和ik的聚合信息,σ表示LeakyRelu激活函数,用于产生非线性表示。为了解决由交互数目不一致带来的尺度变化问题,采用标准化邻接矩阵方式生成
Figure BDA0003937843180000101
形式上可更新为式(5):
Figure BDA0003937843180000102
根据本发明实施例,所述用户-用户、项目-项目全局关联模块,具体为:
采用可学习超图结构进行关联学习;
所述可学习超图结构由一组可学习超边组成,不同的用户/项目作为不同节点,每条可学习超边作为信息枢纽,以不同的权重连接所有的用户/项目,从全局的视角中聚集所有用户/项目的信息以更新自身节点的嵌入表示,得到第二对比学习视图;
不同的超边作为不同的通道从多个的语义维度捕获用户-用户、项目-项目之间的复杂连接关系。
需要说明的是,所述用户-用户、项目-项目全局关联模块,采用可学习超图结构进行关联学习。所述可学习超图结构由一组可学习超边组成,用于全局用户关联和全局项目关联的超边分别表示为
Figure BDA0003937843180000103
Figure BDA0003937843180000104
其中,h表示超边数量。所述可学习超边将不同的用户/项目作为不同节点,每条可学习超边作为信息枢纽,以不同的权重连接所有的用户/项目,从全局的视角中聚集所有用户/ 项目的信息以更新自身节点的嵌入表示,生成第二对比学习视图。形式上可表示为式(6):
Ψ(u)=σ(H(u)·H(u)T·g(u)),Ψ(i)=σ(H(i)·H(i)T·g(i)) (6)
其中,
Figure BDA0003937843180000105
对于第一对比学习视图生产的用户表示g(u),先采用转置的可学习超边H(u)T将g(u)中每个用户的信息传递到超边上,此时,向量尺寸维度由
Figure BDA0003937843180000106
更新为
Figure BDA0003937843180000107
随后再次与H(u)进行矩阵相乘运算,每条超边将聚合的全局用户信息传递回每个用户的表示上,向量尺寸维度由
Figure BDA0003937843180000108
更新为
Figure BDA0003937843180000109
特别地,不同的超边作为不同的通道从多个的语义维度捕获用户-用户、项目-项目之间的复杂连接关系。
根据本发明实施例,所述可学习超图网络结构,具体为:
通过低秩分解的方法生成可学习超图参数矩阵;
根据权利要求4所述的用户初级表征与项目初级表征,结合可学习多层感知机网络,生成可学习超图结构。
需要说明的是,所述可学习超图网络结构,为了减少神经网络模型的参数量,采用低秩分解的方法生成可学习超图参数矩阵。根据所述的用户初级表征与项目初级表征,结合多层感知机网络,生成可学习超图结构,形式上表示如式(7):
H(u)=MLPu(z(u)·W(uh)),H(i)=MLPi(z(i)·W(ih)) (7)
其中
Figure BDA0003937843180000111
为可学习参数。其中,隐藏层维数远小于用户数量(即d<<J)。通过低秩分解方法构造超边可大幅度降低参数量,减少神经网络训练时间,提升推荐效率。所述多层感知机网络(MLP),包含多个线性层和非线性激活函数,可形式化如式(8):
MLP(x)=w2·σ(w1·x+b1)+b2 (8)
其中,w1
Figure BDA0003937843180000112
为可训练权重参数,b1
Figure BDA0003937843180000113
为可训练偏置参数。
根据本发明实施例,所述自监督增强学习模块,具体为:
采用对比学习方法,将不同视图作为对比学习对象,利用互信息最大化机制优化模型梯度;
将权利要求5所述的第一对比学习视图与权利要求6所述的第二对比学习视图进行对比学习;将不同视图下相同用户/项目作为正例对;将不同视图下不同用户/项目作为负例对,以互信息最大化函数作为优化方程,得到具有辨别性的用户/项目表征。
需要说明的是,所述自监督增强学习模块,采用对比学习方法,将不同视图作为对比学习对象,利用互信息最大化机制优化模型梯度。特别地,对所述图卷积网络生成的第一对比学习视图g(u)与所述可学习超图网络生成的第二对比学习视图Ψ(u)进行对比学习,将不同视图下相同用户/项目作为正例对,将不同视图下不同用户/项目作为负例对,以互信息最大化函数作为优化方程,使局部特征和全局特征相互协作监督,生成具有辨别性的用户/项目表征。其中,用户互信息最大化函数描述如式(9):
Figure BDA0003937843180000121
其中cos(·)表示余弦相似度,用于衡量不同对比学习视图的嵌入的相似性;
Figure BDA0003937843180000122
为温度系数,用于调整梯度的尺度。通过将所述互信息最大化函数作为损失函数,在高维空间中缩短第一对比学习视图和第二对比学习视图之间相同用户表示的距离,扩大第一对比学习视图和第二对比学习视图之间不同用户表示的距离,允许算法在自监督条件下进行局部特征和全局特征相互协作监督,进一步增强了用户表示。类似的,项目互信息最大化函数以相似形式进行设置。
根据本发明实施例,所述自监督增强学习模块,还包括:
将用户数据通过数据增强缓解数据噪声;
将用户-项目交互图进行随机掩码并发送至图卷积网络,得到第三对比学习视图;
将第三对比学习视图与第一对比学习视图进行协同监督。
需要说明的是,所述自监督增强学习模块,采用数据增强的方法缓解数据噪声问题。通过对所述用户-项目交互图A进行随机掩码,生成数据增强后的用户-项目交互图
Figure BDA0003937843180000123
输入到所述图卷积网络生成第三对比学习视图。数据增强方法描述如式(10):
Figure BDA0003937843180000124
其中,A′j,k表示数据增强后用户uj和项目Ik的连接关系,
Figure BDA0003937843180000125
表示取值范围(0,1)的随机数,Mj,k表示第j行第k列的某个随机数,对应于A′j,k;∈表示预设定阈值。如果随机数Mj,k小于∈,则对所述用户-项目交互图进行掩码操作,反之,则保留原图。所述第三对比学习视图,将式(5)A替换为A′进行图卷积运算,生成第三对比学习视图嵌入表示g′(u),g′(i)。随后,采用式(9)所述的对比学习策略,将第三对比学习视图与第一对比学习视图进行协同监督;
特别的,所述基于深度学习的个性化推荐方法,在获得用户-项目的相关度表示后,根据所述基于相似度的预推荐方法的文献推荐方法进行推荐。
根据本发明实施例,所述迭代式更新模块,具体为:采用迭代式更新策略,对用户-项目交互表以及模型参数进行周期性更新。
需要说明的是所述迭代式更新策略,主要包括1)用户-项目交互表更新:根据研究生对所推荐文献资源与其现阶段研究需求匹配情况的判断结果,周期性更新用户-项目交互表,作为所述图卷积网络用户-项目交互图构建的基础,同时为个性化推荐算法模型提供更多可利用标签。2)模型参数更新;随着时间推移,用户群体发生改变,文献数量逐渐增加,需要更新用户表示以及文献表示。采取预训练- 微调更新原则,在原训练模型参数基础上,进行再次训练,以更新模型参数。
图2示出了本发明提供的一种基于大数据技术的研究生文献资源推荐方法架构图。
如图所示,本发明提供的一种基于大数据技术的研究生文献资源推荐方法包括:基于相似度的预推荐方法和基于深度学习的个性化推荐方法,其中基于相似度的预推荐方法以用户信息以及和用户的互动数据信息为基础,根据相似度确定初步用户文献推荐表。其中基于深度学习的个性化推荐方法包括:用户、项目个性化表示模块;用户- 项目交互表示模块;用户-用户、项目-项目全局关联模块;自监督增强学习模块以及迭代式更新模块。
图3示出了本发明提供的一种基于深度学习的个性化推荐方法架构图。
如图所示,基于深度学习的个性化推荐方法中各模块之间独立显示又紧密相连,其中:用户-项目交互表示模块生成的第一对比学习视图、用户-用户,项目-项目全局关联模块生成的第二对比学习视图和自监督增强学习模块生成的第三对比学些视图通过相互之间对比,将所述三个模块进行关联。
在本发明所提供的实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个***,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (10)

1.一种基于大数据技术的研究生文献资源推荐方法,其特征在于,包括:
获取用户感兴趣研究领域信息;
基于相似度的预推荐方法,将用户感兴趣研究领域信息和预设文献类型进行匹配,得到相似度;
将相似度按照由高到低的顺序对文献类型进行排列,得到初步用户文献推荐表;
获取用户反馈信息;
根据用户反馈信息和初步用户文献推荐表,得到用户-项目交互信息;
基于深度学习的个性化推荐方法,根据用户-项目交互信息,将文献资源按照模块进行分别推荐;
所述基于深度学习的个性化推荐方法:搭建自监督深度学习网格,包括:用户/项目个性化表示模块;用户-项目交互表示模块;用户-用户、项目-项目全局关联模块;自监督增强学习模块以及迭代式更新模块。
2.根据权利要求1所述的一种基于大数据技术的研究生文献资源推荐方法,其特征在于,所述基于相似度的预推荐方法,还包括:
获取用户的表征文本信息;
基于预设向量空间模型(VSM),将用户的表征从文本形式映射到高维向量空间中(用户);
将不同文献类型映射到相同空间中(项目);
将用户-项目两类向量在对应空间进行匹配,得到相似度;
通过判断用户-项目两类向量在该空间的相似度是否大于预设相似度阈值,若是,则将对应文献类型设为对应用户感兴趣的类型文献;若否,则不感兴趣。
3.根据权利要求1所述的一种基于大数据技术的研究生文献资源推荐方法,其特征在于,所述基于相似度的预推荐方法,还包括:
将文献按照相似度从高到低进行排序;
获取用户端对所推荐的文献资源与其现阶段研究需求匹配情况进行的二分类判断信息;
根据所述用户端对所推荐的文献资源与其现阶段研究需求匹配情况进行的二分类判断信息,得到下一次推荐文献资源信息和用户-项目交互表。
4.根据权利要求1所述的一种基于大数据技术的研究生文献资源推荐方法,其特征在于,所述用户/项目个性化表示模块,具体为:
获取用户信息;
基于融合用户多信息的方式,得到用户个性化表示信息;
将用户信息发送至预设嵌入层,得到用户信息生成嵌入表示信息;
根据注意力网络衡量不同特征对推荐任务的影响权重,并利用全连接网络层融合不同权值特征,得到用户初级表征信息;
根据预设嵌入层为不同文献类型生成嵌入表示,得到项目初级表征信息。
5.根据权利要求1或3所述的一种基于大数据技术的研究生文献资源推荐方法,其特征在于,所述用户-项目交互表示模块,具体为:
根据预设的图卷积网络的消息传递机制,得到更新用户/项目表示信息;
将项目-交互表信息发送至预设的图卷积网络,得到用户-项目交互图;
通过聚合邻接节点表示学习用户-项目局部交互关系,得到第一对比学习视图。
6.根据权利要求1所述的一种基于大数据技术的研究生文献资源推荐方法,其特征在于,所述用户-用户、项目-项目全局关联模块,具体为:
采用可学习超图结构进行关联学习;
所述可学习超图结构由一组可学习超边组成,不同的用户/项目作为不同节点,每条可学习超边作为信息枢纽,以不同的权重连接所有的用户/项目,从全局的视角中聚集所有用户/项目的信息以更新自身节点的嵌入表示,得到第二对比学习视图;
不同的超边作为不同的通道从多个的语义维度捕获用户-用户、项目-项目之间的复杂连接关系。
7.根据权利要求6所述的一种基于大数据技术的研究生文献资源推荐方法,其特征在于,所述可学习超图网络结构,具体为:
通过低秩分解的方法生成可学习超图参数矩阵;
根据权利要求4所述的用户初级表征与项目初级表征,结合可学习多层感知机网络,生成可学习超图结构。
8.根据权利要求1所述的一种基于大数据技术的研究生文献资源推荐方法,其特征在于,所述自监督增强学习模块,具体为:
采用对比学习方法,将不同视图作为对比学习对象,利用互信息最大化机制优化模型梯度;
将权利要求5所述的第一对比学习视图与权利要求6所述的第二对比学习视图进行对比学习;将不同视图下相同用户/项目作为正例对;将不同视图下不同用户/项目作为负例对,以互信息最大化函数作为优化方程,得到具有辨别性的用户/项目表征。
9.根据权利要求1或5所述的一种基于大数据技术的研究生文献资源推荐方法,其特征在于,所述自监督增强学习模块,还包括:
将用户数据通过数据增强缓解数据噪声;
将用户-项目交互图进行随机掩码并发送至图卷积网络,得到第三对比学习视图;
将第三对比学习视图与第一对比学习视图进行协同监督。
10.根据权利要求1所述的一种基于大数据技术的研究生文献资源推荐方法,其特征在于,所述迭代式更新模块,具体为:采用迭代式更新策略,对用户-项目交互表以及模型参数进行周期性更新。
CN202211409115.7A 2022-11-11 2022-11-11 一种基于大数据技术的研究生文献资源推荐方法 Pending CN115630153A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211409115.7A CN115630153A (zh) 2022-11-11 2022-11-11 一种基于大数据技术的研究生文献资源推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211409115.7A CN115630153A (zh) 2022-11-11 2022-11-11 一种基于大数据技术的研究生文献资源推荐方法

Publications (1)

Publication Number Publication Date
CN115630153A true CN115630153A (zh) 2023-01-20

Family

ID=84910568

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211409115.7A Pending CN115630153A (zh) 2022-11-11 2022-11-11 一种基于大数据技术的研究生文献资源推荐方法

Country Status (1)

Country Link
CN (1) CN115630153A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116522006A (zh) * 2023-07-05 2023-08-01 中国传媒大学 基于视图自监督训练的慕课推荐方法及***
CN116541593A (zh) * 2023-04-28 2023-08-04 华中师范大学 一种基于超图神经网络的课程推荐方法
CN116628350A (zh) * 2023-07-26 2023-08-22 山东大学 基于可区分主题的新论文推荐方法和***
CN118210916A (zh) * 2024-05-20 2024-06-18 华东交通大学 一种基于超图注意力和增强对比学习的科技文献推荐方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116541593A (zh) * 2023-04-28 2023-08-04 华中师范大学 一种基于超图神经网络的课程推荐方法
CN116541593B (zh) * 2023-04-28 2024-05-31 华中师范大学 一种基于超图神经网络的课程推荐方法
CN116522006A (zh) * 2023-07-05 2023-08-01 中国传媒大学 基于视图自监督训练的慕课推荐方法及***
CN116522006B (zh) * 2023-07-05 2023-10-20 中国传媒大学 基于视图自监督训练的慕课推荐方法及***
CN116628350A (zh) * 2023-07-26 2023-08-22 山东大学 基于可区分主题的新论文推荐方法和***
CN116628350B (zh) * 2023-07-26 2023-10-10 山东大学 基于可区分主题的新论文推荐方法和***
CN118210916A (zh) * 2024-05-20 2024-06-18 华东交通大学 一种基于超图注意力和增强对比学习的科技文献推荐方法

Similar Documents

Publication Publication Date Title
CN110162700B (zh) 信息推荐及模型的训练方法、装置、设备以及存储介质
Athey et al. Machine learning methods that economists should know about
Liu et al. Multi-perspective social recommendation method with graph representation learning
CN115630153A (zh) 一种基于大数据技术的研究生文献资源推荐方法
Sun et al. Learning multiple-question decision trees for cold-start recommendation
Velásquez et al. Adaptive web sites: A knowledge extraction from web data approach
CN110674407A (zh) 基于图卷积神经网络的混合推荐方法
CN112819023B (zh) 样本集的获取方法、装置、计算机设备和存储介质
CN111667022A (zh) 用户数据处理方法、装置、计算机设备和存储介质
CN112380453B (zh) 物品推荐方法、装置、存储介质及设备
Yuen et al. Temporal context-aware task recommendation in crowdsourcing systems
Zhong et al. Design of a personalized recommendation system for learning resources based on collaborative filtering
Alhamdani et al. Recommender system for global terrorist database based on deep learning
Yin et al. An efficient recommendation algorithm based on heterogeneous information network
Isoni Machine learning for the web
CN115631008B (zh) 商品推荐方法、装置、设备及介质
CN108647295B (zh) 一种基于深度协同哈希的图片标注方法
Hain et al. The promises of Machine Learning and Big Data in entrepreneurship research
Kim et al. A deep generative model for feasible and diverse population synthesis
Zhang et al. Probabilistic matrix factorization recommendation of self-attention mechanism convolutional neural networks with item auxiliary information
CN114996566A (zh) 一种面向工业互联网平台的智能推荐***及方法
CN115545834A (zh) 基于图神经网络与元数据的个性化服务推荐方法
CN114298118B (zh) 一种基于深度学习的数据处理方法、相关设备及存储介质
CN113469819A (zh) 基金产品的推荐方法、相关装置及计算机存储介质
Xin Deep learning-based implicit feedback recommendation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination