CN112214687A - 时态感知学术信息的论文推荐方法、***及介质 - Google Patents
时态感知学术信息的论文推荐方法、***及介质 Download PDFInfo
- Publication number
- CN112214687A CN112214687A CN202011050718.3A CN202011050718A CN112214687A CN 112214687 A CN112214687 A CN 112214687A CN 202011050718 A CN202011050718 A CN 202011050718A CN 112214687 A CN112214687 A CN 112214687A
- Authority
- CN
- China
- Prior art keywords
- user
- paper
- thesis
- data
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了时态感知学术信息的论文推荐方法、***及介质,方法包括:对用户信息和论文信息进行特征提取,得到用户特征数据、论文特征数据和评分数据;根据所述用户特征数据、论文特征数据和评分数据,对神经网络进行训练,得到初始推荐模型;通过时态感知函数对所述初始推荐模型进行动态加权处理,得到目标推荐模型;根据所述目标推荐模型,确定推荐的论文。本发明实施例提高了推荐***的准确度和实用性,可广泛应用于内容推荐技术领域。
Description
技术领域
本发明涉及内容推荐技术领域,尤其是时态感知学术信息的论文推荐方法、***及介质。
背景技术
时态感知函数就是时间变化规律函数,主要是用来刻画时间的如何变化的,包括时间变化的速率,从而得到其变化轨迹,一般包括线性、逻辑回归、指数型等。一般可以用来刻画一部电影、一篇文章、一个短视频的热度变化,用户的兴趣变化等。
随着社交网络的快速发展,学者与学者之间的交流也在不断增加。然而,在信息***的时代,如何从海量的数据中挖掘出有意义的信息是一个重大挑战。推荐***在缓解信息过载方面起到了举足轻重的作用,被广泛应用于包括社交网络在内的各种在线服务中。因此,学者之间的交流更加频繁,产生了大量的学术论文。从各种各样的论文中找出人们的兴趣所在是现代学术论文推荐***的关键。
目前,学术论文推荐算法主要包括协同过滤算法和基于内容的推荐方法。其中,协同过滤算法又包括基于用户和基于物品的协同过滤。传统的基于邻域的协同过滤算法根据用户的行为数据,计算用户或物品之间相似度的历史,然后将相似度很大的用户或物品划分为同一组邻域最后,邻居们互相推荐。
该算法可以利用相似用户的反馈信息寻找用户的潜在兴趣,但也存在数据冷启动、稀疏、时效性短等问题。此外,时间是非常重要的因素。我们都知道,如果一篇学术论文是几十年前发表的,那么它的影响将是微弱的,这意味着它的参考价值更少。
因此,需要提供一种既能解决数据冷启动、稀疏等问题,又能有效控制数据的时效性问题的方法。
发明内容
有鉴于此,本发明实施例提供一种准确度高且实用性高的时态感知学术信息的论文推荐方法、***及介质。
本发明的第一方面提供了一种时态感知学术信息的论文推荐方法,包括:
对用户信息和论文信息进行特征提取,得到用户特征数据、论文特征数据和评分数据;
根据所述用户特征数据、论文特征数据和评分数据,对神经网络进行训练,得到初始推荐模型;
通过时态感知函数对所述初始推荐模型进行动态加权处理,得到目标推荐模型;
根据所述目标推荐模型,确定推荐的论文。
在一些实施例中,所述对用户信息和论文信息进行特征提取,得到用户特征数据、论文特征数据和评分数据,包括:
对所述用户信息以及被所述用户标记过的论文信息进行特征提取,得到用户标识以及所述论文的评价标签数据;
将所述论文信息输入Doc2Vec的训练模型中,得到论文的文档向量数据,所述文档向量数据包括论文的标识、论文的主旨以及论文中的专业术语;
根据用户对论文标记的标签信息,确定用户-论文关系列表,所述用户-论文关系列表包括用户标识、论文标识、标记时间以及标签类别。
在一些实施例中,所述将所述论文信息输入Doc2Vec的训练模型中,得到论文的文档向量数据,包括:
获取被用户标记过的论文信息;
将所述论文信息转换为多个向量;
将所述多个向量连接成句向量;
根据所述句向量以及相应的上下文信息,确定下一个词向量,直至得到论文的文档向量数据。
在一些实施例中,所述根据所述用户特征数据、论文特征数据和评分数据,对神经网络进行训练,得到初始推荐模型,包括:
通过时态感知矩阵分解模型对用户与论文之间的线性关系进行学习;
通过多层感知机对用户与论文之间的非线性关系进行学习;
根据所述线性关系与所述非线性关系的学习结果,确定用户与论文之间的交互结构。
在一些实施例中,所述通过时态感知矩阵分解模型对用户与论文之间的线性关系进行学习,包括:
将用户标识和被用户标记过的论文作为输入特征,将所述输入特征转换成具有单热点编码的二维稀疏向量;
通过嵌入层将所述稀疏向量映射到稠密向量的全连通层;
通过神经协同过滤层映射潜在向量的预测分数;
通过隐藏层和输出层得到论文的预测评分。
在一些实施例中,所述通过多层感知机对用户与论文之间的非线性关系进行学习,包括:
对于每一个用户,通过单热点编码得到用户的二进制向量;
将所有用户的二进制向量整合为内嵌矩阵;
将提取到的论文特征数据和所述内嵌矩阵嵌入至输入层;所述用户特征数据和论文特征数据包括交互特征、属性特征和文本特征;
将所述交互特征、属性特征和文本特征作为向量嵌入,输入至多层感知机中,对输入的低维稠密嵌入向量进行合并,确定用户和论文之间的非线性关系。
在一些实施例中,所述通过时态感知函数对所述初始推荐模型进行动态加权处理,得到目标推荐模型,包括:
通过四种时态感知函数对初始推荐模型进行动态加权处理;
所述四种时态感知函数包括线性时态感知函数、逻辑时态感知函数、指数时态感知函数以及艾宾浩斯时态感知函数。
在一些实施例中,根据所述目标推荐模型,确定推荐的论文,包括:
通过所述目标推荐模型确定预测概率,所述预测概率代表用户对自己没有打过标签的论文的感兴趣概率;
根据各个论文的预测概率,构建论文推荐列表;
根据所述论文推荐列表,通过Top-N推荐算法向用户推荐论文。
本发明第二方面提供了一种时态感知学术信息的论文推荐***,包括:
特征提取模块,用于对用户信息和论文信息进行特征提取,得到用户特征数据、论文特征数据和评分数据;
训练模块,用于根据所述用户特征数据、论文特征数据和评分数据,对神经网络进行训练,得到初始推荐模型;
加权处理模块,用于通过时态感知函数对所述初始推荐模型进行动态加权处理,得到目标推荐模型;
推荐模块,用于根据所述目标推荐模型,确定推荐的论文。
本发明的第三方面提供了一种计算机可读存储介质,所述存储介质存储有程序,所述程序被处理器执行实现如本发明第一方面所述的方法。
本发明的实施例通过对用户信息和论文信息进行特征提取,得到用户特征数据、论文特征数据和评分数据;根据所述用户特征数据、论文特征数据和评分数据,对神经网络进行训练,得到初始推荐模型;通过时态感知函数对所述初始推荐模型进行动态加权处理,得到目标推荐模型;根据所述目标推荐模型,确定推荐的论文,本发明提高了推荐***的准确度和实用性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的论文推荐方法的整体步骤流程图;
图2为本发明实施例提供的论文推荐方法的具体流程示意图;
图3为本发明实施例提供的神经网络训练过程的示意图;
图4为本发明实施例提供的TGMF和MLP的融合过程示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
针对现有技术存在的问题,本发明实施例提供了一种时态感知学术信息的论文推荐方法,如图1所示,方法包括以下步骤:
对用户信息和论文信息进行特征提取,得到用户特征数据、论文特征数据和评分数据;
根据所述用户特征数据、论文特征数据和评分数据,对神经网络进行训练,得到初始推荐模型;
通过时态感知函数对所述初始推荐模型进行动态加权处理,得到目标推荐模型;
根据所述目标推荐模型,确定推荐的论文。
具体地,本发明主要针对学术社交网络中论文推荐的问题。在本发明中,用户的特征信息主要包括用户的id和用户对感兴趣的论文所打得标签,其中标签的种类各种各样,一般是用户的当下研究方向或兴趣,未打标签的标记为no-tag。论文特征包括论文的id、发表期刊、发表时间和文本信息(即将论文的题目和摘要连接起来)。这些特征信息不仅可以很好的表示出用户研究兴趣,也更适合表达用户-论文之间的关系,从而更好的进行学术社交网络中论文推荐的研究。
如图2所示,本发明实施例对用户和论文相关信息进行特征提取,得到“用户”、“论文”和“评分”三部分数据;其中,“评分”是指用户对自己所感兴趣的论文打的标签;然后分别使用四种不同的时态感知函数对“用户”、“论文”和“评分”进行动态加权,并输入神经网络进行训练,得到输出结果;最后根据输出结果进行论文推荐。
在本发明中,首先从用户来说,用户在不同时间范围内可能会有不同的兴趣和研究方向;从论文角度来说,论文的参考价值一般与时间成反比,即论文发表时间越久,它的价值也就越低(由于一些经典算法属于特殊情况,所以本发明没有将其算在内)。此外,本发明使用的数据集中包含用户和论文的交互行为,也就是用户对论文打的标签,以此来表明用户对其打标签的论文感兴趣,这里也包含打标签的时间,所以也要考虑在内。
综上,本发明中,时态感知函数主要是为了能够为用户更准确的推荐其可能感兴趣的但自己没有打过标签的论文,将时态感知函数作为一个时间权重,然后动态加权到用户和论文向量进行训练,得到的结果也就比不考虑时间因素的算法更加准确有效。
在一些实施例中,所述对用户信息和论文信息进行特征提取,得到用户特征数据、论文特征数据和评分数据,包括:
对所述用户信息以及被所述用户标记过的论文信息进行特征提取,得到用户标识以及所述论文的评价标签数据;
将所述论文信息输入Doc2Vec的训练模型中,得到论文的文档向量数据,所述文档向量数据包括论文的标识、论文的主旨以及论文中的专业术语;
根据用户对论文标记的标签信息,确定用户-论文关系列表,所述用户-论文关系列表包括用户标识、论文标识、标记时间以及标签类别。
具体地,本发明实施例的用户特征提取是根据用户和用户标记的论文,得到用户的id和用户对论文打的标签;论文特征提取是将提取到的“论文”数据文档赋值到Doc2Vec的训练模型中,得到用来表示不同文档的向量,即得到了每篇论文的id、主旨、专业术语;其中,Doc2Vec是一种无监督算法,可以从可变长度的文本片段(如句子、段落和文档)中学习固定长度的特征表示。与Word2Vec相比,它克服了词袋模型的缺点:丢失了词的顺序,忽略了词的语义,而且解决了数据稀疏的问题,从而提高了准确性。
具体地,本发明实施例对用户-论文关系进行提取。根据用户对论文所打的标签,得到用户-论文关系列表,即“评分”列表,包括用户的id、论文的id、打标签时间t以及标签类别tag四种特征信息。然后,将一类论文和二类论文预设比例并进行采样;其中,所述一类论文为用户打过标签的,即用户感兴趣的论文;所述二类论文为用户没有打过标签的论文。
根据采样结果得到训练后的模型;
将用户-论文数据对输入训练后的模型。
在本实施例中,将一类论文和二类论文按1:4的比例进行采样。在一类论文的集合中抽取一篇,并与其打标签的用户组成一类用户-论文对;然后在二类论文也抽取四篇,与上个一类用户-论文对中的用户分别组成四个二类用户-论文对;利用一类用户-论文对和四个二类用户-论文对组合进行模型训练,得到训练后的模型;然后重复一类和二类论文抽取步骤,再输入训练后的模型。
在一些实施例中,所述将所述论文信息输入Doc2Vec的训练模型中,得到论文的文档向量数据,包括:
获取被用户标记过的论文信息;
将所述论文信息转换为多个向量;
将所述多个向量连接成句向量;
根据所述句向量以及相应的上下文信息,确定下一个词向量,直至得到论文的文档向量数据。
具体地,本发明实施例采用Doc2Vec进行文档主题提取的主要步骤包括:
首先,找出被用户标记过的论文,即有标签的论文;
其次,将文档转换为向量。其中,段落向量通过固定单词向量和训练新的句向量直到收敛来推断;
最后,将多个词向量进行连接成句向量,然后根据给定的上下文预测下一个词向量。
在一些实施例中,所述根据所述用户特征数据、论文特征数据和评分数据,对神经网络进行训练,得到初始推荐模型,包括:
通过时态感知矩阵分解模型对用户与论文之间的线性关系进行学习;
通过多层感知机对用户与论文之间的非线性关系进行学习;
根据所述线性关系与所述非线性关系的学习结果,确定用户与论文之间的交互结构。
具体地,本发明实施例的神经网络包括一种神经矩阵分解模型NCF(NeuralCollaborative Filtering),该模型集成了TGMF(Time-aware Generalized MatrixFactorization)和MLP(Multi-Layer Perceptron),TGMF即时态感知矩阵分解模型,是对传统MF(Matrix Factorization)在神经网络下的扩展,同时考虑时态属性的影响,从而学习用户User和论文项目Item之间的线性关系;MLP是一个多层感知机,用来学习用户和论文之间的潜在非线性特性。因此,本发明统一了MF的线性和MLP的非线性的优点来建模用户-论文潜在结构。
具体地,如图3所示,本发明实施例采用多层表示来建模用户-论文之间的交互,从而允许***过滤的完整神经处理。其中,一个层的输出作为下一层的输入。
底层输入层由用户和论文的两个特征向量组成,不同用户和论文对应不同的特征向量,从而支持广泛的用户和论文建模。使用用户的id和该用户打过标签的论文作为输入特征,将其转换为一个具有单热点编码(one-hot)二维稀疏向量。因为这是一个通用的输入特性表示,所以可以根据内容特性来表示用户和论文,从而解决数据的冷启动问题。
本发明实施例的输入层的上面是一个嵌入层,它是一个将稀疏向量表示映射到稠密向量的全连通层,得到的User或Item嵌入可以看作是潜在模型中的User或Item的潜在向量。
本发明实施例的用户和论文的嵌入被输入到一个多层神经网络中,命名为神经协同过滤层(Neural CF Layers,后面简称NCF层),用来映射潜在向量的预测分数,同输入层相同,不同用户和论文对应不同的潜在向量,可以更广泛地发掘用户和论文之间的潜在特性。
最后,输出层得到预测评分Output。
本发明实施例的隐藏层中的维数决定了该模型的能力。
综上,上述模型计算可表示为:
在一些实施例中,所述通过时态感知矩阵分解模型对用户与论文之间的线性关系进行学习,包括:
将用户标识和被用户标记过的论文作为输入特征,将所述输入特征转换成具有单热点编码的二维稀疏向量;
通过嵌入层将所述稀疏向量映射到稠密向量的全连通层;
通过神经协同过滤层映射潜在向量的预测分数;
通过隐藏层和输出层得到论文的预测评分。
具体地,本发明实施例描述的是TGMF模型的学习过程:
由于输入层对User和Item的id属性进行了热编码,所以得到的嵌入向量可以看做User和Item的潜在向量。
进一步,用潜在向量cu、ci分别表示PVU、QVI,于是得到第一个神经协同过滤层的映射函数:
其中,⊙是向量内积运算符号,是一种二元运算,它取两个维数相同的矩阵并产生另一个维数相同的矩阵,其中每个元素i,j都是原两个矩阵的元素i,j的乘积,cu、ci是用户和论文的潜在向量。
然后,将其映射到输出层,得到:
Output=asT*(cu⊙ci)
其中,Output表示TGMF层的输出,T是时态感知函数,cu、ci是用户和论文的潜在向量,as是激活函数,这里考虑到是线性建模,故采用Sigmoid作为激活函数。
进一步,在将用户和论文映射到输出层的步骤中还包括:
由于用户的兴趣会随着时间的迁移而变化,学术论文的影响力会随着时间的变化而逐渐减弱。也就是说,随着研究内容的深化,学者最初的研究兴趣不仅可能会趋于稳定,还可能会转向其他研究领域。因此,用户最近的一些行为最有可能代表他们最近的研究兴趣。
在一些实施例中,所述通过多层感知机对用户与论文之间的非线性关系进行学习,包括:
对于每一个用户,通过单热点编码得到用户的二进制向量;
将所有用户的二进制向量整合为内嵌矩阵;
将提取到的论文特征数据和所述内嵌矩阵嵌入至输入层;所述用户特征数据和论文特征数据包括交互特征、属性特征和文本特征;
将所述交互特征、属性特征和文本特征作为向量嵌入,输入至多层感知机中,对输入的低维稠密嵌入向量进行合并,确定用户和论文之间的非线性关系。
具体地,本发明实施例描述的是MLP模型的学习过程。本发明实施例将提取到的用户特征和论文特征嵌入到输入层,这些特征大致可以分为三类:交互特征、属性特征、文本特征。
交互特征就是用户与其打过标签的论文的用户-论文列表,包括用户User_id、论文ltem_id、时间戳timestamp以及标签tag。
属性特征包括论文类别type、发表期刊journal、出版社publisher等信息,但本发明中只选择了论文类别和发表期刊这两种属性。
文本特征Text即论文的题目和摘要,因为题目和摘要通常包含论文的主题,尤其是摘要,包括从提出问题到分析、实验和解决问题的整个过程。基于此,本发明将得到的论文题目和摘要连接起来,并采用Doc2Vec模型提取了每篇论文的主题。
进一步,将选取的交互特征User_id、ltem_id、timestamp、tag,属性特征type、journal和文本特征text作为向量嵌入,然后输入到标准的多层感知机MLP中学习用户和论文之间的潜在非线性特性,不再只是简单地使用元素内积来描述潜在的用户和项目之间的交互特性,是对输入的低维稠密嵌入向量进行合并,然后通过前向传递送入神经网络的全连接层,自动学习向量之间的潜在非线性关系,从而为模型提供了高度的灵活性和非线性建模能力。其中,特征嵌入的作用是将高维稀疏二值向量映射到相应的低维稠密向量。
进一步,对于每一个用户,本发明实施例采用单热点编码得到其二进制向量cu=[0,1,...,...,0]∈RM,每个用户对应一个独特的单热点编码,其中M表示数据集中用户的数量。
其中,D是输出的向量的维数。将用户U的二进制向量转化为该矩阵中的低维密集嵌入向量。
综上所述,MLP中具体的计算过程如下:
Z1=[Uid;Iid;Jid;Typeid;Text]
……
ZL+1=aL(WLZL+bL)
其中,Uid、Iid、Jid、Typeid和Text分别为前文所述的用户id、论文id、发表期刊、论文类型以及论文主题,L是感知机的层数,W和b分别为权值矩阵和当前层的偏置量。aL是激活函数,与TGMF中不同的是,考虑到是稀疏矩阵,同时为了防止数据过拟合,更好地挖掘用户和论文之间的非线性关系,这里选择ReLU作为激活函数。
进一步,如图4所示,本发明实施例通过融合TGMF和MLP模型,可以理解的是,本发明实施例的融合TGMF和MLP模型是指基于TGMF和MLP各自独立训练至收敛后,得到了各自的输出结果,然后将两个输出结果作为TGMF-MLP层的参数输入。TGMF应用时态感知函数作为动态权重来衡量论文的影响和用户的兴趣,应用线性核来建模潜在特征交互;MLP使用非线性核从数据中学习用户和论文之间的交互,通过所述特征提取步骤得到的学术特征进行嵌入学习。通过独立的用户和论文向量的嵌入,让两个模型各自进行学习,然后连接它们的最后一个隐藏层实现两个模型的融合。
在一些实施例中,所述通过时态感知函数对所述初始推荐模型进行动态加权处理,得到目标推荐模型,包括:
通过四种时态感知函数对初始推荐模型进行动态加权处理;
所述四种时态感知函数包括线性时态感知函数、逻辑时态感知函数、指数时态感知函数以及艾宾浩斯时态感知函数。
具体地,本发明实施例采用4种时态感知函数对模型进行动态加权,分别是:
(1)、线性时态感知函数W(tp,t):即时间是成线性变化的:
其中,t是当前时间,tp是用户和项目的交互时间,在这里就是用户给论文打标签的时间;τ代表代表时间线性变化的权重系数。变化权重系数越大,则变化的速度越快。
(2)、逻辑时态感知函数W(tp,t):函数增长的初始状态是指数增长的状态,然后增长会在接近结束时达到相对稳定的状态。
其中,μ是权重系数。
(3)、指数时态感知函数W(tp,t):时间变化呈指数形式
其中,γ也是一个权重系数,γ越大,时间t变化的也就越快。
(4)、艾宾浩斯时态感知函数W(tp,t):德国心理学家一项研究人类大脑的记忆变化曲线
在一些实施例中,根据所述目标推荐模型,确定推荐的论文,包括:
通过所述目标推荐模型确定预测概率,所述预测概率代表用户对自己没有打过标签的论文的感兴趣概率;
根据各个论文的预测概率,构建论文推荐列表;
根据所述论文推荐列表,通过Top-N推荐算法向用户推荐论文。
具体地,本发明实施例输出预测结果yui,yui表示用户对自己没有打过标签的论文感兴趣的概率,即预测概率yui,可表示为:
其中,为了更准确的预测,会通过损失函数Loss对模型进行训练,损失函数Loss公式如下:
本发明实施例还提供了一种时态感知学术信息的论文推荐***,包括:
特征提取模块,用于对用户信息和论文信息进行特征提取,得到用户特征数据、论文特征数据和评分数据;
训练模块,用于根据所述用户特征数据、论文特征数据和评分数据,对神经网络进行训练,得到初始推荐模型;
加权处理模块,用于通过时态感知函数对所述初始推荐模型进行动态加权处理,得到目标推荐模型;
推荐模块,用于根据所述目标推荐模型,确定推荐的论文。
本发明实施例还提供了一种计算机可读存储介质,所述存储介质存储有程序,所述程序被处理器执行实现如图1所述的方法。
本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行图1所示的方法。
相较于现有技术,本发明通过时态感知用户和论文的学术特征;输入模型,动态加权后得到输出结果,根据输出结果进行论文推荐。使用四个时态感知函数比较推荐的结果,并使用多个评价指标对我们的模型进行评价。该方法能有效地考虑到论文的特点和学者兴趣的变化,解决了数据冷启动、稀疏等问题,对过期论文进行过滤,有效控制了数据的时效性问题,从而极大地提高了论文推荐的准确度。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (10)
1.一种时态感知学术信息的论文推荐方法,其特征在于,包括:
对用户信息和论文信息进行特征提取,得到用户特征数据、论文特征数据和评分数据;
根据所述用户特征数据、论文特征数据和评分数据,对神经网络进行训练,得到初始推荐模型;
通过时态感知函数对所述初始推荐模型进行动态加权处理,得到目标推荐模型;
根据所述目标推荐模型,确定推荐的论文。
2.根据权利要求1所述的一种时态感知学术信息的论文推荐方法,其特征在于,所述对用户信息和论文信息进行特征提取,得到用户特征数据、论文特征数据和评分数据,包括:
对所述用户信息以及被所述用户标记过的论文信息进行特征提取,得到用户标识以及所述论文的评价标签数据;
将所述论文信息输入Doc2Vec的训练模型中,得到论文的文档向量数据,所述文档向量数据包括论文的标识、论文的主旨以及论文中的专业术语;
根据用户对论文标记的标签信息,确定用户-论文关系列表,所述用户-论文关系列表包括用户标识、论文标识、标记时间以及标签类别。
3.根据权利要求1所述的一种时态感知学术信息的论文推荐方法,其特征在于,所述将所述论文信息输入Doc2Vec的训练模型中,得到论文的文档向量数据,包括:
获取被用户标记过的论文信息;
将所述论文信息转换为多个向量;
将所述多个向量连接成句向量;
根据所述句向量以及相应的上下文信息,确定下一个词向量,直至得到论文的文档向量数据。
4.根据权利要求1所述的一种时态感知学术信息的论文推荐方法,其特征在于,所述根据所述用户特征数据、论文特征数据和评分数据,对神经网络进行训练,得到初始推荐模型,包括:
通过时态感知矩阵分解模型对用户与论文之间的线性关系进行学习;
通过多层感知机对用户与论文之间的非线性关系进行学习;
根据所述线性关系与所述非线性关系的学习结果,确定用户与论文之间的交互结构。
5.根据权利要求4所述的一种时态感知学术信息的论文推荐方法,其特征在于,所述通过时态感知矩阵分解模型对用户与论文之间的线性关系进行学习,包括:
将用户标识和被用户标记过的论文作为输入特征,将所述输入特征转换成具有单热点编码的二维稀疏向量;
通过嵌入层将所述稀疏向量映射到稠密向量的全连通层;
通过神经协同过滤层映射潜在向量的预测分数;
通过隐藏层和输出层得到论文的预测评分。
6.根据权利要求4所述的一种时态感知学术信息的论文推荐方法,其特征在于,所述通过多层感知机对用户与论文之间的非线性关系进行学习,包括:
对于每一个用户,通过单热点编码得到用户的二进制向量;
将所有用户的二进制向量整合为内嵌矩阵;
将提取到的论文特征数据和所述内嵌矩阵嵌入至输入层;所述用户特征数据和论文特征数据包括交互特征、属性特征和文本特征;
将所述交互特征、属性特征和文本特征作为向量嵌入,输入至多层感知机中,对输入的低维稠密嵌入向量进行合并,确定用户和论文之间的非线性关系。
7.根据权利要求1所述的一种时态感知学术信息的论文推荐方法,其特征在于,所述通过时态感知函数对所述初始推荐模型进行动态加权处理,得到目标推荐模型,包括:
通过四种时态感知函数对初始推荐模型进行动态加权处理;
所述四种时态感知函数包括线性时态感知函数、逻辑时态感知函数、指数时态感知函数以及艾宾浩斯时态感知函数。
8.根据权利要求1所述的一种时态感知学术信息的论文推荐方法,其特征在于,根据所述目标推荐模型,确定推荐的论文,包括:
通过所述目标推荐模型确定预测概率,所述预测概率代表用户对自己没有打过标签的论文的感兴趣概率;
根据各个论文的预测概率,构建论文推荐列表;
根据所述论文推荐列表,通过Top-N推荐算法向用户推荐论文。
9.一种时态感知学术信息的论文推荐***,其特征在于,包括:
特征提取模块,用于对用户信息和论文信息进行特征提取,得到用户特征数据、论文特征数据和评分数据;
训练模块,用于根据所述用户特征数据、论文特征数据和评分数据,对神经网络进行训练,得到初始推荐模型;
加权处理模块,用于通过时态感知函数对所述初始推荐模型进行动态加权处理,得到目标推荐模型;
推荐模块,用于根据所述目标推荐模型,确定推荐的论文。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有程序,所述程序被处理器执行实现如权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011050718.3A CN112214687B (zh) | 2020-09-29 | 2020-09-29 | 时态感知学术信息的论文推荐方法、***及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011050718.3A CN112214687B (zh) | 2020-09-29 | 2020-09-29 | 时态感知学术信息的论文推荐方法、***及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112214687A true CN112214687A (zh) | 2021-01-12 |
CN112214687B CN112214687B (zh) | 2023-06-06 |
Family
ID=74052459
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011050718.3A Active CN112214687B (zh) | 2020-09-29 | 2020-09-29 | 时态感知学术信息的论文推荐方法、***及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112214687B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113343125A (zh) * | 2021-06-30 | 2021-09-03 | 南京大学 | 一种面向学术精准推荐的异质科研信息集成方法及*** |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180211174A1 (en) * | 2017-01-24 | 2018-07-26 | International Business Machines Corporation | System for evaluating journal articles |
CN109785062A (zh) * | 2019-01-10 | 2019-05-21 | 电子科技大学 | 一种基于协同过滤模型的混合神经网络推荐*** |
CN111581401A (zh) * | 2020-05-06 | 2020-08-25 | 西安交通大学 | 一种基于深度相关性匹配的局部引文推荐***及方法 |
-
2020
- 2020-09-29 CN CN202011050718.3A patent/CN112214687B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180211174A1 (en) * | 2017-01-24 | 2018-07-26 | International Business Machines Corporation | System for evaluating journal articles |
CN109785062A (zh) * | 2019-01-10 | 2019-05-21 | 电子科技大学 | 一种基于协同过滤模型的混合神经网络推荐*** |
CN111581401A (zh) * | 2020-05-06 | 2020-08-25 | 西安交通大学 | 一种基于深度相关性匹配的局部引文推荐***及方法 |
Non-Patent Citations (1)
Title |
---|
唐浩;刘柏嵩;刘晓玲;黄伟明;: "基于协同知识图谱特征学习的论文推荐方法", 计算机工程 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113343125A (zh) * | 2021-06-30 | 2021-09-03 | 南京大学 | 一种面向学术精准推荐的异质科研信息集成方法及*** |
CN113343125B (zh) * | 2021-06-30 | 2023-08-22 | 南京大学 | 一种面向学术精准推荐的异质科研信息集成方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN112214687B (zh) | 2023-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hjørland | Data (with big data and database semantics) | |
Benabderrahmane et al. | On the predictive analysis of behavioral massive job data using embedded clustering and deep recurrent neural networks | |
Kulkarni et al. | Deep learning for NLP | |
CN110083836B (zh) | 一种文本预测结果的关键证据抽取方法 | |
Ma et al. | MMM: multi-source multi-net micro-video recommendation with clustered hidden item representation learning | |
Ji et al. | Cross-domain sentiment classification via a bifurcated-LSTM | |
Wang et al. | Joint representation learning with ratings and reviews for recommendation | |
Ibrahim et al. | An intelligent hybrid neural collaborative filtering approach for true recommendations | |
CN114003726B (zh) | 一种基于子空间嵌入的学术论文差异性分析方法 | |
Firdaus et al. | Sentiment guided aspect conditioned dialogue generation in a multimodal system | |
Ghorbanali et al. | Exploiting bi-directional deep neural networks for multi-domain sentiment analysis using capsule network | |
Issam et al. | Financial sentiment analysis of tweets based on deep learning approach | |
CN112214687A (zh) | 时态感知学术信息的论文推荐方法、***及介质 | |
Achilles et al. | Using Surface and Semantic Features for Detecting Early Signs of Self-Harm in Social Media Postings. | |
Al Mubasher et al. | A novel neural network-based recommender system for drug recommendation | |
Wen et al. | Hierarchical text interaction for rating prediction | |
CN115269984A (zh) | 一种专业情报推荐方法和*** | |
Liu et al. | User-generated content analysis for customer needs elicitation | |
Oleinik | Detection of opinion communities with the help of chance-corrected measures of agreement | |
Lu | Design of a music recommendation model on the basis of multilayer attention representation | |
Ochoa-Luna et al. | Word embeddings and deep learning for spanish twitter sentiment analysis | |
Swaileh et al. | A named entity extraction system for historical financial data | |
Fu et al. | Sequence-based recommendation with bidirectional lstm network | |
Martin et al. | Fusion-based Representation Learning Model for Multimode User-generated Social Network Content | |
Habbat et al. | Analyzing Booking's Comments Using Stacking Ensemble Deep Learning Model and Neural Topic Model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |