CN113656709A - 一种融合知识图谱和时序特征的可解释兴趣点推荐方法 - Google Patents
一种融合知识图谱和时序特征的可解释兴趣点推荐方法 Download PDFInfo
- Publication number
- CN113656709A CN113656709A CN202110972282.1A CN202110972282A CN113656709A CN 113656709 A CN113656709 A CN 113656709A CN 202110972282 A CN202110972282 A CN 202110972282A CN 113656709 A CN113656709 A CN 113656709A
- Authority
- CN
- China
- Prior art keywords
- interest
- user
- point
- entities
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种融合知识图谱和时序特征的可解释兴趣点推荐方法,涉及兴趣点推荐技术领域。该方法主要包括三个部分:知识图谱构建、实体间的潜在关系表示学***和接受度。
Description
技术领域
本发明属于兴趣点推荐技术领域,主要涉及一种融合知识图谱和时序特征的可解释兴趣点推荐方法。
背景技术
随着移动互联网技术的飞速发展,基于位置的社交网络平台应运而生并受到广泛关注,例如Foursquare、Gowalla和Facebook Places等。基于位置的社交网络将网络空间与物理世界联系在一起,使用户可以通过发布兴趣点(如餐厅、商场等)签到来分享生活经历,从而产生海量移动数据。这些移动数据为分析用户的行为和偏好提供了机遇,并催生了对兴趣点推荐的研究。
目前,研究者们提出了大量兴趣点推荐方法。现有方法大致可分为两类,分别为基于协同过滤的兴趣点推荐方法和基于深度学***和接受度。为提高推荐结果的说服力,进一步增加推荐***的可信度,给用户提供推荐兴趣点的支持性信息和证据是至关重要的。
可解释推荐对于用户移动行为分析是十分必要的,已有针对可解释兴趣点推荐的研究工作主要分为基于嵌入(Embedding-based)和基于路径(Path-based)的方法。基于嵌入的方法侧重于对语义关联进行建模,使相似的实体具有较小的表示距离,但缺乏发现多跳关系路径的能力。与基于嵌入的方法相比,基于路径的方法能够有效挖掘实体间的多跳关系,但可解释兴趣点推荐仍然存在许多挑战。一方面,现有方法在构建知识图谱时未利用兴趣点的空间信息,而空间信息对于学习用户个性化偏好起着至关重要的作用;另一方面,利用知识图谱的静态信息虽然提高了模型的可解释性,却无法捕捉用户移动行为的动态性,影响了兴趣点推荐的性能。
发明内容
针对上述现有技术存在的不足,本发明提供一种融合知识图谱和时序特征的可解释兴趣点推荐方法,旨在有效融合知识图谱的结构化信息和用户的签到序列,挖掘用户偏好来进行兴趣点推荐,并根据路径推理促进推荐解释生成。
本发明的技术方案为:
一种融合知识图谱和时序特征的可解释兴趣点推荐方法,该方法包括:
步骤I:对数据集中的初始数据空间进行划分,获得的每个子空间视为一个区域,进而根据兴趣点的原始空间信息获取兴趣点的所属区域,将兴趣点的原始空间信息转换为粗粒度的空间信息;
步骤II:整合用户-兴趣点的交互信息和兴趣点的粗粒度的空间信息,构建知识图谱;
所述知识图谱包含的实体有:用户、兴趣点、空间信息,包含的关系有:用户-兴趣点、兴趣点-区域;其中用户-兴趣点代表用户与兴趣点之间存在历史交互;兴趣点-区域代表兴趣点的位置位于某个区域内;
步骤III:基于知识图谱中的路径静态信息捕捉实体之间的潜在关系,并融合用户签到序列的时序动态信息来学习用户偏好;
所述实体间的潜在关系通过实体间的潜在关系路径体现,所述实体间的潜在关系路径,是指知识图谱中连接两个实体的多跳路径,能够表示两个实体间的潜在关系,包括用户与兴趣点之间的潜在关系路径、兴趣点与兴趣点之间的潜在关系路径两个类别;
步骤IV:基于学习到的用户偏好为用户推荐兴趣点,生成推荐结果的解释。
进一步地,根据所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,所述数据集,是指由某一基于位置的社交网络中用户的签到数据构成的集合,其中包含签到数据所涉及的用户ID、兴趣点ID、用户-兴趣点的交互时间,以及兴趣点的位置信息。
进一步地,根据所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,所述初始数据空间,是指数据集中所有兴趣点的位置信息构成的空间。
进一步地,根据所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,所述步骤I包括如下步骤:
步骤I-1:设置超参数:区域边长阈值δ;
步骤I-2:初始化待划分的空间集合X,令X={初始数据空间};
步骤I-3:将X中的每个空间按横坐标划分成两个大小相同的子空间,判断各子空间边长是否小于区域边长阈值δ,如果存在子空间边长小于区域边长阈值δ,则停止划分,输出最终的区域划分结果,结束步骤I,否则,令X={当前步骤划分得到的多个子空间},执行步骤I-4;
步骤I-4:将X中的每个空间按纵坐标划分成两个大小相同的子空间,判断各子空间边长是否小于区域边长阈值δ,如果存在子空间边长小于区域边长阈值δ,则停止划分,输出最终的区域划分结果,结束步骤I,否则,令X={当前步骤划分得到的多个子空间},转至步骤I-3。
进一步地,根据所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,所述关系用户-兴趣点表示为(u1,签到,v1);所述关系兴趣点-区域表示为(v1,隶属于,a1);其中u1为任一用户,v1为任一兴趣点,a1为兴趣点v1位于的区域。
进一步地,根据所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,所述步骤III包括如步骤:
步骤III-1:利用现有的知识图谱嵌入方法学习知识图谱中各实体和关系的嵌入表示;
步骤III-2:根据知识图谱中各实体和关系的嵌入表示,学习实体间的潜在关系表示;
步骤III-3:在知识图谱中实体间的路径静态信息的基础上,进一步融合用户签到的时序动态信息,进而学习用户偏好。
进一步地,根据所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,所述步骤III-1包括如下步骤:
步骤III-1-1:根据知识图谱获取邻居上下文和路径上下文;
对于给定的任意实体e,实体e的邻居上下文CN(e)是以e为头实体的三元组中出现的所有关系-尾实体对;
对于给定的两个实体e和e′,实体e和实体e′的路径上下文CP(e,e′)是指实体e到实体e′的一组路径中出现的所有合成关系;其中,所述合成关系,是指一个实体到另一个实体的某条路径中的多个关系形成的多元组;
步骤III-1-2:形成由邻居上下文和路径上下文组成的三元组上下文,并基于三元组上下文得到知识图谱嵌入方法的得分函数f(e,r,e′):
f(e,r,e′)=P((e,r,e′)|C(e,r,e′);ΘE)
其中,e和e′为给定的两个实体;r表示关系;ΘE为嵌入方法的参数,P(·)表示概率,C(e,r,e′)表示由邻居上下文和路径上下文组成的三元组上下文;
步骤III-1-3:通过最大化知识图谱中所有三元组的联合概率P(KG|ΘE)训练参数ΘE,从而实现知识图谱嵌入方法的训练;
其中,KG是构建的知识图谱;
步骤III-1-4:根据训练好的知识图谱嵌入方法,获得所有实体和关系的嵌入表示。
进一步地,根据所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,所述步骤III-2包括如下步骤:
步骤III-2-1:学习实体间的潜在关系路径的嵌入表示;
其中,ei和ri分别是实体ei和关系ri的嵌入表示,ek=e′;
步骤III-2-2:将实体对(e,e′)间的多条潜在关系路径的嵌入表示组成表征矩阵p(e,e′):
其中,n表示实体对(e,e′)间的潜在关系路径数量,当1≤i≤n时,pi(e,e′)表示潜在关系路径pi(e,e′)的嵌入表示;
步骤III-2-3:基于自注意力机制学习各潜在关系路径的权重,并根据权重聚合多条潜在关系路径,形成实体间潜在关系表示;
充分考虑不同潜在关系路径之间的关系,在表征矩阵p(e,e′)的基础上,利用自注意力机制计算得到实体间的潜在关系表示p′(e,e′):
p′(e,e′)=Attention(p(e,e′)WQ,p(e,e′)WK,p(e,e′)WV)
其中,WQ、WK、WV分别表示注意力机制中Query、Key、Value的权重矩阵,d表示维度,softmax(·)表示归一化函数。
进一步地,根据所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,所述步骤III-3包括如下步骤:
步骤III-3-1:从所述数据集获取用户的签到序列;
步骤III-3-2:获取用户的签到序列中涉及的实体间的潜在关系表示;
用户-兴趣点、兴趣点-兴趣点两类实体间的潜在关系表示,分别为用户与在第1个时间步上访问的兴趣点之间的潜在关系表示、被连续访问的两个兴趣点之间的潜在关系表示;
步骤III-3-3:根据实体间的潜在关系表示初始化循环神经网络的输入向量;
第1个时间步t1上的输入向量x1为:
当1<l≤T时,第l个时间步tl上的输入向量xl可以表示为:
步骤III-3-4:根据时间步更新循环神经网络;
步骤III-3-5:通过循环神经网络的每一个时间步对信息的存储以及过滤,输出最后一个时间步的隐藏向量hT;
步骤III-3-6:融合用户实体的嵌入表示和最后一个时间步的隐藏向量,以得到用户与最后一个时间步的兴趣点之间的交互向量;
进一步地,根据所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,所述步骤IV包括如下步骤:
步骤IV-1:使用交叉熵损失构建兴趣点推荐的目标函数,并最小化目标函数以进行参数学习;
步骤IV-2:将学习到的参数代入步骤III,计算最终用户访问各兴趣点的概率,输出概率最大的top-k兴趣点;
步骤IV-3:生成兴趣点推荐结果的解释;
对于数据集中某用户u1,假设该用户在时间t1访问过兴趣点并且曾在时间t2访问过兴趣点即存在签到对于推荐的一个兴趣点生成推荐解释的方法为:将用户u1与兴趣点之间的路径视为由用户u1与第1个时间步上访问的兴趣点之间的潜在关系路径被连续访问的两个兴趣点之间的潜在关系路径组成,其中,每个实体对之间存在多条关系路径;根据权重值,选择潜在关系路径和由这些潜在关系路径组成的完整路径形成向u1推荐目标兴趣点的解释。
总体而言,通过本发明所构思的以上技术方案较现有技术具有以下有益效果:本发明在构建知识图谱时引入了空间信息,有助于捕捉空间信息对于用户个性化偏好的影响,并且通过区域划分,将兴趣点的原始空间信息转换为粗粒度的空间信息,使得构建的知识图谱能有效捕捉兴趣点之间的空间关系。同时,本发明在利用知识图谱中实体间的路径静态信息的基础上,进一步引入用户签到的时序动态信息,有效学***和接受度。
附图说明
图1为本实施方式融合知识图谱和时序特征的可解释兴趣点推荐方法的实施过程示意图;
图2为本实施方式融合知识图谱和时序特征的可解释兴趣点推荐方法的具体流程示意图;
图3为本发明与其他方法的推荐性能对比结果图;
图4为本发明提供的生成推荐结果解释的过程示意图。
具体实施方式
为了使本发明的目的、技术方案及优势更加清晰,下面结合附图和具体实施例对本发明做进一步详细说明。此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
图1是本实施方式的融合知识图谱和时序特征的可解释兴趣点推荐方法的实施过程示意图,所述融合知识图谱和时序特征的可解释兴趣点推荐方法中包括三个部分:知识图谱构建、实体间的潜在关系表示学习及用户行为的时序动态性捕捉、输出可解释的推荐结果,如图1所示,实体间的潜在关系表示学习是基于构建的知识图谱实现的,通过捕捉实体间的多条潜在关系路径,学习实体间的潜在关系表示,并进一步利用用户的签到序列,即融合路径静态信息和时序动态信息来学习用户偏好,最后基于学习到的用户偏好为用户推荐兴趣点,并提供推荐结果的解释。
所述兴趣点,是指用户感兴趣的地理地点,例如对于在某地旅游的用户来说,可能需要品尝当地美食,那么具有某地特色的餐厅就是兴趣点。
所述知识图谱,是指揭示实体之间关系的语义网络,可以提供丰富的结构化信息,它不仅有助于提高推荐性能,而且由于其直观易于理解实体间的关系,能够增强推荐方法的可解释性。我们构建的知识图谱中包含的实体有:用户、兴趣点、空间信息,包含的关系有用户-兴趣点、兴趣点-空间信息,其中用户-兴趣点表示用户与兴趣点之间存在历史交互,本发明采用区域表示兴趣点的空间信息,即兴趣点-区域,表示兴趣点的位置位于某个区域内。
所述实体间的潜在关系路径,是指知识图谱中连接两个实体的多跳路径,能够表示两个实体间的潜在关系。
所述签到,是指用户在某时刻访问兴趣点的行为,可以用(用户,时间,兴趣点)三元组来表示。
所述用户的签到序列,是指将用户的历史签到按签到时间的先后进行排序得到的序列。
所述用户的时序动态性捕捉是基于循环神经网络实现的,其中循环神经网络,是指以序列数据为输入,在序列的演进方向进行递归且所有循环单元按链式连接的递归神经网络。
图2是本实施方式的融合知识图谱和时序特征的可解释兴趣点推荐方法的具体流程示意图,如图2所示,所述融合知识图谱和时序特征的可解释兴趣点推荐方法包括如下步骤:
步骤1:构建知识图谱,包括对数据集中的初始数据空间进行区域划分、根据划分结果将兴趣点的原始空间信息转换为粗粒度的空间信息、基于用户-兴趣点的交互信息和兴趣点粗粒度的空间信息构建知识图谱;
所述数据集,是指由某一基于位置的社交网络中用户的签到数据构成的集合,其可以是开放数据集,例如Foursquare、Gowalla,也可以通过采集获得,其中包含了签到数据所涉及的用户ID、兴趣点ID、用户-兴趣点的交互时间,以及兴趣点的位置信息。本实施方式的数据集是采用的开放数据集——Foursquare数据集。
所述初始数据空间,是指所有兴趣点构成的空间。每个兴趣点的位置信息是由横坐标和纵坐标组成的,根据所有兴趣点的位置信息,可以分别获得兴趣点的横坐标和纵坐标的区间,同时符合横坐标区间和纵坐标区间的空间即为初始数据空间。
所述区域,是指将初始数据空间进行划分,在划分的最终结果中,每一个子空间称为一个区域。
所述原始空间信息,是指从数据集中获取到的兴趣点的位置。
所述粗粒度的空间信息,是指兴趣点位于的区域。
所述步骤1具体内容包括:
步骤1-1:对数据集中的初始数据空间进行区域划分,具体过程如下:
步骤1-1-1:设置超参数区域边长阈值δ,本实施方式中根据经验将δ设置为0.8千米;
步骤1-1-2:初始化待划分的空间集合X,令X={初始数据空间},其中X可能包含一个或多个待划分的空间,在步骤1-1-2仅包含一个空间,即初始数据空间;
步骤1-1-3:将X中的每个空间按横坐标划分成两个大小相同的子空间,判断各子空间边长是否小于区域边长阈值δ,如果存在子空间边长小于区域边长阈值δ,则停止划分,输出最终的区域划分结果,结束步骤1-1,否则,令X={当前步骤划分得到的多个子空间},执行步骤1-1-4;
步骤1-1-4:将X中的每个空间按纵坐标划分成两个大小相同的子空间,判断各子空间边长是否小于区域边长阈值δ,如果存在子空间边长小于区域边长阈值δ,则停止划分,输出最终的区域划分结果,结束步骤1-1,否则,令X={当前步骤划分得到的多个子空间},转至步骤1-1-3;
步骤1-2:根据区域划分结果,将兴趣点的原始空间信息转换为粗粒度的空间信息;
本实施例是在兴趣点推荐模型中考虑用户-兴趣点的交互信息和空间信息的前提下进行的。如上文所述的知识图谱,我们构建的知识图谱中包含的实体有:用户、兴趣点、空间信息,包含的关系有用户-兴趣点、兴趣点-空间信息。如果知识图谱仅利用兴趣点的原始空间信息,很难揭示兴趣点间的空间关联度,即空间邻近程度,因此,我们利用兴趣点位于的区域来表示兴趣点的空间信息。基于步骤1-1的区域划分结果,根据兴趣点的原始空间信息获取兴趣点的所属区域,依次将数据集所有兴趣点的原始空间信息转换为粗粒度的空间信息。
步骤1-3:整合用户-兴趣点的交互信息和兴趣点粗粒度的空间信息,构建知识图谱;
我们提出的方法将利用知识图谱中实体间的路径静态信息,而用户-兴趣点的交互以及兴趣点的空间信息对于用户偏好的学习起着至关重要的作用,因此,知识图谱中需包含关系用户-兴趣点、兴趣点-空间信息。构建的时空数据知识图谱由大量头实体-关系-尾实体形成的三元组构成。基于步骤1-2可知,知识图谱中的空间信息为区域,因此实体集合包括三个子集合分别为:用户集合、兴趣点集合和区域集合。实体间可能存在不同类型的关系,例如,用户1(即u1)和兴趣点1(即v1)之间存在交互数据,则用户1和兴趣点1之间的交互表示为(u1,签到,v1);兴趣点1位于区域1(即a1),则可使用(v1,隶属于,a1)描述。知识图谱中的三元组清晰地描述了实体之间直接或潜在(即单跳或多跳)的关系,这些属性构成了实体之间的一条或多条路径。
步骤2:基于知识图谱中的路径静态信息捕捉实体之间的潜在关系,并进一步融合用户签到序列的时序动态信息来学习用户偏好;
现有方法在学习用户与兴趣点之间的关系时,大多侧重于仅建模用户与兴趣点之间的潜在关系路径。与现有方法不同,我们根据兴趣点推荐任务中涉及到的实体类型,将实体间的潜在关系路径分为两个类别,即用户与兴趣点之间的潜在关系路径和兴趣点与兴趣点之间的潜在关系路径。一方面,探索用户的历史签到的上下文信息,能够有效捕获用户访问兴趣点的动机。另一方面,兴趣点与兴趣点之间的潜在关系路径可捕捉用户访问兴趣点的时序性,提高推荐方法的性能。
所述步骤2具体内容包括:
步骤2-1:学习知识图谱中各实体和关系的嵌入表示;
多种知识图谱嵌入方法可以用来进行实体和关系的嵌入表示学习,本实施方式采用的是能够有效利用知识图谱图形结构特征的TCE(Triple-Context-based knowledgeEmbedding)嵌入方法。其中,所述知识图谱图形结构特征,指的是三元组上下文。TCE嵌入方法是利用知识图谱中的三元组上下文,尤其是由邻居上下文和路径上下文组成的三元组上下文,在统一的框架中表示三元组及其上下文的结构信息。其中,所述邻居,是将知识图谱中与某实体直接相连的其他实体称为邻居。具体过程如下:
步骤2-1-1:根据知识图谱获取邻居上下文;
对于给定的任意实体e,实体e的邻居上下文CN(e)是以e为头实体的三元组中出现的所有关系-尾实体对,可以形式化表示为:
其中,r表示关系,e′表示尾实体,KG是构建的知识图谱。
步骤2-1-2:根据知识图谱获取路径上下文;
对于给定的两个实体e和e′,实体e和实体e′的路径上下文CP(e,e′)是指实体e到实体e′的一组路径中出现的所有合成关系(Composite Relation)。其中,所述合成关系,是指一个实体到另一个实体的某条路径中的多个关系形成的多元组。例如,假定实体e和实体e′之间存在路径其中r1、r2、r3表示关系,e1、e2表示实体,则合成关系 CP(e,e′)可以形式化表示为:
步骤2-1-3:形成由邻居上下文和路径上下文组成的三元组上下文;
C(e,r,e′)=CN(e)∪CP(e,e′)
步骤2-1-4:基于三元组上下文得到嵌入方法的得分函数f(e,r,e′);
f(e,r,e′)=P((e,r,e′)|C(e,r,e′);ΘE)
其中,ΘE为嵌入方法的参数,P(·)表示概率。
步骤2-1-5:基于知识图谱中所有三元组的联合概率来定义目标函数P(KG|ΘE);
步骤2-1-6:通过最大化目标函数训练参数ΘE;
步骤2-1-7:根据训练好的嵌入方法,获得所有实体和关系的嵌入表示;
步骤2-2:基于知识图谱中各实体和关系的嵌入表示,进一步学习实体间的潜在关系表示;
步骤2-2的主要目的是捕捉实体间的潜在关系特征。首先,学习实体间的潜在关系路径的嵌入表示。然后,由于在知识图谱中,实体间存在多条潜在关系路径,而且不同路径表示用户选择访问兴趣点的不同动机,为了捕获不同动机对用户访问兴趣点的决策的影响程度,我们采用自注意力机制从多个路径中学习组合特征,以更好地表示知识图谱中实体对之间的复杂的潜在关系。具体过程如下:
步骤2-2-1:学习实体间的潜在关系路径的嵌入表示;
其中,ei和ri分别是根据步骤2-1得到的实体ei和关系ri的嵌入表示,ek=e′。
步骤2-2-2:将实体对(e,e′)间的多条潜在关系路径的嵌入表示组成表征矩阵p(e,e′):
其中,n表示实体对(e,e′)间的潜在关系路径数量,当1≤i≤n时,pi(e,e′)表示潜在关系路径pi(e,e′)的嵌入表示。
步骤2-2-3:基于自注意力机制学习各潜在关系路径的权重,并根据权重聚合多条潜在关系路径,形成实体间潜在关系表示;
充分考虑不同潜在关系路径之间的关系,在表征矩阵p(e,e′)的基础上,利用自注意力机制计算得到实体间的潜在关系表示p′(e,e′):
p′(e,e′)=Attention(p(e,e′)WQ,p(e,e′)WK,p(e,e′)WV)
其中,WQ、WK、WV分别表示注意力机制中Query、Key、Value的权重矩阵,d表示维度,softmax(·)表示归一化函数。
步骤2-3:在知识图谱中实体间的路径静态信息的基础上,进一步融合用户签到的时序动态信息,进而学习用户偏好;
步骤2-3的主要目的是基于步骤2-2学习到的两类实体间(用户-兴趣点、兴趣点-兴趣点)的潜在关系表示,进一步捕捉用户连续签到之间的时序依赖性,利用循环神经网络建模更具体的用户访问兴趣点的决策路径,学习用户偏好。具体过程如下:
步骤2-3-1:根据所述数据集获取用户的签到序列;
步骤2-3-2:获取用户的签到序列中涉及的实体间的潜在关系表示;
考虑到用户连续签到的时序依赖性,本实施方式利用连续签到的兴趣点之间存在的潜在关系,因此,两类实体间(用户-兴趣点、兴趣点-兴趣点)的潜在关系表示,分别为用户与在第1个时间步上访问的兴趣点之间的潜在关系表示、被连续访问的两个兴趣点之间的潜在关系表示。
步骤2-3-3:初始化循环神经网络的输入向量,本实施方式采用的融合路径静态信息和时序动态信息;
第1个时间步上的输入向量x1可以表示为:
当1<l≤T时,第l个时间步上的输入向量xl可以表示为:
步骤2-3-4:根据时间步更新循环神经网络;
循环神经网络的多种变体例如变体长短期记忆网络LSTM、门控循环单元GRU等都可用来捕捉用户连续签到之间的时序依赖性,本实施方式采用循环神经网络变体中的门控循环单元,以第l个时间步为例,更新公式如下:
zl=σ(Wzxl+Uzhl-1)
rl=σ(Wrxl+Urhl-1)
其中,Wz、Uz、Wr、Ur、Wh、Uh表示训练参数,σ(·)表示sigmod函数,tanh(·)表示双曲正切函数,°表示哈达玛积,zl和rl分别表示更新门和重置门,hl-1表示第l-1个时间步输出的隐藏向量,表示当前时间步的记忆内容,hl-1表示上一个时间步输出的隐藏向量,hl表示当前时间步输出的隐藏向量。
步骤2-3-5:通过循环神经网络的每一个时间步对信息的存储以及过滤,输出最后一个时间步的隐藏向量hT;
在本实施方式中通过更新门与重置门的存储以及过滤信息,输出最后一个时间步的隐藏向量hT,hT不仅包含了用户签到的时序动态信息,也融合了被连续访问的兴趣点之间的潜在关系;
步骤2-3-6:融合用户实体的嵌入表示和最后一个时间步的隐藏向量,以得到用户与最后一个时间步的兴趣点之间的交互向量;
所述多层感知器,是一种前馈人工神经网络模型,能够表示输入和输出向量之间的非线性映射,多层感知器有至少一个隐藏层。
其中,MLP表示双层感知器,σ(·)表示sigmod函数,Relu(·)表示线性整流函数,W1和W2表示双层感知器的两个权重矩阵。
步骤3:基于学习到的用户偏好为用户推荐兴趣点,生成推荐结果的解释;
所述步骤3具体内容包括:
步骤3-1:构建兴趣点推荐的目标函数;
将观察到的用户访问行为视为正样本反之视为负样本利用平衡采样器(Balanced Sampler)随机采样负样本,并使用交叉熵损失来学习本发明方法的参数,将所有参数记为Θ,为了避免过拟合,采用L2正则化训练参数Θ。兴趣点推荐的目标函数为:
步骤3-2:最小化目标函数以进行参数学习;
步骤3-3:将学习到的参数代入步骤2,计算最终用户访问各兴趣点的概率,输出概率最大的top-k兴趣点;
本实施方式根据经验将k设置为5、10、20,如图3所示,与已有兴趣点推荐方法相比,本发明方法具有更加优秀的推荐性能。
步骤3-4:生成兴趣点推荐结果的解释;
对于数据集中某用户u1,该用户在时间t1访问过兴趣点并且曾在时间t2访问过兴趣点即存在签到本发明方法为用户推荐了多个兴趣点,即用户可能对推荐的几个地点感兴趣并在第3个时间步进行访问。以推荐的其中一个兴趣点为例,介绍生成推荐解释的过程。
为提供推荐兴趣点的解释,需构建用户u1与兴趣点之间的路径。如图4所示,根据步骤2-3所述,本实施方式将用户u1与兴趣点之间的路径看成是由用户u1与第1个时间步上访问的兴趣点之间的潜在关系路径被连续访问的两个兴趣点之间的潜在关系路径组成的。其中,每个实体对之间存在多条关系路径,根据权重值,获得对用户访问兴趣点的决策影响大即权重值大的潜在关系路径和由这些潜在关系路径组成的完整路径形成了向u1推荐目标兴趣点的解释。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;因而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。
Claims (10)
1.一种融合知识图谱和时序特征的可解释兴趣点推荐方法,其特征在于,该方法包括:
步骤I:对数据集中的初始数据空间进行划分,获得的每个子空间视为一个区域,进而根据兴趣点的原始空间信息获取兴趣点的所属区域,将兴趣点的原始空间信息转换为粗粒度的空间信息;
步骤II:整合用户-兴趣点的交互信息和兴趣点的粗粒度的空间信息,构建知识图谱;
所述知识图谱包含的实体有:用户、兴趣点、空间信息,包含的关系有:用户-兴趣点、兴趣点-区域;其中用户-兴趣点代表用户与兴趣点之间存在历史交互;兴趣点-区域代表兴趣点的位置位于某个区域内;
步骤III:基于知识图谱中的路径静态信息捕捉实体之间的潜在关系,并融合用户签到序列的时序动态信息来学习用户偏好;
所述实体间的潜在关系通过实体间的潜在关系路径体现,所述实体间的潜在关系路径,是指知识图谱中连接两个实体的多跳路径,能够表示两个实体间的潜在关系,包括用户与兴趣点之间的潜在关系路径、兴趣点与兴趣点之间的潜在关系路径两个类别;
步骤IV:基于学习到的用户偏好为用户推荐兴趣点,生成推荐结果的解释。
2.根据权利要求1所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,其特征在于,所述数据集,是指由某一基于位置的社交网络中用户的签到数据构成的集合,其中包含签到数据所涉及的用户ID、兴趣点ID、用户-兴趣点的交互时间,以及兴趣点的位置信息。
3.根据权利要求1或2所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,其特征在于,所述初始数据空间,是指数据集中所有兴趣点的位置信息构成的空间。
4.根据权利要求1所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,其特征在于,所述步骤I包括如下步骤:
步骤I-1:设置超参数:区域边长阈值δ;
步骤I-2:初始化待划分的空间集合X,令X={初始数据空间};
步骤I-3:将X中的每个空间按横坐标划分成两个大小相同的子空间,判断各子空间边长是否小于区域边长阈值δ,如果存在子空间边长小于区域边长阈值δ,则停止划分,输出最终的区域划分结果,结束步骤I,否则,令X={当前步骤划分得到的多个子空间},执行步骤I-4;
步骤I-4:将X中的每个空间按纵坐标划分成两个大小相同的子空间,判断各子空间边长是否小于区域边长阈值δ,如果存在子空间边长小于区域边长阈值δ,则停止划分,输出最终的区域划分结果,结束步骤I,否则,令X={当前步骤划分得到的多个子空间},转至步骤I-3。
5.根据权利要求1所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,其特征在于,所述关系用户-兴趣点表示为(u1,签到,v1);所述关系兴趣点-区域表示为(v1,隶属于,a1);其中u1为任一用户,v1为任一兴趣点,a1为兴趣点v1位于的区域。
6.根据权利要求1所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,其特征在于,所述步骤III包括如下步骤:
步骤III-1:利用现有的知识图谱嵌入方法学习知识图谱中各实体和关系的嵌入表示;
步骤III-2:根据知识图谱中各实体和关系的嵌入表示,学习实体间的潜在关系表示;
步骤III-3:在知识图谱中实体间的路径静态信息的基础上,进一步融合用户签到的时序动态信息,进而学习用户偏好。
7.根据权利要求6所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,其特征在于,所述步骤III-1包括如下步骤:
步骤III-1-1:根据知识图谱获取邻居上下文和路径上下文;
对于给定的任意实体e,实体e的邻居上下文CN(e)是以e为头实体的三元组中出现的所有关系-尾实体对;
对于给定的两个实体e和e′,实体e和实体e′的路径上下文CP(e,e′)是指实体e到实体e′的一组路径中出现的所有合成关系;其中,所述合成关系,是指一个实体到另一个实体的某条路径中的多个关系形成的多元组;
步骤III-1-2:形成由邻居上下文和路径上下文组成的三元组上下文,并基于三元组上下文得到知识图谱嵌入方法的得分函数f(e,r,e′):
f(e,r,e′)=P((e,r,e′)|C(e,r,e′);ΘE)
其中,e和e′为给定的两个实体;r表示关系;ΘE为嵌入方法的参数,P(·)表示概率,C(e,r,e′)表示由邻居上下文和路径上下文组成的三元组上下文;
步骤III-1-3:通过最大化知识图谱中所有三元组的联合概率P(KG|ΘE)训练参数ΘE,从而实现知识图谱嵌入方法的训练;
其中,KG是构建的知识图谱;
步骤III-1-4:根据训练好的知识图谱嵌入方法,获得所有实体和关系的嵌入表示。
8.根据权利要求6所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,其特征在于,所述步骤III-2包括如下步骤:
步骤III-2-1:学习实体间的潜在关系路径的嵌入表示;
其中,ei和ri分别是实体ei和关系ri的嵌入表示,ek=e′;
步骤III-2-2:将实体对(e,e′)间的多条潜在关系路径的嵌入表示组成表征矩阵p(e,e′):
其中,n表示实体对(e,e′)间的潜在关系路径数量,当1≤i≤n时,pi(e,e′)表示潜在关系路径pi(e,e′)的嵌入表示;
步骤III-2-3:基于自注意力机制学习各潜在关系路径的权重,并根据权重聚合多条潜在关系路径,形成实体间潜在关系表示;
充分考虑不同潜在关系路径之间的关系,在表征矩阵p(e,e′)的基础上,利用自注意力机制计算得到实体间的潜在关系表示p′(e,e′):
p′(e,e′)=Attention(p(e,e′)WQ,p(e,e′)WK,p(e,e′)WV)
其中,WQ、WK、WV分别表示注意力机制中Query、Key、Value的权重矩阵,d表示维度,softmax(·)表示归一化函数。
9.根据权利要求6所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,其特征在于,所述步骤III-3包括如下步骤:
步骤III-3-1:从所述数据集获取用户的签到序列;
步骤III-3-2:获取用户的签到序列中涉及的实体间的潜在关系表示;
用户-兴趣点、兴趣点-兴趣点两类实体间的潜在关系表示,分别为用户与在第1个时间步上访问的兴趣点之间的潜在关系表示、被连续访问的两个兴趣点之间的潜在关系表示;
步骤III-3-3:根据实体间的潜在关系表示初始化循环神经网络的输入向量;
第1个时间步t1上的输入向量x1为:
当1<l≤T时,第l个时间步tl上的输入向量xl可以表示为:
步骤III-3-4:根据时间步更新循环神经网络;
步骤III-3-5:通过循环神经网络的每一个时间步对信息的存储以及过滤,输出最后一个时间步的隐藏向量hT;
步骤III-3-6:融合用户实体的嵌入表示和最后一个时间步的隐藏向量,以得到用户与最后一个时间步的兴趣点之间的交互向量;
10.根据权利要求1所述的融合知识图谱和时序特征的可解释兴趣点推荐方法,其特征在于,所述步骤IV包括如下步骤:
步骤IV-1:使用交叉熵损失构建兴趣点推荐的目标函数,并最小化目标函数以进行参数学习;
步骤IV-2:将学习到的参数代入步骤III,计算最终用户访问各兴趣点的概率,输出概率最大的top-k兴趣点;
步骤IV-3:生成兴趣点推荐结果的解释;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110972282.1A CN113656709B (zh) | 2021-08-24 | 2021-08-24 | 一种融合知识图谱和时序特征的可解释兴趣点推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110972282.1A CN113656709B (zh) | 2021-08-24 | 2021-08-24 | 一种融合知识图谱和时序特征的可解释兴趣点推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113656709A true CN113656709A (zh) | 2021-11-16 |
CN113656709B CN113656709B (zh) | 2023-07-25 |
Family
ID=78492607
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110972282.1A Active CN113656709B (zh) | 2021-08-24 | 2021-08-24 | 一种融合知识图谱和时序特征的可解释兴趣点推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113656709B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114493755A (zh) * | 2021-12-28 | 2022-05-13 | 电子科技大学 | 一种融合时序信息的自注意力序列推荐方法 |
CN114969525A (zh) * | 2022-05-25 | 2022-08-30 | 天翼爱音乐文化科技有限公司 | 音乐社交推荐方法、***、装置及存储介质 |
CN117853152A (zh) * | 2024-03-07 | 2024-04-09 | 云南疆恒科技有限公司 | 一种基于多渠道的业务营销数据处理*** |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190139165A1 (en) * | 2017-11-06 | 2019-05-09 | Microsoft Technology Licensing, Llc | Contextual trip itinerary generator |
CN110334221A (zh) * | 2019-07-18 | 2019-10-15 | 桂林电子科技大学 | 一种基于知识图谱路径的可解释性推荐方法 |
CN111209475A (zh) * | 2019-12-27 | 2020-05-29 | 武汉大学 | 一种基于时空序列和社会嵌入排名的兴趣点推荐方法及装置 |
CN111582948A (zh) * | 2020-05-25 | 2020-08-25 | 北京航空航天大学 | 一种基于手机信令数据与poi兴趣点的个体行为分析方法 |
CN112131490A (zh) * | 2020-09-18 | 2020-12-25 | 东南大学 | 一种知识图谱驱动下区域敏感的兴趣点推荐方法 |
CN112182386A (zh) * | 2020-09-29 | 2021-01-05 | ***股份有限公司 | 一种基于知识图谱的目标推荐方法及装置 |
WO2021120543A1 (zh) * | 2019-12-17 | 2021-06-24 | 北京百度网讯科技有限公司 | 基于自然语言和知识图谱的表示学习方法及装置 |
CN113158038A (zh) * | 2021-04-02 | 2021-07-23 | 上海交通大学 | 基于sta-tcn神经网络框架的兴趣点推荐方法及*** |
-
2021
- 2021-08-24 CN CN202110972282.1A patent/CN113656709B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190139165A1 (en) * | 2017-11-06 | 2019-05-09 | Microsoft Technology Licensing, Llc | Contextual trip itinerary generator |
CN110334221A (zh) * | 2019-07-18 | 2019-10-15 | 桂林电子科技大学 | 一种基于知识图谱路径的可解释性推荐方法 |
WO2021120543A1 (zh) * | 2019-12-17 | 2021-06-24 | 北京百度网讯科技有限公司 | 基于自然语言和知识图谱的表示学习方法及装置 |
CN111209475A (zh) * | 2019-12-27 | 2020-05-29 | 武汉大学 | 一种基于时空序列和社会嵌入排名的兴趣点推荐方法及装置 |
CN111582948A (zh) * | 2020-05-25 | 2020-08-25 | 北京航空航天大学 | 一种基于手机信令数据与poi兴趣点的个体行为分析方法 |
CN112131490A (zh) * | 2020-09-18 | 2020-12-25 | 东南大学 | 一种知识图谱驱动下区域敏感的兴趣点推荐方法 |
CN112182386A (zh) * | 2020-09-29 | 2021-01-05 | ***股份有限公司 | 一种基于知识图谱的目标推荐方法及装置 |
CN113158038A (zh) * | 2021-04-02 | 2021-07-23 | 上海交通大学 | 基于sta-tcn神经网络框架的兴趣点推荐方法及*** |
Non-Patent Citations (4)
Title |
---|
MEIHUI SHI等: "Next point-of-interest recommendation by sequential feature mining and public preference awareness", 《JOURNAL OF INTELLIGENT & FUZZY SYSTEMS》, vol. 40, no. 03, pages 4075 - 4090 * |
XIAOWEN HUANG等: "Explainable Interaction-driven User Modeling over Knowledge Graph for Sequential Recommenddation", 《MM\'19: PROCEEDINGS OF THE 27TH ACM INTERNATIONAL CONFERENCE ON MULTIMEDIA》, pages 548 - 556 * |
沈冬东等: "基于知识图谱嵌入与多神经网络的序列推荐算法", 计算机工程与科学, no. 09, pages 1661 - 1669 * |
董鑫: "基于时空行为轨迹的兴趣点预测研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 06, pages 138 - 814 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114493755A (zh) * | 2021-12-28 | 2022-05-13 | 电子科技大学 | 一种融合时序信息的自注意力序列推荐方法 |
CN114493755B (zh) * | 2021-12-28 | 2022-10-14 | 电子科技大学 | 一种融合时序信息的自注意力序列推荐方法 |
CN114969525A (zh) * | 2022-05-25 | 2022-08-30 | 天翼爱音乐文化科技有限公司 | 音乐社交推荐方法、***、装置及存储介质 |
CN114969525B (zh) * | 2022-05-25 | 2023-04-07 | 天翼爱音乐文化科技有限公司 | 音乐社交推荐方法、***、装置及存储介质 |
CN117853152A (zh) * | 2024-03-07 | 2024-04-09 | 云南疆恒科技有限公司 | 一种基于多渠道的业务营销数据处理*** |
CN117853152B (zh) * | 2024-03-07 | 2024-05-17 | 云南疆恒科技有限公司 | 一种基于多渠道的业务营销数据处理*** |
Also Published As
Publication number | Publication date |
---|---|
CN113656709B (zh) | 2023-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Islam et al. | A survey on deep learning based Point-of-Interest (POI) recommendations | |
Logesh et al. | A personalised travel recommender system utilising social network profile and accurate GPS data | |
CN113656709B (zh) | 一种融合知识图谱和时序特征的可解释兴趣点推荐方法 | |
CN112084427A (zh) | 一种基于图神经网络的兴趣点推荐方法 | |
CN111209475B (zh) | 一种基于时空序列和社会嵌入排名的兴趣点推荐方法及装置 | |
Zhou et al. | Deepmove: Learning place representations through large scale movement data | |
CN116244513B (zh) | 随机群组poi推荐方法、***、设备及存储介质 | |
Chen et al. | Next POI recommendation based on location interest mining with recurrent neural networks | |
CN115270007B (zh) | 一种基于混合图神经网络的poi推荐方法及*** | |
CN116340524B (zh) | 一种基于关系自适应网络的小样本时态知识图谱补全方法 | |
CN116401380A (zh) | 面向异构知识图谱的对比学习预测方法及*** | |
Wang et al. | Online POI recommendation: Learning dynamic geo-human interactions in streams | |
Xu et al. | Deep convolutional recurrent model for region recommendation with spatial and temporal contexts | |
Wang et al. | Social dual-effect driven group modeling for neural group recommendation | |
Lv | [Retracted] Prediction of the Forwarding Volume of Campus Microblog Public Opinion Emergencies Using Neural Network | |
CN116894122A (zh) | 一种基于超图卷积网络的跨视图对比学习群组推荐方法 | |
An et al. | Enabling the interpretability of pretrained venue representations using semantic categories | |
CN113032688B (zh) | 针对社交网络用户在未来给定时间的访问位置预测方法 | |
Zhang et al. | Hybrid structural graph attention network for POI recommendation | |
Huang | Personalized travel route recommendation model of intelligent service robot using deep learning in big data environment | |
Wang et al. | Cthgat: category-aware and time-aware next point-of-interest via heterogeneous graph attention network | |
Zhu et al. | POI recommendation based on first-order collaborative filtering tree | |
Ji et al. | A task recommendation model in mobile crowdsourcing | |
Zhang et al. | Session‐Based Graph Attention POI Recommendation Network | |
Liu et al. | Dapred: Dynamic attention location prediction with long-short term movement regularity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |