CN110288436A - 一种基于游客偏好建模的个性化景点推荐方法 - Google Patents
一种基于游客偏好建模的个性化景点推荐方法 Download PDFInfo
- Publication number
- CN110288436A CN110288436A CN201910530074.9A CN201910530074A CN110288436A CN 110288436 A CN110288436 A CN 110288436A CN 201910530074 A CN201910530074 A CN 201910530074A CN 110288436 A CN110288436 A CN 110288436A
- Authority
- CN
- China
- Prior art keywords
- tourist
- sight spot
- sight
- spot
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于游客偏好建模的个性化景点推荐方法,包括:采集数据和预处理,对游客、景点等对象编号;将显示评分转换为隐式评分,划分正例和负例景点;构建三元组和景点知识图谱,生成每个景点的特征向量和上下文特征向量;通过KCNN生成游客历史游览景点和候选景点的向量表示;通过注意力网络计算游客每个历史游览景点的影响权重,得到游客对景点的偏好向量;利用DNN计算游客游览该景点的概率,按概率从小到大生成游客的景点推荐列表。本发明在刻画游客历史访问景点对候选景点的不同影响以及表征游客多样化的偏好时,使用注意力网络来计算游客历史访问景点对候选景点的影响权重,使得推荐结果更加符合游客的偏好。
Description
技术领域
本发明涉及景点推荐技术领域,尤其涉及一种基于游客偏好建模的个性化景点推荐方法。
背景技术
随着互联网的飞速发展,在线内容和信息出现***式的增长,如何帮助游客从海量的数据中获取他们想要的信息对于互联网服务提供商来说至关重要。因此,如何根据游客的历史访问信息来构建游客的偏好特征,这是个性化推荐***的关键。传统的游客偏好建模方法,大多数都是根据游客历史访问的景点,通过生成景点的特征向量来刻画游客的偏好特征,进而给游客生成个性化的推荐。然而,游客历史访问的景点仅包含有限的特征信息,根据景点的特征生成的游客偏好过于单一,无法全面地表征游客的兴趣,不能很好地满足游客个性化的要求,同时也没有考虑游客-景点交互数据的稀疏性和冷启动问题,不能准确地根据游客偏好给游客推荐所需要的信息。
目前已公布的发明专利“一种基于游客偏好特征建模的Web服务推荐方法”,公开号为CN 103544623B,通过计算游客间的多维度的偏好相似度,将前N个偏好相似邻居游客调用最多的Web服务进行排序,生成最终的服务推荐列表。该发明没有考虑游客历史访问Web服务对候选服务的不同影响,也忽略了Web服务本身的语义信息,很难准确地给游客推荐服务。
发明内容
有鉴于此,本发明的目的是提供一种基于游客偏好建模的个性化景点推荐方法,以此提高推荐结果的个性化和准确度。
本发明通过以下技术手段解决上述技术问题:
一种基于游客偏好建模的个性化景点推荐方法,包括:
S1:采集游客对景点的历史评分数值和景点相关属性数据,对采集到的原始数据进行预处理后,对数据中的游客、景点对象进行编号;
S2:将评分大于等于一设定数值的景点的作为游客喜欢的景点并标签为1,将评分小于所述设定数值分的景点作为游客不喜欢的景点并标签为0;
S3:构建景点的实体—关系三元组,然后以实体关系三元组为基础单元构建景点相关知识图谱,使用网络表示学习方法学习知识图谱中的结点结构及其属性特征,将知识图谱中每个实体和关系表示为一个对应的低维特征向量,再根据每个实体的特征向量生成该实体的上下文特征向量;
S4:将游客历史访问过的景点输入到一卷积神经网络中,将实体的特征向量和相应的上下文特征向量进行拼接作为所述卷积神经网络的输入,卷积神经网络输出游客历史访问景点的向量表示;
S5:将游客历史访问景点和候选景点的向量表示输入到注意力网络中,计算游客每个历史访问景点的影响权重,游客关于候选景点的偏好向量通过计算游客历史访问景点向量表示的加权和得到;
S6:将游客偏好向量和候选景点的向量表示输入到一个深度神经网络中,计算游客访问该景点的概率,将不同候选景点的预测概率从大到小排列,取前K个景点作为该游客的推荐列表。
进一步,所述采集游客对景点的历史评分数值和景点相关属性数据,对采集到的原始数据进行预处理,具体包括:
L1:利用爬虫工具从旅游网站爬取游客历史游览景点序列及对景点的评分数据;
L2:将游客、景点和景点属性进行编号,设置唯一的ID表示某一对象;
L3:根据对景点的评分数据划分游客喜欢的景点和不喜欢的景点;
L4:将景点及其属性信息表示成三元组的形式,基于三元组构建景点知识图谱;
L5:利用网络表示学习的方法处理景点知识图谱,向量化景点实体和关系。
进一步,所述利用网络表示学习的方法处理景点知识图谱,向量化景点实体和关系,具体包括:
M1:取出三元组中的景点实体、关系和属性的ID;
M2:随机初始化得到景点实体、关系和属性的表示向量,对所有表示向量归一化;
M3:根据三元组的距离性质构建得分函数,训练三元组;
M4:根据得分函数构建损失函数,通过优化损失函数学习实体和关系的向量表示。
进一步,所述卷积神经网络输出游客历史访问景点的向量表示的具体步骤包括:
N1:利用非线性变换函数得到变换的景点特征向量和景点上下文特征向量;
N2:将变换的景点特征向量和景点上下文特征向量进行叠加,得到多通道输入;
N3:利用多重卷积核抽取景点的特征映射;
N4:在得到的特征映射上进行最大池化操作;
N5:将最大池化后的所有特征进行拼接,得到景点最终的向量表示。
进一步,所述将游客偏好向量和候选景点的向量表示输入到一个深度神经网络中,计算游客访问该景点的概率,具体包括:
P1:将游客历史游览的景点及候选景点的表示向量进行拼接,输入深度神经网络中得到影响权重;
P2:计算游客历史游览景点表示向量的加权和,作为游客关于候选景点的偏好向量;
P3:通过一深度神经网络计算游客游览候选景点的概率。
进一步,所述旅游属性数据包括景点等级、景点位置、景点类型、门票价格、建议游玩时长
本发明的有益效果:
1、本发明将景点的特征构成三元组,并以三元组为单元构建知识图谱。三元组的使用不仅简化了数据的存储,还保留了景点所具有的属性;知识图谱作为一种辅助信息丰富了景点的语义信息,知识图谱中包含各种类型的关系,通过关系链接了景点的各种属性信息,有效地缓解了交,数据的稀疏性问题,这有助于合理地扩展游客的偏好,增加推荐景点的准确性和多样性。
2、本发明使用网络表示学习的方法,将知识图谱中的三元组向量化,即将三元组中实体和关系映射到低维度向量空间中表示成向量。该方法将繁杂的网络节点结构和属性数据表示为简单的向量,不仅保持原有知识图谱中的结构信息,还极大地简化计算,使得推荐结果更加可靠和合理。
3、本发明在计算景点的向量表示时,在KCNN的框架下将景点的实体特征向量和上下文特征向量进行拼接作为KCNN的输入,而不仅是简单地将景点的实体特征向量作为输入,这充分利用了知识图谱中丰富的语义信息,使得生成的游客偏好更加准确、全面地表示游客的兴趣。
4、本发明在刻画游客历史访问景点对候选景点的不同影响以及表征游客多样化的偏好时,使用注意力网络来计算游客历史访问景点对候选景点的影响权重,进一步考虑了游客对景点多样化的兴趣,使得推荐结果更加符合游客的偏好。
附图说明
图1是本发明一种基于游客偏好建模的个性化景点推荐方法的整体流程图;
图2是本发明一种基于游客偏好建模的个性化景点推荐方法的模型框架图;
图3为数据采集和处理流程图;
图4为知识图谱中景点的向量化流程图;
图5为卷积神经网络的结构示意图;
图6为融合景点上下文信息的历史游览景点和候选景点实体向量表示生成的流程图;
图7为游客对景点的偏好向量及游客游览景点概率生成流程图。
具体实施方式
以下将结合附图和具体实施例对本发明进行详细说明:
本发明的个性化景点推荐的整体流程如图1所示,模型框架如图2所示,本发明的一种基于游客偏好建模的个性化景点推荐方法,具体步骤包括:
步骤S1、利用网络爬虫技术从各大旅游门户网站采集游客历史游览的景点序列,例如:(故宫→八达岭长城→颐和园→天坛公园→奥林匹克公园),以及对各景点评分信息和景点的多种旅游属性数据,并进行预处理;在清洗掉无用的数据后,对游客、景点等对象进行编号;
步骤S2、因为步骤S1采集的游客对景点的评分信息为显式评分,评分范围为1到5分,为了便于计算,将评分大于等于3分的景点标记1,作为游客喜欢的景点(正例),小于3分的景点标记为0,作为游客不喜欢的景点(负例);
步骤S3、根据景点及其相关的属性信息,构建景点的实体-关系三元组,例如:“故宫是国家5S级旅游景区”,则可以用三元组<故宫,景区等级,国家5S级>表示,其中“故宫”为景点实体,“景区等级”为三元组的关系属性,“国家5S级”为景点的属性,将所有景点及其旅游属性值表示成以上三元组的形式以构建景点知识图谱,利用网络表示学习(如TrSnsE)的方法来为知识图谱中的每一个景点、关系和景点属性学习一个低维的特征向量,根据每个景点的实体特征向量计算出该景点的上下文特征向量;
步骤4、将游客历史游览过的景点和候选景点的特征向量输入到卷积神经网络(KCNN)中,即将步骤S3中得到的景点的实体特征向量以及景点的上下文特征向量进行拼接作为KCNN的输入,经过卷积层和最大池化层的处理输出游客历史游览景点和候选景点的向量表示;
步骤S5、为了刻画游客历史游览景点对候选景点的不同影响以及表征游客多样化的偏好,将步骤S4得到的游客历史游览景点和候选景点的向量表示同时输入到注意力网络中,计算游客每个历史游览景点的影响权重,则游客关于候选景点的偏好向量通过计算游客历史游览景点向量表示的加权和得到;
步骤S6、将步骤S5得到的游客关于候选景点的偏好向量和候选景点的向量表示拼接后输入到深度神经网络中,计算出游客游览该景点的概率,将不同景点的预测概率从大到小排列,取前K个景点作为该游客的景点推荐列表。
图3显示的是本实例数据采集和处理的流程图,具体的步骤包含:
步骤L1、通过现有的网络爬虫工具,在同程旅游、携程、马蜂窝等旅游网站上爬取北京市内游客历史游览的景点序列,对景点的评分信息以及景点的多种旅游属性,旅游属性包括:景点等级、景点位置、景点类型、门票价格、建议游玩时长等。由于爬取的原始数据存在缺失、杂乱等问题无法直接用于后续的计算,需要对没有价值的数据进行清洗。例如,对游客历史游览的景点序列,只保留游览的景点数量大于等于5的序列;例如,对游客对景点的评分,去除那些游客已游览但是未评分的景点。
步骤L2、经过步骤L1处理后的原始数据不能直接作为模型的输入,为了便于后续计算,需要为上述游客、景点和景点属性值进行编号。即将步骤1处理后的游客、景点和景点相关属性值都设置唯一的ID,用该ID来表示唯一的一个对象。例如,游客“100100”的ID值设为0,游客“100101”的ID值设为1,景点“故宫”的ID值设为10,类似上述编码将所有的游客、景点和景点属性都分配一个ID值,由此得到匿名后的已编码数据。
步骤L3、由于所采集到的游客对景点实际评分都是显式评分,其分值都在1到5分之间,为了便于处理和简化后续的计算,将游客对景点评分大于等于3分的景点作为正例,表示游客喜欢的景点,标记为1;将游客对景点评分小于3分的景点作为负例,表示游客不喜欢的景点,标记为0,正例和负例的数量相同。
步骤L4、将上述步骤处理后的数据以三元组(h,r,t)的形式表示,h,r,t分别为头实体,关系和尾实体,在本实施例中h,r,t分别为游客,景点和标签。例如,游客1对景点10的评分为1,表示为(1,10,1)其中1表示游客的ID,10表示景点的ID,1为标签。将所有数据都表示成上述三元组的形式,三元组的形式可以清晰地表示游客历史游览的景点和评分信息,有助于后续的计算以及景点知识图谱地构建。基于上述三元组,将三元组中的头实体和尾实体通过关系进行链接,形成含有大规模语义信息的有向语义网络,即景点的知识图谱,该知识图谱由大量的景点实体、关系和景点属性组成。
步骤L5、上述三元组中的实体和关系只是景点和关系属性的ID表示,无法直接作为模型的输入,因此需要利用网络表示学习的方法将景点知识图谱中的景点实体和关系属性表示成低维的特征向量。在本实施例使用网络表示学习中的TransE模型来处理知识图谱,为上述三元组中的景点实体和关系分别学习一个唯一的低维特征向量,向量化后的景点实体和关系仍以三元组的形式存在。
上述知识图谱中项目的向量化流程如图4所示,其中步骤包括:
步骤M1、从构建好的景点知识图谱中抽取三元组的景点实体ID、关系ID和属性ID;
步骤M2、利用均匀分布产生的随机值初始化实体表示向量、关系表示向量和属性表示向量的各个维度,在该实施例中表示向量的维度为100,由此得到景点实体表示向量h,关系表示向量r和属性表示向量t,初始化所有向量后需要对上述表示向量进行归一化操作,通过归一化控制表示向量的模长度;
步骤M3、将归一化后的景点实体表示向量h、关系表示向量r和属性表示向量t在TransE模型下进行训练,使这三个表示向量在向量空间中满足h+r=t的距离性质,即景点实体表示向量h加上关系表示向量r等于属性表示向量t。其中,训练三元组并映射到向量空间的得分函数为:
fr(h,t)表示得分函数,L1/2表示得分函数可以使用L1范式或者L2范式进行运算,整个公式的含义是景点实体表示向量h和关系表示向量r相加所得的表示向量与属性表示向量t间地距离。在训练时使用随机梯度下降(Stochastic Gradient Descent,SGD)的方法更新景点实体表示向量h、关系表示向量r和属性表示向量t,使得上述表示向量间的关系满足得分函数fr(h,t)的要求,即fr(h,t)尽可能地趋近于0。
步骤M4、在实际的模型训练过程中,为了将三元组中的景点实体,关系和属性分别学习一个唯一的低维表示向量,通过最小化下面的目标函数实现:
L=∑(h,r,t)∈S∑(h′,r,t′)∈S′max(0,fr(h,t)+γ-fr(h′,t′))
其中,S是正确的三元组的集合,S′是错误三元组的集合,max(x,y)的作用是返回的和中较大的值,为正确三元组得分和错误三元组的得分之间的间隔距离。TransE模型训练的过程也就是通过调整各个三元组中实体、关系及属性的表示向量,使得目标函数L取得最小,也即通过优化表示向量使得正例三元组得分fr(h,t)尽可能接近0,而负例三元组得分fr(h′,t′)尽可能偏离0。通过优化函数的计算,使得正例三元组中的景点实体表示向量h和关系表示向量r相加所得的向量越来越接近属性表示向量t,负例三元组的景点实体表示向量h′和关系表示向量r相加所得的表示向量越来越远离属性表示向量t′。
TransE模型中的正例三元组S由景点知识图谱中的客观事实构成,负例三元组S′则由算法通过替换正例三元组S中的实体h或属性t随机生成的,即构成与客观事实相反的三元组。例如,正例三元组<故宫,景区等级,国家5A级>,<故宫,景区位置,北京东城区>的负例三元组分别可以为<故宫,景区等级,国家3A级>、<故宫,景区位置,北京海淀区>等。TransE模型通过正例三元组构建数量相等的负例三元组来完成景点知识图谱中各个实体,关系和属性表示向量的训练。
通过TransE模型向量化景点知识图谱中实体,关系和属性后,可以得到一个景点实体的表示向量。然而,一个景点实体除了自身的特征向量之外,还可以通过该实体的上下文实体表示,即实体e还可以由它在知识图谱中周围的其它实体特征向量共同表示。实体e的上下文定义为在知识图谱中与e直接相连的实体集合C(e),即:
C(e)={ei|(e,r,ei)∈G or(ei,r,e)∈G}
其中r为关系,G为景点知识图谱。从语义和逻辑上看,上下文实体通常与当前实体具有紧密的相关性,上下文实体的使用可以提供更加完备的辅助信息,帮助增加实体的可辨识性。例如,景点“故宫”的上下文实体包括“国家5A级(景点等级)”,“北京东城区长安街(景点位置)”,“历史古迹(景点类别)”,“72万平方米(景点占地面积)”等。给定实体e的上下文,则实体e的上下文特征向量e′通过计算e上下文实体的平均得到:
其中ei为实体ei通过TransE学到的特征向量。得到实体的特征向量和上下文特征向量后,通过KCNN生成游客历史游览景点和候选景点实体的向量表示。KCNN的结构如图5所示,其结构为:输入层,卷积层,最大池化层,输出层。实体向量表示的维度为100,卷积层的卷积核维度为(100,1,1,1),滑动窗口步幅为(1,1,1,1)。输入层接收的输入是将实体的特征向量和上下文特征向量进行拼接后的表示向量。经过KCNN的处理后,得到历史游览景点和候选景点实体的向量表示,由于历史游览景点对候选景点有不同的影响,为了获取用户多样化的兴趣,本发明提出利用注意力网络计算出不同历史游览景点的影响权重,根据历史游览景点的向量表示及相应的权重计算加权和得到用户最终的偏好,再将用户偏好和候选景点向量表示进行拼接,再通过深度神经网络(DNN)计算该用户访问该景点的概率。
融合了景点上下文信息的历史游览景点和候选景点向量表示生成的流程图如图6所示,具体的步骤如下:
步骤N1、将通过TransE学到的景点特征向量和上下文特征向量经由一个非线性变换函数g(e)=tanh(Me+b),其中M和b分别为可训练的变换矩阵和偏置,得到变换的景点特征向量g(e1:n)=[g(e1)g(e2)...g(en)]和变换的景点上下文特征向量g(e′1:n)=[g(e′1)g(e′2)...g(e′n)];
步骤N2、上述步骤1得到的变换景点特征向量和变换景点上下文特征向量具有相同的维度大小,类似彩色图像中的红绿蓝三通道,将上述变换后的特征向量进行拼接,得到KCNN的多通道输入W:
W=[[g(e1)g(e′1)][g(e2)g(e′2)]...[g(en)g(e′n)]]∈Rd×n×2
其中d为特征向量的维度,n为用户历史访问景点的个数;
步骤N3、得到多通道输入W后,利用具有不同窗口大小l的多重卷积核f∈Rd×l×2来抽取景点局部的特征映射
步骤N4、在步骤N3得到的特征映射上进行最大池化操作,来选择最重要的特征信息:
步骤N5、将步骤N4得到的所有特征映射进行拼接,作为景点最终的向量表示e(t):
其中m=1为卷积核的数量。
通过上述步骤得到景点的向量表示后,一种常见的方法是通过平均游客所有历史游览景点的向量表示作为游客关于候选景点的偏好向量。但是,如前所述,一个游客对不同景点的偏好是不同的,当考虑游客是否会游览某一候选景点时,游客的历史游览景点被认为对候选景点具有不同的影响。为了表征游客多样化的兴趣,本发明提出使用注意力网络来建模游客历史游览景点对候选景点的不同影响。
通过注意力网络计算游客每个历史游览景点的影响权重,得到游客对景点的偏好向量以及游客游览候选景点的概率的流程图如图7所示,具体的步骤包括:
步骤P1、给定游客i的一个历史游览景点以及候选景点tj,首先将和tj的表示向量进行拼接,将一个三层的深度神经网络(DNN)作为注意力网络H,H的输入层接收和tj拼接后的表示向量,经过隐藏层将拼接后的表示向量乘以权重加上偏置项,其中权重矩阵的维度为(100,100),偏置项的维度为(100),再通过Relu激活后利用softmax归一化输出影响权重
步骤P2、通过步骤P1得到影响权重后,游客i关于候选景点tj的偏好向量e(i)通过计算游客i历史游览景点向量表示的加权和得到:
步骤P3、经过上述步骤得到游客i的偏好向量e(i)和候选景点tj的向量表示e(tj)后,游客i游览景点tj的概率由另一个DNN N得到。N的结构与上述注意力网络H类似,即包含输入层、隐藏层和输出层的三层感知机(MLP)。首先将e(i)和e(tj)进行拼接,将拼接后的表示向量作为N输入,输入层包含100*2个神经元,隐藏层将输入乘以权重加上偏置项,其中权重矩阵的维度为(100*2,100),偏置项的维度为(100),再通过Relu对隐藏层的输出进行激活处理,然后利用sigmoid进行归一化得到最终的游客游览候选景点的概率
为0到1之间的浮点数。经过上述步骤得到游客游览候选景点的概率后,对于不同的候选景点的游览概率按从大到小排列,取前K个景点作为游客的推荐景点列表。
以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。本发明未详细描述的技术、形状、构造部分均为公知技术。
Claims (6)
1.一种基于游客偏好建模的个性化景点推荐方法,其特征在于,包括:
采集游客对景点的历史评分数值和景点相关属性数据,对采集到的原始数据进行预处理后,对数据中的游客、景点对象进行编号;
将评分大于等于一设定数值的景点的作为游客喜欢的景点并标签为1,将评分小于所述设定数值分的景点作为游客不喜欢的景点并标签为0;
构建景点的实体—关系三元组,然后以实体关系三元组为基础单元构建景点相关知识图谱,使用网络表示学习方法学习知识图谱中的结点结构及其属性特征,将知识图谱中每个实体和关系表示为一个对应的低维特征向量,再根据每个实体的特征向量生成该实体的上下文特征向量;
将游客历史访问过的景点输入到一卷积神经网络中,将实体的特征向量和相应的上下文特征向量进行拼接作为所述卷积神经网络的输入,卷积神经网络输出游客历史访问景点的向量表示;
将游客历史访问景点和候选景点的向量表示输入到注意力网络中,计算游客每个历史访问景点的影响权重,游客关于候选景点的偏好向量通过计算游客历史访问景点向量表示的加权和得到;
将游客偏好向量和候选景点的向量表示输入到一个深度神经网络中,计算游客访问该景点的概率,将不同候选景点的预测概率从大到小排列,取前K个景点作为该游客的推荐列表。
2.根据权利要求1所述的一种基于游客偏好建模的个性化景点推荐方法,其特征在于:所述采集游客对景点的历史评分数值和景点相关属性数据,对采集到的原始数据进行预处理,具体包括:
利用爬虫工具从旅游网站爬取游客历史游览景点序列及对景点的评分数据;
将游客、景点和景点属性进行编号,设置唯一的ID表示某一对象;
根据对景点的评分数据划分游客喜欢的景点和不喜欢的景点;
将景点及其属性信息表示成三元组的形式,基于三元组构建景点知识图谱;
利用网络表示学习的方法处理景点知识图谱,向量化景点实体和关系。
3.根据权利要求2所述的一种基于游客偏好建模的个性化景点推荐方法,其特征在于,所述利用网络表示学习的方法处理景点知识图谱,向量化景点实体和关系,具体包括:
取出三元组中的景点实体、关系和属性的ID;
随机初始化得到景点实体、关系和属性的表示向量,对所有表示向量归一化;
根据三元组的距离性质构建得分函数,训练三元组;
根据得分函数构建损失函数,通过优化损失函数学习实体和关系的向量表示。
4.根据权利要求3所述的一种基于游客偏好建模的个性化景点推荐方法,其特征在于,所述卷积神经网络输出游客历史访问景点的向量表示的具体步骤包括:
利用非线性变换函数得到变换的景点特征向量和景点上下文特征向量;
将变换的景点特征向量和景点上下文特征向量进行叠加,得到多通道输入;
利用多重卷积核抽取景点的特征映射;
在得到的特征映射上进行最大池化操作;
将最大池化后的所有特征进行拼接,得到景点最终的向量表示。
5.根据权利要求4所述的一种基于游客偏好建模的个性化景点推荐方法,其特征在于,所述将游客偏好向量和候选景点的向量表示输入到一个深度神经网络中,计算游客访问该景点的概率,具体包括:
将游客历史游览的景点及候选景点的表示向量进行拼接,输入DNN中得到影响权重;
计算游客历史游览景点表示向量的加权和,作为游客关于候选景点的偏好向量;
通过一深度神经网络计算游客游览候选景点的概率。
6.根据权利要求5所述的一种基于游客偏好建模的个性化景点推荐方法,其特征在于:所述旅游属性数据包括景点等级、景点位置、景点类型、门票价格、建议游玩时长。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910530074.9A CN110288436A (zh) | 2019-06-19 | 2019-06-19 | 一种基于游客偏好建模的个性化景点推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910530074.9A CN110288436A (zh) | 2019-06-19 | 2019-06-19 | 一种基于游客偏好建模的个性化景点推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110288436A true CN110288436A (zh) | 2019-09-27 |
Family
ID=68005211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910530074.9A Pending CN110288436A (zh) | 2019-06-19 | 2019-06-19 | 一种基于游客偏好建模的个性化景点推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110288436A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110795571A (zh) * | 2019-10-24 | 2020-02-14 | 南宁师范大学 | 基于深度学习和知识图谱的文化旅游资源推荐方法 |
CN110879864A (zh) * | 2019-10-29 | 2020-03-13 | 南京大学 | 一种基于图神经网络和注意力机制的上下文推荐方法 |
CN111191149A (zh) * | 2019-11-26 | 2020-05-22 | 恒大智慧科技有限公司 | 一种基于最短时间的旅游线路推荐方法、装置及存储介质 |
CN111259235A (zh) * | 2020-01-09 | 2020-06-09 | 齐鲁工业大学 | 基于上下文感知及特征交互建模的个性化推荐方法及*** |
CN111415198A (zh) * | 2020-03-19 | 2020-07-14 | 桂林电子科技大学 | 一种基于逆向强化学习的游客行为偏好建模方法 |
CN111460249A (zh) * | 2020-02-24 | 2020-07-28 | 桂林电子科技大学 | 一种基于学习者偏好建模的个性化学习资源推荐方法 |
CN111709819A (zh) * | 2020-01-20 | 2020-09-25 | 山东佳联电子商务有限公司 | 一种点拍网基于图神经网络的产权交易推荐***及推荐方法 |
CN111949885A (zh) * | 2020-08-27 | 2020-11-17 | 桂林电子科技大学 | 一种面向旅游景点的个性化推荐方法 |
CN112184341A (zh) * | 2020-11-10 | 2021-01-05 | 电子科技大学 | 一种基于档案网络的美食推荐方法 |
CN112214685A (zh) * | 2020-09-27 | 2021-01-12 | 电子科技大学 | 一种基于知识图谱的个性化推荐方法 |
CN112269882A (zh) * | 2020-10-12 | 2021-01-26 | 西安工程大学 | 一种面向知识图谱的旅游景点推荐方法 |
CN112784153A (zh) * | 2020-12-31 | 2021-05-11 | 山西大学 | 融合属性特征注意力与异质类型信息的旅游景点推荐方法 |
JP2023091701A (ja) * | 2021-12-20 | 2023-06-30 | ネイバー コーポレーション | ユーザ嗜好に基づいた場所個人化推薦のための方法、コンピュータシステム、およびコンピュータプログラム |
CN117407606A (zh) * | 2023-12-14 | 2024-01-16 | 青岛理工大学 | 一种基于大语言模型和知识图谱的旅游线路推荐方法 |
JP7460703B2 (ja) | 2021-08-06 | 2024-04-02 | 楽天グループ株式会社 | 共有されたニューラルアイテム表現をコールドスタート推薦に用いる改良型のレコメンダシステム及び方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107729444A (zh) * | 2017-09-30 | 2018-02-23 | 桂林电子科技大学 | 一种基于知识图谱的个性化旅游景点推荐方法 |
CN108563653A (zh) * | 2017-12-21 | 2018-09-21 | 清华大学 | 一种用于知识图谱中知识获取模型的构建方法及*** |
CN109087130A (zh) * | 2018-07-17 | 2018-12-25 | 深圳先进技术研究院 | 一种基于注意力机制的推荐***及推荐方法 |
CN109165350A (zh) * | 2018-08-23 | 2019-01-08 | 成都品果科技有限公司 | 一种基于深度知识感知的信息推荐方法和*** |
CN109189944A (zh) * | 2018-09-27 | 2019-01-11 | 桂林电子科技大学 | 基于用户正负反馈画像编码的个性化景点推荐方法及*** |
CN109829775A (zh) * | 2018-12-03 | 2019-05-31 | 苏州大学 | 一种物品推荐方法、装置、设备及可读存储介质 |
-
2019
- 2019-06-19 CN CN201910530074.9A patent/CN110288436A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107729444A (zh) * | 2017-09-30 | 2018-02-23 | 桂林电子科技大学 | 一种基于知识图谱的个性化旅游景点推荐方法 |
CN108563653A (zh) * | 2017-12-21 | 2018-09-21 | 清华大学 | 一种用于知识图谱中知识获取模型的构建方法及*** |
CN109087130A (zh) * | 2018-07-17 | 2018-12-25 | 深圳先进技术研究院 | 一种基于注意力机制的推荐***及推荐方法 |
CN109165350A (zh) * | 2018-08-23 | 2019-01-08 | 成都品果科技有限公司 | 一种基于深度知识感知的信息推荐方法和*** |
CN109189944A (zh) * | 2018-09-27 | 2019-01-11 | 桂林电子科技大学 | 基于用户正负反馈画像编码的个性化景点推荐方法及*** |
CN109829775A (zh) * | 2018-12-03 | 2019-05-31 | 苏州大学 | 一种物品推荐方法、装置、设备及可读存储介质 |
Non-Patent Citations (1)
Title |
---|
贾中浩 等: "旅游知识图谱特征学习的景点推荐", 《智能***学报》 * |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110795571B (zh) * | 2019-10-24 | 2023-05-05 | 南宁师范大学 | 基于深度学习和知识图谱的文化旅游资源推荐方法 |
CN110795571A (zh) * | 2019-10-24 | 2020-02-14 | 南宁师范大学 | 基于深度学习和知识图谱的文化旅游资源推荐方法 |
CN110879864B (zh) * | 2019-10-29 | 2022-06-07 | 南京大学 | 一种基于图神经网络和注意力机制的上下文推荐方法 |
CN110879864A (zh) * | 2019-10-29 | 2020-03-13 | 南京大学 | 一种基于图神经网络和注意力机制的上下文推荐方法 |
CN111191149A (zh) * | 2019-11-26 | 2020-05-22 | 恒大智慧科技有限公司 | 一种基于最短时间的旅游线路推荐方法、装置及存储介质 |
CN111259235A (zh) * | 2020-01-09 | 2020-06-09 | 齐鲁工业大学 | 基于上下文感知及特征交互建模的个性化推荐方法及*** |
CN111709819A (zh) * | 2020-01-20 | 2020-09-25 | 山东佳联电子商务有限公司 | 一种点拍网基于图神经网络的产权交易推荐***及推荐方法 |
CN111460249A (zh) * | 2020-02-24 | 2020-07-28 | 桂林电子科技大学 | 一种基于学习者偏好建模的个性化学习资源推荐方法 |
CN111415198A (zh) * | 2020-03-19 | 2020-07-14 | 桂林电子科技大学 | 一种基于逆向强化学习的游客行为偏好建模方法 |
CN111415198B (zh) * | 2020-03-19 | 2023-04-28 | 桂林电子科技大学 | 一种基于逆向强化学习的游客行为偏好建模方法 |
CN111949885A (zh) * | 2020-08-27 | 2020-11-17 | 桂林电子科技大学 | 一种面向旅游景点的个性化推荐方法 |
CN112214685B (zh) * | 2020-09-27 | 2023-03-28 | 电子科技大学 | 一种基于知识图谱的个性化推荐方法 |
CN112214685A (zh) * | 2020-09-27 | 2021-01-12 | 电子科技大学 | 一种基于知识图谱的个性化推荐方法 |
CN112269882B (zh) * | 2020-10-12 | 2022-10-18 | 西安工程大学 | 一种面向知识图谱的旅游景点推荐方法 |
CN112269882A (zh) * | 2020-10-12 | 2021-01-26 | 西安工程大学 | 一种面向知识图谱的旅游景点推荐方法 |
CN112184341A (zh) * | 2020-11-10 | 2021-01-05 | 电子科技大学 | 一种基于档案网络的美食推荐方法 |
CN112784153A (zh) * | 2020-12-31 | 2021-05-11 | 山西大学 | 融合属性特征注意力与异质类型信息的旅游景点推荐方法 |
CN112784153B (zh) * | 2020-12-31 | 2022-09-20 | 山西大学 | 融合属性特征注意力与异质类型信息的旅游景点推荐方法 |
JP7460703B2 (ja) | 2021-08-06 | 2024-04-02 | 楽天グループ株式会社 | 共有されたニューラルアイテム表現をコールドスタート推薦に用いる改良型のレコメンダシステム及び方法 |
JP2023091701A (ja) * | 2021-12-20 | 2023-06-30 | ネイバー コーポレーション | ユーザ嗜好に基づいた場所個人化推薦のための方法、コンピュータシステム、およびコンピュータプログラム |
JP7399216B2 (ja) | 2021-12-20 | 2023-12-15 | ネイバー コーポレーション | ユーザ嗜好に基づいた場所個人化推薦のための方法、コンピュータシステム、およびコンピュータプログラム |
CN117407606A (zh) * | 2023-12-14 | 2024-01-16 | 青岛理工大学 | 一种基于大语言模型和知识图谱的旅游线路推荐方法 |
CN117407606B (zh) * | 2023-12-14 | 2024-03-05 | 青岛理工大学 | 一种基于大语言模型和知识图谱的旅游线路推荐方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110288436A (zh) | 一种基于游客偏好建模的个性化景点推荐方法 | |
CN110555112B (zh) | 一种基于用户正负偏好学习的兴趣点推荐方法 | |
CN111460249B (zh) | 一种基于学习者偏好建模的个性化学习资源推荐方法 | |
CN110633409B (zh) | 一种融合规则与深度学习的汽车新闻事件抽取方法 | |
CN110287335B (zh) | 基于知识图谱和用户长短期偏好的个性化景点推荐方法及装置 | |
CN110287336B (zh) | 一种面向旅游景点推荐的游客画像构建方法 | |
CN110516160A (zh) | 基于知识图谱的用户建模方法、序列推荐方法 | |
CN109189944A (zh) | 基于用户正负反馈画像编码的个性化景点推荐方法及*** | |
CN110489547A (zh) | 一种基于混合式监督学习的旅游景点推荐方法及装置 | |
CN108804689A (zh) | 面向问答平台的融合用户隐连接关系的标签推荐方法 | |
Zhao et al. | Modeling fonts in context: Font prediction on web designs | |
CN112836120A (zh) | 一种基于多模态知识图谱的电影推荐方法、***及终端 | |
CN109544306A (zh) | 一种基于用户行为序列特征的跨领域推荐方法及装置 | |
CN112380435A (zh) | 基于异构图神经网络的文献推荐方法及推荐*** | |
CN111488931A (zh) | 文章质量评估方法、文章推荐方法及其对应的装置 | |
CN110795571A (zh) | 基于深度学习和知识图谱的文化旅游资源推荐方法 | |
CN108172047B (zh) | 一种网络在线学习资源个性化实时推荐方法 | |
CN108921657A (zh) | 一种基于知识增强记忆网络的序列推荐方法 | |
Díez et al. | Towards explainable personalized recommendations by learning from users’ photos | |
CN110489523A (zh) | 一种基于网购评价的细粒度情感分析方法 | |
CN112632296B (zh) | 基于知识图谱具有可解释性的论文推荐方法及***、终端 | |
CN109584006A (zh) | 一种基于深度匹配模型的跨平台商品匹配方法 | |
CN112131261B (zh) | 基于社区网络的社区查询方法、装置和计算机设备 | |
CN110990536A (zh) | 一种基于bert和知识图谱感知的cql生成方法 | |
CN110532464B (zh) | 一种基于多旅游上下文建模的旅游推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190927 |
|
RJ01 | Rejection of invention patent application after publication |