CN107133277A - 一种基于动态主题模型和矩阵分解的旅游景点推荐方法 - Google Patents
一种基于动态主题模型和矩阵分解的旅游景点推荐方法 Download PDFInfo
- Publication number
- CN107133277A CN107133277A CN201710237404.6A CN201710237404A CN107133277A CN 107133277 A CN107133277 A CN 107133277A CN 201710237404 A CN201710237404 A CN 201710237404A CN 107133277 A CN107133277 A CN 107133277A
- Authority
- CN
- China
- Prior art keywords
- mrow
- user
- msub
- sight spot
- msubsup
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 78
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000000354 decomposition reaction Methods 0.000 title claims abstract description 39
- 238000013480 data collection Methods 0.000 claims description 31
- 230000006870 function Effects 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 7
- 238000011478 gradient descent method Methods 0.000 claims description 6
- 239000000203 mixture Substances 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 239000008186 active pharmaceutical agent Substances 0.000 claims 2
- 230000004927 fusion Effects 0.000 claims 1
- 239000003550 marker Substances 0.000 claims 1
- 230000008859 change Effects 0.000 abstract description 6
- 230000003068 static effect Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 3
- 206010068052 Mosaicism Diseases 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 210000003765 sex chromosome Anatomy 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于动态主题模型和矩阵分解的旅游景点推荐方法,通过分析用户在不同时间间隔内的旅行历史信息获得用户旅行偏爱的变化,为用户提供细粒度的旅游推荐服务。方法首先从社交网络中获取数据集的信息。其次,利用动态主题模型从用户历史信息中挖掘用户和景点的隐式特征信息。再次,通过对数据集分析,挖掘用户和景点的显式特征信息,并结合用户和景点的隐式特征信息获得用户‑用户和景点‑景点相似性信息。最后,利用带有联合正则项的矩阵分解方法融合用户‑用户和景点‑景点的相似性信息。该方法能够获得用户的旅行偏爱的变化,为用户推荐合适的旅游景点。
Description
技术领域
本发明涉及信息推荐技术领域,尤其涉及一种基于动态主题模型和矩阵分解的旅游景点推荐方法。
背景技术
近年来,随着移动互联网、智能手机、以及照片分享网站(例如:Flickr、Panoramio、以及Instagram等)的快速发展,互联网上出现了大量带有地理位置信息的照片数据。并且,这些由群体所贡献的带有地理位置信息的照片数量呈现出急剧增长的趋势。基于这些带有地理位置信息的照片可以挖掘城市中的旅游景点、获得城市中受游客欢迎的旅游线路、分析游客的旅游偏爱,进一步为用户提供个性化的旅游景点或者旅游线路推荐服务。
目前的基于带有地理位置信息照片挖掘的旅游景点推荐方法通常是直接利用用户访问景点的次数信息获得用户间的相似性信息,并结合基于用户的协同过滤方法为用户推荐景点。然而,由于旅行时间或者金钱花费的限制,用户在旅游城市中通常只会游览少量的景点,导致了基于用户-景点矩阵的推荐***在建模过程中出现数据稀疏性问题。
为解决上述景点推荐中的数据稀疏性问题,目前出现了基于数据降维的景点推荐方法,例如:静态主题模型。该模型是文本挖掘领域中一种比较流行的获得文档隐含主题的方法。在该模型中,用户的旅行历史被看作是文档,旅游景点被看作是词。通过该模型,用户和景点的主题概率分布可以获得。然而,静态主题模型在基于用户旅行历史获得用户旅行偏爱的主题概率分布时,将用户在所有时间段内(例如:年份)的旅行历史信息看作成一个文档,忽略了用户在不同时间段内旅行偏爱的变化问题。
动态主题模型是基于静态主题模型获得文档主题变化的一种扩展形式。它通过将文档集按照时间段划分成子文档集,假设每一个子文档集的主题具有前后依赖关系,主题是随着时间而演化的。通过该模型,文档和词在不同时间段的主题概率分布可以获得,这些在不同时间段的主题体现了文档和词的主题演化过程。该模型为解决在旅游推荐中静态主题模型不能获得用户旅行偏爱的变化问题提供了可能。
发明内容
本发明要解决的问题是如何通过动态主题模型获得用户旅行偏爱变化信息,为用户提供细粒度的旅游景点推荐服务。
一种基于动态主题模型和矩阵分解的旅游景点推荐方法,包括:
获取数据集信息阶段:从社交网络中获取照片数据集Dphoto并对其进行去噪处理,得到旅游照片数据集Dphoto-travel,再从社交网络中签到数据Dcheck-in,并提取签到数据Dcheck-in中的签到地点的类别信息,得到签到地点的类别数据集Dcategory;
获得用户旅行偏爱阶段:利用动态主题模型从旅游照片数据集Dphoto-travel中提取用户和景点的隐式特征;然后,通过对旅游照片数据集Dphoto-travel的分析,统计得到用户和景点的显式特征,并结合用户和景点的隐式特征获得用户-用户和景点-景点相似性信息;最后,利用带有联合正则项的矩阵分解方法融合用户-用户和景点-景点的相似性信息,补全稀疏的用户-景点矩阵Y,得到含有用户旅行偏爱信息的矩阵Y’;
推荐旅游景点阶段:利用矩阵Y’对候选集中的景点打分,并将打分排名前N个旅游景点推荐给用户。
所述的获取数据集信息阶段的具体步骤为:
(1-1)利用照片分享网站的公用API下载旅游城市中带有地理位置信息的照片数据,组成照片数据集Dphoto;
(1-2)利用基于熵的流动性方法对照片数据集Dphoto中的非旅游照片进行过滤,去除照片集中的噪音照片,得到旅游照片数据集Dphoto-travel;
(1-3)利用基于位置的社交媒体网站的公用API下载用户在旅游城市中的签到数据Dcheck-in;
(1-4)提取签到数据Dcheck-in中的签到地点的类别信息,并统计组成签到地点的类别数据集Dcategory。
所述的照片数据集Dphoto中的照片数据包含:照片的标识信息、照片拍摄时间、照片拍摄地点的经纬度信息、用户为照片添加的文本描述信息以及照片上传者的标识信息。
所述的签到数据Dcheck-in中的签到数据包括:用户签到行为的标识信息、用户签到的时间信息、签到地点的经纬度信息、签到地点的类别信息以及签到用户的标识信息。
所述的获得用户旅行偏爱阶段的具体步骤为:
(2-1)利用基于密度的聚类方法对旅游照片数据集Dphoto-travel中的照片进行空间聚类,获得旅游景点集合L;
(2-2)根据从旅游照片数据集Dphoto-travel统计得到的用户访问景点的次数、旅游景点集合L中的旅游景点,构建用户-景点矩阵Y;
(2-3)将文档代表用户旅行历史,词代表旅游景点,利用动态主题模型推断用户和景点在不同时间段的潜在主题概率分布,并联合所有时间段的主题概率分布,得到用户的全部隐式特征和景点的全部隐式特征
(2-4)从旅游照片数据集Dphoto-trave和签到地点的类别数据集Dcategorye中提取用户的显式特征和景点的显式特征然后结合用户的全部隐式特征和景点的全部隐式特征建立用户画像Fuser和景点画像Flocation,并利用余弦函数构建m×m的用户-用户相似性矩阵A和n×n的景点-景点相似性矩阵B;
(2-5)根据建立的Y、A、以及B,利用用户-用户以及景点-景点的相似性关系构建带有联合正则项的矩阵分解模型,完成对Y的分解;
(2-6)根据带有联合正则项的矩阵分解的结果,补全稀疏的用户-景点矩阵Y,得到含有用户旅行偏爱信息的矩阵Y’。
所述的步骤(2-2)的具体步骤为:
(2-2-1)从旅游照片数据集Dphoto-trave中提取所有的访问信息v=(l,u,t),其中,v表示用户u于t时间访问旅游景点l;
(2-2-2)根据所有的访问信息v=(l,u,t)统计每个用户访问每个景点的次数和旅游照片数据集Dphoto-trave中的用户总个数m;
(2-2-3)根据每个用户访问每个景点的次数、用户总个数m以及旅游景点集合L中的共计n个旅游景点,构建用户-景点矩阵Y,其中,Y∈Rm×n,矩阵Y中(i,j)位置处的值为第i个用户访问第j个景点的次数。
所述的步骤(2-3)的具体步骤为:
(2-3-1)将旅游照片数据集Dphoto-trave中所有的访问信息v=(l,u,t)按照相同的时间长度切片,得到与每个时间段对应子数据集,共M个;
(2-3-2)将子数据集作为动态主题模型的输入,通过训练获得用户和景点在不同时间段的主题概率分布,
其中,为用户在第T个时间段的主题概率分布,景点在第T个时间段的主题概率分布,k为主题个数;
(2-3-3)将用户在所有时间段的主题概率分布按时间串联在一起,组成用户的全部隐式特征将景点在所有时间段的主题概率分布按时间串联在一起,组成景点的全部隐式特征
所述的步骤(2-4)的具体步骤为:
(2-4-1)对旅游照片数据集Dphoto-trave中所有的访问信息v=(l,u,t)和签到地点的类别数据集Dcategory进行统计,获得用户的显式特征和景点的显式特征其中,r为用户的显式特征的总个数,s为景点的显式特征的总个数;
(2-4-2)将用户的显式特征与隐式特征联合一起,构建用户画像将景点的显式特征与隐式特征联合一起,构建景点画像
(2-4-3)结合余弦公式获得用户-用户相似性矩阵A:
其中,fpi和fqi分别表示用户p和q的第i个显式特征;
同样利用余弦公式获得景点-景点相似性矩阵B,此时,余弦公式为:
其中,fx′i和fy′i分别表示景点x和y的第i个显式特征。
步骤(2-5)中,在矩阵Y的分解过程中,将A和B的相似性信息作为额外正则项限制Y的分解,具体的目标函数为:
其中,Rij为矩阵Y中(i,j)位置处的数值,Iij表示是用户i是否访问景点j的标识器,如果访问,其值为1,否则为0,Simig表示用户i和用户g之间的相似性信息,Simjq表示景点j和景点q景点之间的相似性信息;Ui表示为用户i的潜在特征向量,Ug表示为用户g的潜在特征向量,Lj表示为景点j的潜在特征向量,Lg表示为景点g的潜在特征向量,表示用户i的潜在特征向量与用户g的潜在特征向量的距离,G(i)表示用户i的相似性用户群,Q(j)表示表示景点j的相似性景点群,U是Y分解后的用户的潜在特征向量,是d×m维的;L是Y分解后的景点的潜在特征向量,是d×n维的;其中,m、n、以及d分别表示用户个数、景点个数、以及潜在特征向量的个数;
基于带有联合正则项的矩阵分解模型分解Y的具体步骤如下:
(a)随机初始化参数U和参数L,并设置学习率α、误差阈值δ、参数λ1和λ2;
(b)对于Y中每一个非零值Rij,根据计算Rij的估计值Xij,并根据计算Xij与真实值Rij的误差,最后根据统计对所有非零值的总误差θ,其中,w为非零值的个数;
(c)判断总误差θ是否大于误差阈值δ,若是,执行步骤(d),若否,迭代结束,此时的U和L为最优值,完成对矩阵Y的分解;
(d)采用梯度下降方法更新U和L的值,然后跳转执行步骤(b),梯度下降方法的公式为:
步骤(2-6)中,根据公式对Y中缺失的值进行填充,填充后的值代表用户的旅行偏爱信息。
所述的推荐旅游景点阶段的具体步骤为:
(3-1)根据用户输入信息获得用户在旅游城市中景点集合,这些景点作为推荐的候选集;
(3-2)根据矩阵Y’获得用户对推荐的候选集中景点的打分,获得用户偏爱景点;
(3-3)对偏爱景点的打分进行降序排列,选择打分排名前N个旅游景点推荐给用户。
本发明针对传统静态主题模型不足以获得用户旅行偏爱的主题演化问题,提出一种基于动态主题模型和矩阵分解的旅游景点推荐方法,与现有的方法相比,其优点在于:
(1)利用动态主题模型,获得用户的旅行偏爱的主题变化信息(隐式特征信息)。
(2)通过对数据集信息的分析,获得了用户和景点大量显式特征信息,这些信息与隐式特征信息一起可以全面描述用户和景点的特点。
(3)通过带有联合正则项的矩阵分解方法融合用户-用户和景点-景点相似性的信息,这种方法可以在用户-景点矩阵分解的过程中同时限制用户和景点的潜在特征向量,准确补全用户-景点矩阵。
附图说明
图1是本发明基于动态主题模型和矩阵分解的旅游景点推荐方法流程图;
图2是获取数据集信息阶段的流程图;
图3是获得用户旅行偏爱阶段的流程图;
图4是基于动态主题模型的文档生成原理图;
图5是推荐旅游景点阶段的流程图。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
如图1所示,本发明基于动态主题模型和矩阵分解的旅游景点推荐方法分为获取数据集信息、获得用户旅行偏爱、以及推荐旅游景点三个阶段:
获取数据集信息阶段
数据处理的流程图如图2所示,步骤如下:
S1-1,利用照片分享网站的公用API下载旅游城市中带有地理位置信息的照片数据集Dphoto。
获取照片数据的具体步骤包括:
S1-1-1,通过照片分享网站(如:Flickr)提供的公用API,按城市下载在该城市中拍摄的照片及相应的元数据信息。一张带有地理位置信息的照片p可以表示为:p=(pid,pt,pg,px,pu)。其中,pid,pt,pg,px,pu分别表示为照片的唯一标识号、用户拍摄照片的时间、照片的经纬度信息、用户为照片添加的文本描述信息、以及照片上传者的唯一标识号;
S1-1-2,对收集的照片集按照照片的唯一标识信息获得每个用户拍摄的所有照片信息,Hi={p1,p2,…,pe},其中,e为用户i拍摄的所有照片数。
S1-2,利用基于熵的流动性方法对照片数据集Dphoto中的非旅游照片进行过滤,去除照片集中的噪音照片,得到旅游照片数据集Dphoto-travel。
去除非旅游照片的具体步骤如下:
S1-2-1,根据照片内容以及经验知识对用户的照片集进行人工标注少量旅游照片和非旅游照片;
S1-2-2,将城市分成x′×y′个小格子(每个小格子表示为(xi,yj),i=1,2,…,x;j=1,2,…,y),统计用户的照片在这些小格子中的照片数目,并计算每个小格子中照片占整个照片数量的比例a,根据信息熵的原理计算用户的照片集的流动性熵Hmobility,计算过程如公式如下式所示
根据Hmobility>ε,调节ε的值(从0到1,每隔0.1),统计对人工标注照片集的分类准确率,选择准确率高的ε对整个数据集中的照片进行分类,去除非旅游照片。
S1-3,利用基于位置的社交媒体网站的公用API下载用户在旅游城市中的签到数据Dcheck-in。
获取签到数据的具体步骤包括:
S1-3-1,通过基于位置的社交媒体网站(如:SinaWeibo)提供的公用API,按城市下载在该城市中用户签到的数据。用户的一次签到行为q可以表示为:q=(qid,qt,qg,qc,qu);其中,qid,qt,qg,qc,qu分别表示签到行为的唯一标识号、用户签到的时间、兴趣点的经纬度信息、兴趣点的类别信息、以及签到用户的唯一标识号;
S1-3-2,根据用户签到数据的用户标识号提取每个用户的所有签到数据;Qi={q1,q2,…,qo},其中,o为用户i在城市中的所有签到数。
S1-4,提取签到数据Dcheck-in中的签到地点的类别信息,并统计组成签到地点的类别数据集Dcategory。
用户签到行为信息中包含用户访问兴趣点时添加的一些类别信息,对这些信息进行统计可以获得每个兴趣点所有的类别信息,具体可以表示为:CPOI=(c1,c2,…,cz)。其中,z为兴趣点包含的类别数目。
获得用户旅行偏爱阶段
获得用户旅行偏爱阶段的流程图如图3所示,步骤如下:
S2-1,利用基于密度的聚类方法对带有地理位置信息的照片进行空间聚类,从而获得旅游城市中旅游景点集合L。
用户通常在其比较感兴趣的地点拍摄照片,如果大量用户在一个地点拍摄照片,则该地点可以认为是一个旅游景点。采用基于密度的聚类方法(例如:P-DBSCAN)对大量带有地理位置信息的照片进行空间上的聚类,得到的每个聚类代表一个旅游景点,聚类中心即为该旅游景点位置。通过该过程,挖掘出旅游景点集L={l1,l2,…,ln},其中l={Pl,gl},Pl是属于一个景点的所有照片集合,gl是一个景点的经纬度信息。
S2-2,根据从照片中挖掘的旅游景点以及用户在景点的访问历史,统计用户访问景点的次数信息,构建用户-景点矩阵Y。
建立用户-景点矩阵的具体步骤包括:
S2-2-1,从照片集中提取用户对景点的历史访问信息,v=(l,u,t)。其中,l,u,t分别为用户访问的旅游景点、用户的标示、以及用户访问该景点的时间。
S2-2-2,统计用户访问景点次数。构建的用户-景点矩阵可以表示为Y:Y∈Rm×n,m和n分别表示用户和景点个数,矩阵中的值为用户访问景点的次数。
S2-3,将文档代表用户旅行历史,词代表旅游景点,利用动态主题模型推断用户和景点在不同时间段的潜在主题概率分布,并联合所有时间段的主题概率分布,得到用户的全部隐式特征和景点的全部隐式特征
动态主题模型是已经被研究者成功用于获得文档的潜在主题变化的应用中。对于一个文档,其具体生成过程如图4所示。在该图中,文档集按照时间被分成几个子文档集,不同时间段的文档集和词的主题是具有前后依赖关系的,后一个时间段的主题分布是由前一个时间段主题演化而来。α是控制子文档集的主题分布的参数,θ是控制单个文档的主题分布的参数,β是控制主题在词上的概率分布参数,z表示主题,k表示主题个数,w表示词,N表示文档,A表示子文档集。通过该模型,文档和词在不同时间段的主题概率分布都可以获得。
在基于带有地理位置信息照片挖掘的旅游推荐中,用户的旅行历史信息可以被看作是多个主题的组合,每个主题是多个景点的概率分布。简单地说,在使用动态主题模型时,文档代表用户旅行历史,词代表旅游景点。
S2-3-1,获得用户和景点隐式特征的具体步骤包括:
将用户的旅游历史信息按照时间切片(例如:年份)划分为不同的子数据集。
S2-3-2,将子数据集作为动态主题模型的输入,通过训练获得用户和景点在不同时间段的主题概率分布,
其中,为用户在第T个时间段的主题概率分布,景点在第T个时间段的主题概率分布,k为主题个数;
S2-3-3,将用户在所有时间段的主题概率分布按时间串联在一起,组成用户的全部隐式特征将景点在所有时间段的主题概率分布按时间串联在一起,组成景点的全部隐式特征
S2-4,从用户旅行历史中提取用户的显式特征和景点的显式特征然后结合用户的全部隐式特征和景点的全部隐式特征建立用户画像Fuser和景点画像Flocation,并利用余弦函数构建m×m的用户-用户相似性矩阵A和n×n的景点-景点相似性矩阵B。
建立A和B的具体步骤包括:
S2-4-1,对用户访问景点的历史信息进行统计(例如:用户访问景点的总个数、一个景点被访问的总用户数、景点类别信息等),获得大量显示信息以描述用户和景点的特征,分别表示为:和其中,r和s分别表示用户和景点显示特征的总个数,每个具体的特征如表1和表2所示。这些特征中有些特征的获取需要利用第三方网络服务获得,具体说明如下:
性别和年龄信息:游客的这些信息通过第三方网络服务对照片的内容进行分析获得。例如:www.alchemyapi.com,当该网络服务获得一张上传的照片时,它会调用其API函数(即,Alchemy Vision Face Detection and Recognition API)对照片进行分析,然后返回给上传者该照片中所出现的人脸的性别和年龄信息。对所有在一个景点拍摄的照片中人脸的性别和年龄信息进行统计,即可获得该景点的性别和年龄信息的分布。类似的,通过对一个用户所拍摄的所有照片中人脸的性别和年龄信息的统计,获得该用户所拍摄照片中的人脸的性别和年龄信息的分布。
天气信息:基于第三方天气网络服务、照片的经纬度信息、以及照片拍摄的时间可以获得该照片拍摄时的天气信息。例如:wundgerground.com,通过该网络服务的API函数,可以获得每个位置的不同时间点的天气信息。对用户在不同天气条件下拍摄的照片进行统计,可以获得该景点在不同天气情况下受游客欢迎的程度。
S2-4-2,将用户和景点的显式特征以及隐式特征联合一起,构建用户和景点的画像,即:和
S2-4-3,结合余弦公式获得用户-用户相似性矩阵A(m×m):
其中,fpi和fqi分别表示用户p和q的第i个显式特征;
同样利用余弦公式获得景点-景点相似性矩阵B(n×n),此时,余弦公式为:
其中,f′xi和f′yi分别表示景点x和y的第i个显式特征。
S2-5,根据建立的Y、A、以及B,利用用户-用户以及景点-景点的相似性关系构建带有联合正则项的矩阵分解模型,完成对Y的分解。
在Y分解过程中,将A和B的相似性信息作为额外正则项限制Y的分解,具体的目标函数为:
在该公式中Simig表示用户ui和用户ug之间的相似性信息,Simjq表示景点lj和lq景点之间的相似性信息。U(d×m)和L(d×n)分别是Y分解后的用户和景点的潜在向量表示。其中,m、n、以及d分别表示用户个数、景点个数、以及潜在特征向量的个数。
基于带有联合正则项的矩阵分解模型分解Y的具体步骤如下:
(a)随机初始化参数U和参数L,并设置学习率α、误差阈值δ、参数λ1和λ2;
(b)对于Y中每一个非零值Rij,根据计算Rij的估计值Xij,并根据计算Xij与真实值Rij的误差,最后根据统计对所有非零值的总误差θ,其中,w为非零值的个数;
(c)判断总误差θ是否大于误差阈值δ,若是,执行步骤(d),若否,迭代结束,此时的U和L为最优值,完成对矩阵Y的分解;
(d)采用梯度下降方法跟新U和L的值,然后跳转执行步骤(b),梯度下降方法的公式为:
S2-6,根据带有联合正则项的矩阵分解的结果,补全稀疏的Y,获得用户旅行偏爱。
根据公式对Y中缺失的值进行填充,填充后的值代表用户的旅行偏爱信息。
表1 用户显式特征信息
表2 景点显式特征信息
推荐旅游景点阶段
推荐旅游景点的流程如图5所示,主要包括以下步骤:
S3-1,根据用户输入信息获得用户在旅游城市中(目的地)景点集合,这些景点作为推荐的候选集。
根据用户的ID和用户旅游城市c(目的地),在补全的用户-景点矩阵中进行查找,获得该旅游城市c中的景点集合L′。
S3-2,根据步骤1的结果和补全的用户-景点矩阵获得用户对这些景点的打分,即获得用户对这些景点的偏爱。
补全的用户-景点矩阵中的每一个值体现了用户对不同景点的偏爱打分,根据该矩阵以及L′可以获得用户在旅游城市中对不同景点的偏爱。
S3-3,根据S3-2对景点进行排序,选择top N旅游景点推荐给用户。
根据用户在旅游城市中不同景点的打分,按照降序进行排列,将排在前面的N个景点推荐给用户。
以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种基于动态主题模型和矩阵分解的旅游景点推荐方法,包括:
获取数据集信息阶段:从社交网络中获取照片数据集Dphoto并对其进行去噪处理,得到旅游照片数据集Dphoto-travel,再从社交网络中签到数据Dcheck-in,并提取签到数据Dcheck-in中的签到地点的类别信息,得到签到地点的类别数据集Dcategory;
获得用户旅行偏爱阶段:利用动态主题模型从旅游照片数据集Dphoto-travel中提取用户和景点的隐式特征;然后,通过对旅游照片数据集Dphoto-travel的分析,统计得到用户和景点的显式特征,并结合用户和景点的隐式特征获得用户-用户和景点-景点相似性信息;最后,利用带有联合正则项的矩阵分解方法融合用户-用户和景点-景点的相似性信息,补全稀疏的用户-景点矩阵Y,得到含有用户旅行偏爱信息的矩阵Y’;
推荐旅游景点阶段:利用矩阵Y’对候选集中的景点打分,并将打分排名前N个旅游景点推荐给用户。
2.如权利要求1所述的基于动态主题模型和矩阵分解的旅游景点推荐方法,其特征在于,所述的获取数据集信息阶段的具体步骤为:
(1-1)利用照片分享网站的公用API下载旅游城市中带有地理位置信息的照片数据,组成照片数据集Dphoto;
(1-2)利用基于熵的流动性方法对照片数据集Dphoto中的非旅游照片进行过滤,去除照片集中的噪音照片,得到旅游照片数据集Dphoto-travel;
(1-3)利用基于位置的社交媒体网站的公用API下载用户在旅游城市中的签到数据Dcheck-in;
(1-4)提取签到数据Dcheck-in中的签到地点的类别信息,并统计组成签到地点的类别数据集Dcategory。
3.如权利要求1所述的基于动态主题模型和矩阵分解的旅游景点推荐方法,其特征在于,所述的获得用户旅行偏爱阶段的具体步骤为:
(2-1)利用基于密度的聚类方法对旅游照片数据集Dphoto-travel中的照片进行空间聚类,获得旅游景点集合L;
(2-2)根据从旅游照片数据集Dphoto-travel统计得到的用户访问景点的次数、旅游景点集合L中的旅游景点,构建用户-景点矩阵Y;
(2-3)将文档代表用户旅行历史,词代表旅游景点,利用动态主题模型推断用户和景点在不同时间段的潜在主题概率分布,并联合所有时间段的主题概率分布,得到用户的全部隐式特征和景点的全部隐式特征
(2-4)从旅游照片数据集Dphoto-trav和签到地点的类别数据集Dcategorye中提取用户的显式特征和景点的显式特征然后结合用户的全部隐式特征和景点的全部隐式特征建立用户画像Fuser和景点画像Flocation,并利用余弦函数构建m×m的用户-用户相似性矩阵A和n×n的景点-景点相似性矩阵B;
(2-5)根据建立的Y、A、以及B,利用用户-用户以及景点-景点的相似性关系构建带有联合正则项的矩阵分解模型,完成对Y的分解;
(2-6)根据带有联合正则项的矩阵分解的结果,补全稀疏的用户-景点矩阵Y,得到含有用户旅行偏爱信息的矩阵Y’。
4.如权利要求3所述的基于动态主题模型和矩阵分解的旅游景点推荐方法,其特征在于,所述的步骤(2-2)的具体步骤为:
(2-2-1)从旅游照片数据集Dphoto-trave中提取所有的访问信息v=(l,u,t),其中,v表示用户u于t时间访问旅游景点l;
(2-2-2)根据所有的访问信息v=(l,u,t)统计每个用户访问每个景点的次数和旅游照片数据集Dphoto-trave中的用户总个数m;
(2-2-3)根据每个用户访问每个景点的次数、用户总个数m以及旅游景点集合L中的共计n个旅游景点,构建用户-景点矩阵Y,其中,Y∈Rm×n,矩阵Y中(i,j)位置处的值为第i个用户访问第j个景点的次数。
5.如权利要求3所述的基于动态主题模型和矩阵分解的旅游景点推荐方法,其特征在于,所述的步骤(2-3)的具体步骤为:
(2-3-1)将旅游照片数据集Dphoto-trave中所有的访问信息v=(l,u,t)按照相同的时间长度切片,得到与每个时间段对应子数据集,共M个;
(2-3-2)将子数据集作为动态主题模型的输入,通过训练获得用户和景点在不同时间段的主题概率分布,
<mrow>
<msubsup>
<mi>F</mi>
<mrow>
<mi>u</mi>
<mi>s</mi>
<mi>e</mi>
<mi>r</mi>
</mrow>
<mi>T</mi>
</msubsup>
<mo>=</mo>
<mrow>
<mo>(</mo>
<msubsup>
<mi>f</mi>
<mn>1</mn>
<mrow>
<mi>u</mi>
<mi>T</mi>
</mrow>
</msubsup>
<mo>,</mo>
<msubsup>
<mi>f</mi>
<mn>2</mn>
<mrow>
<mi>u</mi>
<mi>T</mi>
</mrow>
</msubsup>
<mo>,</mo>
<mo>...</mo>
<mo>,</mo>
<msubsup>
<mi>f</mi>
<mi>k</mi>
<mrow>
<mi>u</mi>
<mi>T</mi>
</mrow>
</msubsup>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msubsup>
<mi>F</mi>
<mrow>
<mi>l</mi>
<mi>o</mi>
<mi>c</mi>
<mi>a</mi>
<mi>t</mi>
<mi>i</mi>
<mi>o</mi>
<mi>n</mi>
</mrow>
<mi>T</mi>
</msubsup>
<mo>=</mo>
<mrow>
<mo>(</mo>
<msubsup>
<mi>f</mi>
<mn>1</mn>
<mrow>
<mi>l</mi>
<mi>T</mi>
</mrow>
</msubsup>
<mo>,</mo>
<msubsup>
<mi>f</mi>
<mn>2</mn>
<mrow>
<mi>l</mi>
<mi>T</mi>
</mrow>
</msubsup>
<mo>,</mo>
<mo>...</mo>
<mo>,</mo>
<msubsup>
<mi>f</mi>
<mi>k</mi>
<mrow>
<mi>l</mi>
<mi>T</mi>
</mrow>
</msubsup>
<mo>)</mo>
</mrow>
</mrow>
其中,为用户在第T个时间段的主题概率分布,景点在第T个时间段的主题概率分布,k为主题个数;
(2-3-3)将用户在所有时间段的主题概率分布按时间串联在一起,组成用户的全部隐式特征将景点在所有时间段的主题概率分布按时间串联在一起,组成景点的全部隐式特征
6.如权利要求5所述的基于动态主题模型和矩阵分解的旅游景点推荐方法,其特征在于,所述的步骤(2-4)的具体步骤为:
(2-4-1)对旅游照片数据集Dphoto-trave中所有的访问信息v=(l,u,t)和签到地点的类别数据集Dcategory进行统计,获得用户的显式特征和景点的显式特征其中,r为用户的显式特征的总个数,s为景点的显式特征的总个数;
(2-4-2)将用户的显式特征与隐式特征联合一起,构建用户画像将景点的显式特征与隐式特征联合一起,构建景点画像
(2-4-3)结合余弦公式获得用户-用户相似性矩阵A:
<mrow>
<mi>S</mi>
<mi>i</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>u</mi>
<mi>p</mi>
</msub>
<mo>,</mo>
<msub>
<mi>u</mi>
<mi>q</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>r</mi>
</msubsup>
<msub>
<mi>f</mi>
<mrow>
<mi>p</mi>
<mi>i</mi>
</mrow>
</msub>
<mo>&times;</mo>
<msub>
<mi>f</mi>
<mrow>
<mi>q</mi>
<mi>i</mi>
</mrow>
</msub>
</mrow>
<mrow>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>u</mi>
<mi>p</mi>
</msub>
<mo>|</mo>
<mo>|</mo>
<mo>&CenterDot;</mo>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>u</mi>
<mi>q</mi>
</msub>
<mo>|</mo>
<mo>|</mo>
</mrow>
</mfrac>
</mrow>
2
<mrow>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>u</mi>
<mi>p</mi>
</msub>
<mo>|</mo>
<mo>|</mo>
<mo>=</mo>
<msqrt>
<mrow>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>r</mi>
</msubsup>
<msup>
<msub>
<mi>f</mi>
<mrow>
<mi>p</mi>
<mi>i</mi>
</mrow>
</msub>
<mn>2</mn>
</msup>
</mrow>
</msqrt>
</mrow>
<mrow>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>u</mi>
<mi>q</mi>
</msub>
<mo>|</mo>
<mo>|</mo>
<mo>=</mo>
<msqrt>
<mrow>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>r</mi>
</msubsup>
<msup>
<msub>
<mi>f</mi>
<mrow>
<mi>q</mi>
<mi>i</mi>
</mrow>
</msub>
<mn>2</mn>
</msup>
</mrow>
</msqrt>
</mrow>
其中,fpi和fqi分别表示用户p和q的第i个显式特征;
同样利用余弦公式获得景点-景点相似性矩阵B,此时,余弦公式为:
<mrow>
<mi>S</mi>
<mi>i</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>l</mi>
<mi>x</mi>
</msub>
<mo>,</mo>
<msub>
<mi>l</mi>
<mi>y</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>s</mi>
</msubsup>
<msubsup>
<mi>f</mi>
<mrow>
<mi>x</mi>
<mi>i</mi>
</mrow>
<mo>&prime;</mo>
</msubsup>
<mo>&times;</mo>
<msubsup>
<mi>f</mi>
<mrow>
<mi>y</mi>
<mi>i</mi>
</mrow>
<mo>&prime;</mo>
</msubsup>
</mrow>
<mrow>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>u</mi>
<mi>x</mi>
</msub>
<mo>|</mo>
<mo>|</mo>
<mo>&CenterDot;</mo>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>u</mi>
<mi>y</mi>
</msub>
<mo>|</mo>
<mo>|</mo>
</mrow>
</mfrac>
</mrow>
<mrow>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>l</mi>
<mi>x</mi>
</msub>
<mo>|</mo>
<mo>|</mo>
<mo>=</mo>
<msqrt>
<mrow>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>s</mi>
</msubsup>
<msup>
<msubsup>
<mi>f</mi>
<mrow>
<mi>x</mi>
<mi>i</mi>
</mrow>
<mo>&prime;</mo>
</msubsup>
<mn>2</mn>
</msup>
</mrow>
</msqrt>
</mrow>
<mrow>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>l</mi>
<mi>y</mi>
</msub>
<mo>|</mo>
<mo>|</mo>
<mo>=</mo>
<msqrt>
<mrow>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>s</mi>
</msubsup>
<msup>
<msubsup>
<mi>f</mi>
<mrow>
<mi>y</mi>
<mi>i</mi>
</mrow>
<mo>&prime;</mo>
</msubsup>
<mn>2</mn>
</msup>
</mrow>
</msqrt>
</mrow>
其中,f′xi和f′yi分别表示景点x和y的第i个显式特征。
7.如权利要求6所述的基于动态主题模型和矩阵分解的旅游景点推荐方法,其特征在于,步骤(2-5)中,在矩阵Y的分解过程中,将A和B的相似性信息作为额外正则项限制Y的分解,具体的目标函数为:
<mfenced open = "" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mi>V</mi>
<mo>=</mo>
<munder>
<mi>min</mi>
<mrow>
<mi>U</mi>
<mo>,</mo>
<mi>L</mi>
</mrow>
</munder>
<mfrac>
<mn>1</mn>
<mn>2</mn>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>m</mi>
</munderover>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>I</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>R</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>-</mo>
<msubsup>
<mi>U</mi>
<mi>i</mi>
<mi>T</mi>
</msubsup>
<msub>
<mi>L</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mo>+</mo>
<mfrac>
<msub>
<mi>&lambda;</mi>
<mn>1</mn>
</msub>
<mn>2</mn>
</mfrac>
<mrow>
<mo>(</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>m</mi>
</munderover>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>g</mi>
<mo>&Element;</mo>
<mi>G</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>)</mo>
</mrow>
</mrow>
</munder>
<msub>
<mi>Sim</mi>
<mrow>
<mi>i</mi>
<mi>g</mi>
</mrow>
</msub>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>U</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<msub>
<mi>U</mi>
<mi>g</mi>
</msub>
<mo>|</mo>
<msubsup>
<mo>|</mo>
<mi>F</mi>
<mn>2</mn>
</msubsup>
<mo>+</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>q</mi>
<mo>&Element;</mo>
<mi>Q</mi>
<mrow>
<mo>(</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
</mrow>
</munder>
<msub>
<mi>Sim</mi>
<mrow>
<mi>j</mi>
<mi>q</mi>
</mrow>
</msub>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>L</mi>
<mi>j</mi>
</msub>
<mo>-</mo>
<msub>
<mi>L</mi>
<mi>q</mi>
</msub>
<mo>|</mo>
<msubsup>
<mo>|</mo>
<mi>F</mi>
<mn>2</mn>
</msubsup>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mo>+</mo>
<mfrac>
<msub>
<mi>&lambda;</mi>
<mn>2</mn>
</msub>
<mn>2</mn>
</mfrac>
<mrow>
<mo>(</mo>
<mo>|</mo>
<mo>|</mo>
<mi>U</mi>
<mo>|</mo>
<msubsup>
<mo>|</mo>
<mi>F</mi>
<mn>2</mn>
</msubsup>
<mo>+</mo>
<mo>|</mo>
<mo>|</mo>
<mi>L</mi>
<mo>|</mo>
<msubsup>
<mo>|</mo>
<mi>F</mi>
<mn>2</mn>
</msubsup>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
其中,Rij为矩阵Y中(i,j)位置处的数值,Iij表示是用户i是否访问景点j的标识器,如果访问,其值为1,否则为0,Simig表示用户i和用户g之间的相似性信息,Simjq表示景点j和景点q景点之间的相似性信息;Ui表示为用户i的潜在特征向量,Ug表示为用户g的潜在特征向量,Lj表示为景点j的潜在特征向量,Lg表示为景点g的潜在特征向量,表示用户i的潜在特征向量与用户g的潜在特征向量的距离,G(i)表示用户i的相似性用户群,Q(j)表示表示景点j的相似性景点群,U是Y分解后的用户的潜在特征向量,是d×m维的;L是Y分解后的景点的潜在特征向量,是d×n维的;其中,m、n、以及d分别表示用户个数、景点个数、以及潜在特征向量的个数;
基于带有联合正则项的矩阵分解模型分解Y的具体步骤如下:
(a)随机初始化U和L,并设置学习率α、误差阈值δ、参数λ1和λ2;
(b)对于Y中每一个非零值Rij,根据计算Rij的估计值Xij,并根据计算Xij与真实值Rij的误差,最后根据统计对所有非零值的总误差θ,其中,w为非零值的个数;
(c)判断总误差θ是否大于误差阈值δ,若是,执行步骤(d),若否,迭代结束,此时的U和L为最优值,完成对矩阵Y的分解;
(d)采用梯度下降方法更新U和L的值,然后跳转执行步骤(b),梯度下降方法的公式为:
<mrow>
<msub>
<mi>U</mi>
<mi>i</mi>
</msub>
<mo>&LeftArrow;</mo>
<msub>
<mi>U</mi>
<mi>i</mi>
</msub>
<mo>+</mo>
<mi>&alpha;</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>&Delta;</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<msub>
<mi>L</mi>
<mi>j</mi>
</msub>
<mo>-</mo>
<msub>
<mi>&lambda;</mi>
<mn>1</mn>
</msub>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>g</mi>
<mo>&Element;</mo>
<mi>G</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>)</mo>
</mrow>
</mrow>
</munder>
<msub>
<mi>Sim</mi>
<mrow>
<mi>i</mi>
<mi>g</mi>
</mrow>
</msub>
<mo>(</mo>
<mrow>
<msub>
<mi>U</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<msub>
<mi>U</mi>
<mi>g</mi>
</msub>
</mrow>
<mo>)</mo>
<mo>-</mo>
<msub>
<mi>&lambda;</mi>
<mn>2</mn>
</msub>
<msub>
<mi>U</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>L</mi>
<mi>j</mi>
</msub>
<mo>&LeftArrow;</mo>
<msub>
<mi>L</mi>
<mi>j</mi>
</msub>
<mo>+</mo>
<mi>&alpha;</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>&Delta;</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<msub>
<mi>U</mi>
<mi>j</mi>
</msub>
<mo>-</mo>
<msub>
<mi>&lambda;</mi>
<mn>1</mn>
</msub>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>q</mi>
<mo>&Element;</mo>
<mi>Q</mi>
<mrow>
<mo>(</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
</mrow>
</munder>
<msub>
<mi>Sim</mi>
<mrow>
<mi>j</mi>
<mi>q</mi>
</mrow>
</msub>
<mo>(</mo>
<mrow>
<msub>
<mi>L</mi>
<mi>j</mi>
</msub>
<mo>-</mo>
<msub>
<mi>L</mi>
<mi>q</mi>
</msub>
</mrow>
<mo>)</mo>
<mo>-</mo>
<msub>
<mi>&lambda;</mi>
<mn>2</mn>
</msub>
<msub>
<mi>L</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>.</mo>
</mrow>
8.如权利要求7所述的基于动态主题模型和矩阵分解的旅游景点推荐方法,其特征在于,根据公式对Y中缺失的值进行填充,填充后的值代表用户的旅行偏爱信息。
9.如权利要求1所述的基于动态主题模型和矩阵分解的旅游景点推荐方法,其特征在于,所述的推荐旅游景点阶段的具体步骤为:
(3-1)根据用户输入信息获得用户在旅游城市中景点集合,这些景点作为推荐的候选集;
(3-2)根据矩阵Y’获得用户对推荐的候选集中景点的打分,获得用户偏爱景点;
(3-3)对偏爱景点的打分进行降序排列,选择打分排名前N个旅游景点推荐给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710237404.6A CN107133277B (zh) | 2017-04-12 | 2017-04-12 | 一种基于动态主题模型和矩阵分解的旅游景点推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710237404.6A CN107133277B (zh) | 2017-04-12 | 2017-04-12 | 一种基于动态主题模型和矩阵分解的旅游景点推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107133277A true CN107133277A (zh) | 2017-09-05 |
CN107133277B CN107133277B (zh) | 2019-09-06 |
Family
ID=59716372
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710237404.6A Expired - Fee Related CN107133277B (zh) | 2017-04-12 | 2017-04-12 | 一种基于动态主题模型和矩阵分解的旅游景点推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107133277B (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108537691A (zh) * | 2018-06-08 | 2018-09-14 | 延晋 | 一种区域游览智能管理***及方法 |
CN109754305A (zh) * | 2018-11-13 | 2019-05-14 | 北京码牛科技有限公司 | 基于矩阵分解算法的偏好发掘方法及装置 |
CN110119822A (zh) * | 2018-02-06 | 2019-08-13 | 阿里巴巴集团控股有限公司 | 景区管理、行程规划方法、客户端和服务器 |
CN110263256A (zh) * | 2019-06-21 | 2019-09-20 | 西安电子科技大学 | 基于多模态异质信息的个性化推荐方法 |
CN110348968A (zh) * | 2019-07-15 | 2019-10-18 | 辽宁工程技术大学 | 一种基于用户及项目耦合关系分析的推荐***及方法 |
CN110569447A (zh) * | 2019-09-12 | 2019-12-13 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种网络资源的推荐方法、装置及存储介质 |
CN110892232A (zh) * | 2017-11-10 | 2020-03-17 | 宝马股份公司 | 用于智能地管理用户的多个潜在旅行目的地的方法和设备 |
CN112257517A (zh) * | 2020-09-30 | 2021-01-22 | 中国地质大学(武汉) | 一种基于景点聚类和群体情感识别的旅游景点推荐*** |
CN112348291A (zh) * | 2020-12-07 | 2021-02-09 | 福州市长乐区三互信息科技有限公司 | 旅游出行信息管理方法 |
CN113505311A (zh) * | 2021-07-12 | 2021-10-15 | 中国科学院地理科学与资源研究所 | 一种可根据“潜在语义空间”的旅游景点交互推荐方法 |
CN114139052A (zh) * | 2021-11-19 | 2022-03-04 | 北京百度网讯科技有限公司 | 用于智能推荐的排序模型训练方法、智能推荐方法及装置 |
US11378410B1 (en) | 2020-02-19 | 2022-07-05 | BlueOwl, LLC | Systems and methods for generating calm or quiet routes |
US11402223B1 (en) | 2020-02-19 | 2022-08-02 | BlueOwl, LLC | Systems and methods for generating scenic routes |
US11477603B2 (en) | 2021-03-03 | 2022-10-18 | International Business Machines Corporation | Recommending targeted locations and optimal experience time |
CN117575125A (zh) * | 2024-01-17 | 2024-02-20 | 巢湖学院 | 基于矩阵补全的协同过滤和量子近似优化的路径优化方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150154305A1 (en) * | 2013-12-02 | 2015-06-04 | Qbase, LLC | Method of automated discovery of topics relatedness |
CN105045865A (zh) * | 2015-07-13 | 2015-11-11 | 电子科技大学 | 一种基于核的协同主题回归标签推荐方法 |
CN106055713A (zh) * | 2016-07-01 | 2016-10-26 | 华南理工大学 | 基于用户兴趣和社交主题提取的社交网络用户推荐方法 |
-
2017
- 2017-04-12 CN CN201710237404.6A patent/CN107133277B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150154305A1 (en) * | 2013-12-02 | 2015-06-04 | Qbase, LLC | Method of automated discovery of topics relatedness |
CN105045865A (zh) * | 2015-07-13 | 2015-11-11 | 电子科技大学 | 一种基于核的协同主题回归标签推荐方法 |
CN106055713A (zh) * | 2016-07-01 | 2016-10-26 | 华南理工大学 | 基于用户兴趣和社交主题提取的社交网络用户推荐方法 |
Non-Patent Citations (2)
Title |
---|
ZHENGXING XU: "Trip similarity computation for context-aware travel recommendation exploiting geotagged photos", 《2014 IEEE 30TH INTERNATIONAL CONFERENCE ON DATA ENGINEERING WORKSHOPS》 * |
林晓勇等: "基于主题模型的矩阵分解推荐算法", 《计算机应用》 * |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110892232A (zh) * | 2017-11-10 | 2020-03-17 | 宝马股份公司 | 用于智能地管理用户的多个潜在旅行目的地的方法和设备 |
CN110119822A (zh) * | 2018-02-06 | 2019-08-13 | 阿里巴巴集团控股有限公司 | 景区管理、行程规划方法、客户端和服务器 |
CN110119822B (zh) * | 2018-02-06 | 2024-03-15 | 阿里巴巴集团控股有限公司 | 景区管理、行程规划方法、客户端和服务器 |
CN108537691A (zh) * | 2018-06-08 | 2018-09-14 | 延晋 | 一种区域游览智能管理***及方法 |
CN109754305A (zh) * | 2018-11-13 | 2019-05-14 | 北京码牛科技有限公司 | 基于矩阵分解算法的偏好发掘方法及装置 |
CN110263256B (zh) * | 2019-06-21 | 2022-12-02 | 西安电子科技大学 | 基于多模态异质信息的个性化推荐方法 |
CN110263256A (zh) * | 2019-06-21 | 2019-09-20 | 西安电子科技大学 | 基于多模态异质信息的个性化推荐方法 |
CN110348968A (zh) * | 2019-07-15 | 2019-10-18 | 辽宁工程技术大学 | 一种基于用户及项目耦合关系分析的推荐***及方法 |
CN110348968B (zh) * | 2019-07-15 | 2022-02-15 | 辽宁工程技术大学 | 一种基于用户及项目耦合关系分析的推荐***及方法 |
CN110569447B (zh) * | 2019-09-12 | 2022-03-15 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种网络资源的推荐方法、装置及存储介质 |
CN110569447A (zh) * | 2019-09-12 | 2019-12-13 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种网络资源的推荐方法、装置及存储介质 |
US11761778B2 (en) | 2020-02-19 | 2023-09-19 | BlueOwl, LLC | Systems and methods for generating calm or quiet routes |
US11402223B1 (en) | 2020-02-19 | 2022-08-02 | BlueOwl, LLC | Systems and methods for generating scenic routes |
US11971262B2 (en) | 2020-02-19 | 2024-04-30 | BlueOwl, LLC | Systems and methods for generating scenic routes |
US11378410B1 (en) | 2020-02-19 | 2022-07-05 | BlueOwl, LLC | Systems and methods for generating calm or quiet routes |
US11598642B2 (en) | 2020-02-19 | 2023-03-07 | BlueOwl, LLC | Systems and methods for generating calm or quiet routes |
CN112257517A (zh) * | 2020-09-30 | 2021-01-22 | 中国地质大学(武汉) | 一种基于景点聚类和群体情感识别的旅游景点推荐*** |
CN112348291B (zh) * | 2020-12-07 | 2022-08-26 | 福州灵和晞科技有限公司 | 旅游出行信息管理方法 |
CN112348291A (zh) * | 2020-12-07 | 2021-02-09 | 福州市长乐区三互信息科技有限公司 | 旅游出行信息管理方法 |
US11477603B2 (en) | 2021-03-03 | 2022-10-18 | International Business Machines Corporation | Recommending targeted locations and optimal experience time |
CN113505311B (zh) * | 2021-07-12 | 2022-03-11 | 中国科学院地理科学与资源研究所 | 一种可根据“潜在语义空间”的旅游景点交互推荐方法 |
CN113505311A (zh) * | 2021-07-12 | 2021-10-15 | 中国科学院地理科学与资源研究所 | 一种可根据“潜在语义空间”的旅游景点交互推荐方法 |
CN114139052A (zh) * | 2021-11-19 | 2022-03-04 | 北京百度网讯科技有限公司 | 用于智能推荐的排序模型训练方法、智能推荐方法及装置 |
CN117575125A (zh) * | 2024-01-17 | 2024-02-20 | 巢湖学院 | 基于矩阵补全的协同过滤和量子近似优化的路径优化方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107133277B (zh) | 2019-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107133277B (zh) | 一种基于动态主题模型和矩阵分解的旅游景点推荐方法 | |
CN106997389B (zh) | 一种基于多数据集和协同张量分解的旅游景点推荐方法 | |
US20220116347A1 (en) | Location resolution of social media posts | |
Jiang et al. | Author topic model-based collaborative filtering for personalized POI recommendations | |
McKenzie et al. | Weighted multi-attribute matching of user-generated points of interest | |
CN104050196B (zh) | 一种兴趣点数据冗余检测方法及装置 | |
CN107025310A (zh) | 一种自动实时新闻推荐方法 | |
Zhang et al. | Discovering place-informative scenes and objects using social media photos | |
CN108804551B (zh) | 一种兼顾多样性与个性化的空间兴趣点推荐方法 | |
May Petry et al. | MARC: a robust method for multiple-aspect trajectory classification via space, time, and semantic embeddings | |
CN107800801A (zh) | 一种基于用户学习偏好的学习资源推送方法及*** | |
US20100205176A1 (en) | Discovering City Landmarks from Online Journals | |
CN109960763A (zh) | 一种基于用户细粒度摄影偏好的摄影社区个性化好友推荐方法 | |
CN105868267B (zh) | 一种移动社交网络用户兴趣的建模方法 | |
Hauff et al. | Placing images on the world map: a microblog-based enrichment approach | |
CN106960044A (zh) | 一种基于张量分解及加权hits的时间感知个性化poi推荐方法 | |
Peng et al. | Perceiving Beijing’s “city image” across different groups based on geotagged social media data | |
CN111488385A (zh) | 基于人工智能的数据处理方法、装置和计算机设备 | |
Majid et al. | GoThere: travel suggestions using geotagged photos | |
Ning et al. | Choosing an appropriate training set size when using existing data to train neural networks for land cover segmentation | |
Honarparvar et al. | Improvement of a location-aware recommender system using volunteered geographic information | |
CN115408618A (zh) | 一种基于社交关系融合位置动态流行度和地理特征的兴趣点推荐方法 | |
CN112989167B (zh) | 搬运账号的识别方法、装置、设备及计算机可读存储介质 | |
Shen et al. | Novel model for predicting individuals’ movements in dynamic regions of interest | |
Xiang | Region2vec: An Approach for Urban Land Use Detection by Fusing Multiple Features |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190906 |
|
CF01 | Termination of patent right due to non-payment of annual fee |