CN113158038A - 基于sta-tcn神经网络框架的兴趣点推荐方法及*** - Google Patents

基于sta-tcn神经网络框架的兴趣点推荐方法及*** Download PDF

Info

Publication number
CN113158038A
CN113158038A CN202110362907.2A CN202110362907A CN113158038A CN 113158038 A CN113158038 A CN 113158038A CN 202110362907 A CN202110362907 A CN 202110362907A CN 113158038 A CN113158038 A CN 113158038A
Authority
CN
China
Prior art keywords
interest
time
vector
sequence
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110362907.2A
Other languages
English (en)
Other versions
CN113158038B (zh
Inventor
江浩
欧俊杰
王孝诚
金海明
刘艺娟
黄建强
王新兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN202110362907.2A priority Critical patent/CN113158038B/zh
Publication of CN113158038A publication Critical patent/CN113158038A/zh
Application granted granted Critical
Publication of CN113158038B publication Critical patent/CN113158038B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于STA‑TCN神经网络框架的兴趣点推荐方法,包括如下步骤:步骤S1:将用户签到序列的数据进行预处理,过滤不活跃用户和不活跃兴趣点;步骤S2:预处理之后的数据转化为高维的嵌入向量序列;步骤S3:利用神经网络学习嵌入向量序列的顺序过渡相关性,输出得到包含顺序过渡相关性信息的结果向量;步骤S4:对包含顺序过渡相关性信息的结果向量利用时空自注意力机制学习全局时空相关性,输出最终的表示向量;步骤S5:根据最终的表示向量得出兴趣点推荐结果。本发明还提供了一种STA‑TCN神经网络框架的兴趣点推荐***,本发明使用ST‑Attention将时间信息和空间信息融入到Attention机制中,这将极大促进模型学习兴趣点之间的多种相关性。

Description

基于STA-TCN神经网络框架的兴趣点推荐方法及***
技术领域
本发明涉及推荐***领域,具体地,涉及一种基于STA-TCN神经网络框架的兴趣点推荐方法及***。
背景技术
如今,随着Foursquare和Yelp等基于位置的社交网络(LBSN)平台的飞速发展,越来越多的用户希望与朋友分享他们在不同位置的兴趣点(Point of Interest)签到记录,如餐馆、博物馆等。大量的用户签到数据有助于学习用户对兴趣点的偏好研究。怎么准确地向用户推荐兴趣点,这对兴趣点所有者吸引***,以及用户探索周围环境并发现潜在的有趣景点都具有很高的价值。针对专有的一些名词做如下解释:
兴趣点(POI,Point-of-Interest):位于地图上的某一地点,可以是娱乐场所、餐饮场所、景点等,其所在位置由GPS表示。
基于位置的社交网络(LBSN,Location-based Social Networks):其中用户集合表示为
Figure BDA0003006298710000011
兴趣点集合表示为
Figure BDA0003006298710000012
其中每个兴趣点
Figure BDA0003006298710000013
其所在位置为gp=(lon,lat),其中lon和lat表示其经度和纬度坐标。
签到记录(Check-In):用户签到记录表示为三元组
Figure BDA0003006298710000014
这表示用户在过去的时间戳t处访问了位置
Figure BDA0003006298710000015
的兴趣点p。
签到历史(Check-In History):给定数据集,用户
Figure BDA0003006298710000016
的签到历史定义为该用户的所有签到记录的集合,其中每个元素表示用户
Figure BDA0003006298710000017
在数据集中的第i个签到记录。
兴趣点推荐(POI Recommendation):对于给定的目标用户
Figure BDA0003006298710000018
兴趣点推荐问题的目的是推荐目标用户
Figure BDA0003006298710000019
会优先选择下一个但从未访问过的前M个兴趣点的列表。
实际上,用户的兴趣点访问行为显示出很强的顺序过渡相关性。也就是说,用户下一次访问的兴趣点与用户以往访问过的兴趣点高度相关。例如,在周末在饭店吃晚餐之后,某些用户很有可能随后会去电影院、酒吧或者其他娱乐场所。自然地,在签到记录之间捕获这种顺序过渡相关性对于兴趣点推荐***至关重要。
基于循环神经网络(RNN)的模型率先被用来解决兴趣点推荐问题,循环神经网络可以通过用户的签到记录学习到用户兴趣点签到记录之间的顺序过渡相关性。要想训练这种基于神经网络的模型,必须将用户的历史签到序列分为多个较短的子序列,然后将它们逐个输入这些模型,这不可避免地会非常耗时。
经过检索,专利文献CN111241306A公开了一种基于知识图谱和指针网络的路径规划方法,包括:获取旅游图中兴趣点作为节点构建知识图谱,每个节点中包括兴趣点的四维信息,利用图神经网络对知识图谱中每个节点的四维信息进行聚合生成兴趣点的嵌入矩阵;将嵌入矩阵作为训练样本输入到指针网络,对指针网络进行训练,得到训练后的指针网络;针对旅游图中待测试的兴趣点,获得兴趣点的嵌入矩阵作为测试样本输入到训练后的指针网络中,依次选择输出概率最高的兴趣点,作为当前路线的下一个兴趣点,完成路径规划。该现有技术需要兴趣点的经度、纬度、热度和游玩时长等信息之后,并且根据这些信息数据先构建知识图谱并存储,实际运用过程中也需要不断对知识图谱进行更新,流程比较繁琐。同时,没有使用时间信息,对于空间信息到使用也仅限于构建知识图谱,对知识图谱并不能充分挖掘兴趣点的空间相关性。
专利文献CN109885756A公开了一种基于CNN和RNN的序列化推荐方法,该算法利用CNN的局部特征学习能力来捕捉最近历史行为数据中存在的相关关系,同时利用RNN的全局和序列学习能力来学习用户历史行为的长短期偏好,最后通过学习到的特征表达利用多层感知机预测用户未来会产生的行为并提供推荐,实验表明该算法的效果优于单一的基于CNN或RNN的序列化推荐。该现有技术没有使用数据中的时间信息和空间信息,并不能充分挖掘兴趣点的时间和空间相关性。
并且,上述两篇现有技术都使用RNN进行训练,RNN可以处理普通的序列问题,但对于长序列问题,RNN则无能为力,RNN会出现梯度消失/***的问题,并且无法保留长序列信息,只能串行训练的特点导致模型的训练异常耗时。
因此,亟需研发设计一种新的神经网络框架来更好地学习用户兴趣点推荐的签到历史记录的局部过渡相关性和全局空间相关性。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于STA-TCN神经网络框架的兴趣点推荐方法及***,本发明充分利用了数据中的时间信息和空间信息,无需构建知识图谱,使用ST-Attention将时间信息和空间信息融入到Attention机制中,极大促进模型学习兴趣点之间的多种相关性。
根据本发明提供的一种基于STA-TCN神经网络框架的兴趣点推荐方法,包括如下步骤:
步骤S1:将用户签到序列的数据进行预处理,过滤不活跃用户和不活跃兴趣点;
步骤S2:预处理之后的数据转化为高维的嵌入向量序列;
步骤S3:利用神经网络学习嵌入向量序列的顺序过渡相关性,输出得到包含顺序过渡相关性信息的结果向量;
步骤S4:对包含顺序过渡相关性信息的结果向量利用时空自注意力机制学习全局时空相关性,输出最终的表示向量;
步骤S5:根据最终的表示向量得出兴趣点推荐结果。
优选地,步骤S1中通过删除少于10个签到记录的不活跃用户和少于10个访问用户的不受欢迎的兴趣点的方式对两个数据集进行预处理。
优选地,步骤S2包括如下:
步骤S2.1:通过Tile Map system嵌入GPS坐标转化为r维的GPS坐标向量;
步骤S2.2:嵌入时间戳向量;
步骤S2.3:嵌入兴趣点向量。
优选地,步骤S3中使用时序卷积网络学习用户签到序列之间的顺序过渡相关性。
优选地,步骤S3包括:将长度为L的兴趣点嵌入序列X1:L=(X1,X2,…,XL)输入到时序卷积网络中,其中
Figure BDA0003006298710000032
表示第i个兴趣点的嵌入向量,使用如下公式对X1:L进行因果卷积,
Figure BDA0003006298710000031
其中,*表示膨胀的因果卷积操作,f表示核大小为H的卷积滤波器,e是控制卷积核的接收窗口大小的膨胀因子,xj-eh表示位置j之前的第(e×h)个向量。
优选地,步骤S3还包括:对于所有输入的向量都使用相同的核权重矩阵,再利用激活函数得到输出特征X1:L的非线性信息。
Y1:L=ReLU(W*X1:L)
其中,W表示时序卷积网络中共享的核权重矩阵,ReLU是非线性的激活函数,而Y1:L表示输出特征。
优选地,步骤S4中的时空自注意力机制包括网格距离学习机制和时间敏感性学习机制。
优选地,网格距离学习机制通过执行以下公式的运算获得两个GPS位置的网格距离向量
Figure BDA0003006298710000041
Figure BDA0003006298710000042
其中
Figure BDA0003006298710000044
表示向量
Figure BDA0003006298710000045
中的第q个元素,Abs(·)表示绝对值计算算符。
优选地,时间敏感性学习机制将时间嵌入向量序列C1:L=(c1,c2,…,cL)和时间嵌入向量序列T1:L=(t1,t2,…,tL)作为输入,其中
Figure BDA0003006298710000046
表示签到中第i个兴趣点的嵌入向量,
Figure BDA0003006298710000047
表示第i个时间戳在嵌入序列中的时间嵌入向量,时间敏感性学习机制通过计算输出时间相关性得分矩阵At
Figure BDA0003006298710000043
其中,Wt表示T-SL机制中的参数。
根据本发明提供的一种基于STA-TCN神经网络框架的兴趣点推荐***,包括:
输入嵌入层:输入嵌入层将用户签到序列作为输入,由兴趣点、GPS位置和时间戳组成,并分别输出其嵌入向量序列;
时序卷积网络:时序卷积网络将兴趣点嵌入向量作为输入,并输出得到包含顺序过渡相关性信息的结果向量;
时空注意力模块:将时序卷积网络的输出以及签到记录的时间戳和GPS位置嵌入向量作为输入,并输出学习到的全局空间和时间相关性的最终的表示向量;
输出模块:输出模块使用选择器根据最终的表示向量得出兴趣点推荐结果。
与现有技术相比,本发明具有如下的有益效果:
1、本发明充分利用时间和空间信息,无需构建知识图谱,使用ST-Attention将时间信息和空间信息融入到Attention机制中,极大促进模型学习兴趣点之间的多种相关性。
2、本发明利用STA-TCN神经网络进行兴趣点的搜索,其中TCN加入残差模型解决梯度消失/***的问题,能够使用因果卷积、膨胀卷积捕捉长序列信息,同时使得浅层模型很容易扩展为深层模型。
3、本发明中TCN利用因果卷积屏蔽未来信息,使得模型可以处理时序问题,膨胀卷积则让模型能够捕捉更长的序列长度。
4、本发明中的Attention可以获取全局与局部的联系,不会像RNN网络那样对长期依赖的捕捉会收到序列长度的限制;相比CNN与RNN,参数少,模型复杂度低;每步的结果不依赖于上一步,可以并行计算。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明中基于STA-TCN神经网络框架的兴趣点推荐***的整体架构图;
图2为本发明中的基于Tile Map system的分层网格化第一级地图;
图3为本发明中的基于Tile Map system的分层网格化第二级地图;
图4为本方法在不同的超参数下,在Gowalla数据集上的HR@10(推荐列表长度为10时的命中率)的表现效果;
图5为本方法在不同的超参数下,在Foursquare数据集上的HR@10(推荐列表长度为10时的命中率)的表现效果;
图6为本方法在不同的超参数下,在Gowalla数据集上的NDCG@10(归一化折损累计增益)的表现效果;
图7为本方法在不同的超参数下,在Foursquare数据集上的NDCG@10(归一化折损累计增益)的表现效果;
图8为当下流行的POI推荐方法与本方法在Gowalla数据集上达到最好的表现效果(推荐列表长度为5时的命中率)时所花费的时间;
图9为当下流行的POI推荐方法与本方法在Foursquare数据集上达到最好的表现效果(推荐列表长度为5时的命中率)时所花费的时间;
图10为当下流行的POI推荐方法与本方法在Gowalla数据集上达到最好的表现效果(推荐列表长度为5时的归一化折损累计增益)时所花费的时间;
图11为当下流行的POI推荐方法与本方法在Foursquare数据集上达到最好的表现效果(推荐列表长度为5时的归一化折损累计增益)时所花费的时间。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
如图1-11所示,本发明提供了一种基于STA-TCN神经网络框架的兴趣点推荐方法,包括如下步骤:
步骤S1:将用户签到序列的数据进行预处理,过滤不活跃用户和不活跃兴趣点;
步骤S2:预处理之后的数据转化为高维的嵌入向量序列;
步骤S3:利用神经网络学习嵌入向量序列的顺序过渡相关性,输出得到包含顺序过渡相关性信息的结果向量;
步骤S4:对包含顺序过渡相关性信息的结果向量利用时空自注意力机制学习全局时空相关性,输出最终的表示向量;
步骤S5:根据最终的表示向量得出兴趣点推荐结果。
具体地,进一步来说,步骤S1包括以下具体步骤:
步骤S1.1:实验是在两个真实世界的LBSN数据集Gowalla和Foursquare上进行的,它们被广泛用于评估兴趣点推荐方法。Gowalla数据集包含2009年2月至2010年10月在全球范围内的签到记录,Foursquare数据集的签到样本都发生在2010年2月至2011年1月的纽约市。通过删除少于10个签到记录的不活跃用户和少于10个访问用户的不受欢迎的兴趣点的方式对两个数据集进行预处理。为了确保用户兴趣的多样性,同时将少于5个不同兴趣点访问记录的用户排除掉。表1给出了这两个数据集的详细的统计结果。
表1数据集统计结果
Figure BDA0003006298710000061
骤S2包括:将数据输入到嵌入层,由于数据集中存在大量的兴趣点索引
Figure BDA0003006298710000062
GPS坐标
Figure BDA0003006298710000063
和时间戳t,如果直接使用独热编码(One-hot)来表示的话,它们中的每一个都会产生稀疏的高维向量,这将会降低模型性能。因此,为了将每个兴趣点,GPS坐标和时间戳嵌入到低维表示矢量中,本发明通过执行以下操作来设计输入嵌入层。
步骤S2.1:GPS坐标嵌入。如图2、图3和图4-7所示,首先使用Tile Map system将整个区域分层划分为多层级的网格,并使用哈希键表示每个网格,每个网格可以由向量
Figure BDA0003006298710000071
表示,其中
Figure BDA0003006298710000078
是以4为底的数字,表示网格在第i级区域中所在的位置。然后,通过这样的Tile Map system,所有的兴趣点可以通过其GPS信息将其转化为r维的GPS坐标向量。
步骤S2.2:时间戳嵌入:考虑到用户通常在一天中的不同时间和不同的日期有不同的兴趣点访问行为,首先将一天划分为N个间隔相等的时间段,然后根据每个时间段
Figure BDA0003006298710000072
属于工作日还是周末将每个时段12i分为
Figure BDA0003006298710000073
Figure BDA0003006298710000074
因此,时间可以被分为2N个时间段,分别表示为
Figure BDA0003006298710000075
对于给定的时间戳t,将其嵌入到独热向量
Figure BDA0003006298710000076
中,值为1的位置与这个t所属的时间段相对应。
步骤S2.3:兴趣点嵌入,显然,用户访问兴趣点的概率在一天中的不同时间有所不同。本发明利用这种时间敏感性对兴趣点进行分类,具体地说,对于签到序列中的每个兴趣点,在整个数据集中计算上述2N个时间段内所有用户的签到频率,这些签到频率进一步组合为时间敏感度嵌入向量
Figure BDA0003006298710000077
其中
Figure BDA0003006298710000079
表示考虑的兴趣点在第i个时间段内的用户访问频率。考虑到兴趣点同时拥有唯一的GPS坐标和时间敏感性属性,将c与GPS嵌入向量g拼接起来,就形成x=c||g的兴趣点的最终表示向量。
通过共同执行以上三种类型的嵌入,输入嵌入层将把长度为L的用户签到序列转换为四个嵌入矢量序列,包括兴趣点嵌入向量序列X1:L,时间敏感度嵌入向量序列表示为G1:L,GPS嵌入向量序列表示为G1:L,时间嵌入向量序列表示为T1:L
步骤S3包括以下具体步骤:
步骤S3.1:本发明使用时序卷积网络来学习用户签到记录之间的顺序过渡相关性。循环神经网络使用串行结构处理和传递输入信息,并且利用大量的单元状态和隐藏状态存储信息,而时序卷积网络使用并行架构对输入信息进行卷积运算,从而实现了较少的内存需求和更快的训练速度。与原始的卷积神经网络相比,时序卷积网络采用了被称为因果卷积的特殊卷积结构,在很大程度上促进了输入序列的顺序过渡相关性学习效果。一方面,时序卷积网络的因果卷积运算将输入与过去的时间戳进行兴趣点嵌入,对输入向量进行卷积运算,从而保留了用户签到序列的时间顺序;另一方面,时序卷积网络的卷积运算具有膨胀性质,因此可以成倍地扩大接收域,以处理长度过长的输入序列。
更具体地说,将长度为L的兴趣点嵌入序列X1:L=(X1,X2,…,XL)输入到时序卷积网络中,其中
Figure BDA0003006298710000085
表示第i个兴趣点的嵌入向量,使用如下公式对X1:L进行因果卷积。
Figure BDA0003006298710000081
其中*表示膨胀的因果卷积操作,f表示核大小为H的卷积滤波器,e是控制卷积核的接收窗口大小的膨胀因子,xj-eh表示位置j之前的第(e×h)个向量。
步骤S3.2:本发明对于所有输入的向量都使用相同的核权重矩阵,然后,利用激活函数得到输出特征X1:L的非线性信息。
Y1:L=ReLU(W*X1:L)
其中W表示时序卷积网络中共享的核权重矩阵,ReLU是非线性的激活函数,而Y1:L表示输出特征。为了产生等长的输出序列,将零填充到输入序列X1:L的末尾。
此外,为了更好地表示用户对兴趣点的偏爱程度,本发明还设计了门控注入机制,该机制将经过门控单元的原始输入向量与时序卷积网络的输出特征相加。
Y1:L=Y1:L+X1:L⊙σ(Wg·X1:L+bg)
最终输出的Y1:L融合了TCN输出的卷积特征和输入信息X1:L,X1:L注入的信息量由门控机制控制,其中wg和bg表示参数,σ(·)表示sigmoid型函数,⊙表示基于矩阵元素的乘法。
步骤S4包括以下具体步骤:
尽管时序卷积网络可以帮助捕获用户签到序列之间的顺序转换相关性,但仅考虑这种顺序过渡相关性并不足以准确地学习用户对兴趣点的偏好程度。用户通常一天中的相同时间段和地理位置的较近区域有相似的兴趣点访问行为,为了学习这种全局时空相关性,本发明在时序卷积网络的基础上提出了一种时空自注意力(STAtt)模块,该模块通过两种新颖的方法增强了自注意力网络。分别是网格距离学习(G-DL,grid-differencelearning)机制和时间敏感性学习(T-SL,time-sensitivity learning)机制。
步骤S4.1:首先根据步骤S2得到GPS嵌入序列G1:L=(g1,g2,…,gL),
Figure BDA0003006298710000087
表示在签到序列中第i个GPS坐标的嵌入向量,为了学习全局的空间相关性,对于序列G1:L中的每对嵌入向量
Figure BDA0003006298710000086
Figure BDA0003006298710000082
G-DL机制通过执行以下公式的运算获得两个GPS位置的网格距离向量
Figure BDA0003006298710000083
Figure BDA0003006298710000084
其中
Figure BDA00030062987100000913
表示向量
Figure BDA00030062987100000914
中的第q个元素,Abs(·)表示绝对值计算算符。向量
Figure BDA0003006298710000091
表示由
Figure BDA00030062987100000915
Figure BDA0003006298710000092
两者间的网格距离,然后该机制将与G1:L中每对GPS嵌入向量对应的
Figure BDA0003006298710000093
组合成为向量矩阵
Figure BDA0003006298710000094
并应用前馈神经网络来计算得到空间相关性的得分矩阵As,其中Ws和bs表示G-DL中的参数。
As=Ws·Ms+bs
步骤S4.2:用户的兴趣点访问偏好显示了时间敏感性属性。受此启发,本发明提出了T-SL机制来学习输入序列的全局的时间相关性。这种机制将时间嵌入向量序列C1:L=(c1,c2,…,cL)和时间嵌入向量序列T1:L=(t1,t2,…,tL)作为输入,其中
Figure BDA00030062987100000916
表示签到中第i个兴趣点的嵌入向量,
Figure BDA00030062987100000917
表示第i个时间戳在检入序列中的时间嵌入向量,T-SL通过计算输出时间相关性得分矩阵At。其中Wt表示T-SL机制中的参数。
Figure BDA0003006298710000095
步骤S4.3:为了更好地学习用户签到之间的全局时空相关性,STAtt将上述时空相关性得分矩阵与传统的自注意力机制相结合,并输出最终的表示向量序列Z1:L
Figure BDA0003006298710000096
其中
Figure BDA0003006298710000097
WQ、WK、WV分别表示查询矩阵,关键字矩阵和值矩阵,d是关键向量的维数;M是一个掩码矩阵,在所有上三角元素中均用-∞填充,以满足输入序列的时间关系约束。
最后,STAtt将Z1:L中的最后一个向量zL作为用户偏好的最终表示向量。
步骤S5包括以下具体步骤:
步骤S5.1:如图1所示,输出模块将zL输入选择器以产生推荐结果。具体地说,首先输出模块通过检索距离用户当前签到位置最近的
Figure BDA0003006298710000098
个兴趣点来生成兴趣点候选集
Figure BDA0003006298710000099
然后选择器将
Figure BDA00030062987100000918
作为输入,并基于其兴趣点嵌入向量
Figure BDA00030062987100000910
与用户偏好向量zL之间的内积来计算每个候选兴趣点
Figure BDA00030062987100000911
的偏好得分,记为
Figure BDA00030062987100000912
最后选择器通过选择得分最高的top-M个候选兴趣点来输出推荐的兴趣点列表。
本发明使用新型的深度学习模型--STA-TCN神经网络框架,与以往的模型分别在Gowalla和Foursquare数据集上进行实验,通过HR标准比较模型和NDCG标准比较模型两个标准比较模型的性能。
HR标准比较模型是指代命中率模型,用户关心的出现在推荐列表中即为命中;
NDCG标准比较模型指归一化折损累计增益,由折损累计增益(DCG)除以理想情况下最大的DCG值(IDCG)得到。
在训练过程中,将输入签到序列的最大长度设置为100,长序列将从右到左被分为长度为100的非重叠子序列。在测试过程中将用户的所有签到记录都作为输入用于推荐下一个兴趣点,对于每条用户签到序列,采用最新的且未在以往记录中出现的兴趣点作为目标兴趣点来评估模型性能。将每天的时间段数N设置为12,将层次图网格划分的级别r设置为17;将卷积层数和时序卷积网络的内核大小分别设置为2和6;此外,时序卷积网络的两个卷积层中的膨胀因子分别为1和2;兴趣点候选集大小
Figure BDA0003006298710000103
设置为100。
在实验中采用两种常用的评估指标,即命中率(HR)和归一化的累积收益(NDCG)。HR@K计算了出现在推荐列表前K个兴趣点中的目标兴趣点所占的比例,NDCG@K进一步计算列表中前K个兴趣点中目标兴趣点的排名得分。
表2各模型在Gowalla数据集上的表现
Figure BDA0003006298710000101
表3各模型在Foursquare数据集上的表现
Figure BDA0003006298710000102
Figure BDA0003006298710000111
表2和表3总结了STA-TCN和所有baseline方法的结果,其中最优结果已经以黑体字突出显示。显而易见,本发明提出的STA-TCN在每个数据集上的所有指标上均表现出最优性能。STA-TCN通过G-DL和T-DL机制改进了自注意力架构,并且增强其学习时空相关性的能力,与次优的GeoSAN相比,STA-TCN在Gowalla和Foursquare数据集上的HR@5/10分别显著提高了8.53%/11.81%和6.23%/10.26%。
进行对比试验,从超参数对模型的影响和模型训练效率两个角度进行评估。具体地,分析时序卷积网络的超参数设置对模型性能的影响。通过对时序卷积网络中卷积层数和内核大小的不同组合进行实验,分析超参数设置对模型性能的影响。实验中将内核大小从2开始以2为步长增加到12,将层数从2开始以2为步长增加到4,并在两个数据集上评估STA-TCN的性能变化。如图4-7所示,本发明提出的STA-TCN的性能非常强大且稳定,在卷积层数和内核大小方面只有很小的性能波动。
进一步来说,比较不同模型的训练效率。在相同训练环境下,实验统计了从训练开始到训练损失收敛时每种方法消耗的时间,并在两个数据集上计算了它们的所表现的推荐性能。图8-11显示了每种方法的训练时间消耗和相应的HR@5和NDCG@5,那些更靠近左上角的标记表示该方法具有较高的训练效率和更好的表现。可以看到,由于循环神经网络的串行训练结构,大多数基于循环神经网络的模型的训练非常耗时,本发明提出的STA-TCN显著提高了训练速度和推荐***的性能。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的***及其各个装置、模块、单元以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的***及其各个装置、模块、单元以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以,本发明提供的***及其各项装置、模块、单元可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置、模块、单元也可以视为硬件部件内的结构;也可以将用于实现各种功能的装置、模块、单元视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

Claims (10)

1.一种基于STA-TCN神经网络框架的兴趣点推荐方法,其特征在于,包括如下步骤:
步骤S1:将用户签到序列的数据进行预处理,过滤不活跃用户和不活跃兴趣点;
步骤S2:预处理之后的数据转化为高维的嵌入向量序列;
步骤S3:利用神经网络学习嵌入向量序列的顺序过渡相关性,输出得到包含顺序过渡相关性信息的结果向量;
步骤S4:对包含顺序过渡相关性信息的结果向量利用时空自注意力机制学习全局时空相关性,输出最终的表示向量;
步骤S5:根据最终的表示向量得出兴趣点推荐结果。
2.根据权利要求1所述的基于STA-TCN神经网络框架的兴趣点推荐方法,其特征在于,所述步骤S1中通过删除少于10个签到记录的不活跃用户和少于10个访问用户的不受欢迎的兴趣点的方式对两个数据集进行预处理。
3.根据权利要求1所述的基于STA-TCN神经网络框架的兴趣点推荐方法,其特征在于,所述步骤S2包括如下:
步骤S2.1:通过Tile Map system嵌入GPS坐标转化为r维的GPS坐标向量;
步骤S2.2:嵌入时间戳向量;
步骤S2.3:嵌入兴趣点向量。
4.根据权利要求1所述的基于STA-TCN神经网络框架的兴趣点推荐方法,其特征在于,所述步骤S3中使用时序卷积网络学习用户签到序列之间的顺序过渡相关性。
5.根据权利要求1所述的基于STA-TCN神经网络框架的兴趣点推荐方法,其特征在于,所述步骤S3中将长度为L的兴趣点嵌入序列X1:L=(X1,X2,…,XL)输入到时序卷积网络中,其中xi表示第i个兴趣点的嵌入向量,使用如下公式对X1:L进行因果卷积,
Figure FDA0003006298700000011
其中,*表示膨胀的因果卷积操作,f表示核大小为H的卷积滤波器,e是控制卷积核的接收窗口大小的膨胀因子,xj-eh表示位置j之前的第(e×h)个向量。
6.根据权利要求1所述的基于STA-TCN神经网络框架的兴趣点推荐方法,其特征在于,所述步骤S3中还对于所有输入的向量都使用相同的核权重矩阵,再利用激活函数得到输出特征X1:L的非线性信息。
Y1:L=ReLU(W*X1:L)
其中,W表示时序卷积网络中共享的核权重矩阵,ReLU是非线性的激活函数,而Y1:L表示输出特征。
7.根据权利要求1所述的基于STA-TCN神经网络框架的兴趣点推荐方法,其特征在于,所述步骤S4中的时空自注意力机制包括网格距离学习机制和时间敏感性学习机制。
8.根据权利要求7所述的基于STA-TCN神经网络框架的兴趣点推荐方法,其特征在于,所述网格距离学习机制通过执行以下公式的运算获得两个GPS位置的网格距离向量
Figure FDA0003006298700000021
Figure FDA0003006298700000022
其中gi(q)表示向量gi中的第q个元素,Abs(·)表示绝对值计算算符。
9.根据权利要求7所述的基于STA-TCN神经网络框架的兴趣点推荐方法,其特征在于,所述时间敏感性学习机制将时间嵌入向量序列C1:L=(c1,c2,…,cL)和时间嵌入向量序列T1:L=(t1,t2,…,tL)作为输入,其中ci表示签到中第i个兴趣点的嵌入向量,ti表示第i个时间戳在嵌入序列中的时间嵌入向量,时间敏感性学习机制通过计算输出时间相关性得分矩阵At
Figure FDA0003006298700000023
其中,Wt表示T-SL机制中的参数。
10.一种基于STA-TCN神经网络框架的兴趣点推荐***,其特征在于,包括:
输入嵌入层:输入嵌入层将用户签到序列作为输入,由兴趣点、GPS位置和时间戳组成,并分别输出其嵌入向量序列;
时序卷积网络:时序卷积网络将兴趣点嵌入向量作为输入,并输出得到包含顺序过渡相关性信息的结果向量;
时空注意力模块:将时序卷积网络的输出以及签到记录的时间戳和GPS位置嵌入向量作为输入,并输出学习到的全局空间和时间相关性的最终的表示向量;
输出模块:输出模块使用选择器根据最终的表示向量得出兴趣点推荐结果。
CN202110362907.2A 2021-04-02 2021-04-02 基于sta-tcn神经网络框架的兴趣点推荐方法及*** Active CN113158038B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110362907.2A CN113158038B (zh) 2021-04-02 2021-04-02 基于sta-tcn神经网络框架的兴趣点推荐方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110362907.2A CN113158038B (zh) 2021-04-02 2021-04-02 基于sta-tcn神经网络框架的兴趣点推荐方法及***

Publications (2)

Publication Number Publication Date
CN113158038A true CN113158038A (zh) 2021-07-23
CN113158038B CN113158038B (zh) 2022-06-14

Family

ID=76888431

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110362907.2A Active CN113158038B (zh) 2021-04-02 2021-04-02 基于sta-tcn神经网络框架的兴趣点推荐方法及***

Country Status (1)

Country Link
CN (1) CN113158038B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113656709A (zh) * 2021-08-24 2021-11-16 东北大学 一种融合知识图谱和时序特征的可解释兴趣点推荐方法
CN114186139A (zh) * 2021-12-30 2022-03-15 重庆理工大学 一种基于时间增强的图神经网络会话推荐方法
CN115225731A (zh) * 2022-07-29 2022-10-21 中国人民解放军陆军工程大学 一种基于混合神经网络的在线协议识别方法
WO2023015658A1 (zh) * 2021-08-13 2023-02-16 浙江大学 一种基于类脑时空感知表征的兴趣点推荐方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110399565A (zh) * 2019-07-29 2019-11-01 北京理工大学 基于时空周期注意力机制的递归神经网络兴趣点推荐方法
CN111506835A (zh) * 2020-04-17 2020-08-07 北京理工大学 一种融合用户时间特征和个性特征的数据特征提取方法
CN111949865A (zh) * 2020-08-10 2020-11-17 杭州电子科技大学 基于图神经网络与用户长短期偏好的兴趣点推荐方法
CN112069415A (zh) * 2020-08-13 2020-12-11 中国海洋大学 一种基于异构属性网络表征学习的兴趣点推荐方法
US20210064665A1 (en) * 2019-01-19 2021-03-04 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for online to offline services

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210064665A1 (en) * 2019-01-19 2021-03-04 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for online to offline services
CN110399565A (zh) * 2019-07-29 2019-11-01 北京理工大学 基于时空周期注意力机制的递归神经网络兴趣点推荐方法
CN111506835A (zh) * 2020-04-17 2020-08-07 北京理工大学 一种融合用户时间特征和个性特征的数据特征提取方法
CN111949865A (zh) * 2020-08-10 2020-11-17 杭州电子科技大学 基于图神经网络与用户长短期偏好的兴趣点推荐方法
CN112069415A (zh) * 2020-08-13 2020-12-11 中国海洋大学 一种基于异构属性网络表征学习的兴趣点推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LI QUAN等: "Next location recommendation based on spatiotemporal-aware GRU and attention", 《JOURNAL OF COMPUTER APPLICATIONS》 *
刘婕等: "基于自注意力机制的多模态语义轨迹预测", 《计算机工程与科学》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023015658A1 (zh) * 2021-08-13 2023-02-16 浙江大学 一种基于类脑时空感知表征的兴趣点推荐方法及***
CN113656709A (zh) * 2021-08-24 2021-11-16 东北大学 一种融合知识图谱和时序特征的可解释兴趣点推荐方法
CN113656709B (zh) * 2021-08-24 2023-07-25 东北大学 一种融合知识图谱和时序特征的可解释兴趣点推荐方法
CN114186139A (zh) * 2021-12-30 2022-03-15 重庆理工大学 一种基于时间增强的图神经网络会话推荐方法
CN115225731A (zh) * 2022-07-29 2022-10-21 中国人民解放军陆军工程大学 一种基于混合神经网络的在线协议识别方法
CN115225731B (zh) * 2022-07-29 2024-03-05 中国人民解放军陆军工程大学 一种基于混合神经网络的在线协议识别方法

Also Published As

Publication number Publication date
CN113158038B (zh) 2022-06-14

Similar Documents

Publication Publication Date Title
CN113158038B (zh) 基于sta-tcn神经网络框架的兴趣点推荐方法及***
Yin et al. Joint modeling of user check-in behaviors for real-time point-of-interest recommendation
Chen et al. Curriculum meta-learning for next POI recommendation
CN110516160A (zh) 基于知识图谱的用户建模方法、序列推荐方法
Li et al. Next and next new POI recommendation via latent behavior pattern inference
Chen et al. CEM: A convolutional embedding model for predicting next locations
CN110119475A (zh) 一种poi推荐方法及推荐***
Chen et al. Next POI recommendation based on location interest mining with recurrent neural networks
CN111708876A (zh) 生成信息的方法和装置
CN110570044A (zh) 基于循环神经网络和注意力机制的下一个地点预测方法
CN111553279B (zh) 兴趣点的表征学习、识别方法、装置、设备及存储介质
CN113139140A (zh) 基于时空感知gru并结合用户关系偏好的旅游景点推荐方法
CN115408618B (zh) 一种基于社交关系融合位置动态流行度和地理特征的兴趣点推荐方法
Wang et al. ST-SAGE: A spatial-temporal sparse additive generative model for spatial item recommendation
US20210263939A1 (en) Transition regularized matrix factorization for sequential recommendation
Chen et al. Multi-objective reinforcement learning approach for trip recommendation
Baral et al. CAPS: Context aware personalized POI sequence recommender system
CN114417166B (zh) 基于行为序列和动态社交影响的连续兴趣点推荐方法
CN116503588A (zh) 一种基于多元关系时空网络的poi推荐方法,装置及设备
CN116975359A (zh) 资源处理方法、资源推荐方法、装置和计算机设备
Tomasi et al. Automatic Music Playlist Generation via Simulation-based Reinforcement Learning
Li et al. On route planning by inferring visiting time, modeling user preferences, and mining representative trip patterns
CN115048530A (zh) 融合邻居重要度和特征学习的图卷积推荐***
CN114065024A (zh) 基于用户个性化生活模式的poi推荐方法
CN117633371B (zh) 基于多注意力机制的推荐方法、设备和可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant