CN112199609A - 自注意力下时空语义间隔感知的poi推荐***及方法 - Google Patents

自注意力下时空语义间隔感知的poi推荐***及方法 Download PDF

Info

Publication number
CN112199609A
CN112199609A CN202011285422.XA CN202011285422A CN112199609A CN 112199609 A CN112199609 A CN 112199609A CN 202011285422 A CN202011285422 A CN 202011285422A CN 112199609 A CN112199609 A CN 112199609A
Authority
CN
China
Prior art keywords
user
poi
interval
semantic
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011285422.XA
Other languages
English (en)
Other versions
CN112199609B (zh
Inventor
于亚新
吴晓露
包健
王亚龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN202011285422.XA priority Critical patent/CN112199609B/zh
Publication of CN112199609A publication Critical patent/CN112199609A/zh
Application granted granted Critical
Publication of CN112199609B publication Critical patent/CN112199609B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种自注意力下时空语义间隔感知的POI推荐***及方法,涉及推荐技术领域。本发明***包括***,包括数据采集清洗模块、个性化时间间隔模块、个性化空间间隔模块、语义相关性计算模块、时空语义间隔感知自我注意模块和POI推荐模块;通过将用户交互序列建模为具有不同时间间隔的序列,不仅考虑了用户签到数据的绝对位置,同时将这些不同时间间隔纳入推荐***;基于用户的历史签到数据,通过考虑签到数据之间的时间间隔、空间间隔以及语义相关性,有效捕获用户的动态偏好,合理的向用户推荐其下一步会去的地方,提高推荐准确度。

Description

自注意力下时空语义间隔感知的POI推荐***及方法
技术领域
本发明涉及推荐技术领域,尤其涉及一种自注意力下时空语义间隔感知的POI推荐***及方法。
背景技术
随着定位技术的快速发展以及智能手机的普及,大大增强了社交网络服务,越来越多的人通过智能手机使用在线社交网络,用户可以随时随地的分享他们当前所在的位置、图片、音频、视频及轨迹等,产生了许多基于位置的社交网络(Location Based SocialNetworks,LBSNs),如Foursquare、Gowalla和Yelp等等。在LBSNs中,用户通过移动设备以签到形式记录自己的位置空间信息,并分享他们对相关兴趣点POI(Point Of Interest)如旅游景点、博物馆、图书馆、餐厅等的评论信息和体验感觉。所谓的签到就是指移动设备的***自动地获取位置信息。LBSNs的兴起吸引了越来越多的用户参与其中,签到记录数据成指数型增长,这在一定程度上造成了严重的信息过载。如何有效处理数据量持续上升的时空数据,挖掘用户有意义的运动行为模式,为用户提供简单快捷的推荐服务受到人们的普遍关注。
与传统POI推荐不同,下一个POI推荐的目标是利用用户的历史签到序列来预测其下一个感兴趣的地方。目前,大多数相关推荐算法是根据交互时间戳对签到数据进行排序,侧重于顺序模式挖掘,来预测用户下一步会去的地方。然而,这些推荐方式会丢弃时间戳的影响,只保留签到数据的顺序。即它们认为序列中相邻POI之间的时间间隔是相同的。但事实上,POI之间的时间间隔不同。即使POI的签到顺序相同,但具有更短时间间隔的POI将会对推荐效果产生更大的影响。另外,POI之间的距离以及语义信息(比如酒店、餐厅等)也是影响下一个POI推荐的重要因素。基于此,本发明提出将时间间隔、空间间隔和语义相关性三要素纳入下一个POI推荐***中,利用其优势设计了一种新的时空语义间隔感知自我注意机制来推荐更合适的POI给目标用户,提高推荐效率。
发明内容
针对现有技术的不足,本发明提出一种自注意力下时空语义间隔感知的POI推荐***及方法,基于用户的历史签到数据,通过考虑签到数据之间的时间间隔、空间间隔以及语义相关性,有效捕获用户的动态偏好,合理的向用户推荐其下一步会去的地方,提高推荐准确度。
为解决上述技术问题,本发明所采取的技术方案是:
一方面,一种自注意力下时空语义间隔感知的POI推荐***,包括数据采集清洗模块、个性化时间间隔模块、个性化空间间隔模块、语义相关性计算模块、时空语义间隔感知自我注意模块和POI推荐模块;
所述数据采集清洗模块用于采集清洗基于位置的社交网络数据,即社交网站的用户签到数据集,包括用户信息、POI签到信息,经过数据清洗操作后进行存储;
所述用户信息为用户ID,所述POI签到信息包括POI ID、POI经纬度、POI语义,POI签到时间;
所述个性化时间间隔模块用于计算用户签到序列中POI之间的时间间隔;所述个性化空间间隔模块用于计算用户签到序列中POI之间的空间间隔;所述语义相关性计算模块用于计算用户签到序列中POI之间的语义相关性;所述嵌入模块用于将用户签到数据、绝对位置、时间间隔、空间间隔、语义相关性进行结合,获得反映用户实际需求的嵌入向量;所述绝对位置表示签到数据中每个POI的位置,通过字嵌入技术获得;
所述时空语义间隔感知自我注意模块用于学习融合签到数据、绝对位置、时间间隔、空间间隔、语义相关性的签到序列数据的特征向量;
所述POI推荐模块向目标用户进行下一步推荐。采用潜在因子模型来计算用户对候选集中POI的偏好评分。所述偏好评分越高则相关性越高,通过对分数进行由高到低排序来进行下一个POI推荐。
另一方面,一种自注意力下时空语义间隔感知的POI推荐方法,基于前述一种自注意力下时空语义间隔感知的POI推荐***实现,包括以下步骤:
步骤1:采用基于位置的社交网络LBSN获取社交网站的用户签到数据集,然后进行数据清洗操作,去除被访问次数少于10次的用户及POI,获得最终的用户签到数据,同时采集POI属性信息,根据时间戳顺序对每个用户的签到记录进行排序。
所述对签到记录进行排序首先将用户的签到数据转换成固定长度为n的序列,如果序列长度大于n,则提取时间最近的n个签到记录,反之,则在序列左侧进行数据填充,即用第一个签到记录进行填充,直到长度满足n为止,最终生成长度为n的用户签到序列。
步骤2、采用个性化时间间隔模块,对步骤1中的固定长度用户签到数据进行处理,获取POI之间的个性化时间间隔信息;
步骤2-1、获取时间序列,从固定长度的用户签到数据中提取POI的签到时间属性,获得时间序列t;
步骤2-2、计算POI之间的时间间隔,获得时间间隔集合;POI之间的时间间隔计算公式如下,形成时间间隔集合T:
Δtij=|ti-tj|
其中,ti和tj分别代表POI i和POI j的签到时间;
步骤2-3、选取时间间隔集合T中的最小时间间隔tmin=min(T),对于步骤2-2中计算所得的所有时间间隔,除以最小时间间隔tmin,以获得个性化时间间隔tij,计算公式如下:
Figure BDA0002782162240000031
步骤2-4、采用阈值法对个性化时间间隔tij进行处理,假设个性化时间间隔tij在超过设定阈值t’后是没有用的,对每个个性化时间间隔做处理,则最终的用户个性化时间间隔为:
tij=min(t',tij)
步骤3、采用个性化空间间隔模块,对固定长度的用户签到数据进行处理,获取POI之间的个性化空间间隔信息,具体步骤如下:
步骤3-1、获取空间序列,从固定长度的用户签到序列中提取POI的经纬度属性,获得空间序列d;
步骤3-2、计算POI之间的空间间隔,获得空间间隔集合D;
步骤3-2-1、将目标用户签到数据的地理经度和纬度转换成平面距离,根据平面距离计算目标用户POI之间的距离,计算公式如下式所示,形成空间间隔集合D:
Figure BDA0002782162240000032
其中,Distance(pi,pj)表示POI i和POI j之间的平面距离,lati表示弧度值,a=|lati-latj|表示两点的纬度差,b=|lngi-lngj|表示两点的经度差,r表示地球半径,r=6371公里;
步骤3-2-2、选取空间间隔集合D中的最小空间间隔dmin=min(D),对于步骤3-2-1中计算所得的所有空间间隔除以最短空间间隔dmin,获得个性化空间间隔dij,计算公式如下:
Figure BDA0002782162240000033
步骤3-3、采用阈值法对个性化空间间隔进行处理,假设精确的个性化空间间隔在超过设定阈值d’后是没有用的,对每个个性化空间间隔进行处理,则最终的用户个性化时间间隔为:
dij=min(d',dij)
步骤4、采用语义相关性计算模块,计算用户签到序列中POI之间的语义关联关系,具体步骤如下:
步骤4-1、获取语义序列,从固定长度的用户签到序列中提取POI语义信息,获得语义序列c;
步骤4-2、将语义序列c划分成一对一POI序列集合c';
步骤4-3、对于每个一对一POI序列集合,计算二者之间的语义相关性;其中,s(pi,pi)=1;计算公式如下:
Figure BDA0002782162240000041
Figure BDA0002782162240000042
Figure BDA0002782162240000043
其中,we表示用户从pi到pj所花费的时间,n代表用户从pi到pj的访问次数,c(pi,pj)代表语义权重路径长度,
Figure BDA0002782162240000044
代表语义权重路径平均长度,s(pi,pj)表示pi和pj的语义相关性,n代表输入序列长度;
最终,获得用户语义相关性序列集合S。
步骤5、采用嵌入模块,将用户的签到数据、绝对位置与上述计算所得的时间间隔、空间间隔、语义相关性相结合,获得反映用户实际需求的输入序列的嵌入向量。
步骤6、采用时空语义间隔感知自我注意模块,学习融合位置关系、时间间隔、空间间隔、语义相关性的特征向量;
步骤6-1、采用自我注意力机制,通过整合输入序列的所有POI的影响,将其融入到正在处理的POI中,计算公式如下:
Figure BDA0002782162240000045
其中,n代表输入序列长度,xj代表POI j的嵌入表示,
Figure BDA0002782162240000046
代表位置值向量,
Figure BDA0002782162240000047
代表时间间隔值向量,
Figure BDA0002782162240000048
代表空间间隔值向量,
Figure BDA0002782162240000049
代表语义相关性值向量,WV代表值权重矩阵,zi表示输入的POIi与位置、时间间隔、空间间隔、语义关系的加权和,αij代表其他POI对当前POIi的影响权重,使用Softmax函数计算,计算公式如下:
Figure BDA00027821622400000410
其中,eij表示输入序列中POI j对当前POIi的影响分数,通过将键向量与查询向量进行点积运算来获得,公式如下:
Figure BDA0002782162240000051
其中,WQ,WK分别代表查询权重矩阵和键权重矩阵,
Figure BDA0002782162240000052
代表位置键向量,
Figure BDA0002782162240000053
代表时间间隔键向量,
Figure BDA0002782162240000054
代表空间间隔键向量,
Figure BDA0002782162240000055
代表语义相关性键向量,d表示潜在维度,k为键值向量;为了使梯度更稳定,除以比例因子
Figure BDA0002782162240000056
步骤6-2、利用前馈神经网络,赋予模型非线性;
在时空语义间隔感知的自我注意层之后,使用前馈神经网络,赋予模型非线性,公式如下:
FFN(zi)=max(0,ziW1+b1)W2+b2
其中,W1,W2代表权重,b1,b2代表偏差。
采用残差连接和层归一化处理,计算公式如下:
Zi=zi+Dropout(f(LayerNorm(zi)))
Figure BDA0002782162240000057
其中,f(z)是前馈神经网络或者自我注意层,⊙是元素智能乘积element-wiseproduct,μ和σ是输入向量z的均值和方差,α和β是学习的缩放因子和偏置项,ε为趋于0的正数;
步骤7、通过POI推荐模块,向目标用户进行下一步推荐。采用潜在因子模型来计算用户对候选POI i的偏好评分Ri,t,计算公式如下:
Ri,t=ztxi T
其中,xi代表候选POI i的嵌入表示,zt代表前t个POI的联合嵌入表示,Ri,t越高意味着相关性越高,通过对分数进行排序来进行下一个POI推荐。
采用上述技术方案所产生的有益效果在于:
本发明提出了一种自注意力下时空语义间隔感知的POI推荐***及方法,本发明针对默认所有相邻的POI具有相同的时间间隔问题,本发明通过将用户交互序列建模为具有不同时间间隔的序列,不仅考虑了用户签到数据的绝对位置,同时将这些不同时间间隔纳入推荐***;
其次,影响POI推荐效果的一个重要因素就是地理距离,用户会偏向去距离自己当前位置较近的地方。基于此,本发明考虑了空间间隔的影响,将其整合到推荐中;
此外,基于上述时间间隔、空间间隔要素的启发,本发明还引入了签到序列之间的语义相关性,反映用户的移动模式。本发明的另一优点在于成功运用自我注意机制,将不同的要素以及所有相关POI信息进行整合,实现更为精准的推荐效果。
附图说明
图1为本发明一种自注意力下时空语义间隔感知的POI推荐***的体系结构框图;
图2为本发明一种自注意力下时空语义间隔感知的POI推荐方法流程图;
图3为本发明一种实施例在不同潜在维度下的推荐效果测试图;
图4为本发明一种实施例在不同序列长度下的推荐效果测试图;
图5为本发明一种实施例在不同推荐个数下的推荐效果测试图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
一方面,一种自注意力下时空语义间隔感知的POI推荐***,如图1所示,包括数据采集清洗模块、个性化时间间隔模块、个性化空间间隔模块、语义相关性计算模块、时空语义间隔感知自我注意模块和POI推荐模块;
所述数据采集清洗模块用于采集清洗基于位置的社交网络数据,即社交网站的用户签到数据集,包括用户信息、POI签到信息,经过数据清洗操作后进行存储;
所述用户信息为用户ID,所述POI签到信息包括POI ID、POI经纬度、POI语义,POI签到时间;
所述个性化时间间隔模块用于计算用户签到序列中POI之间的时间间隔;考虑时间间隔对推荐效率的影响。即使签到序列中相同的POI顺序,签到时间不同,时间间隔也会不同,最终也会影响推荐准确度。所述个性化空间间隔模块用于计算用户签到序列中POI之间的空间间隔;考虑地理距离对推荐效率的影响。用户通常会选择访问距离自己较近的POI,而不是类似的POI,但是离现在很远。所述语义相关性计算模块用于计算用户签到序列中POI之间的语义相关性;在语义层面考虑下一个POI推荐问题。语义序列中不同POI之间相关性越高,代表用户的感兴趣程度越大,反映出用户的移动模式。
所述嵌入模块用于将用户签到数据、绝对位置、时间间隔、空间间隔、语义相关性进行结合,获得反映用户实际需求的嵌入向量;所述绝对位置表示签到数据中每个POI的位置,通过字嵌入技术获得;
所述时空语义间隔感知自我注意模块用于学习融合签到数据、绝对位置、时间间隔、空间间隔、语义相关性的签到序列数据的特征向量;随着模型处理输入序列的每个POI,自注意力机制会关注整个输入序列的所有POI,将所有相关POI的信息融入到我们正在处理的POI中,帮助模型对正在处理的POI更好地进行编码,获得融合更多信息的特征向量。
所述POI推荐模块向目标用户进行下一步推荐。采用潜在因子模型来计算用户对候选集中POI的偏好评分。所述偏好评分越高意味着相关性越高,通过对分数进行由高到低排序来进行下一个POI推荐。
另一方面,一种自注意力下时空语义间隔感知的POI推荐方法,基于前述一种自注意力下时空语义间隔感知的POI推荐***实现,如图2所示,包括以下步骤:
步骤1:在Gowalla样本采集范围内采用基于位置的社交网络LBSN,获取社交网站的用户签到数据集,然后进行数据清洗操作,去除被访问次数少于10次的用户及POI,获得最终的用户签到数据,同时采集POI属性信息,根据时间戳顺序对每个用户的签到记录进行排序。
由于用户的签到数据有很多,本发明所述对签到记录进行排序首先将用户的签到数据转换成固定长度为n的序列,如果序列长度大于n,则提取时间最近的n个签到记录,反之,则在序列左侧进行数据填充,即用第一个签到记录进行填充,直到长度满足n为止,最终生成长度为n的用户签到序列。
本实施例中实验数据采集的是基于位置的社交网络Gowalla中用户及其相关活动数据。首先进行数据清洗,去除被访问次数少于10次的用户及POI,同时采集POI属性信息。然后,根据时间戳顺序对每个用户的签到记录进行排序。时间范围从2009年3月14日到2010年10月22日。实验数据采集的Gowalla空间范围是一个从(32.54273942,-114.3466677)到(40.59126377,-123.0006272)的范围。该范围可用数据包含了7858个用户个数,12541个POI,515713个签到记录。原始数据包含用户数据和POI数据两类数据,其中用户数据主要有用户ID属性;POI数据主要有POI ID、POI经纬度、POI签到时间、POI语义(比如酒店、餐厅)等属性。用户签到数据的格式如下:用户ID、POI ID、签到时间、经度、纬度、POI语义信息。
本发明实施例中,假如给定某用户u的签到记录,签到记录格式如上所示。首先将其转换成固定长度5的序列。如果序列长度大于5,则提取时间最近的5个签到记录。反之,则在序列左侧进行数据填充(用第一个签到记录进行填充),直到长度满足5为止。将用户序列按照时间排序,获得如表1所示的用户固定签到数据:
表1用户固定签到数据信息
Figure BDA0002782162240000071
Figure BDA0002782162240000081
步骤2、采用个性化时间间隔模块,对步骤1中的固定长度用户签到数据进行处理,获取POI之间的个性化时间间隔信息;
步骤2-1、获取时间序列,从固定长度的用户签到数据中提取POI的签到时间属性,获得时间序列t,t={2009-04-1923:36:04,2009-04-2000:27:03,2009-04-2002:59:31,2009-04-2003:03:05,2009-04-2004:14:56}。
步骤2-2、计算POI之间的时间间隔,获得时间间隔集合;POI之间的时间间隔计算公式式(1),形成时间间隔集合T:
Δtij=|ti-tj| (1)
其中,ti和tj分别代表POI i和POI j的签到时间;
将签到时间转换成时间戳格式:
t={1240155364.0,1240158423.0,1240167571.0,1240167785.0,1240172096.0}
利用公式(1),获得的时间间隔如下:
Figure BDA0002782162240000082
步骤2-3、选取时间间隔集合T中的最小时间间隔tmin=min(T),对于步骤2-2中计算所得的所有时间间隔,除以最小时间间隔tmin,以获得个性化时间间隔tij,计算公式如下:
Figure BDA0002782162240000083
本实施例中个性化时间间隔如下:
Figure BDA0002782162240000084
步骤2-4、采用阈值法对个性化时间间隔tij进行处理,假设个性化时间间隔tij在超过设定阈值t’后是没有用的,对每个个性化时间间隔做处理,则最终的用户个性化时间间隔为:
tij=min(t',tij) (3)
假定时间阈值t'=256,对上述每个个性化时间间隔做处理,利用公式(3)将超出阈值的部分丢弃。
步骤3、采用个性化空间间隔模块,对固定长度的用户签到数据进行处理,获取POI之间的个性化空间间隔信息,具体步骤如下:
步骤3-1、获取空间序列,从固定长度的用户签到序列中提取POI的经纬度属性,获得空间序列d={(37.8023625614,-122.4058270454),(37.79762505,-122.4065995167),(37.798704571,-122.407296896),(37.8005003833,-122.4074578167),(37.8000101086,-122.4075114727)}。
步骤3-2、计算POI之间的空间间隔,获得空间间隔集合D;
步骤3-2-1、将目标用户签到数据的地理经度和纬度转换成平面距离,根据平面距离计算目标用户POI之间的距离,计算公式如式(4)所示,形成空间间隔集合D:
Figure BDA0002782162240000091
其中,Distance(pi,pj)表示POI i和POI j之间的平面距离,lati表示弧度值,a=|lati-latj|表示两点的纬度差,b=|lngi-lngj|表示两点的经度差,r表示地球半径,r=6371公里;
本实施例中POI之间的平面距离,如下所示:
Figure BDA0002782162240000092
步骤3-2-2、选取空间间隔集合D中的最小空间间隔dmin=min(D),对于步骤3-2-1中计算所得的所有空间间隔除以最短空间间隔dmin,获得个性化空间间隔dij,计算公式如下:
Figure BDA0002782162240000093
本实施例中个性化时间间隔如下:
Figure BDA0002782162240000094
步骤3-3、采用阈值法对个性化空间间隔进行处理,假设精确的个性化空间间隔在超过设定阈值d’后是没有用的,对每个个性化空间间隔进行处理,则最终的用户个性化时间间隔为:
dij=min(d',dij) (6)
假定空间阈值d'=10,对每个个性化空间间隔做处理。利用公式(6)摒弃大于空间阈值的个性化空间间隔。
步骤4、采用语义相关性计算模块,计算用户签到序列中POI之间的语义关联关系,具体步骤如下:
步骤4-1、获取语义序列,从固定长度的用户签到序列中提取POI语义信息,获得语义序列c;c={Historic Landmark,Bookstore,Coffee Shop,Pizza,Paper Goods}。
步骤4-2、将语义序列c划分成一对一POI序列集合c';c'={<Historic Landmark,Bookstore>,<Bookstore,Coffee Shop>,<Coffee Shop,Pizza>,<Pizza,Paper Goods>};
步骤4-3、对于每个一对一POI序列集合,计算二者之间的语义相关性;其中,s(pi,pi)=1;计算公式如下:
Figure BDA0002782162240000101
Figure BDA0002782162240000102
Figure BDA0002782162240000103
其中,we表示用户从pi到pj所花费的时间,n代表用户从pi到pj的访问次数,c(pi,pj)代表语义权重路径长度,
Figure BDA0002782162240000104
代表语义权重路径平均长度,s(pi,pj)表示pi和pj的语义相关性,n代表输入序列长度;
最终,获得用户语义相关性序列集合S。
本实施例中根据公式(7)到(9)获得POI语义相关性,如下所示:
Figure BDA0002782162240000105
步骤5、采用嵌入模块,将用户的签到数据、绝对位置与上述计算所得的时间间隔、空间间隔、语义相关性相结合,获得反映用户实际需求的输入序列的嵌入向量。
首先,将每个签到POI通过词嵌入算法转换成向量表示。签到POI向量表示如下:
Figure BDA0002782162240000111
另外,用户的签到数据是有顺序的,为了让模型理解POI顺序,给每个POI添加一个位置编码向量,这有助于确定每个POI的位置。位置向量如下:
Figure BDA0002782162240000112
然后,结合步骤2、3、4的相关要素,共同构成模型的输入。此时,模型的输入不仅包括签到数据的位置顺序,还包括时间间隔、空间间隔、语义相关性等。最终的嵌入向量表示如下:
Figure BDA0002782162240000113
步骤6、采用时空语义间隔感知自我注意模块,用于学习融合位置关系、时间间隔、空间间隔、语义相关性的特征向量,具体步骤如下:
步骤6-1、采用自我注意力机制,通过整合输入序列的所有POI的影响,将其融入到正在处理的POI中,实现POI更好地进行编码操作,计算公式如下:
Figure BDA0002782162240000114
其中,n代表输入序列长度,xj代表POI j的嵌入表示,
Figure BDA0002782162240000115
代表位置值向量,
Figure BDA0002782162240000116
代表时间间隔值向量,
Figure BDA0002782162240000117
代表空间间隔值向量,
Figure BDA0002782162240000118
代表语义相关性值向量,WV代表值权重矩阵,zi表示输入的POIi与位置、时间间隔、空间间隔、语义关系的加权和,αij代表其他POI对当前POIi的影响权重,使用Softmax函数计算,计算公式如下:
Figure BDA0002782162240000119
其中,eij表示输入序列中POI j对当前POIi的影响分数,通过将键向量与查询向量进行点积运算来获得,公式如下:
Figure BDA00027821622400001110
其中,WQ,WK分别代表查询权重矩阵和键权重矩阵,
Figure BDA0002782162240000121
代表位置键向量,
Figure BDA0002782162240000122
代表时间间隔键向量,
Figure BDA0002782162240000123
代表空间间隔键向量,
Figure BDA0002782162240000124
代表语义相关性键向量,d表示潜在维度,k为键值向量;为了使梯度更稳定,除以比例因子
Figure BDA0002782162240000125
步骤6-2、利用前馈神经网络,赋予模型非线性;
自我注意机制是通过线性组合来整合相关要素的,考虑到不同潜在维度之间的相互作用,我们在时空语义间隔感知的自我注意层之后,使用前馈神经网络,赋予模型非线性,公式如下:
FFN(zi)=max(0,ziW1+b1)W2+b2 (13)
其中,W1,W2代表权重,b1,b2代表偏差。
为了避免过拟合、梯度消失等问题出现,采用残差连接和层归一化处理,计算公式如下:
Zi=zi+Dropout(f(LayerNorm(zi))) (14)
Figure BDA0002782162240000126
其中,f(z)是前馈神经网络或者自我注意层,⊙是element-wise product,μ和σ是输入向量z的均值和方差,α和β是学习的缩放因子和偏置项,ε为趋于0的正数,保证分母大于0;
在自我注意模块后,我们得到考虑序列全部信息的特征向量表示,即:
z5=[-0.17 0.45 -0.31 0.85 -0.29]
步骤7、通过POI推荐模块,向目标用户进行下一步推荐。采用潜在因子模型来计算用户对候选POI i的偏好评分Ri,t,计算公式如下:
Ri,t=ztxi T (16)
其中,xi代表候选POI i的嵌入表示,zt代表前t个POI的联合嵌入表示,它考虑了用户的所有动作。Ri,t越高意味着相关性越高,通过对分数进行排序来进行下一个POI推荐。
假定候选集中POI有3个,分别是Garden、Mexican、Corporate office。
首先,通过字嵌入技术获得候选集POI的特征向量。
x1=[0.23 -0.44 0.51 0.29 -0.59]
x2=[0.14 0.27 -0.8 -0.47 -0.62]
x3=[-0.21 -0.38 0.62 0.37 -0.09]
利用公式(16),采用潜在因子模型来计算用户对候选集POI的偏好评分。
R1,5=z5x1 T=0.022
R2,5=z5x2 T=0.126
R3,5=z5x3 T=0.013
偏好分数越高意味着相关性越高,通过对偏好分数进行排序来进行下一POI推荐。R2,5>R1,5>R3,5,所以将Mexican推荐给用户。
本发明实施例中,通过实验验证了所提的时空语义间隔感知的基于自我注意力的下一POI推荐***的有效性和可行性,通过三个实验对该***进行性能验证。
首先,考虑用户最大序列长度n的影响。如图3所示,在保持其他最佳超参数不变的情况下,最大序列长度n从10到50的NDCG。当考虑更长的序列时,用户的推荐性能会提高。
其次,考虑潜在维度d的影响。如图4所示给出了潜在维度d从10到50的变化过程中,推荐性能的变化。潜在维度越长,推荐性能越好。
另外,本实施例实验中还考虑了推荐数量对推荐准确度的影响。如图5所示给出了推荐数量从1到20的变化过程中,推荐性能的变化。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (6)

1.一种自注意力下时空语义间隔感知的POI推荐***,其特征在于:包括数据采集清洗模块、个性化时间间隔模块、个性化空间间隔模块、语义相关性计算模块、时空语义间隔感知自我注意模块和POI推荐模块;
所述数据采集清洗模块用于采集清洗基于位置的社交网络数据,即社交网站的用户签到数据集,包括用户信息、POI签到信息,经过数据清洗操作后进行存储;
所述用户信息为用户ID,所述POI签到信息包括POI ID、POI经纬度、POI语义,POI签到时间;
所述个性化时间间隔模块用于计算用户签到序列中POI之间的时间间隔;所述个性化空间间隔模块用于计算用户签到序列中POI之间的空间间隔;所述语义相关性计算模块用于计算用户签到序列中POI之间的语义相关性;所述嵌入模块用于将用户签到数据、绝对位置、时间间隔、空间间隔、语义相关性进行结合,获得反映用户实际需求的嵌入向量;所述绝对位置表示签到数据中每个POI的位置,通过字嵌入技术获得;
所述时空语义间隔感知自我注意模块用于学习融合签到数据、绝对位置、时间间隔、空间间隔、语义相关性的签到序列数据的特征向量;
所述POI推荐模块向目标用户进行下一步推荐,采用潜在因子模型来计算用户对候选集中POI的偏好评分,所述偏好评分越高则相关性越高,通过对分数进行由高到低排序来进行下一个POI推荐。
2.一种自注意力下时空语义间隔感知的POI推荐方法,通过权利要求1所述一种自注意力下时空语义间隔感知的POI推荐***实现,具体包括以下步骤;
步骤1:采用基于位置的社交网络LBSN获取社交网站的用户签到数据集,然后进行数据清洗操作,去除被访问次数少于10次的用户及POI,获得最终的用户签到数据,同时采集POI属性信息,根据时间戳顺序对每个用户的签到记录进行排序;
所述对签到记录进行排序首先将用户的签到数据转换成固定长度为n的序列,如果序列长度大于n,则提取时间最近的n个签到记录,反之,则在序列左侧进行数据填充,即用第一个签到记录进行填充,直到长度满足n为止,最终生成长度为n的用户签到序列;
步骤2、采用个性化时间间隔模块,对步骤1中的固定长度用户签到数据进行处理,获取POI之间的个性化时间间隔信息;
步骤3、采用个性化空间间隔模块,对固定长度的用户签到数据进行处理,获取POI之间的个性化空间间隔信息;
步骤4、采用语义相关性计算模块,计算用户签到序列中POI之间的语义关联关系;
步骤5、采用嵌入模块,将用户的签到数据、绝对位置与上述计算所得的时间间隔、空间间隔、语义相关性相结合,获得反映用户实际需求的输入序列的嵌入向量;
步骤6、采用时空语义间隔感知自我注意模块,学习融合位置关系、时间间隔、空间间隔、语义相关性的特征向量;
步骤7、通过POI推荐模块,向目标用户进行下一步推荐;采用潜在因子模型来计算用户对候选POIi的偏好评分Ri,t,计算公式如下:
Ri,t=ztxi T
其中,xi代表候选POI i的嵌入表示,zt代表前t个POI的联合嵌入表示,Ri,t越高意味着相关性越高,通过对分数进行排序来进行下一个POI推荐。
3.根据权利要求2所述的一种自注意力下时空语义间隔感知的POI推荐方法,其特征在于,所述步骤2具体包括以下步骤:
步骤2-1、获取时间序列,从固定长度的用户签到数据中提取POI的签到时间属性,获得时间序列t;
步骤2-2、计算POI之间的时间间隔,获得时间间隔集合;POI之间的时间间隔计算公式如下,形成时间间隔集合T:
Δtij=|ti-tj|
其中,ti和tj分别代表POIi和POIj的签到时间;
步骤2-3、选取时间间隔集合T中的最小时间间隔tmin=min(T),对于步骤2-2中计算所得的所有时间间隔,除以最小时间间隔tmin,以获得个性化时间间隔tij,计算公式如下:
Figure FDA0002782162230000021
步骤2-4、采用阈值法对个性化时间间隔tij进行处理,假设个性化时间间隔tij在超过设定阈值t’后是没有用的,对每个个性化时间间隔做处理,则最终的用户个性化时间间隔为:
tij=min(t′,tij)。
4.根据权利要求2所述的一种自注意力下时空语义间隔感知的POI推荐方法,其特征在于,所述步骤3具体包括以下步骤:
步骤3-1、获取空间序列,从固定长度的用户签到序列中提取POI的经纬度属性,获得空间序列d;
步骤3-2、计算POI之间的空间间隔,获得空间间隔集合D;
步骤3-2-1、将目标用户签到数据的地理经度和纬度转换成平面距离,根据平面距离计算目标用户POI之间的距离,计算公式如下,形成空间间隔集合D:
Figure FDA0002782162230000031
其中,Distance(pi,pj)表示POIi和POIj之间的平面距离,lati表示弧度值,a=|lati-latj|表示两点的纬度差,b=|lngi-lngj|表示两点的经度差,r表示地球半径,r=6371公里;
步骤3-2-2、选取空间间隔集合D中的最小空间间隔dmin=min(D),对于步骤3-2-1中计算所得的所有空间间隔除以最短空间间隔dmin,获得个性化空间间隔dij,计算公式如下:
Figure FDA0002782162230000032
步骤3-3、采用阈值法对个性化空间间隔进行处理,假设精确的个性化空间间隔在超过设定阈值d’后是没有用的,对每个个性化空间间隔进行处理,则最终的用户个性化时间间隔为:
dij=min(d′,dij)。
5.根据权利要求2所述的一种自注意力下时空语义间隔感知的POI推荐方法,其特征在于,所述步骤4具体包括以下步骤:
步骤4-1、获取语义序列,从固定长度的用户签到序列中提取POI语义信息,获得语义序列c;
步骤4-2、将语义序列c划分成一对一POI序列集合c′;
步骤4-3、对于每个一对一POI序列集合,计算二者之间的语义相关性;其中,s(pi,pi)=1;计算公式如下:
Figure FDA0002782162230000033
Figure FDA0002782162230000034
Figure FDA0002782162230000041
其中,we表示用户从pi到pj所花费的时间,n代表用户从pi到pj的访问次数,c(pi,pj)代表语义权重路径长度,
Figure FDA0002782162230000042
代表语义权重路径平均长度,s(pi,pj)表示pi和pj的语义相关性,n代表输入序列长度;
最终,获得用户语义相关性序列集合S。
6.根据权利要求2所述的一种自注意力下时空语义间隔感知的POI推荐方法,其特征在于,所述步骤6具体包括以下步骤:
步骤6-1、采用自我注意力机制,通过整合输入序列的所有POI的影响,将其融入到正在处理的POI中,计算公式如下:
Figure FDA0002782162230000043
其中,n代表输入序列长度,xj代表POIj的嵌入表示,
Figure FDA0002782162230000044
代表位置值向量,
Figure FDA0002782162230000045
代表时间间隔值向量,
Figure FDA0002782162230000046
代表空间间隔值向量,
Figure FDA0002782162230000047
代表语义相关性值向量,Wv代表值权重矩阵,zi表示输入的POIi与位置、时间间隔、空间间隔、语义关系的加权和,αij代表其他POI对当前POIi的影响权重,使用Softmax函数计算,计算公式如下:
Figure FDA0002782162230000048
其中,eij表示输入序列中POIj对当前POIi的影响分数,通过将键向量与查询向量进行点积运算来获得,公式如下:
Figure FDA0002782162230000049
其中,WQ,WK分别代表查询权重矩阵和键权重矩阵,
Figure FDA00027821622300000410
代表位置键向量,
Figure FDA00027821622300000411
代表时间间隔键向量,
Figure FDA0002782162230000051
代表空间间隔键向量,
Figure FDA0002782162230000052
代表语义相关性键向量,d表示潜在维度,k为键值向量;为了使梯度更稳定,除以比例因子
Figure FDA0002782162230000053
步骤6-2、利用前馈神经网络,赋予模型非线性;
在时空语义间隔感知的自我注意层之后,使用前馈神经网络,赋予模型非线性,公式如下:
FFN(zi)=max(0,ziW1+b1)W2+b2
其中,W1,W2代表权重,b1,b2代表偏差;
采用残差连接和层归一化处理,计算公式如下:
Zi=zi+Dropout(f(LayerNorm(zi)))
Figure FDA0002782162230000054
其中,f(z)是前馈神经网络或者自我注意层,⊙是元素智能乘积element-wiseproduct,μ和σ是输入向量z的均值和方差,α和β是学习的缩放因子和偏置项,ε为趋于0的正数。
CN202011285422.XA 2020-11-17 2020-11-17 自注意力下时空语义间隔感知的poi推荐***及方法 Active CN112199609B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011285422.XA CN112199609B (zh) 2020-11-17 2020-11-17 自注意力下时空语义间隔感知的poi推荐***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011285422.XA CN112199609B (zh) 2020-11-17 2020-11-17 自注意力下时空语义间隔感知的poi推荐***及方法

Publications (2)

Publication Number Publication Date
CN112199609A true CN112199609A (zh) 2021-01-08
CN112199609B CN112199609B (zh) 2021-09-21

Family

ID=74033868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011285422.XA Active CN112199609B (zh) 2020-11-17 2020-11-17 自注意力下时空语义间隔感知的poi推荐***及方法

Country Status (1)

Country Link
CN (1) CN112199609B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112800346A (zh) * 2021-01-15 2021-05-14 郑州大学 一种融入空间关系的poi推荐方法及推荐***
CN112818216A (zh) * 2021-01-13 2021-05-18 平安科技(深圳)有限公司 客户推荐方法、装置、电子设备及存储介质
CN114493755A (zh) * 2021-12-28 2022-05-13 电子科技大学 一种融合时序信息的自注意力序列推荐方法
CN115774819A (zh) * 2023-02-10 2023-03-10 湖北省楚天云有限公司 一种基于层次循环神经网络的兴趣点推荐方法及***
CN116680486A (zh) * 2023-05-31 2023-09-01 西安工程大学 基于时空注意力机制的用户兴趣预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593361A (zh) * 2012-08-14 2014-02-19 中国科学院沈阳自动化研究所 感应网络环境下移动时空轨迹分析方法
CN105260795A (zh) * 2015-10-13 2016-01-20 广西师范学院 一种基于条件随机场的重点人员位置时空预测方法
US10152547B2 (en) * 2016-02-05 2018-12-11 Flipboard, Inc. Pattern matching for content in digital magazine

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593361A (zh) * 2012-08-14 2014-02-19 中国科学院沈阳自动化研究所 感应网络环境下移动时空轨迹分析方法
CN105260795A (zh) * 2015-10-13 2016-01-20 广西师范学院 一种基于条件随机场的重点人员位置时空预测方法
US10152547B2 (en) * 2016-02-05 2018-12-11 Flipboard, Inc. Pattern matching for content in digital magazine

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孔德江等: "时空嵌入式生成对抗网络的地点预测方法", 《模式识别与人工智能》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112818216A (zh) * 2021-01-13 2021-05-18 平安科技(深圳)有限公司 客户推荐方法、装置、电子设备及存储介质
CN112818216B (zh) * 2021-01-13 2021-09-28 平安科技(深圳)有限公司 客户推荐方法、装置、电子设备及存储介质
CN112800346A (zh) * 2021-01-15 2021-05-14 郑州大学 一种融入空间关系的poi推荐方法及推荐***
CN112800346B (zh) * 2021-01-15 2022-10-14 郑州大学 一种融入空间关系的poi推荐方法及推荐***
CN114493755A (zh) * 2021-12-28 2022-05-13 电子科技大学 一种融合时序信息的自注意力序列推荐方法
CN114493755B (zh) * 2021-12-28 2022-10-14 电子科技大学 一种融合时序信息的自注意力序列推荐方法
CN115774819A (zh) * 2023-02-10 2023-03-10 湖北省楚天云有限公司 一种基于层次循环神经网络的兴趣点推荐方法及***
CN115774819B (zh) * 2023-02-10 2023-05-09 湖北省楚天云有限公司 一种基于层次循环神经网络的兴趣点推荐方法及***
CN116680486A (zh) * 2023-05-31 2023-09-01 西安工程大学 基于时空注意力机制的用户兴趣预测方法
CN116680486B (zh) * 2023-05-31 2024-06-14 西安工程大学 基于时空注意力机制的用户兴趣预测方法

Also Published As

Publication number Publication date
CN112199609B (zh) 2021-09-21

Similar Documents

Publication Publication Date Title
CN112199609B (zh) 自注意力下时空语义间隔感知的poi推荐***及方法
Kurashima et al. Travel route recommendation using geotagged photos
Xiao et al. Inferring social ties between users with human location history
Stock Mining location from social media: A systematic review
Wu et al. Garg: anonymous recommendation of point-of-interest in mobile networks by graph convolution network
Kurashima et al. Travel route recommendation using geotags in photo sharing sites
Zheng et al. Collaborative location and activity recommendations with gps history data
CN103023977B (zh) 基于位置信息的推荐***及推荐方法
Liu et al. Extracting semantic location from outdoor positioning systems
CN110119475B (zh) 一种poi推荐方法及推荐***
Yue et al. Detect: Deep trajectory clustering for mobility-behavior analysis
CN107341261B (zh) 一种面向位置社交网络的兴趣点推荐方法
Sang et al. Activity sensor: Check-in usage mining for local recommendation
Gao et al. Mining human mobility in location-based social networks
Zhang et al. VCG: Exploiting visual contents and geographical influence for Point-of-Interest recommendation
Lin et al. Inferring the home locations of Twitter users based on the spatiotemporal clustering of Twitter data
Abbruzzo et al. A pre-processing and network analysis of GPS tracking data
CN115408618B (zh) 一种基于社交关系融合位置动态流行度和地理特征的兴趣点推荐方法
Zhao et al. Annotating points of interest with geo-tagged tweets
Ding et al. Spatial-temporal distance metric embedding for time-specific POI recommendation
Lathia The anatomy of mobile location-based recommender systems
Tang et al. Discovering Travel Community for POI Recommendation on Location‐Based Social Networks
Duan et al. Personalized service recommendations for travel using trajectory pattern discovery
Tan et al. Preference-oriented mining techniques for location-based store search
Zou et al. An innovative GPS trajectory data based model for geographic recommendation service

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant