CN111915104A - 一种预测出行位置的方法及装置 - Google Patents

一种预测出行位置的方法及装置 Download PDF

Info

Publication number
CN111915104A
CN111915104A CN202010887136.4A CN202010887136A CN111915104A CN 111915104 A CN111915104 A CN 111915104A CN 202010887136 A CN202010887136 A CN 202010887136A CN 111915104 A CN111915104 A CN 111915104A
Authority
CN
China
Prior art keywords
user
traj
travel
sequence
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010887136.4A
Other languages
English (en)
Inventor
孙久虎
相恒茂
高浠舰
李�浩
梁玉才
张恒才
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Provincial Institute of Land Surveying and Mapping
Original Assignee
Shandong Provincial Institute of Land Surveying and Mapping
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Provincial Institute of Land Surveying and Mapping filed Critical Shandong Provincial Institute of Land Surveying and Mapping
Priority to CN202010887136.4A priority Critical patent/CN111915104A/zh
Publication of CN111915104A publication Critical patent/CN111915104A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/047Optimisation of routes or paths, e.g. travelling salesman problem
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Development Economics (AREA)
  • Algebra (AREA)
  • Pure & Applied Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Optimization (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种预测出行位置的方法及装置,所述方法包括获取出行轨迹数据集;对所述出行轨迹数据集进行语义化;利用k阶马尔科夫概率转移矩阵,通过单个用户u的语义轨迹序列,计算空间实体之间的转移概率矩阵,并将所述转移概率矩分解为k个一阶马尔科夫链;选择用户u的最优化k值,记为ku;结合长短期记忆网络对ku个一阶马尔可夫链进行融合得到混合预测模型;根据所述混合预测模型构建出行位置预测结果集。本申请通过对人类出行活动产生的轨迹数据进行处理,通过提取用户停留区域,确定该停留区域的语义位置,构建混合预测模型预测行人未来出行位置,为移动位置服务、城市交通、移动互联网络技术等领域提供支持。

Description

一种预测出行位置的方法及装置
技术领域
本申请涉及移动位置服务、出行位置预测及移动互联网技术领域,尤其是涉及一种预测出行位置的方法及装置。
背景技术
位置预测技术是根据用户的历史轨迹数据推断用户下一时刻位置,预测出行过程中在未来某个时间可能所在的位置是重要的基础性研究工作,可为城市规划、城市管理、智能交通、基于位置的信息服务、商业广告投放等应用提供支撑。
近年来,随着定位技术快速发展、移动终端设备不断普及,移动用户的轨迹数据呈爆发式增长,为室内外用户位置预测与实时位置服务研究提供了重要的数据源。
目前被广泛用于出行位置预测的经典统计模型中,如Sha等提出的高阶马尔科夫链模型,该模型假设下一时刻的位置与前k位置有关,但易造成维数灾难的问题,即其状态空间随着n的增加呈现***增长,此问题使得k-MC在位置预测领域实用性较低;Mathew等提出的利用隐马尔可夫模型HMM来预测出行位置,但是不适用于预测长时序位置数据。为了解决时序数据中存在的长期依赖问题,深度学习模型被应用到位置预测中,如循环神经网络(Recurrent Neural Network,RNN)、长短时记忆网络(Long Short-Term Memory,LSTM),门控循环单元网络(Gated-Recurrent-Unit,GRU)等。与经典统计模型相比,深度学习模型取得了较好的预测精度。
然而,深度学习模型是一种数据驱动的经验模型,难以解释模型中的因果关系,或者说是放弃了对因果关系的解释。此外,目前位置的研究多侧重于位置点的预测,而没有对语义位置的预测予以足够重视,所以对人类基于主观偏好的出行位置预测仍是一个具有挑战性的问题。
发明内容
(一)发明目的
本申请的目的是提供一种预测出行位置的方法及装置,以解决目前出行预测方法的统计模型无法提高预测精度或无法解释前后位置关系,同时通过对出行轨迹数据集的语义化,利用统计模型与深度学习模型的结合,以解决出行轨迹预测准确率低的问题。
(二)技术方案
第一方面,本申请实施例提供了一种预测出行位置的方法,包括:
获取出行轨迹数据集Traj;
对所述出行轨迹数据集Traj进行语义化;
利用k阶马尔科夫概率转移矩阵,通过单个用户u的语义轨迹序列locSequ,计算空间实体之间的转移概率矩阵Yu(k)
将所述转移概率矩阵Yu(k)分解为k个一阶马尔科夫链;
选择用户u的最优化k值,记为ku
结合长短期记忆网络对ku个一阶马尔可夫链进行融合得到混合预测模型;
根据所述混合预测模型构建出行位置预测结果集。
第二方面,本申请实施例提供了一种预测出行位置的装置,包括:
出行轨迹数据集预处理模块,用于获取出行轨迹数据集Traj;
出行轨迹数据集语义化模块,用于对所述出行轨迹数据集Traj进行语义化;
k阶马尔科夫构建模块,用于利用k阶马尔科夫概率转移矩阵,通过单个用户u的语义轨迹序列locSequ,计算空间实体之间的转移概率矩阵Yu(k),并将所述转移概率矩阵Yu(k)分解为k个一阶马尔科夫链;
k值最优化选择模块,用于选择用户u的最优化k值,记为ku
预测模型构建模块,用于结合长短期记忆网络对ku个一阶马尔可夫链进行融合得到混合预测模型;
预测结果集构建模块,用于根据所述混合预测模型构建出行位置预测结果集。
第三方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机执行指令,当所述计算机执行指令被处理器执行时,实现上述第一方面所述的方法。
(三)有益效果
本申请技术方案的有益效果在于:通过出行轨迹语义化的方法,对人类出行活动产生的轨迹数据进行处理,通过提取用户停留区域,确定该停留区域的语义位置,构建混合预测模型预测行人未来出行位置,为移动位置服务、城市交通、移动互联网络技术等领域提供支持。
附图说明
图1为本申请实施例预测出行位置的方法流程示意图;
图2为图1实施例中所述语义轨迹序列示意图;
图3为本申请实施例室内定位数据分布间隔图;
图4为本申请实施例实验结果对比图;
图5为本申请实施例预测出行位置的装置结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本申请进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本申请的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本申请的概念。
图1为本申请实施例预测出行位置的方法流程示意图。
如图1所示,一种预测出行位置的方法,包括:
S101:获取出行轨迹数据集Traj;
S102:对所述出行轨迹数据集Traj进行语义化;
S103:利用k阶马尔科夫概率转移矩阵,通过单个用户u的语义轨迹序列locSequ,计算空间实体之间的转移概率矩阵Yu(k),并将所述转移概率矩阵Yu(k)分解为k个一阶马尔科夫链;
S104:选择用户u的最优化k值,记为ku
S105:结合长短期记忆网络对ku个一阶马尔可夫链进行融合得到混合预测模型;
S106:根据所述混合预测模型构建出行位置预测结果集。
步骤S101中获取出行轨迹数据集Traj,具体数据格式为:
Traj={traj1,traj2,...,trajm},其中,m为用户数量,traji为用户i的轨迹数,traji={locfile1,locfile2,...,locfileq},其中,q为单个用户的轨迹数量,单条轨迹locfilej定义为,locfilej={pt1,pt2,...,ptn},n为轨迹点的数量,单个轨迹点ptl={lat,lon,time},表示用户在某一个时刻的经纬度信息。
Traj可以根据需要采用gpx、kml、plt和log等格式。为实现对海量原始轨迹数据分布式存储,在该实施例案例中采用的数据库为MongoDB集群,实现通过非结构化方式进行数据的逻辑存储与管理。在实际的存储方案中采用了数据库的自动分片策略,分布式集群处理模型采用MapReduce模型,从而实现利用分布式计算环境和存储结构进行轨迹数据的物理存储与处理。
原始轨迹数据由于信号不稳定或者定位误差,易产生异常、无效、错误等数据,需要对原始轨迹数据进行数据清洗预处理,主要包含以下三个步骤:
(1)范围越界的轨迹点,如果轨迹点落在研究区域之外时,则将其视为范围越界轨迹点。
(2)时间异常的轨迹点,如果相邻两个轨迹点采样间隔为0秒时,则将其是为时间异常轨迹点。
(3)位置跳跃的轨迹点,如果某用户的相邻轨迹点在短时间内在两个位置间跳跃距离超过10米,则将其是为跳跃轨迹点。
图2为图1实施例中所述语义轨迹序列示意图。
步骤S102中对所述出行轨迹数据集Traj进行语义化。
其中:语义轨迹
Figure BDA0002655906940000051
是由n个停留点中的空间实体语义标签s按照时间顺序组成的序列,如图2所示,用户原始轨迹可以用空间实体语义标签序列<Nike,Converse,Vans>表示,所有用户语义轨迹组成的集合为语义轨迹集ST。
本申请实施例提出的TrajSegment算法从出行轨迹traj检测停留点spid,该方法在传统DBSCAN基础上定义了室内空间的时空邻域,首先将个体轨迹traj划分为k个不相交顺序簇集{C1,C2,...,Ck},k个簇集得到k个停留点,计算其空间的时空邻域公式所示:
Figure BDA0002655906940000052
其中:sd用于计算轨迹点pti与ptj之间的空间距离;td用于计算轨迹点pti与ptj之间的时间距离;
Figure BDA0002655906940000053
表示时空邻域中包含的轨迹点集合。
接着在停留点语义化,本申请实施例采用采用近邻搜索(nearest-neighborsearch)为每个停留点赋予语义。对于用户u停留点
Figure BDA0002655906940000054
其公式如式所示。
Figure BDA0002655906940000055
Figure BDA0002655906940000056
其中:d={d1,d2,...,dN}T表示停留点到位置集合
Figure BDA0002655906940000057
的距离集合,d1表示spid到位置l1的距离;min(d)是一个函数,用于求向量d中的最小值;argmin是一个函数,用于求向量d中最小值所在的索引;δ是一个距离阈值,即当停留点距离最近的空间实体的距离小于阈值δ时,认为用户u在停留点
Figure BDA0002655906940000058
出参观空间实体
Figure BDA0002655906940000059
当所有停留点匹配结束即可获得单个用户u的语义位置序列locSequ
步骤S103中利用k阶马尔科夫概率转移矩阵,通过单个用户u的语义轨迹序列locSequ,计算空间实体之间的转移概率矩阵Yu(k),并将所述转移概率矩阵Yu(k)分解为k个一阶马尔科夫链。
当k=1时为用户u的1步转移概率矩阵Yu(1)等同于1阶转移概率矩阵,
Figure BDA0002655906940000061
表示用户u从位置li经过1步跳转到lj的概率,
Figure BDA0002655906940000062
的计算公式如下:
Figure BDA0002655906940000063
其中:locSequ表示用户u的位置序列
Figure BDA0002655906940000064
表示用户u从位置li经1步跳转到位置lj的次数;
Figure BDA0002655906940000065
表示用户u从位置li出发到其他位置的计数总和;N表示空间实体总个数。
用户u的k步转移概率矩阵Yu(k)是一个N×N的矩阵,
Figure BDA0002655906940000066
Figure BDA0002655906940000067
表示用户u从位置li经过k步跳转到其他位置的概率,用户u的Yu(k)
Figure BDA0002655906940000068
的计算如下所示:
Figure BDA0002655906940000069
Figure BDA00026559069400000610
其中:Yu(k)可以直接通过Yu(1)求得,Yu(k)=(Yu(1))k
Figure BDA00026559069400000611
表示用户u一个随机变量;
Figure BDA00026559069400000612
表示用户u在随机变量
Figure BDA00026559069400000613
处确定去了位置
Figure BDA00026559069400000614
可在位置序列locSequ中获得,即Yu(k)从另mbu外一个角度描述了跨位置对预测结果的影响;N表示商场中空间实体总个数。
K阶马尔科夫概率转移矩阵核心在于建立一个与1-MC的转移概率矩阵同规模的转移概率矩阵,通过该矩阵可以将一个k-MC分解为k个一阶马尔科夫链,从而避免求解k-MC的联合概率,也在一定程度上降低了转移概率矩阵的维度。
步骤S104中选择用户u的最优化k值,记为ku
K值的最优化选择,其合理性对模型的预测精度有很大影响。k主要用于确定邻接位置的数量,如果k过小,对应一阶马尔科夫链,模型预测精度不高;如果k过大,模型变得更加复杂且容易过拟合。考虑到k值选择对预测精度的影响。
本申请实施例采用cross-validation选择k值。每个人都是一个独立的个体,我们为不同的用户选择最优的k值,以用户u为例,对应的为ku,当ku>1时,k-MC分解的马尔科夫链如式所示。
Figure BDA0002655906940000071
步骤105中结合长短期记忆网络对ku个一阶马尔可夫链进行融合得到混合预测模型。
针对每个用户u已经建立了ku个一阶马尔可夫模型,而每个模型对下一个位置的预测能力是有限的,因此,本申请实施例将ku个一阶马尔可夫模型进行融合保证位置预测的准确性。考虑到ku个一阶马尔可夫模型的预测结果是存在顺序,即
Figure BDA0002655906940000072
本申请实施例并不采用线性方程融合多个预测结果,而是结合LSTM模型对ku个结果进行融合。
LSTM模型作为RNN模型的一个扩展,具有特有的细胞单元(cell),其通过引入门限机制(输入门、遗忘门和输出门)有效节制信息的积累速率,并选择性地遗忘部分历史积累信息,从而达到预测长时序数据的效果。如图3所示,ku个一阶马尔可夫模型的输出依次经过输入门、遗忘门和输出门,最终融合在一起,这样不仅可以整合多个输出对预测结果的独立影响,还可以挖掘多个输出之间的相互作用。用户u的融合的过程如式(10)所示。
Figure BDA0002655906940000073
式中:fm、im、Cm和om分别表示是遗忘门、输入门、控制单元和输出门;hm-1表示隐藏单元,代表了多个马尔可夫模型输出的相关作用;Whf、Wyf、Whi、Wyi、Wha、Wya、Who、Woy和Wh表示权重矩阵;⊙表示Hadamard积;
Figure BDA0002655906940000081
表示混合预测模型的输出,即
Figure BDA0002655906940000082
对应问题定义中的
Figure BDA0002655906940000083
σ表示sigmoid激活函数。
其中的混合预测模型的损失函数定义如下:
Figure BDA0002655906940000084
式中:θ表示混合预测模型中所有可学习的参数,即所有的W和b;N表示位置的总数,即商铺的数量;
Figure BDA0002655906940000085
表示模型的实际输出,
Figure BDA0002655906940000086
表示模型的期待输出(真值)。
步骤106中根据所述混合预测模型构建出行位置预测结果集。
出行位置预测结果集构建在本申请实施例将用户u的位置序列locSequ划分为三部分:历史位置序列(historical samples),训练位置序列(training samples)和测试位置序列(test samples)。历史位置序列用于构建用户u的k步转移概率矩阵Yu(k);训练位置序列用于训练模型
Figure BDA0002655906940000087
的参数θ;测试位置序列用于测试模型
Figure BDA0002655906940000088
的预测性能,最后得到出行位置预测结果集Rpredict
需要说明的是,本申请实施例的方法适用于所有出行轨迹语义位置提取过程,出行位置预测过程,本申请发明构思并不限制具体的城市范围及具体的定位数据提供商。
本申请实施例一种预测出行位置的方法中可以实现行人语义位置提取,行人出行位置预测,为个性化位置信息服务推荐,本申请实施例的方法可以广泛应用于人类出行未来位置预测,为人类出行行为特征分析的定量化分析提供了更加准确的数据支撑,有效支撑城市规划、城市管理、智能交通、基于位置的信息服务、商业广告投放等“智慧城市”应用。
图3为本申请实施例室内定位数据分布间隔图。
为了验证本申请实施方式提供的方法的提取效果,下面采用实验数据进行具体分析:
以某城市某购物广场45天50个移动用户的室内定位数据以及室内商铺数据为例,定位数据从2017年12月20日至2018年2月1日,覆盖广场8个楼层,定位精度约为3米,数据采样间隔如图4所示,采样间隔为1s~5s的轨迹点占比70%以上,轨迹点总记录量为11677438个,数据字段包括用户唯一标识ID、记录上传时间、用户所在位置(XY坐标及所在楼层ID)。商铺数据共489条,每条商铺数据包括商铺唯一标识ID、商铺范围(坐标序列组成的面要素)、商铺名称、所在楼层ID,如表二所示,商铺范围和所在楼层ID唯一确定该商铺在商场的具***置。室内商铺数据共包含352间商铺数据,经坐标转换后与室内用户定位数据相匹配,每条商铺数据包括商铺唯一标识ID、商铺范围(坐标序列组成的面要素)、商铺名称、所在楼层ID。
为验证本申请实施例方法的有效性,本申请实施例采用Accuracy@X,Precision@X,Recall@X and F1-Measure@X四个指标来进行验证,其中X为预测位置正确的数量,其计算公式如下:
Figure BDA0002655906940000091
Figure BDA0002655906940000092
Figure BDA0002655906940000093
Figure BDA0002655906940000094
其中N为所有空间商铺的数量,TPi为模型预测正确的用户访问空间实***置li的数量,FNi为模型预测错误的用户方位空间实***置的数量。
图4为本申请实施例实验结果对比图。
如图4所示,混合预测模型的预测精度高于基准模型,且预测5分钟级别内,当X=1,X=3,X=5,X=7,X=9模型的预测精度分别提升了7.33%,7.47%,5.46%,6.38%,6.13%,7.02%。
图5为本申请实施例预测出行位置的装置结构框图。
如图5所示,一种预测出行位置的装置,包括:
出行轨迹数据集获取模块01,用于获取出行轨迹数据集Traj;
出行轨迹数据集语义化模块02,用于对所述出行轨迹数据集Traj进行语义化;
k阶马尔科夫链构建模块03,用于利用k阶马尔科夫概率转移矩阵,通过单个用户u的语义轨迹序列locSequ,计算空间实体之间的转移概率矩阵Yu(k),并将所述转移概率矩阵Yu(k)分解为k个一阶马尔科夫链;
最优化k值选择模块04,用于选择用户u的最优化k值,记为ku
混合预测模型构建模块05,用于结合长短期记忆网络对ku个一阶马尔可夫链进行融合得到混合预测模型;
预测结果集构建模块06,用于根据所述混合预测模型构建出行位置预测结果集。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机执行指令,当所述计算机执行指令被处理器执行时,实现上述方法实施例任一所述的方法。
应当理解的是,本申请的上述具体实施方式仅仅用于示例性说明或解释本申请的原理,而不构成对本申请的限制。因此,在不偏离本申请的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。此外,本申请所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (11)

1.一种预测出行位置的方法,其特征在于,包括:
获取出行轨迹数据集Traj;
对所述出行轨迹数据集Traj进行语义化;
利用k阶马尔科夫概率转移矩阵,通过单个用户u的语义轨迹序列locSequ,计算空间实体之间的转移概率矩阵Yu(k),并将所述转移概率矩阵Yu(k)分解为k个一阶马尔科夫链;
选择用户u的最优化k值,记为ku
结合长短期记忆网络对ku个一阶马尔可夫链进行融合得到混合预测模型;
根据所述混合预测模型构建出行位置预测结果集。
2.根据权利要求1所述的方法,其特征在于,所述数据集Traj的数据格式为:Traj={traj1,traj2,...,trajm},其中,m为用户数量,traji为用户i的轨迹数;traji={locfile1,locfile2,...,locfileq},其中,q为单个用户的轨迹数量;单条轨迹locfilej定义为,locfilej={pti,pt2,...,ptn},其中,n为轨迹点的数量;单个轨迹点ptl={lat,lon,time},表示用户在某一个时刻的经纬度信息。
3.根据权利要求1所述的方法,其特征在于,所述对所述出行轨迹数据集Traj进行语义化,包括:
从出行轨迹数据集Traj检测停留点spid
为每个停留点spid赋予空间实体语义;
将每个停留点spid的空间实体语义标签按照时间顺序组成语义序列;
由所述语义序列构成语义轨迹,实现所述出行轨迹数据集Traj的语义化。
4.根据权利要求3所述的方法,其特征在于,所述从出行轨迹数据集Traj检测停留点spid,包括:
将轨迹数据集traj划分为k个不相交顺序簇集{C1,C2,...,CK};
通过所述k个簇集得到k个停留点,所述k个停留点的时空邻域计算公式为:
Figure FDA0002655906930000027
其中,sd函数用于计算轨迹点pti与ptj之间的空间距离;td函数用于计算轨迹点pti与ptj之间的时间距离;
Figure FDA0002655906930000028
表示时空邻域中包含的轨迹点集合。
5.根据权利要求3所述的方法,其特征在于,所述为每个停留点spid赋予空间实体语义,包括:
通过近邻搜索为每个停留点赋予空间实体语义,其中,用户u的第i停留点
Figure FDA0002655906930000021
的近邻搜索公式表示如下:
Figure FDA0002655906930000022
Figure FDA0002655906930000023
其中,d={d1,d2,...,dN}T表示停留点到位置集合
Figure FDA0002655906930000024
的距离集合,d1表示spid到位置l1的距离;min(d)函数用于求向量d中的最小值;argmin函数用于求向量d中最小值所在的索引;δ是一个距离阈值,当停留点距离最近的空间实体的距离小于阈值δ时,认为用户u在停留点
Figure FDA0002655906930000025
出参观空间实体
Figure FDA0002655906930000026
6.根据权利要求1所述的方法,其特征在于,所述利用k阶马尔科夫概率转移矩阵,通过单个用户u的语义轨迹序列locSequ,计算空间实体之间的转移概率,包括:
获得单个用户u的语义轨迹序列locSequ
通过单个用户u的语义轨迹序列locSequ计算空间实体之间的转移概率Yu(k),其中:
当k=1时,用户u的1步转移概率矩阵Yu(1)等同于1阶转移概率矩阵,
Figure FDA0002655906930000031
表示用户u从位置li经过1步跳转到l的概率,
Figure FDA0002655906930000032
的计算公式如下:
Figure FDA0002655906930000033
其中,locSequ表示用户u的位置序列
Figure FDA0002655906930000034
Figure FDA0002655906930000035
表示用户u从位置li经1步跳转到位置l的次数;
Figure FDA0002655906930000036
表示用户u从位置li出发到其他位置的计数总和;
当k>1时,用户u的k步转移概率矩阵Yu(k)是一个N×N的矩阵,
Figure FDA0002655906930000037
表示用户u从位置li经过k步跳转到其他位置的概率,用户u的Yu(k)
Figure FDA0002655906930000038
的计算如下所示:
Figure FDA0002655906930000039
Figure FDA00026559069300000310
其中,Yu(k)=(Yu(1))k
Figure FDA00026559069300000311
表示用户u一个随机变量;
Figure FDA00026559069300000312
Figure FDA00026559069300000313
表示用户u在随机变量
Figure FDA00026559069300000314
处确定去了位置
Figure FDA00026559069300000315
在位置序列locSequ中获得;N表示空间实体总个数;
通过k=1时的1步转移概率矩阵Yu(1),将k步转移概率矩阵Yu(k)分解为k个一阶马尔科夫链。
7.根据权利要求1所述的方法,其特征在于,所述选择用户u的最优化k值,记为ku,包括:
定义用户u的最优化K值为ku,当ku>1时,可分解的马尔科夫链如下:
Figure FDA0002655906930000041
其中,
Figure FDA0002655906930000042
表示用户u跨位置对预测结果的影响。
8.根据权利要求1所述的方法,其特征在于,所述结合长短期记忆网络模型对ku个一阶马尔可夫链进行融合得到混合预测模型,包括:
通过引入门限机制,使ku个一阶马尔可夫链的输出依次经过输入门、遗忘门和输出门产生融合,融合的过程如下式:
Figure FDA0002655906930000043
其中,fm、im、Cm和om分别表示是遗忘门、输入门、控制单元和输出门;hm-1表示隐藏单元,代表了多个马尔可夫模型输出的相关作用;Whf、Wyf、Whi、Wyi、Wha、Wya、Who、Woy和Wh表示权重矩阵;⊙表示Hadamard积;
Figure FDA0002655906930000044
表示Markov-LSTM模型的输出,即
Figure FDA0002655906930000045
对应问题定义中的
Figure FDA0002655906930000046
σ表示sigmoid激活函数;
所述混合预测模型的损失函数定义如下:
Figure FDA0002655906930000047
式中:θ表示混合预测模型中所有可学习的参数,即所有的W和b;N表示位置的总数,即商铺的数量;
Figure FDA0002655906930000048
表示模型的实际输出,
Figure FDA0002655906930000049
表示模型的期待输出。
9.根据权利要求1所述的方法,其特征在于,所述根据所述混合预测模型构建出行位置预测结果集,包括:
用历史位置序列构建用户u的k步转移概率矩阵Yu(k)
用训练位置序列训练模型
Figure FDA0002655906930000051
的参数θ;
用测试位置序列测试模型
Figure FDA0002655906930000052
的预测性能,并得到出行位置预测结果集Rpredict
10.一种预测出行位置的装置,其特征在于,包括:
出行轨迹数据集预处理模块,用于获取出行轨迹数据集Traj;
出行轨迹数据集语义化模块,用于对所述出行轨迹数据集Traj进行语义化;
k阶马尔科夫构建模块,用于利用k阶马尔科夫概率转移矩阵,通过单个用户u的语义轨迹序列locSequ,计算空间实体之间的转移概率矩阵Yu(k),并将所述转移概率矩阵Yu(k)分解为k个一阶马尔科夫链;
k值最优化选择模块,用于选择用户u的最优化k值,记为ku
预测模型构建模块,用于结合长短期记忆网络对ku个一阶马尔可夫链进行融合得到混合预测模型;
预测结果集构建模块,用于根据所述混合预测模型构建出行位置预测结果集。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机执行指令,当所述计算机执行指令被处理器执行时,实现权利要求1-9任一项所述的方法。
CN202010887136.4A 2020-08-28 2020-08-28 一种预测出行位置的方法及装置 Pending CN111915104A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010887136.4A CN111915104A (zh) 2020-08-28 2020-08-28 一种预测出行位置的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010887136.4A CN111915104A (zh) 2020-08-28 2020-08-28 一种预测出行位置的方法及装置

Publications (1)

Publication Number Publication Date
CN111915104A true CN111915104A (zh) 2020-11-10

Family

ID=73267784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010887136.4A Pending CN111915104A (zh) 2020-08-28 2020-08-28 一种预测出行位置的方法及装置

Country Status (1)

Country Link
CN (1) CN111915104A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215667A (zh) * 2020-11-18 2021-01-12 中国联合网络通信集团有限公司 用户行为预测方法和装置
CN112529158A (zh) * 2020-12-08 2021-03-19 华强方特(深圳)科技有限公司 位置预测方法、装置、计算机设备及存储介质
CN112764022A (zh) * 2020-12-24 2021-05-07 珠海格力电器股份有限公司 公共安全管理方法及公共安全管理***
CN113537122A (zh) * 2021-07-28 2021-10-22 浙江大华技术股份有限公司 动作识别方法和装置、存储介质及电子设备
CN113610307A (zh) * 2021-08-12 2021-11-05 中国民用航空飞行学院 一种航班计划管理***
CN113938817A (zh) * 2021-09-10 2022-01-14 哈尔滨工业大学(威海) 一种基于车辆位置信息的车主出行位置预测方法
CN116502055A (zh) * 2023-01-10 2023-07-28 昆明理工大学 一种基于类马尔可夫模型的多维特征动态异常积分模型
WO2023185716A1 (zh) * 2022-03-28 2023-10-05 维沃移动通信有限公司 终端信息的预测方法、装置及网元

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111125551A (zh) * 2019-11-12 2020-05-08 杭州电子科技大学 一种基于选择记忆的马尔可夫模型的用户位置预测方法
CN111444302A (zh) * 2020-04-17 2020-07-24 中国传媒大学 基于用户分类的移动性预测方法、***、装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111125551A (zh) * 2019-11-12 2020-05-08 杭州电子科技大学 一种基于选择记忆的马尔可夫模型的用户位置预测方法
CN111444302A (zh) * 2020-04-17 2020-07-24 中国传媒大学 基于用户分类的移动性预测方法、***、装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PEIXIAO WANG等: "A Hybrid Markov and LSTM Model for Indoor Location Prediction", 《IEEE ACCESS》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215667A (zh) * 2020-11-18 2021-01-12 中国联合网络通信集团有限公司 用户行为预测方法和装置
CN112215667B (zh) * 2020-11-18 2023-07-18 中国联合网络通信集团有限公司 用户行为预测方法和装置
CN112529158A (zh) * 2020-12-08 2021-03-19 华强方特(深圳)科技有限公司 位置预测方法、装置、计算机设备及存储介质
CN112764022A (zh) * 2020-12-24 2021-05-07 珠海格力电器股份有限公司 公共安全管理方法及公共安全管理***
CN113537122A (zh) * 2021-07-28 2021-10-22 浙江大华技术股份有限公司 动作识别方法和装置、存储介质及电子设备
CN113610307A (zh) * 2021-08-12 2021-11-05 中国民用航空飞行学院 一种航班计划管理***
CN113938817A (zh) * 2021-09-10 2022-01-14 哈尔滨工业大学(威海) 一种基于车辆位置信息的车主出行位置预测方法
WO2023185716A1 (zh) * 2022-03-28 2023-10-05 维沃移动通信有限公司 终端信息的预测方法、装置及网元
CN116502055A (zh) * 2023-01-10 2023-07-28 昆明理工大学 一种基于类马尔可夫模型的多维特征动态异常积分模型
CN116502055B (zh) * 2023-01-10 2024-05-03 昆明理工大学 一种基于类马尔可夫模型的多维特征动态异常积分模型

Similar Documents

Publication Publication Date Title
Yuan et al. A survey of traffic prediction: from spatio-temporal data to intelligent transportation
CN111915104A (zh) 一种预测出行位置的方法及装置
Yang et al. Using graph structural information about flows to enhance short-term demand prediction in bike-sharing systems
Sun et al. Joint prediction of next location and travel time from urban vehicle trajectories using long short-term memory neural networks
Zhang et al. Traffic flow prediction model based on deep belief network and genetic algorithm
Mingheng et al. Accurate multisteps traffic flow prediction based on SVM
CN110414732B (zh) 一种出行未来轨迹预测方法、装置、储存介质及电子设备
Guo et al. Air pollution concentration forecast method based on the deep ensemble neural network
Jiang et al. Deep ROI-based modeling for urban human mobility prediction
Luca et al. Deep learning for human mobility: a survey on data and models
Zhang et al. A Traffic Prediction Method of Bicycle-sharing based on Long and Short term Memory Network.
WO2014194480A1 (en) Air quality inference using multiple data sources
Chen et al. CEM: A convolutional embedding model for predicting next locations
Al-Molegi et al. Move, attend and predict: An attention-based neural model for people’s movement prediction
He et al. On‐line map‐matching framework for floating car data with low sampling rate in urban road networks
Hua et al. Forecasting usage and bike distribution of dockless bike‐sharing using journey data
Singh et al. A review of bus arrival time prediction using artificial intelligence
Zeng et al. A next location predicting approach based on a recurrent neural network and self-attention
Jiang et al. Bi‐GRCN: A Spatio‐Temporal Traffic Flow Prediction Model Based on Graph Neural Network
Liu et al. POI Recommendation Method Using Deep Learning in Location‐Based Social Networks
Jiang et al. Will you go where you search? A deep learning framework for estimating user search-and-go behavior
Sun et al. Trajectory-user link with attention recurrent networks
Iovino et al. Unavailable transit feed specification: making it available with recurrent neural networks
Cui et al. Spatiotemporal correlation modelling for machine learning-based traffic state predictions: state-of-the-art and beyond
Xu et al. A taxi dispatch system based on prediction of demand and destination

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201110

RJ01 Rejection of invention patent application after publication