CN117407711A - 基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法 - Google Patents

基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法 Download PDF

Info

Publication number
CN117407711A
CN117407711A CN202311340148.5A CN202311340148A CN117407711A CN 117407711 A CN117407711 A CN 117407711A CN 202311340148 A CN202311340148 A CN 202311340148A CN 117407711 A CN117407711 A CN 117407711A
Authority
CN
China
Prior art keywords
sequence
track
time
layer
driving state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311340148.5A
Other languages
English (en)
Inventor
桂志鹏
孙云增
张效通
王锦添
李文翰
薛洁
吴华意
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN202311340148.5A priority Critical patent/CN117407711A/zh
Publication of CN117407711A publication Critical patent/CN117407711A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Strategic Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法,首先基于兴趣点数据集与语义主题提取算法,得到各轨迹起始点及途径轨迹点的位置语义;其次,从轨迹起始点的时间戳中获取出发时间,并采用启发式循环编码对其进行处理,得到日期时间等多层次出发时间语义;接着,提取驾驶状态特征,并与轨迹点经纬度、位置语义及出发时间语义拼接为输入特征序列;然后,构建目的地预测模型,利用Transformer位置编码学习输入特征序列中的上下文依赖关系,引入时间注意力机制捕获出行关键特征,得到出行活动隐藏状态序列,并通过多层全连接残差网络将其映射为预测目的地坐标。本发明的方法能够大幅提高车辆轨迹目的地预测的精度。

Description

基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法
技术领域
本发明属于交通大数据分析技术领域,涉及一种车辆轨迹预测方法,具体涉及一种基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法。
背景技术
移动轨迹目的地预测是人类出行模式研究领域的重要分支,旨在依据一段尚未完成出行过程的移动轨迹及对应出行上下文信息,预测该次出行最有可能抵达的目的地所在位置。车辆轨迹目的地预测在公共交通轨迹数据上已有广泛研究,随着移动定位技术的发展与普及,非公共车辆个体层面的出行模式研究将成为热点,且对于个性化服务推荐、交通导航、车辆保险推荐等基于位置的服务具有重要的科学意义与应用价值。
现有技术中,目的预测任务主要包含特征工程与模型构建两个方面。其中,特征工程主要基于专家领域知识,从出行轨迹及相关信息中提取出行特征;而模型的构建过程指在对个体出行规律深入分析的基础上,设计概率或深度学习模型,实现对个体出行行为习惯与移动偏好的建模。
现有的特征工程主要关注轨迹点序列的特征提取,而忽略了出行时空语义对于个体出行意图的作用与反映,限制了预测模型对出行语境知识的感知与学习。同时,常用的概率预测模型无法捕获长距离出行轨迹数据中的长期依赖关系,而现有的深度学习预测模型忽略了驾驶状态对于出行关键时空特征探测与学习的重要作用,无法实现个体出行模式的准确表达,导致轨迹目的地预测的精度偏低。
发明内容
为了解决现有技术中的方法存在精度较低的技术问题,本发明提供了一种基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法。
本发明的方法所采用的技术方案是:一种基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法,包括以下步骤:
步骤1:采集车辆时空特征信息、地理语义信息及驾驶状态信息,获取车辆的时空特征序列、地理语义序列及驾驶状态序列;
步骤2:将车辆的时空特征序列、地理语义序列及驾驶状态序列拼接为输入特征序列,输入驾驶目的地预测网络,输出预测目的地。
作为优选,步骤1中,所述地理语义信息,包括车辆起始轨迹点信息和途经轨迹点信息;
所述采集车辆地理语义信息,具体实现包括以下子步骤:
步骤A1:选取轨迹所在区域内的兴趣点数据,并根据其名称所代表的含义属性划分为不同类别;
步骤A2:基于预设的尺度建立覆盖轨迹所在区域的最小外接网格;
步骤A3:对轨迹所在区域内的各类兴趣点数据和覆盖轨迹所在区域的最小外接网格执行空间相交操作,统计落入每个网格单元内的各类兴趣点数量;
步骤A4:根据步骤A3中得到的各类型兴趣点数量统计结果,划分得到若干出行主题,每种主题由各类型兴趣点的概率分布p(POItopic i)组成;
p(POItopic i)=<POI 0POI 1,…,POI n>;
其中,n为兴趣点POI类型的数量,topic i为第i种出行主题的表示;POI i为第i种类型的兴趣点;
步骤A5:根据第j次出行活动的目的地格网中的POI数量得到其对应第i种出行主题的可能性m j
其中,travel j为第j次出行活动;
组合所有出行主题的可能性得到第j次出行活动的地理语义向量
其中,c为出行主题的个数;
步骤A6:基于轨迹点的经纬度计算轨迹点所在的网格单元编号,并利用地理语义格网地图匹配得到其对应的地理语义向量;
步骤A7:对所有起始轨迹点进行聚类得到多个不同出发区域,取同一出发区域中各起始轨迹点地理语义向量的平均值作为该出发区域的地理语义;
步骤A8:取地理语义向量中值最大的兴趣点类型作为途径轨迹点的地理语义,对其进行编码,表征为多维连续数值型特征向量。
作为优选,步骤1中,所述时空特征信息,包括车辆途经轨迹点的经度、纬度和时间戳信息;
所述采集车辆时空特征信息,具体实现包括以下子步骤:
步骤B1:通过对原始轨迹记录中起始轨迹点的时间戳进行解析,得到每一条轨迹对应的多层次出发时间信息,即起始轨迹点时间戳的归属月份、归属周数、周内日期和出发时刻;并计算轨迹起始点时间戳在归属周内的秒数、在归属日内的秒数;
步骤B2:采用正余弦映射函数对多层次出发时间进行循环表达,每一个归属周内的秒数和归属日内的秒数都对应一个二维的连续数值型正余弦特征向量,从秒数到正余弦特征向量的编码按照如下公式:
其中,为日内秒数对应的极角值,/>为周内秒数对应的极角值,采用正弦函数和余弦函数编码为二维的连续数值型正余弦特征向量;t表示轨迹起始点的时间戳;
步骤B3:添加可学习的极角增减参数和极径缩放参数/>,顾及不同驾驶者的出行节律,得到归属周内秒数和归属日内秒数的启发式循环编码/>
其中,表示日内的秒数,/>表示周内的秒数。
作为优选,步骤1中,所述驾驶状态信息,包括车辆途经轨迹的转向角、行驶速度、已行驶距离及时间消耗信息;
所述采集车辆驶状态信息,具体实现包括以下子步骤:
步骤C1:基于速度中值滤波对轨迹点序列清洗,然后采用Z-Score标准化,通过设置相邻轨迹点间的距离阈值实现轨迹点序列重采样;
步骤C2:计算第个轨迹点/>的转向角/>、行驶速度、截至当前轨迹点/>的已行驶距离/>和从起点出发的时间消耗/>,将轨迹点的转向角、行驶速度、已行驶距离序列及时间消耗信息执行Z-Score标准化;其中,l为当前轨迹点序列中轨迹点的数量。
作为优选,步骤2中所述驾驶目的地预测网络,包括输入模块、出行时空特征学习模块和目的地预测模块;所述输入模块,包括两个并联设置的Embedding层和两个并联设置的拼接层;第一Embedding层用于对地理语义信息进行编码,获得地理语义序列;第二Embedding层用于时空特征信息进行编码,获得时空特征序列;第一拼接层用于拼接地理语义序列和时空特征序列;第二拼接层用于拼接时空特征序列和驾驶状态序列;所述出行时空特征学习模块,包括两个并联设置的Transformer位置编码层、其后顺序连接有拼接层、多模板卷积层和时间注意力层;第一Transformer位置编码层,与第一Embedding层连接;第二Transformer位置编码层,与第二Embedding层连接;所述拼接层,用于将两个Transformer位置编码层输出的结果进行拼接,得到出行活动隐藏状态序列;所述多模板卷积层,用于学习得到每个维度的关键时频特征,输入的特征包括出行活动隐藏状态序列和从驾驶状态序列中得到的位置重要性locI;所述时间注意力层,用于计算每个轨迹点对应的权重并输出关键时间特征;所述目的地预测模块,由并联设置后再顺序连接的残差网络和全连接层组成。
作为优选,步骤2的具体实现包括以下子步骤:
步骤2.1:将时空特征序列、地理语义序列及驾驶状态序列这三部分拼接为输入特征序列;
步骤2.2:采用Transformer位置编码层处理输入特征序列得到当前出行活动隐藏状态序列,其中/>为Transformer位置编码层输出的第k个轨迹点的隐藏状态特征;l表示当前出行活动隐藏状态序列的长度;
步骤2.3:利用驾驶状态序列计算第个轨迹点/>位置重要性
其中,为拼接操作,/>和/>分别为轨迹点/>对应的转向角和行驶速度;/>表示从出发点到第k个轨迹点的距离,/>表示从出发点到第k个轨迹点消耗的时间;
步骤2.4:按照轨迹点的位置重要性/>的大小对隐藏状态序列排序,取前个隐藏状态序列并按原时序排列得到重采样隐藏状态序列/>,对重采样隐藏状态序列施加时间注意力操作得到出行关键时间特征/>
其中,为驾驶目的地预测网络中多模板卷积层的第/>个滤波模板对隐藏状态序列/>的第/>个维度沿时序方向/>执行卷积后的时频特征,/>为权重矩阵,/>为激活函数,/>是各时频特征的注意力权重系数,表示当前出行特征序列的长度,C为卷积神经网络CNN,f为卷积模板的数量,n为当前隐藏状态特征的序号,/>为得到的每个隐藏状态每维的卷积特征,/>为沿时序方向拼接得到的时序卷积特征,/>为卷积模板的乘数矩阵,/>为卷积中的偏差矩阵;
步骤2.6:将出行关键时间特征分别输入到两个并联设置的多层全连接残差网络中,残差网络结构的由多个完全一致的全连接残差层堆叠而成,下一层的全连接残差层学习上一层的残差,第一个多层全连接残差网络最顶层的全连接残差层输出经纬度形式的预测目的地坐标值,第二个多层全连接残差网络最顶层的全连接残差层输出向量形式的地理语义预测值;
其中,是一个激活函数,/>为权重矩阵,/>为偏置量,/>是矩阵对应位置相加的操作,第i层的输出依赖于第/>层的输入/>和输出/>,这样第i层可以学习第/>层的残差;最后利用一个神经元经过一次非线性映射输出经纬度坐标形式的预测目的地及地理语义。
作为优选,所述驾驶目的地预测网络,是训练好的网络,训练过程包括:
(1)数据集构建;
获取若干历史车辆轨迹数据,将时空特征序列、地理语义序列及驾驶状态序列这三部分拼接为输入特征序列;
将输入特征序列按照一定的比例切分成子轨迹序列,模拟车辆在行驶中的轨迹不断向前延伸的状态,每个子轨迹序列由从出发点到切分位置之间的轨迹点组成;
将切分得到的子轨迹序列按照一定的比例划分为训练集和测试集:首先将所有轨迹数据平均分成若干等份,然后取出其中的一份作为测试集,剩余的轨迹数据作为训练集;
(2)网络训练;
其中,是正则化超参数,/>是以纬度和经度形式表示的预测目的地,/>是目标目的地,/>是轨迹条数;/>表示模型训练中的参数矩阵;模型训练过程结束标准是,达到迭代90个轮次之后停止。
本发明的***所采用的技术方案是:一种基于时空特征、地理语义及驾驶状态的车辆轨迹预测***,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现所述的基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法。
相对于现有技术,本发明的有益效果是:
(1)本发明设计的驾驶目的地预测网络与现有网络结构的实质性不同在于并联设置的Embedding层和Transformer位置编码层,并联设置的两个Embedding层分别用于编码地理语义信息和时空特征信息,并联设置的两个Transformer位置编码层分别用于学习地理语义信息和时空特征信息中的上下文信息及隐藏状态特征。所述驾驶目的地预测网络中的多模板卷积层与现有网络存在实质上的不同,在于输入残差网络的只有出行关键时间特征,其在不需要关键空间特征的情况下即可进行目的地预测。所述目的地预测网络由两个并联设置后再顺序连接的残差网络和全连接层组成,其中第一个输出二维的经纬度向量,第二个输出五维的地理语义向量,而现有网络无法完成地理语义的输出。
(2)本发明基于出行时空语义上下文信息扩宽了模型可学习的时空知识,让模型能在时空语境中捕获个体出行的时空规律;基于驾驶状态的时空注意力机制帮助模型更好地探测出行关键时空特征,实现个体出行模式的精细化表达,以此提升出行目的地预测的准确性。
(3)本发明方法可应用于具有经纬度及时间戳记录的各种车辆移动轨迹数据中,以期大幅提高出行目的地预测的精度,并应用于个性化服务推荐、交通导航、车辆保险推荐等基于位置的服务。例如,基于预测目的地的附近景点推荐和广告投放、基于预测目的地空间分布的公共交通车辆调度和城市基础设施规划、以及基于个体驾驶轨迹预测目的地的重点人员监控和异常行为预警等。
附图说明
下面使用实施例,以及具体实施方式作进一步说明本文的技术方案。另外,在说明技术方案的过程中,也使用了一些附图。对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图以及本发明的意图。
图1:为本发明实施例的方法流程示意图;
图2:为本发明实施例中车辆轨迹目的地预测的计算流程图;
图3:为本发明实施例中出行位置语义提取示意图;
图4:为本发明实施例中多层次时间语义提取示意图;
图5:为本发明实施例的驾驶目的地预测网络结构图;
图6:为本发明实施例的时间注意力机制示意图;
图7:为传统方法与本发明方法在深圳市18名用户的私家车轨迹数据集上的综合预测误差对比图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
本发明的目的在于针对现有的个体轨迹目的地预测模型忽略了出行时空上下文信息,无法在具体的时空语境中学习用户的出行偏好和行为习惯,同时忽略驾驶状态信息对出行关键时空特征的探测与学习的重要作用,难以细粒度地描述整个出行过程,而导致出行目的地预测结果精度较低的技术问题,提供一种顾及时空语义及驾驶状态的车辆轨迹目的地预测方法,从而达到提高预测精度的目的。
本发明首先,统计行政区划内与出行行为及生产生活具有密切联系的兴趣点类型分布信息,并构建覆盖行政区划的最小外接格网,基于格网单元内各类兴趣点的数量信息采用语义主题提取和TF-IDF算法计算各网格单元的位置语义,进而为各出发区域及各轨迹点赋予位置语义,使用Word2Vec词嵌入方法对轨迹点位置语义编码;接着,从起始轨迹点的时间戳中提取层次的出发时间信息,将多层次出发时间信息离散成多层次出发时间槽,使用启发式循环编码处理多层次出发时间槽,得到多层次出发时间语义;接着,从轨迹点序列及对应时间戳中提取驾驶状态(转向角/行驶速度/已行驶距离)序列,拼接轨迹点序列、位置语义、时间语义和驾驶状态序列得到输入特征序列;构建深度学习预测模型,采用Transformer位置编码处理输入特征序列得到隐藏状态序列,基于驾驶状态序列通过空间注意力和时间注意力从隐藏状态序列中发掘出行关键时空特征,利用多层全连接残差网络建立出行关键时空特征与预测目的地经纬度坐标之间的映射;切分输入特征序列得到输入特征子序列,将其划分为训练集与测试集,在训练集中训练深度学习模型,在测试集中验证模型的预测精度。
请见图1,本发明提供的一种基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法,包括以下步骤:
步骤1:采集车辆时空特征信息、地理语义信息及驾驶状态信息,获取车辆的时空特征序列、地理语义序列及驾驶状态序列,以上序列是由轨迹中每个点具备的时空特征、地理语义及驾驶状态信息拼接而成的;
在一种实施方式中,地理语义信息,包括车辆起始轨迹点信息和途经轨迹点信息;
采集车辆地理语义信息,具体实现包括以下子步骤:
步骤A1:选取轨迹所在区域内的兴趣点数据,并根据其名称所代表的含义属性划分为不同类别,并采用对象-关系型数据库管理兴趣点数据;
步骤A2:基于一定的尺度建立覆盖轨迹所在区域的最小外接网格,并采用对象-关系型数据库对各网格单元进行管理;
步骤A3:采用空间关系分析功能对轨迹所在区域内的各类兴趣点数据和覆盖轨迹所在区域的最小外接网格执行空间相交操作,统计落入每个网格单元内的各类兴趣点数量;
步骤A4:根据步骤A3中得到的各类型兴趣点数量统计结果,划分得到若干出行主题,每种主题由各类型兴趣点的概率分布p(POItopic i)组成;
p(POItopic i)=<POI 0POI 1,…,POI n>;
其中,n为兴趣点POI类型的数量,topic i为第i种出行主题的表示;POI i为第i种类型的兴趣点;
步骤A5:根据第j次出行活动的目的地格网中的POI数量得到其对应第i种出行主题的可能性m j
其中,travel j为第j次出行活动;
组合所有出行主题的可能性得到第j次出行活动的地理语义向量
其中,c为出行主题的个数;
步骤A6:基于轨迹点的经纬度计算轨迹点所在的网格单元编号,并利用地理语义格网地图匹配得到其对应的地理语义向量;
步骤A7:对所有起始轨迹点进行聚类得到多个不同出发区域,取同一出发区域中各起始轨迹点地理语义向量的平均值作为该出发区域的地理语义;
步骤A8:取地理语义向量中值最大的兴趣点类型作为途径轨迹点的地理语义,采用词嵌入方法对其进行编码,表征为多维连续数值型特征向量。
在一种实施方式中,时空特征信息包括车辆途经轨迹点的经度、纬度和时间戳信息;
采集车辆时空特征信息,具体实现包括以下子步骤:
步骤B1:通过对原始轨迹记录中起始轨迹点的时间戳进行解析,得到每一条轨迹对应的多层次出发时间信息,即起始轨迹点时间戳的归属月份、归属周数、周内日期和出发时刻;并计算轨迹起始点时间戳在归属周内的秒数、在归属日内的秒数;
步骤B2:采用正余弦映射函数对多层次出发时间进行循环表达,每一个归属周内的秒数和归属日内的秒数都对应一个二维的连续数值型正余弦特征向量,从秒数到正余弦特征向量的编码按照如下公式:
其中,为日内秒数对应的极角值,/>为周内秒数对应的极角值,采用正弦函数和余弦函数编码为二维的连续数值型正余弦特征向量;t表示轨迹起始点的时间戳;
步骤B3:添加可学习的极角增减参数和极径缩放参数/>,顾及不同驾驶者的出行节律,得到归属周内秒数和归属日内秒数的启发式循环编码/>
其中,表示日内的秒数,/>表示周内的秒数。
在一种实施方式中,驾驶状态信息包括车辆途经轨迹的转向角、行驶速度、已行驶距离及时间消耗信息;
采集车辆驾驶状态信息,具体实现包括以下子步骤:
步骤C1:基于速度中值滤波对轨迹点序列清洗,过滤掉速度超过120km/h的轨迹点;然后采用Z-Score标准化,通过设置相邻轨迹点间的距离阈值实现轨迹点序列重采样,距离阈值设置为100米;
步骤C2:计算第个轨迹点/>的转向角/>、行驶速度、截至当前轨迹点/>的已行驶距离/>和从起点出发的时间消耗/>,将轨迹点的转向角、行驶速度、已行驶距离序列及时间消耗信息执行Z-Score标准化;使得各维度的车辆驾驶状态信息处于标准化的数据范围中,避免某一维度数值过大对模型训练的影响;其中,l为当前轨迹点序列中轨迹点的数量。
步骤2:将车辆的时空特征序列、地理语义序列及驾驶状态序列拼接为输入特征序列,输入驾驶目的地预测网络,输出预测目的地。
请见图5,本实施例的驾驶目的地预测网络,包括输入模块、出行时空特征学习模块和目的地预测模块;输入模块,包括两个并联设置的Embedding层和两个并联设置的拼接层;第一Embedding层用于对地理语义信息进行编码,获得地理语义序列;第二Embedding层用于时空特征信息进行编码,获得时空特征序列;第一拼接层用于拼接地理语义序列和时空特征序列;第二拼接层用于拼接时空特征序列和驾驶状态序列;出行时空特征学习模块,包括两个并联设置的Transformer位置编码层、其后顺序连接有拼接层、多模板卷积层和时间注意力层;第一Transformer位置编码层,与第一Embedding层连接;第二Transformer位置编码层,与第二Embedding层连接;拼接层,用于将两个Transformer位置编码层输出的结果进行拼接,得到出行活动隐藏状态序列;多模板卷积层,用于学习得到每个维度的关键时频特征,输入的特征包括出行活动隐藏状态序列和从驾驶状态序列中得到的位置重要性locI;时间注意力层,用于计算每个轨迹点对应的权重并输出关键时间特征;目的地预测模块,由并联设置后再顺序连接的残差网络和全连接层组成。
在一种实施方式中,步骤2的具体实现包括以下子步骤:
步骤2.1:将时空特征序列、地理语义序列及驾驶状态序列这三部分拼接为输入特征序列;
步骤2.2:采用Transformer位置编码层处理输入特征序列得到当前出行活动隐藏状态序列,其中/>为Transformer位置编码层输出的第k个轨迹点的隐藏状态特征;l表示当前出行活动隐藏状态序列的长度;
步骤2.3:利用驾驶状态序列计算第个轨迹点/>位置重要性
其中,为拼接操作,/>和/>分别为轨迹点/>对应的转向角和行驶速度;/>表示从出发点到第k个轨迹点的距离,/>表示从出发点到第k个轨迹点消耗的时间;
步骤2.4:按照轨迹点的位置重要性/>的大小对隐藏状态序列排序,取前个隐藏状态序列并按原时序排列得到重采样隐藏状态序列/>,对重采样隐藏状态序列施加时间注意力操作得到出行关键时间特征/>
其中,为驾驶目的地预测网络中多模板卷积层的第/>个滤波模板对隐藏状态序列/>的第/>个维度沿时序方向/>执行卷积后的时频特征,/>为权重矩阵,/>为激活函数,/>是各时频特征的注意力权重系数,表示当前出行特征序列的长度,C为卷积神经网络CNN,f为卷积模板的数量,n为当前隐藏状态特征的序号,/>为得到的每个隐藏状态每维的卷积特征,/>为沿时序方向拼接得到的时序卷积特征,/>为卷积模板的乘数矩阵,/>为卷积中的偏差矩阵;
步骤2.6:将出行关键时间特征分别输入到两个并联设置的多层全连接残差网络中,残差网络结构的由多个完全一致的全连接残差层堆叠而成,下一层的全连接残差层学习上一层的残差,第一个多层全连接残差网络最顶层的全连接残差层输出经纬度形式的预测目的地坐标值,第二个多层全连接残差网络最顶层的全连接残差层输出向量形式的地理语义预测值。
其中,是一个激活函数,/>为权重矩阵,/>为偏置量,/>是矩阵对应位置相加的操作,第i层的输出依赖于第/>层的输入/>和输出/>,这样第i层可以学习第/>层的残差;最后利用一个神经元经过一次非线性映射输出经纬度坐标形式的预测目的地及地理语义。
在一种实施方式中,驾驶目的地预测网络是训练好的网络,训练过程包括:
(1)数据集构建;
获取若干历史车辆轨迹数据,将时空特征序列、地理语义序列及驾驶状态序列这三部分拼接为输入特征序列;
将输入特征序列按照一定的比例切分成子轨迹序列,模拟车辆在行驶中的轨迹不断向前延伸的状态,每个子轨迹序列由从出发点到切分位置之间的轨迹点组成;
将切分得到的子轨迹序列按照一定的比例划分为训练集和测试集:首先将所有轨迹数据平均分成若干等份,然后取出其中的一份作为测试集,剩余的轨迹数据作为训练集;按照此策略,可划分出若干种不同的训练集和测试集;目的是将不同的轨迹数据划分到测试集中,避免数据集各部分的差异性对预测结果的影响,保证模型的稳定性;
(2)网络训练;
在测试中,根据下列公式计算目标目的地与预测目的地之间的平均绝对误差(MAE),作为测试中的损失函数:
其中,是正则化超参数,/>是以纬度和经度形式表示的预测目的地,/>是目标目的地,/>是轨迹条数;/>表示模型训练中的参数矩阵;模型训练过程结束标准是,达到迭代90个轮次之后停止。
(3)、基于测试集对训练好的网络进行精度评定。
验证精度的方法具体为:衡量误差的指标是平均绝对误差MAE、均方根误差RMSE和平均相对误差MRE,计算公式如下:
其中n为输入特征子序列的总数,是第i条输入特征子序列对应的真实目的地/>和预测目的地/>之间的地理空间距离,/>是第i条输入特征子序列对应的第j条输入特征序列的出行总距离。
具体来说,地理空间距离采用haversine半正矢公式计算。网络精度的验证采用五折交叉验证的方式,即将用于训练和测试的输入特征子序列平均划分为5等份,每次取不同的1份为测试集,其余4份为训练集,重复5次取预测结果的平均值作为最终结果。
图2示出了本发明方法的计算流程,格网单元和输入特征子序列的生成数量可以根据实际情况人为设置。
为了更清楚地说明本发明提供的方法的实现过程和有益效果,下面通过具体的示例来予以详细介绍。
现有深圳市18名用户一年的私家车轨迹数据集,数据清洗后总共包括18445条的轨迹数据,需要针对18名用户分别构建出行目的地预测模型并训练,从而对18名用户的出行最终目的地的经纬度坐标实现准确预测。
本发明提供的一种基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法,通过出行时空语义的提取丰富了上下文知识,让模型能够在时空语义知识中学习用户的移动规律,采用时空注意力机制探测与挖掘出行关键时空特征,对用户的出行过程更好地描述与学习,实现准确细粒度的出行目的地预测。
下面将结合本发明中的附图,对本发明进行详细阐述,具体步骤如下:
1)构建覆盖深圳市行政区的最小外接网格,网格单元的空间粒度设置为500m。统计各单元格内的8类兴趣点类型,包括居民区、公司、医疗、教育、餐饮、生活服务、景点、酒店,基于语义主题提取和TF-IDF算法获得各网格单元内的地理语义向量,得到地理语义格网地图,采用DBCSAN方法对所有起始轨迹点聚类,得到各出发区域,取出发区域内各起始轨迹点位置向量的平均值作为出发区域的位置语义,取网格单元内最重要的兴趣点类型作为网格单元内部中间轨迹点的位置语义,并用Word2Vec词嵌入方法编码,最后得到出发区域的地理语义,如图3所示;
2)从起始轨迹点时间戳中提取出发月份、出发周数、日期描述(工作日/节假日/周末)和出发时刻,通过对上述时间信息进行解析,得到每一条轨迹对应的多层次出发时间信息,即起始轨迹点时间戳的归属月份、归属周数、周内日期和出发时刻;并计算轨迹起始点时间戳在归属周内的秒数、在归属日内的秒数;采用正余弦特征向量对多层次出发时间进行循环表达,将每一个归属周内的秒数和归属日内的秒数都映射为一个二维的连续数值型正余弦特征向量,出发时刻的循环编码如图4所示;
3)提取驾驶状态数据,包括各轨迹点的转向角、行驶速度及已行驶距离,将出发时间与出发区域的地理语义复制轨迹点序列长度份后与轨迹点序列、驾驶状态序列和轨迹点的地理语义拼接,得到输入特征序列;
4)构建如图5所示的驾驶目的地预测网络,将Transformer位置编码层输出的隐藏状态维度设为128,优化方法采用Adam;
5)基于驾驶状态计算各隐藏状态的综合位置重要性,按照位置重要性排序选取前16重要的隐藏状态,设置32个CNN卷积模板,对长度为16的隐藏状态序列按时序方向执行卷积操作,得到时频特征后与计算出的时间注意力权重加权求和得到出行关键时间特征,如图6所示;
6)采用多层全连接网络将128维的关键出行时空特征映射为2维的预测目的地经纬度向量;
7)每个输入特征序列生成30条出行完成度不一的输入特征子序列,采用五折交叉验证实验验证模型预测精度。
图7为传统方法与本发明方法在深圳市18名用户的私家车轨迹数据集上的综合预测误差对比图,即语义地图格网空间分辨率为500米,一条输入特征序列生成30条输入特征子序列。
如图7所示,在18名用户数据集上的综合结果表明,本发明方法在MAE、RMSE及MRE三个评价上均优于传统预测方法,表明本发明通过添加出行时空上下文知识和学习出行关键时空特征的方式有效地提高了预测精度。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (7)

1.一种基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法,其特征在于,包括以下步骤:
步骤1:采集车辆时空特征信息、地理语义信息及驾驶状态信息,获取车辆的时空特征序列、地理语义序列及驾驶状态序列;
步骤2:将车辆的时空特征序列、地理语义序列及驾驶状态序列拼接为输入特征序列,输入驾驶目的地预测网络,输出预测目的地;
所述驾驶目的地预测网络,包括输入模块、出行时空特征学习模块和目的地预测模块;所述输入模块,包括两个并联设置的Embedding层和两个并联设置的拼接层;第一Embedding层用于对地理语义信息进行编码,获得地理语义序列;第二Embedding层用于时空特征信息进行编码,获得时空特征序列;第一拼接层用于拼接地理语义序列和时空特征序列;第二拼接层用于拼接时空特征序列和驾驶状态序列;所述出行时空特征学习模块,包括两个并联设置的Transformer位置编码层、其后顺序连接有拼接层、多模板卷积层和时间注意力层;第一Transformer位置编码层,与第一Embedding层连接;第二Transformer位置编码层,与第二Embedding层连接;所述拼接层,用于将两个Transformer位置编码层输出的结果进行拼接,得到出行活动隐藏状态序列;所述多模板卷积层,用于学习得到每个维度的关键时频特征,输入的特征包括出行活动隐藏状态序列和从驾驶状态序列中得到的位置重要性locI;所述时间注意力层,用于计算每个轨迹点对应的权重并输出关键时间特征;所述目的地预测模块,由并联设置后再顺序连接的残差网络和全连接层组成。
2.根据权利要求1所述的基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法,其特征在于:步骤1中,所述地理语义信息,包括车辆起始轨迹点信息和途经轨迹点信息;
所述采集车辆地理语义信息,具体实现包括以下子步骤:
步骤A1:选取轨迹所在区域内的兴趣点数据,并根据其名称所代表的含义属性划分为不同类别;
步骤A2:基于预设的尺度建立覆盖轨迹所在区域的最小外接网格;
步骤A3:对轨迹所在区域内的各类兴趣点数据和覆盖轨迹所在区域的最小外接网格执行空间相交操作,统计落入每个网格单元内的各类兴趣点数量;
步骤A4:根据步骤A3中得到的各类型兴趣点数量统计结果,划分得到若干出行主题,每种主题由各类型兴趣点的概率分布p(POItopic i)组成;
p(POItopic i)=< POI 0POI 1,…,POI n>;
其中,n为兴趣点POI类型的数量,topic i为第i种出行主题的表示;POI i为第i种类型的兴趣点;
步骤A5:根据第j次出行活动的目的地格网中的POI数量得到其对应第i种出行主题的可能性m j
其中,travel j为第j次出行活动;
组合所有出行主题的可能性得到第j次出行活动的地理语义向量
其中,c为出行主题的个数;
步骤A6:基于轨迹点的经纬度计算轨迹点所在的网格单元编号,并利用地理语义格网地图匹配得到其对应的地理语义向量;
步骤A7:对所有起始轨迹点进行聚类得到多个不同出发区域,取同一出发区域中各起始轨迹点地理语义向量的平均值作为该出发区域的地理语义;
步骤A8:取地理语义向量中值最大的兴趣点类型作为途径轨迹点的地理语义,对其进行编码,表征为多维连续数值型特征向量。
3.根据权利要求1所述的基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法,其特征在于:步骤1中,所述时空特征信息,包括车辆途经轨迹点的经度、纬度和时间戳信息;
所述采集车辆时空特征信息,具体实现包括以下子步骤:
步骤B1:通过对原始轨迹记录中起始轨迹点的时间戳进行解析,得到每一条轨迹对应的多层次出发时间信息,即起始轨迹点时间戳的归属月份、归属周数、周内日期和出发时刻;并计算轨迹起始点时间戳在归属周内的秒数、在归属日内的秒数;
步骤B2:采用正余弦映射函数对多层次出发时间进行循环表达,每一个归属周内的秒数和归属日内的秒数都对应一个二维的连续数值型正余弦特征向量,从秒数到正余弦特征向量的编码按照如下公式:
其中,为日内秒数对应的极角值,/>为周内秒数对应的极角值,采用正弦函数和余弦函数编码为二维的连续数值型正余弦特征向量;t表示轨迹起始点的时间戳;
步骤B3:添加可学习的极角增减参数和极径缩放参数/>,顾及不同驾驶者的出行节律,得到归属周内秒数和归属日内秒数的启发式循环编码/>
其中,表示日内的秒数,/>表示周内的秒数。
4.根据权利要求1所述的基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法,其特征在于:步骤1中,所述驾驶状态信息,包括车辆途经轨迹的转向角、行驶速度、已行驶距离及时间消耗信息;
所述采集车辆驶状态信息,具体实现包括以下子步骤:
步骤C1:基于速度中值滤波对轨迹点序列清洗,然后采用Z-Score标准化,通过设置相邻轨迹点间的距离阈值实现轨迹点序列重采样;
步骤C2:计算第个轨迹点/>的转向角/>、行驶速度/>、截至当前轨迹点/>的已行驶距离/>和从起点出发的时间消耗/>,将轨迹点的转向角、行驶速度、已行驶距离序列及时间消耗信息执行Z-Score标准化;其中,l为当前轨迹点序列中轨迹点的数量。
5.根据权利要求1所述的基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法,其特征在于,步骤2的具体实现包括以下子步骤:
步骤2.1:将时空特征序列、地理语义序列及驾驶状态序列这三部分拼接为输入特征序列;
步骤2.2:采用Transformer位置编码层处理输入特征序列得到当前出行活动隐藏状态序列,其中/>为Transformer位置编码层输出的第k个轨迹点的隐藏状态特征;l表示当前出行活动隐藏状态序列的长度;
步骤2.3:利用驾驶状态序列计算第个轨迹点/>位置重要性
其中,为拼接操作,/>和/>分别为轨迹点/>对应的转向角和行驶速度;/>表示从出发点到第k个轨迹点的距离,/>表示从出发点到第k个轨迹点消耗的时间;
步骤2.4:按照轨迹点的位置重要性/>的大小对隐藏状态序列排序,取前/>个隐藏状态序列并按原时序排列得到重采样隐藏状态序列/>,对重采样隐藏状态序列施加时间注意力操作得到出行关键时间特征/>
其中,为驾驶目的地预测网络中多模板卷积层的第/>个滤波模板对隐藏状态序列/>的第/>个维度沿时序方向/>执行卷积后的时频特征,为权重矩阵,/>为激活函数,/>是各时频特征的注意力权重系数,/>表示当前出行特征序列的长度,C为卷积神经网络CNN,f为卷积模板的数量,n为当前隐藏状态特征的序号,/>为得到的每个隐藏状态每维的卷积特征,/>为沿时序方向拼接得到的时序卷积特征,/>为卷积模板的乘数矩阵,/>为卷积中的偏差矩阵;
步骤2.6:将出行关键时间特征分别输入到两个并联设置的多层全连接残差网络中,残差网络结构的由多个完全一致的全连接残差层堆叠而成,下一层的全连接残差层学习上一层的残差;第一个多层全连接残差网络最顶层的全连接残差层输出经纬度形式的预测目的地坐标值,第二个多层全连接残差网络最顶层的全连接残差层输出向量形式的地理语义预测值;
其中,是一个激活函数,/>为权重矩阵,/>为偏置量,/>是矩阵对应位置相加的操作,第i层的输出依赖于第/>层的输入/>和输出/>,这样第i层能学习第/>层的残差;最后利用一个神经元经过一次非线性映射输出经纬度坐标形式的预测目的地及地理语义。
6.根据权利要求1-5任一项所述的基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法,其特征在于:所述驾驶目的地预测网络,是训练好的网络,训练过程包括:
(1)数据集构建;
获取若干历史车辆轨迹数据,将时空特征序列、地理语义序列及驾驶状态序列这三部分拼接为输入特征序列;
将输入特征序列按照预设的比例切分成子轨迹序列,模拟车辆在行驶中的轨迹不断向前延伸的状态,每个子轨迹序列由从出发点到切分位置之间的轨迹点组成;
将切分得到的子轨迹序列按照预设的比例划分为训练集和测试集:首先将所有轨迹数据平均分成若干等份,然后取出其中的一份作为测试集,剩余的轨迹数据作为训练集;
(2)网络训练;
在测试中,根据下列公式计算目标目的地与预测目的地之间的平均绝对误差,作为测试中的损失函数:
其中,是正则化超参数,/>是以纬度和经度形式表示的预测目的地,/>是目标目的地,/>是轨迹条数;/>表示模型训练中的参数矩阵。
7.一种基于时空特征、地理语义及驾驶状态的车辆轨迹预测***,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至6中任一项所述的基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法。
CN202311340148.5A 2023-10-17 2023-10-17 基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法 Pending CN117407711A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311340148.5A CN117407711A (zh) 2023-10-17 2023-10-17 基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311340148.5A CN117407711A (zh) 2023-10-17 2023-10-17 基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法

Publications (1)

Publication Number Publication Date
CN117407711A true CN117407711A (zh) 2024-01-16

Family

ID=89497382

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311340148.5A Pending CN117407711A (zh) 2023-10-17 2023-10-17 基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法

Country Status (1)

Country Link
CN (1) CN117407711A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117975178A (zh) * 2024-04-02 2024-05-03 北京市计量检测科学研究院 一种基于大数据分析的出租车轨迹数据分析方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113204718A (zh) * 2021-04-22 2021-08-03 武汉大学 一种顾及时空语义及驾驶状态的车辆轨迹目的地预测方法
US20230085296A1 (en) * 2021-08-27 2023-03-16 Toyota Motor Engineering & Manufacturing North America, Inc. Systems and methods for predicting trajectories of multiple vehicles
CN116562487A (zh) * 2023-05-30 2023-08-08 武汉大学 顾及路口时空关联与历史出行语义的移动目的地预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113204718A (zh) * 2021-04-22 2021-08-03 武汉大学 一种顾及时空语义及驾驶状态的车辆轨迹目的地预测方法
US20230085296A1 (en) * 2021-08-27 2023-03-16 Toyota Motor Engineering & Manufacturing North America, Inc. Systems and methods for predicting trajectories of multiple vehicles
CN116562487A (zh) * 2023-05-30 2023-08-08 武汉大学 顾及路口时空关联与历史出行语义的移动目的地预测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117975178A (zh) * 2024-04-02 2024-05-03 北京市计量检测科学研究院 一种基于大数据分析的出租车轨迹数据分析方法
CN117975178B (zh) * 2024-04-02 2024-05-28 北京市计量检测科学研究院 一种基于大数据分析的出租车轨迹数据分析方法

Similar Documents

Publication Publication Date Title
CN113204718A (zh) 一种顾及时空语义及驾驶状态的车辆轨迹目的地预测方法
CA2975002C (en) Methods and systems for providing information for an on-demand service
CN110414732B (zh) 一种出行未来轨迹预测方法、装置、储存介质及电子设备
CN108629978A (zh) 一种基于高维路网和循环神经网络的交通轨迹预测方法
Ye et al. A method for driving route predictions based on hidden Markov model
CN111915104A (zh) 一种预测出行位置的方法及装置
US11435202B2 (en) Trajectory sampling using spatial familiarity
WO2022142418A1 (zh) 一种基于gis地图信息的交通拥堵指数预测方法及装置
Tang et al. Deviation between actual and shortest travel time paths for commuters
Rupi et al. Evaluating cyclist patterns using GPS data from smartphones
CN117407711A (zh) 基于时空特征、地理语义及驾驶状态的车辆轨迹预测方法
CN110443185A (zh) 驾驶员识别方法、驾驶员识别装置、电子设备及存储介质
Cheng et al. Developing a travel time estimation method of freeway based on floating car using random forests
Chen et al. Enabling smart urban services with gps trajectory data
CN114444794B (zh) 基于双注意力图嵌入网络的出行意图预测方法
CN116562487B (zh) 顾及路口时空关联与历史出行语义的移动目的地预测方法
CN115470872B (zh) 一种基于车辆轨迹数据的司机画像构建方法
CN116597666A (zh) 基于迁移学习的城市路网无检测器路段流量实时估计方法
Mohammadi et al. Probabilistic prediction of trip travel time and its variability using hierarchical Bayesian learning
Li et al. VIS-MM: a novel map-matching algorithm with semantic fusion from vehicle-borne images
Yang et al. iLogBook: Enabling text-searchable event query using sparse vehicle-mounted GPS data
AT&T
Gao Estimation of Tourist Travel Patterns with Recursive Logit Models based on Wi-Fi Data with Kyoto City Case Study
Sun et al. Deep learning-based probability model for traffic information estimation
Hofleitner Leveraging geolocalization technologies to model and estimate urban traffic

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination