CN110866538A - 车辆轨迹数据获取方法、装置、计算机设备和存储介质 - Google Patents

车辆轨迹数据获取方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN110866538A
CN110866538A CN201910953306.1A CN201910953306A CN110866538A CN 110866538 A CN110866538 A CN 110866538A CN 201910953306 A CN201910953306 A CN 201910953306A CN 110866538 A CN110866538 A CN 110866538A
Authority
CN
China
Prior art keywords
regression
classification
gps
data
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910953306.1A
Other languages
English (en)
Other versions
CN110866538B (zh
Inventor
肖捡花
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaihua University
Original Assignee
Huaihua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaihua University filed Critical Huaihua University
Priority to CN201910953306.1A priority Critical patent/CN110866538B/zh
Publication of CN110866538A publication Critical patent/CN110866538A/zh
Application granted granted Critical
Publication of CN110866538B publication Critical patent/CN110866538B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/251Fusion techniques of input or preprocessed data

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Abstract

本申请涉及一种车辆轨迹数据获取方法、装置、计算机设备和存储介质,其中,方法包括:获取携带多段车辆轨迹数据的原始回归样本,在原始回归样本中携带有GPS有效时的GPS与OBD融合数据集以及GPS失效时的OBD数据集,通过增量回归框架将原始回归样本转换为分类样本,选择支持向量分类作为基础分类器对分类样本进行多次迭代训练,且在迭代训练过程中通过迁移学习法筛选对当前场景有害的样本,降低对当前场景有害的样本的权值,根据权值投票机制,将迭代训练生成的支持向量分类集成,通过支持向量分类与支持向量回归的共通点,获得基于集成支持向量回归的回归模型,基于通用核函数构建非线性轨迹插值模型,准确得到车辆轨迹插值数据。

Description

车辆轨迹数据获取方法、装置、计算机设备和存储介质
技术领域
本申请涉及数据处理技术领域,特别是涉及一种车辆轨迹数据获取方法、装置、计算机设备和存储介质。
背景技术
随着经济水平的发展,目前车辆保有量逐年快速增加,车辆逐年递增的庞大数量,吸引着无数的学者对其开展研究,其中主要包括车主社会属性研究、驾驶行为研究和车辆对城市交通的影响等。
基于车辆的各类研究主要依据为私家车在道路上行驶时产生的大规模轨迹数据。最常用也是普遍使用的车辆轨迹数据的获取依托于各类移动传感器,例如,通过在私家车上安装GPS(Global Positioning System,全球定位***)设备。
目前车辆上装载的GPS多数为低成本的GPS,此类GPS容易出现GPS信号中断的缺陷。当GPS失效时,会带来大量的轨迹信息的缺失,从而使得车辆轨迹挖掘研究难以进行。
发明内容
基于此,有必要针对上述技术问题,提供一种能够在GPS信号中断情况获取连续轨迹数据的车辆轨迹数据获取方法、装置、计算机设备和存储介质。
一种车辆轨迹数据获取方法,所述方法包括:
获取携带多段车辆轨迹数据的原始回归样本,所述原始回归样本携带GPS有效时的GPS与OBD(On-Board Diagnostic,车载诊断***)融合数据集以及GPS失效时的OBD数据集;
通过增量回归(R2C模型)框架将所述原始回归样本转换为分类样本;
选择支持向量分类(SVC)作为基础分类器对所述分类样本进行多次迭代训练,且在迭代训练过程中通过迁移学习法(TrAdaboost)筛选对当前场景有害的样本,降低对当前场景有害的样本的权值;
根据权值投票机制,将迭代训练生成的支持向量分类集成,通过支持向量分类与支持向量回归的共通点,获得基于集成支持向量回归的回归模型;
基于通用核函数、并根据所述回归模型,构建非线性轨迹插值模型,得到车辆轨迹插值数据。
在其中一个实施例中,所述获取携带多段车辆轨迹数据的原始回归样本包括:
获取车辆原始GPS数据和OBD数据,将所述车辆原始GPS数据和OBD数据融合,得到GPS有效时的GPS与OBD融合数据集以及GPS失效时的OBD数据集;
将所述GPS有效时的GPS与OBD融合数据集和所述GPS失效时的OBD数据集连接并进行分块处理,得到携带多段车辆轨迹数据的原始回归样本。
在其中一个实施例中,所述通过增量回归框架将所述原始回归样本转换为分类样本包括:
识别所述原始回归样本中响应变量;
将所述响应变量上下移动预设量
Figure BDA0002226423800000021
构造分类样本。
在其中一个实施例中,所述通过增量回归框架将所述原始回归样本转换为分类样本之后,还包括:
在所述原始回归样本携带的两个数据集上分别构造分类型损失函数,得到两种分类型损失函数;
所述选择支持向量分类作为基础分类器对所述分类样本进行多次迭代训练包括:
根据所述两种分类型损失函数,通过迭代得到一系列的支持向量分类分类器,其中,各所述支持向量分类分类器的权值随迭代次数的增加而发生相应变化。
在其中一个实施例中,在迭代训练过程中通过迁移学习法筛选对当前场景有害的样本,降低对当前场景有害的样本的权值包括:
获取预设样本相关性因子β,所述预设样本相关性因子β为通过迁移学习法在所述GPS有效时的GPS与OBD融合数据集上定义得到,所述预设样本相关性因子β表征某样本与目标样本的关系强度;
通过所述预设样本相关性因子β,调整迭代训练过程中的各支持向量分类的权值向量。
在其中一个实施例中,所述根据权值投票机制,将迭代训练生成的支持向量分类集成,通过支持向量分类与支持向量回归的共通点,获得基于集成支持向量回归的回归模型包括:
根据权值投票机制,对迭代训练生成的支持向量分类集成,得到最适应当前样本的加权集成模型;
求解所述加权集成模型对应方程,得到基于增量回归和迁移学习法的线性回归模型。
在其中一个实施例中,所述基于通用核函数、并根据所述回归模型,构建非线性轨迹插值模型,得到车辆轨迹插值数据包括:
获取预设的通用核函数;
对所述通用核函数进行支持向量分类训练,得到决策函数;
根据所述回归模型和所述决策函数,得到集成分类平面;
将所述集成分类平面转换为回归分类平面;
求解所述回归分类平面,构建非线性轨迹插值模型;
通过贝叶斯优化算法优化所述非线性轨迹插值模型中参数;
根据参数优化后的所述非线性轨迹插值模型得到车辆轨迹插值数据。
一种车辆轨迹数据获取装置,所述装置包括:
数据集获取模块,用于获取携带多段车辆轨迹数据的原始回归样本,所述原始回归样本携带GPS有效时的GPS与OBD融合数据集以及GPS失效时的OBD数据集;
转换模块,用于通过增量回归框架将所述原始回归样本转换为分类样本;
迭代训练模块,用于选择支持向量分类作为基础分类器对所述分类样本进行多次迭代训练,且在迭代训练过程中通过迁移学习法筛选对当前场景有害的样本,降低对当前场景有害的样本的权值;
回归模型构建模块,用于根据权值投票机制,将迭代训练生成的支持向量分类集成,通过支持向量分类与支持向量回归的共通点,获得基于集成支持向量回归的回归模型;
轨迹数据获取模块,用于基于通用核函数、并根据所述回归模型,构建非线性轨迹插值模型,得到车辆轨迹插值数据。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的方法的步骤。
上述车辆轨迹数据获取方法、装置、计算机设备和存储介质,获取携带多段车辆轨迹数据的原始回归样本,在原始回归样本中携带有GPS有效时的GPS与OBD融合数据集以及GPS失效时的OBD数据集,通过增量回归框架将所述原始回归样本转换为分类样本,将回归问题转换为分类问题,选择支持向量分类作为基础分类器对所述分类样本进行多次迭代训练,且在迭代训练过程中通过迁移学习法筛选对当前场景有害的样本,降低对当前场景有害的样本的权值,根据权值投票机制,将迭代训练生成的支持向量分类集成,通过支持向量分类与支持向量回归的共通点,获得基于集成支持向量回归的回归模型,基于通用核函数构建非线性轨迹插值模型,基于迁移学习法和增量回归框架,准确得到车辆轨迹插值数据。
附图说明
图1为一个实施例中车辆轨迹数据获取方法的应用环境图;
图2为一个实施例中车辆轨迹数据获取方法的流程示意图;
图3为另一个实施例中车辆轨迹数据获取方法的流程示意图;
图4为一个实施例中车辆轨迹数据获取方法整体流程框架示意图;
图5为一个实施例中设置GPS失效时间和对应轨迹缺失的路段示意图;
图6为需要轨迹插值的多种场景示意图;
图7为轨迹插值对比实验在经度上的累计误差图;
图8为轨迹插值对比实验在纬度上的累计误差图;
图9为一个实施例中车辆轨迹数据获取装置的结构示意图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的车辆轨迹数据获取方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信,终端102可以分别与车载GPS以及车载OBD连接,接收车载GPS以及车载OBD的数据,并将该数据上传至服务器104。服务器104获取携带多段车辆轨迹数据的原始回归样本,在原始回归样本中携带有GPS有效时的GPS与OBD融合数据集以及GPS失效时的OBD数据集,通过增量回归框架将原始回归样本转换为分类样本,将回归问题转换为分类问题,选择支持向量分类作为基础分类器对分类样本进行多次迭代训练,且在迭代训练过程中通过迁移学***板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种车辆轨迹数据获取方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
S100:获取携带多段车辆轨迹数据的原始回归样本,原始回归样本携带GPS有效时的GPS与OBD融合数据集以及GPS失效时的OBD数据集。
OBD是指车载诊断***,这个***随时监控发动机的运行状况和尾气后处理***的工作状态,一旦发现有可能引起排放超标的情况,会马上发出警示,当***出现故障时,故障灯或检查发动机警告灯亮,同时OBD***会将故障信息存入存储器,通过标准的诊断仪器和诊断接口可以以故障码的形式读取相关信息,根据故障码的提示,维修人员能迅速准确地确定故障的性质和部位。具体来说,服务器可以接收外部终端已经收集好的车辆GPS数据和OBD数据,针对这部分数据进行筛选和分类,分为GPS有效时的GPS与OBD融合数据和GPS失效时的OBD数据。在本实施例中,获取GPS以及OBD两种类型的数据的目的是希望借助OBD数据来完善在GPS失效情况的车辆轨迹数据。
如图3所示,在其中一个实施例中,步骤S100包括:
S120:获取车辆原始GPS数据和OBD数据,将车辆原始GPS数据和OBD数据融合,得到GPS有效时的GPS与OBD融合数据集以及GPS失效时的OBD数据集。
S140:将GPS有效时的GPS与OBD融合数据集和GPS失效时的OBD数据集连接并进行分块处理,得到携带多段车辆轨迹数据的原始回归样本。
通过将GPS和OBD进行数据融合,把数据分为两块,一块是GPS有效时的GPS和OBD数据,一块是GPS失效时仅有的OBD数;然后将两块数据连接起来,进行分块操作,以获得多段轨迹数据。具体来说,原始回归样本数据由两块数据组成:GPS有效时的GPS/OBD数据集
Figure BDA0002226423800000061
和GPS失效时仅有的OBD数据集
Figure BDA0002226423800000062
通过分块操作之后得到的一系列回归数据如下所示:
SR={(Xi,yi)|Xi∈Rn+m,yi∈R,i=1,2,...,n+m}
S200:通过增量回归框架将原始回归样本转换为分类样本。
通过增量回归框架将原始回归样本对应的回归问题转换为分类样本对应的分类问题。具体来说,上述转换过程为:识别原始回归样本中响应变量;将响应变量上下移动预设量
Figure BDA0002226423800000063
构造分类样本。在构造分类样本之后可以通过在指定的数据集上构造分类型损失函数,将回归问题转为分类问题来处理。其中,指定的数据集是指GPS有效时的GPS与OBD融合数据集以及GPS失效时的OBD数据集。
下面将基于数学公式详细说明上述步骤S200中回归样本转换为分类样本的过程。
在经过S200步骤中,通过将原始回归样本的响应变量y上下移动
Figure BDA0002226423800000071
构造如下的分类样本:
Figure BDA0002226423800000072
此时的原始回归样本与新的分类标签的关系可表示为:
Figure BDA0002226423800000073
此时的分类型损失被设计为仅在
Figure BDA0002226423800000074
上的计算错误率,如下所示:
Figure BDA0002226423800000075
其中,ρ是一个概率分布,
Figure BDA0002226423800000076
是分类模型F在
Figure BDA0002226423800000077
上的预测值,
Figure BDA0002226423800000078
表示真实值。
S300:选择支持向量分类作为基础分类器对分类样本进行多次迭代训练,且在迭代训练过程中通过迁移学习法筛选对当前场景有害的样本,降低对当前场景有害的样本的权值。
在步骤S300处理希望通过迭代训练和迁移学习算法将OBD数据迁移到GPS数据上,以最终能够得到准确的车辆轨迹插值数据。有害的样本是指与当前场景不相关,干扰最终查找到目标样本的样本数据,其可以理解为“噪音”数据。在实际应用中,可以通过迁移学习法不断调整在迭代训练过程中各个分类样本对应的权值,降低其中有害样本的权值,提高相关样本的权值,来实现把OBD信息迁移到GPS信息上的目的。
S400:根据权值投票机制,将迭代训练生成的支持向量分类集成,通过支持向量分类与支持向量回归的共通点,获得基于集成支持向量回归的回归模型。
根据权值投票机制,对步骤S300迭代训练得到的一系列支持向量分类进行集成,然后通过支持向量分类与支持向量回归的共通点,获得基于集成支持向量回归的回归模型。
具体来说,在步骤S400中,有法向量
Figure BDA0002226423800000081
构成了如下的分类模型:
Figure BDA0002226423800000082
其中b是偏差。根据权重投票机制,对完成步骤S300之后得到的一系列支持向量分类进行集成,获得最适应当前样本的加权集成模型,如下所示:
Figure BDA0002226423800000083
其中,W是更新样本权值后得到的分类器权值向量,PX是输入样本的特征向量X的概率分布,py是原始回归样本中的响应向量的概率。此时,我们需要的原始回归的响应变量y的信息也包含其中,解这个方程即可得到基于R2C和迁移学习法的新的线性回归模型:
Figure BDA0002226423800000084
S500:基于通用核函数、并根据回归模型,构建非线性轨迹插值模型,得到车辆轨迹插值数据。
针对非线性回归模型,则需要引入核函数。然而,因为我们改变了原始回归模型的构造,使得普遍使用的核函数不能直接应用在本框架中,应对其也进行相应的改变。通用的核函数包括线性核函数(polynomial kernel)、RBF(径向基)核函数以及Sigmoid核函数。由回归模型和通用核函数,得到集成分类平面,将集成分类平面转换为回归分类平面,再求解回归分类平面的方程,构建非线性轨迹插值模型,得到车辆轨迹插值数据。
上述车辆轨迹数据获取方法,获取携带多段车辆轨迹数据的原始回归样本,在原始回归样本中携带有GPS有效时的GPS与OBD融合数据集以及GPS失效时的OBD数据集,通过增量回归框架将原始回归样本转换为分类样本,将回归问题转换为分类问题,选择支持向量分类作为基础分类器对分类样本进行多次迭代训练,且在迭代训练过程中通过迁移学习法筛选对当前场景有害的样本,降低对当前场景有害的样本的权值,根据权值投票机制,将迭代训练生成的支持向量分类集成,通过支持向量分类与支持向量回归的共通点,获得基于集成支持向量回归的回归模型,基于通用核函数构建非线性轨迹插值模型,基于迁移学习法和增量回归框架,准确得到车辆轨迹插值数据。
在其中一个实施例中,通过增量回归框架将原始回归样本转换为分类样本之后,还包括:在原始回归样本携带的两个数据集上分别构造分类型损失函数,得到两种分类型损失函数;选择支持向量分类作为基础分类器对分类样本进行多次迭代训练包括:根据两种分类型损失函数,通过迭代得到一系列的支持向量分类分类器,其中,各支持向量分类分类器的权值随迭代次数的增加而发生相应变化。
在GPS有效时的GPS与OBD融合数据集以及GPS失效时的OBD数据集两个数据集上分别构造分类型损失函数,得到两种分类型损失函数。通过迭代,得到一系列的支持向量分类分类器,每一个支持向量分类的权值随着迭代次数的增加而发生相应的变化。
在其中一个实施例中,在迭代训练过程中通过迁移学习法筛选对当前场景有害的样本,降低对当前场景有害的样本的权值包括:
获取预设样本相关性因子β,预设样本相关性因子β为通过迁移学习法在GPS有效时的GPS与OBD融合数据集上定义得到,预设样本相关性因子β表征某样本与目标样本的关系强度;通过预设样本相关性因子β,调整迭代训练过程中的各支持向量分类的权值向量。
利用TrAdboost在
Figure BDA0002226423800000091
上,定义一个样本相关性因子β,表示为某样本与目标样本的关系强度。从而在每次迭代中,将不相关的样本的作用减弱,过滤掉队当前应用场景有害的样本。此时的权值更新可描述为:
Figure BDA0002226423800000092
其中ωS是权值向量,它表示被集成的一系列的支持向量分类的权值。此更新过程后得到的样本都囊括了与当前应用场景强相关的信息。
在其中一个实施例中,上述步骤S500具体包括:
获取预设的通用核函数;对通用核函数进行支持向量分类训练,得到决策函数;根据回归模型和决策函数,得到集成分类平面;将集成分类平面转换为回归分类平面;求解回归分类平面,构建非线性轨迹插值模型;通过贝叶斯优化算法优化非线性轨迹插值模型中参数;根据参数优化后的非线性轨迹插值模型得到车辆轨迹插值数据。
通常引入核函数,经过支持向量分类训练之后,会得到如下决策函数:
Figure BDA0002226423800000101
其中,K代表核函数,C是补偿因子,以及
Figure BDA0002226423800000102
是通过支持向量分类训练出来的支持向量。相对应地,集成分类平面可表示为:
Figure BDA0002226423800000103
在本框架中,以线性核函数
Figure BDA0002226423800000104
为例,即可得到:
Figure BDA0002226423800000105
值得注意的是,所有训练得到的信息都隐含在支持向量
Figure BDA0002226423800000106
里,因此,我们通过解这个方程,可以得到最终的非线性回归模型。而求解之后得到的回归的核空间与线性分类的核空间不是同一个,因此原来的核函数不能直接应用于本回归框架。最终得到的非线性集成回归模型如下所示:
Figure BDA0002226423800000107
通过矩阵计算,将上式变换后得到如下方程:
Figure BDA0002226423800000108
有此式可以看出,回归模型的输出响应变量也包含在其中,因此通过求解可以得到最终集成模型:
Figure BDA0002226423800000109
同理,使用其他两个常用的核函数,也可以推导出最终模型。另外,为了自动优化和调整所涉及的参数,采用贝叶斯优化来进行参数选取。假设优化模型为:
x=argmaxx∈Xf(x)
其中,X是参数组合的候选集,f(x)表示模型的准确度。该模型的目标为选择从X选择一个x使得f(x)的取值达到最大,此过程可分为两步进行。首先,选择一个先验模型,此模型通常为高斯过程(Gaussian process);然后通过计算获得后验分布。在进行操作之前,我们必须假设f(x)是服从高斯分布的,可描述为:
f(x)~GP((μ(x),k(x,x′))
其中,μ(x)是平均函数,k(x,x′)表示协方差函数。然后,利用采集函数(Acquisition function)找到下一个合适的样本点。我们选择当前主流的获取函数Expected Improvement(EI),它属于期望函数,且考虑了f(x)和f(x*)的关系。这里f(x*)表示已经被优化的X的目标函数值。此时的优化模型可表示为:
x=argmaxx∈XE(max0,fk+i(x)-f(x*)|Sk)
其中,k是样本的数量,Sk表示前k个样本。结合高维正态分布的先验假设,我们可以得到如下所示的采集模型:
Figure BDA0002226423800000111
其中Φ和φ分别是标准正态分布的PDF和CDF,μ(x)和σ(x)分别表示为通过GP得到的目标函数的平均值和方差,以及Z等于(μ(x)-f(x*))和σ(x)的比值。由此贝叶斯优化模型,我们可以将本申请所涉及的超参数自动优化调整并获取。所涉及的超参数有:窗口大小(块大小)、SVM中的补偿因子C以及各类核函数中的参数,例如多项式核函数中的γ、d和r。
如图4所示,在其中一个应用实例中,本申请车辆轨迹数据获取方法具体可以为基于迁移学***面转化为回归超平面,即得到轨迹插值模型,最终获得完整轨迹数据集。
如图5为本发明用于验证该插值算法所涉及的轨迹数据集(其中有端点的白色轨迹为GPS失效的轨迹),该数据集为长沙某一复杂路段,其中包含直线、高架桥、城市高速、城市低速、城市弯道以及城市连续直角弯道。我们强制性使得这些路段发生GPS失效且轨迹缺失,具体详情如图6所示,其中直线是缺失了36秒的数据,且经过一个车流汇入的口和一个车流驶出的路口;高架桥是本验证试验中最复杂的场景,设置为缺失68秒的轨迹,且该路段有连续上坡和连续下坡,还有多个出入口,极为复杂;城市高速路段选择的是38秒的轨迹缺失;城市低速选择的是学校路段,且发生40秒的轨迹缺失。该路段前后都有供学生自由选择的可控的人行道交通灯,因此在此路段中,车辆经常有踩停的情况,使得轨迹插值会有时延的困扰。城市弯道选取的是速度较快的转弯路段,缺失轨迹时长为44秒。该路段由于速度很快,同时又有方向角的变化,因此在轨迹插值任务中,可能会发生很大的偏差。最后是连续直角弯道,失效时长为58秒。该路段也是为学校内部路段,两旁有学院建筑和树木的遮挡,导致收集的GPS本身就有些偏差,因此给轨迹插值任务带来很真实的困难。
如图7和图8分别展示出了本发明提出的轨迹插值方法的效果。对比方法有:传统机器学***均绝对误差。图6和图7的横坐标为不同的应用场景,纵坐标为平均绝对误差的值。从中可以看出高架桥和连续直角弯道是实验偏差最大的场景,但本发明所提出的方法表现趋于稳定,还是有相对较好的效果。另外,从最右边的平均值比较也可以看出,本发明所提出的方法表现整体由优于其他对比方法。
应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
另外,如图9所示,本申请还提供一种车辆轨迹数据获取装置,装置包括:
数据集获取模块100,用于获取携带多段车辆轨迹数据的原始回归样本,原始回归样本携带GPS有效时的GPS与OBD融合数据集以及GPS失效时的OBD数据集;
转换模块200,用于通过增量回归框架将原始回归样本转换为分类样本;
迭代训练模块300,用于选择支持向量分类作为基础分类器对分类样本进行多次迭代训练,且在迭代训练过程中通过迁移学习法筛选对当前场景有害的样本,降低对当前场景有害的样本的权值;
回归模型构建模块400,用于根据权值投票机制,将迭代训练生成的支持向量分类集成,通过支持向量分类与支持向量回归的共通点,获得基于集成支持向量回归的回归模型;
轨迹数据获取模块500,用于基于通用核函数、并根据回归模型,构建非线性轨迹插值模型,得到车辆轨迹插值数据。
上述车辆轨迹数据获取装置,获取携带多段车辆轨迹数据的原始回归样本,在原始回归样本中携带有GPS有效时的GPS与OBD融合数据集以及GPS失效时的OBD数据集,通过增量回归框架将原始回归样本转换为分类样本,将回归问题转换为分类问题,选择支持向量分类作为基础分类器对分类样本进行多次迭代训练,且在迭代训练过程中通过迁移学习法筛选对当前场景有害的样本,降低对当前场景有害的样本的权值,根据权值投票机制,将迭代训练生成的支持向量分类集成,通过支持向量分类与支持向量回归的共通点,获得基于集成支持向量回归的回归模型,基于通用核函数构建非线性轨迹插值模型,基于迁移学习法和增量回归框架,准确得到车辆轨迹插值数据。
在其中一个实施例中,数据集获取模块100还用于获取车辆原始GPS数据和OBD数据,将车辆原始GPS数据和OBD数据融合,得到GPS有效时的GPS与OBD融合数据集以及GPS失效时的OBD数据集;将GPS有效时的GPS与OBD融合数据集和GPS失效时的OBD数据集连接并进行分块处理,得到携带多段车辆轨迹数据的原始回归样本。
在其中一个实施例中,转换模块200还用于识别原始回归样本中响应变量;将响应变量上下移动预设量
Figure BDA0002226423800000141
构造分类样本。
在其中一个实施例中,迭代训练模块300还用于在原始回归样本携带的两个数据集上分别构造分类型损失函数,得到两种分类型损失函数;根据两种分类型损失函数,通过迭代得到一系列的支持向量分类分类器,其中,各支持向量分类分类器的权值随迭代次数的增加而发生相应变化。
在其中一个实施例中,迭代训练模块300还用于获取预设样本相关性因子β,预设样本相关性因子β为通过迁移学习法在GPS有效时的GPS与OBD融合数据集上定义得到,预设样本相关性因子β表征某样本与目标样本的关系强度;通过预设样本相关性因子β,调整迭代训练过程中的各支持向量分类的权值向量。
在其中一个实施例中,回归模型构建模块400还用于根据权值投票机制,对迭代训练生成的支持向量分类集成,得到最适应当前样本的加权集成模型;求解加权集成模型对应方程,得到基于增量回归和迁移学习法的线性回归模型。
在其中一个实施例中,轨迹数据获取模块500还用于获取预设的通用核函数;对通用核函数进行支持向量分类训练,得到决策函数;根据回归模型和决策函数,得到集成分类平面;将集成分类平面转换为回归分类平面;求解回归分类平面,构建非线性轨迹插值模型;通过贝叶斯优化算法优化非线性轨迹插值模型中参数;根据参数优化后的非线性轨迹插值模型得到车辆轨迹插值数据。
关于车辆轨迹数据获取装置的具体限定可以参见上文中对于车辆轨迹数据获取方法的限定,在此不再赘述。上述车辆轨迹数据获取装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储历史GPS数据和OBD数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种车辆轨迹数据获取方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
获取携带多段车辆轨迹数据的原始回归样本,原始回归样本携带GPS有效时的GPS与OBD融合数据集以及GPS失效时的OBD数据集;
通过增量回归框架将原始回归样本转换为分类样本;
选择支持向量分类作为基础分类器对分类样本进行多次迭代训练,且在迭代训练过程中通过迁移学习法筛选对当前场景有害的样本,降低对当前场景有害的样本的权值;
根据权值投票机制,将迭代训练生成的支持向量分类集成,通过支持向量分类与支持向量回归的共通点,获得基于集成支持向量回归的回归模型;
基于通用核函数、并根据回归模型,构建非线性轨迹插值模型,得到车辆轨迹插值数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取车辆原始GPS数据和OBD数据,将车辆原始GPS数据和OBD数据融合,得到GPS有效时的GPS与OBD融合数据集以及GPS失效时的OBD数据集;将GPS有效时的GPS与OBD融合数据集和GPS失效时的OBD数据集连接并进行分块处理,得到携带多段车辆轨迹数据的原始回归样本。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
识别原始回归样本中响应变量;将响应变量上下移动预设量
Figure BDA0002226423800000161
构造分类样本。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
在原始回归样本携带的两个数据集上分别构造分类型损失函数,得到两种分类型损失函数;根据两种分类型损失函数,通过迭代得到一系列的支持向量分类分类器,其中,各支持向量分类分类器的权值随迭代次数的增加而发生相应变化。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取预设样本相关性因子β,预设样本相关性因子β为通过迁移学习法在GPS有效时的GPS与OBD融合数据集上定义得到,预设样本相关性因子β表征某样本与目标样本的关系强度;通过预设样本相关性因子β,调整迭代训练过程中的各支持向量分类的权值向量。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据权值投票机制,对迭代训练生成的支持向量分类集成,得到最适应当前样本的加权集成模型;求解加权集成模型对应方程,得到基于增量回归和迁移学习法的线性回归模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取预设的通用核函数;对通用核函数进行支持向量分类训练,得到决策函数;根据回归模型和决策函数,得到集成分类平面;将集成分类平面转换为回归分类平面;求解回归分类平面,构建非线性轨迹插值模型;通过贝叶斯优化算法优化非线性轨迹插值模型中参数;根据参数优化后的非线性轨迹插值模型得到车辆轨迹插值数据。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取携带多段车辆轨迹数据的原始回归样本,原始回归样本携带GPS有效时的GPS与OBD融合数据集以及GPS失效时的OBD数据集;
通过增量回归框架将原始回归样本转换为分类样本;
选择支持向量分类作为基础分类器对分类样本进行多次迭代训练,且在迭代训练过程中通过迁移学习法筛选对当前场景有害的样本,降低对当前场景有害的样本的权值;
根据权值投票机制,将迭代训练生成的支持向量分类集成,通过支持向量分类与支持向量回归的共通点,获得基于集成支持向量回归的回归模型;
基于通用核函数、并根据回归模型,构建非线性轨迹插值模型,得到车辆轨迹插值数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取车辆原始GPS数据和OBD数据,将车辆原始GPS数据和OBD数据融合,得到GPS有效时的GPS与OBD融合数据集以及GPS失效时的OBD数据集;将GPS有效时的GPS与OBD融合数据集和GPS失效时的OBD数据集连接并进行分块处理,得到携带多段车辆轨迹数据的原始回归样本。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
识别原始回归样本中响应变量;将响应变量上下移动预设量
Figure BDA0002226423800000171
构造分类样本。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
在原始回归样本携带的两个数据集上分别构造分类型损失函数,得到两种分类型损失函数;根据两种分类型损失函数,通过迭代得到一系列的支持向量分类分类器,其中,各支持向量分类分类器的权值随迭代次数的增加而发生相应变化。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取预设样本相关性因子β,预设样本相关性因子β为通过迁移学习法在GPS有效时的GPS与OBD融合数据集上定义得到,预设样本相关性因子β表征某样本与目标样本的关系强度;通过预设样本相关性因子β,调整迭代训练过程中的各支持向量分类的权值向量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据权值投票机制,对迭代训练生成的支持向量分类集成,得到最适应当前样本的加权集成模型;求解加权集成模型对应方程,得到基于增量回归和迁移学习法的线性回归模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取预设的通用核函数;对通用核函数进行支持向量分类训练,得到决策函数;根据回归模型和决策函数,得到集成分类平面;将集成分类平面转换为回归分类平面;求解回归分类平面,构建非线性轨迹插值模型;通过贝叶斯优化算法优化非线性轨迹插值模型中参数;根据参数优化后的非线性轨迹插值模型得到车辆轨迹插值数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种车辆轨迹数据获取方法,所述方法包括:
获取携带多段车辆轨迹数据的原始回归样本,所述原始回归样本携带GPS有效时的GPS与OBD融合数据集以及GPS失效时的OBD数据集;
通过增量回归框架将所述原始回归样本转换为分类样本;
选择支持向量分类作为基础分类器对所述分类样本进行多次迭代训练,且在迭代训练过程中通过迁移学习法筛选对当前场景有害的样本,降低对当前场景有害的样本的权值;
根据权值投票机制,将迭代训练生成的支持向量分类集成,通过支持向量分类与支持向量回归的共通点,获得基于集成支持向量回归的回归模型;
基于通用核函数、并根据所述回归模型,构建非线性轨迹插值模型,得到车辆轨迹插值数据。
2.根据权利要求1所述的方法,其特征在于,所述获取携带多段车辆轨迹数据的原始回归样本包括:
获取车辆原始GPS数据和OBD数据,将所述车辆原始GPS数据和OBD数据融合,得到GPS有效时的GPS与OBD融合数据集以及GPS失效时的OBD数据集;
将所述GPS有效时的GPS与OBD融合数据集和所述GPS失效时的OBD数据集连接并进行分块处理,得到携带多段车辆轨迹数据的原始回归样本。
3.根据权利要求1所述的方法,其特征在于,所述通过增量回归框架将所述原始回归样本转换为分类样本包括:
识别所述原始回归样本中响应变量;
将所述响应变量上下移动预设量
Figure FDA0002226423790000011
构造分类样本。
4.根据权利要求1所述的方法,其特征在于,所述通过增量回归框架将所述原始回归样本转换为分类样本之后,还包括:
在所述原始回归样本携带的两个数据集上分别构造分类型损失函数,得到两种分类型损失函数;
所述选择支持向量分类作为基础分类器对所述分类样本进行多次迭代训练包括:
根据所述两种分类型损失函数,通过迭代得到一系列的支持向量分类分类器,其中,各所述支持向量分类分类器的权值随迭代次数的增加而发生相应变化。
5.根据权利要求1所述的方法,其特征在于,在迭代训练过程中通过迁移学习法筛选对当前场景有害的样本,降低对当前场景有害的样本的权值包括:
获取预设样本相关性因子β,所述预设样本相关性因子β为通过迁移学习法在所述GPS有效时的GPS与OBD融合数据集上定义得到,所述预设样本相关性因子β表征某样本与目标样本的关系强度;
通过所述预设样本相关性因子β,调整迭代训练过程中的各支持向量分类的权值向量。
6.根据权利要求1所述的方法,其特征在于,所述根据权值投票机制,将迭代训练生成的支持向量分类集成,通过支持向量分类与支持向量回归的共通点,获得基于集成支持向量回归的回归模型包括:
根据权值投票机制,对迭代训练生成的支持向量分类集成,得到最适应当前样本的加权集成模型;
求解所述加权集成模型对应方程,得到基于增量回归和迁移学习法的线性回归模型。
7.根据权利要求1所述的方法,其特征在于,所述基于通用核函数、并根据所述回归模型,构建非线性轨迹插值模型,得到车辆轨迹插值数据包括:
获取预设的通用核函数;
对所述通用核函数进行支持向量分类训练,得到决策函数;
根据所述回归模型和所述决策函数,得到集成分类平面;
将所述集成分类平面转换为回归分类平面;
求解所述回归分类平面,构建非线性轨迹插值模型;
通过贝叶斯优化算法优化所述非线性轨迹插值模型中参数;
根据参数优化后的所述非线性轨迹插值模型得到车辆轨迹插值数据。
8.一种车辆轨迹数据获取装置,其特征在于,所述装置包括:
数据集获取模块,用于获取携带多段车辆轨迹数据的原始回归样本,所述原始回归样本携带GPS有效时的GPS与OBD融合数据集以及GPS失效时的OBD数据集;
转换模块,用于通过增量回归框架将所述原始回归样本转换为分类样本;
迭代训练模块,用于选择支持向量分类作为基础分类器对所述分类样本进行多次迭代训练,且在迭代训练过程中通过迁移学习法筛选对当前场景有害的样本,降低对当前场景有害的样本的权值;
回归模型构建模块,用于根据权值投票机制,将迭代训练生成的支持向量分类集成,通过支持向量分类与支持向量回归的共通点,获得基于集成支持向量回归的回归模型;
轨迹数据获取模块,用于基于通用核函数、并根据所述回归模型,构建非线性轨迹插值模型,得到车辆轨迹插值数据。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN201910953306.1A 2019-10-09 2019-10-09 车辆轨迹数据获取方法、装置、计算机设备和存储介质 Active CN110866538B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910953306.1A CN110866538B (zh) 2019-10-09 2019-10-09 车辆轨迹数据获取方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910953306.1A CN110866538B (zh) 2019-10-09 2019-10-09 车辆轨迹数据获取方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN110866538A true CN110866538A (zh) 2020-03-06
CN110866538B CN110866538B (zh) 2022-03-11

Family

ID=69652778

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910953306.1A Active CN110866538B (zh) 2019-10-09 2019-10-09 车辆轨迹数据获取方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN110866538B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112749801A (zh) * 2021-01-22 2021-05-04 上海商汤智能科技有限公司 神经网络训练和图像处理方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9494694B1 (en) * 2015-12-09 2016-11-15 International Business Machines Corporation Method and apparatus of road location inference for moving object
CN106314438A (zh) * 2016-08-15 2017-01-11 西北工业大学 一种司机驾驶轨迹中异常轨迹的检测方法和***
CN106370190A (zh) * 2015-07-20 2017-02-01 腾讯科技(深圳)有限公司 车辆导航、位置标记方法、装置及***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106370190A (zh) * 2015-07-20 2017-02-01 腾讯科技(深圳)有限公司 车辆导航、位置标记方法、装置及***
US9494694B1 (en) * 2015-12-09 2016-11-15 International Business Machines Corporation Method and apparatus of road location inference for moving object
CN106314438A (zh) * 2016-08-15 2017-01-11 西北工业大学 一种司机驾驶轨迹中异常轨迹的检测方法和***

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
DONG WANG 等: "Bayesian optimization of support vector machine for regression prediction of short-term traffic flow", 《INTELLIGENT DATA ANALYSIS》 *
JIANHUA XIAO 等: "Short-term traffic volume prediction by ensemble learning in concept drifting environments", 《KNOWLEDGE-BASED SYSTEMS》 *
LIN GAO 等: "AdaBoost regression algorithm based on classification-type loss", 《2010 8TH WORLD CONGRESS ON INTELLIGENT CONTROL AND AUTOMATION》 *
SUMEET KUMAR 等: "Integrating On-board Diagnostics Speed Data with Sparse GPS Measurements for Vehicle Trajectory Estimation", 《THE SICE ANNUAL CONFERENCE 2013》 *
WENYUAN DAI 等: "Boosting for Transfer Learning", 《PROCEEDINGS OF THE 24 TH INTERNATIONAL CONFERENCE ON MACHINE LEARNING》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112749801A (zh) * 2021-01-22 2021-05-04 上海商汤智能科技有限公司 神经网络训练和图像处理方法及装置

Also Published As

Publication number Publication date
CN110866538B (zh) 2022-03-11

Similar Documents

Publication Publication Date Title
Guo et al. Road damage detection algorithm for improved YOLOv5
US20210295162A1 (en) Neural network model training method and apparatus, computer device, and storage medium
Peng et al. Uncertainty evaluation of object detection algorithms for autonomous vehicles
CN112419710B (zh) 交通拥堵数据预测方法、装置、计算机设备及存储介质
US20200094824A1 (en) Learning to simulate
CN114330868A (zh) 基于自注意力的个性化增强图卷积网络的客流预测方法
CN112699941B (zh) 植物病害严重程度图像分类方法、装置、设备和存储介质
CN111414874B (zh) 基于人脸的驾驶风险预测方法、装置、设备和存储介质
EP4145345A1 (en) Data annotation method and device, and fine granularity identification method and device
US10732694B2 (en) Power state control of a mobile device
Saisree et al. Pothole detection using deep learning classification method
Chelbi et al. Worst-case scenarios identification approach for the evaluation of advanced driver assistance systems in intelligent/autonomous vehicles under multiple conditions
CN110866538B (zh) 车辆轨迹数据获取方法、装置、计算机设备和存储介质
US12045023B2 (en) Electronic control device and neural network update system
CN117217280A (zh) 神经网络模型优化方法、装置及计算设备
Liu et al. Mining security assessment in an underground environment using a novel face recognition method with improved multiscale neural network
Makara et al. Public transport congestion detection using incremental learning
US11562184B2 (en) Image-based vehicle classification
CN114548463A (zh) 线路信息预测方法、装置、计算机设备和存储介质
CN110472656B (zh) 车辆图像分类方法、装置、计算机设备及存储介质
US20210326645A1 (en) Robust correlation of vehicle extents and locations when given noisy detections and limited field-of-view image frames
Rezashoar et al. Comparison of Machine Learning Algorithms for Predicting Traffic Accident Severity (Case Study: United Kingdom from 2010 to 2014)
CN117334058B (zh) 一种货车交通流量预测方法、装置、设备及存储介质
CN110942179A (zh) 一种自动驾驶路线规划方法、装置及车辆
CN117292304B (zh) 一种多媒体数据传输控制方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant