CN110490275B - 一种基于迁移学习的驾驶行为预测方法 - Google Patents

一种基于迁移学习的驾驶行为预测方法 Download PDF

Info

Publication number
CN110490275B
CN110490275B CN201910576216.5A CN201910576216A CN110490275B CN 110490275 B CN110490275 B CN 110490275B CN 201910576216 A CN201910576216 A CN 201910576216A CN 110490275 B CN110490275 B CN 110490275B
Authority
CN
China
Prior art keywords
driver
driving behavior
data
target driver
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910576216.5A
Other languages
English (en)
Other versions
CN110490275A (zh
Inventor
吕超
胡风青
陆军琰
徐优志
龚建伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SAIC Motor Corp Ltd
Beijing Institute of Technology BIT
Original Assignee
SAIC Motor Corp Ltd
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SAIC Motor Corp Ltd, Beijing Institute of Technology BIT filed Critical SAIC Motor Corp Ltd
Priority to CN201910576216.5A priority Critical patent/CN110490275B/zh
Publication of CN110490275A publication Critical patent/CN110490275A/zh
Application granted granted Critical
Publication of CN110490275B publication Critical patent/CN110490275B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明涉及一种基于迁移学习的驾驶行为预测方法,属于汽车智能交互技术领域。该预测方法包括S1,采集目标驾驶员的操作信息、本车状态信息和周围环境信息;S2,基于局部普氏分析法将存储的源驾驶员历史信息数据迁移至目标驾驶员处得到迁移学习的数据;S3,根据所述迁移学习的数据并基于主成分分析法和最大期望算法训练目标驾驶员驾驶行为模型;S4,根据所述目标驾驶员驾驶行为模型对目标驾驶员驾驶行为进行实时预测。本发明实现了驾驶员驾驶行为模型自适应和个性化驾驶行为的准确预测,具有很强的实用性。

Description

一种基于迁移学习的驾驶行为预测方法
技术领域
本发明涉及汽车智能交互技术领域,尤其涉及一种基于迁移学习的驾驶行为预测方法。
背景技术
随着汽车智能化的起步,人们对于汽车良好的体验需求,使得人们希望汽车越来越懂自己,并且根据自己的状态和需求定制对应的服务内容和辅助驾驶。准确预测驾驶员的驾驶行为,尤其是个性化的驾驶行为,对于为驾驶员提供更人性化的服务和更安全舒适的辅助驾驶有极其重要的作用。
现阶段,驾驶员驾驶行为预测方法主要有:基于规则的参数模型预测方法和基于数据的机器学习模型预测方法;这两种识别方法的局限性在于:由于不同驾驶员驾驶行为的差异性,由其他驾驶员驾驶行为建立的模型难以对目标驾驶员的驾驶行为,尤其是个性化的驾驶行为进行准确预测。虽然已有部分驾驶行为模型自适应方法,但这些已有的驾驶行为模型自适应方法均需要在已有其他驾驶员驾驶行为模型上进行参数调整,模型自适应效果有限,同样难以准确预测目标驾驶员驾驶行为,实用性不强。
发明内容
鉴于上述的分析,本发明旨在提供一种基于迁移学习的驾驶行为预测方法,用以解决现有技术中驾驶员驾驶行为模型自适应效果较差以及驾驶行为预测准确性低,实用性不强的问题。
本发明的目的主要是通过以下技术方案实现的:
本发明提供了一种基于迁移学习的驾驶行为预测方法,包括以下步骤:S1,采集目标驾驶员的操作信息、本车状态信息和周围环境信息;
S2,基于局部普氏分析法将存储的源驾驶员历史信息数据迁移至目标驾驶员处得到迁移学习的数据;
S3,根据所述迁移学习的数据并基于主成分分析法和最大期望算法训练目标驾驶员驾驶行为模型;
S4,根据所述目标驾驶员驾驶行为模型对目标驾驶员驾驶行为进行实时预测。
进一步地,所述步骤S2中存储的源驾驶员历史信息数据包括其他驾驶员的操作信息、其他驾驶员驾驶本车时的状态信息和周围环境信息;
所述源驾驶员历史信息数据迁移至目标驾驶员处得到迁移学习的数据具体包括:找到与目标驾驶员样本点对应的其他驾驶员驾驶行为数据样本点;计算其他驾驶员驾驶行为数据到目标驾驶员驾驶行为数据的映射关系;根据所述映射关系将所有的其他驾驶员驾驶行为数据映射到目标驾驶员处。
进一步地,所述找到与目标驾驶员样本点对应的其他驾驶员驾驶行为数据样本点具体包括:从目标驾驶员处采集的数据中均匀采样得到目标驾驶员驾驶行为数据样本点;根据动态时间规整算法对目标驾驶员驾驶行为数据样本点与所有的其他驾驶员驾驶行为数据进行一一计算,得到与目标驾驶员数据样本点对应的其他驾驶员驾驶行为数据样本点。
进一步地,基于所述动态时间规整算法获得目标驾驶员对应的其他驾驶员驾驶行为数据样本点,具体包括:将驾驶员的操作信息、本车状态信息和周围环境信息组成矢量z,目标驾驶员驾驶在时刻j的数据为
Figure BDA0002112110740000031
其他驾驶员作为迁移的数据源在时刻i的数据为
Figure BDA0002112110740000032
Figure BDA0002112110740000033
Figure BDA0002112110740000034
构成对应点,则将其索引组成一个索引对wl=(i,j);
求解所有对应点之间的最小距离
Figure BDA0002112110740000035
得到一个最优的索引对序列
Figure BDA0002112110740000036
通过所述最优的索引对序列找到源驾驶员数据中与目标驾驶员数据的对应点,获得目标驾驶员对应的其他驾驶员驾驶行为数据样本点。
进一步地,所述对应点满足以下三个约束条件:
连续条件wl+1-wl∈{(1,0),(0,1),(1,1)};
边界条件w1=(1,1),wL=(Nso,Nta),其中Nso与Nta分别为源驾驶员数据与目标驾驶员数据数量;
单调性条件wl=(i,j),wl′=(i′,j′),若l′≥l则i′≥i且j′≥j;
所述求解所有对应点之间的最小距离得到一个最优的索引对序列的公式如下:
Figure BDA0002112110740000037
进一步地,基于局部普氏分析法的不同驾驶员间数据的迁移学习具体包括:通过所述动态时间规整算法获得与目标驾驶员数据样本点
Figure BDA0002112110740000038
对应的源驾驶员数据样本点
Figure BDA0002112110740000039
基于高斯混合模型对目标驾驶员数据样本点聚类,将目标驾驶员数据样本点分为K部分
Figure BDA00021121107400000310
并通过所述动态时间规整算法获得的样本点对应关系,将源驾驶员数据样本点相应地分为K部分
Figure BDA0002112110740000041
对于每一部分样本点
Figure BDA0002112110740000042
寻找一个最优映射矩阵
Figure BDA0002112110740000043
使得映射后的源驾驶员数据样本与目标驾驶员数据样本最接近,矩阵公式如下:
Figure BDA0002112110740000044
其中,
Figure BDA0002112110740000045
Figure BDA0002112110740000046
分别为源驾驶员数据样本和目标驾驶员数据样本第k部分的协方差矩阵。
进一步地,所述目标驾驶员驾驶行为模型的建立过程包括:
通过主成分分析提取当前时刻目标驾驶员的操作信息、本车状态信息和周围环境信息,得到当前时刻状态信息低维度的特征量s作为模型输入量;将下一时刻的驾驶员操作信息a作为模型输出量;将当前时刻状态量与下一时刻驾驶员操作信息组合为训练数据x=[s,a]T
训练高斯混合模型通过最大期望算法训练得到模型,公式如下:
Figure BDA0002112110740000047
其中,K为模型的预设参数;N表示多维高斯分布,共有K个高斯成分;πk,
Figure BDA0002112110740000048
Figure BDA0002112110740000049
为训练得到的模型参数,分别表示第k个高斯成分的权重,均值,向量和协方差矩阵。
进一步地,根据所述目标驾驶员驾驶行为模型,结合目标驾驶员驾驶时实时采集的驾驶员操作信息、本车状态信息和周围环境信息,对下一时刻目标驾驶员的操作信息进行预测,具体包括:当目标驾驶员驾驶车辆时,实时采集驾驶员驾驶行为信息,通过所述建模过程中的主成分分析得到的特征提取参数,将实时驾驶员驾驶行为信息提取为与建模过程中相同维度的实时状态信息;通过对当前时刻目标驾驶员的操作信息、本车状态信息和周围环境信息进行降维和特征提取,当前的实时数据被处理为驾驶员驾驶行为模型的输入量,预测下一时刻目标驾驶员的驾驶行为。
进一步地,所述建模过程中的主成分分析提取参数的特征信息具体包括:根据采集的目标驾驶员驾驶行为数据dt(t=1…N)计算协方差矩阵:
Figure BDA0002112110740000051
其中,N是数据矢量的数量,
Figure BDA0002112110740000052
为均值矢量,由
Figure BDA0002112110740000053
计算得到;
对所述协方差矩阵进行特征值分解的公式如下:
Σui=λiui
其中,ui与λi分别是相对应的第i个特征向量与特征值;
在特征值中选择最大的D个特征值,并降序排列为λ12,…,λD,其对应的特征向量按同样的顺序组成矩阵U=[u1,u2,…,uD]T
所提取的特征信息矢量由公式
Figure BDA0002112110740000054
得到。
进一步地,所述驾驶员驾驶行为模型预测过程,具体包括:实时采集驾驶员的操作信息、本车状态信息和周围环境信息z′;将实时采集的信息经过与建模过程中相同的降维过程,处理为当前时刻状态向量s′;将当前时刻状态向量作为模型输入,通过高斯混合回归过程预测得到下一时刻驾驶员驾驶行为量
Figure BDA0002112110740000055
所述高斯混合回归过程,具体包括:将模型建立过程中训练得到的高斯混合模型参数
Figure BDA0002112110740000056
Figure BDA0002112110740000057
按照模型输入s的维度和模型输出a的维度拆分为分块矩阵:
Figure BDA0002112110740000061
依据当前时刻的状态s′,按照如下公式计算高斯混合模型中每一个高斯成分的预测量加权平均值,预测下一时刻驾驶员驾驶行为量:
Figure BDA0002112110740000062
其中,
Figure BDA0002112110740000063
表示第k个高斯成分的预测量;
Figure BDA0002112110740000064
表示当前时刻的状态量s′处于第k个高斯成分的概率。
本技术方案的有益效果如下:本发明公开了一种基于迁移学习的驾驶行为预测方法,通过充足的其他驾驶员驾驶行为数据,结合目标驾驶员的操作信息、本车状态信息和周围环境信息,将已有驾驶员驾驶行为数据迁移至目标驾驶员处,从而建立目标驾驶员驾驶行为模型,进一步预测目标驾驶员驾驶行为;这种驾驶员驾驶行为模型自适应方法,实现了数据层面的驾驶行为模型自适应,提高了驾驶员个性化驾驶行为预测的准确性,并且具有很好的实用性。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分的从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。
图1为本发明实施例的基于迁移学习的驾驶行为预测方法流程图;
图2为本发明实施例的源驾驶员与目标驾驶员之间的数据索引图;
图3为本发明实施例的源驾驶员与目标驾驶员之间方向盘转角度的数据索引图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
本发明的一个具体实施例,如图1所示,一种基于迁移学习的驾驶行为预测方法,包括以下步骤:
S1,采集目标驾驶员的操作信息、本车状态信息和周围环境信息;
S2,基于局部普氏分析法将存储的源驾驶员历史信息数据迁移至目标驾驶员处得到迁移学习的数据;
S3,根据所述迁移学习的数据并基于主成分分析法和最大期望算法训练目标驾驶员驾驶行为模型;
S4,根据所述目标驾驶员驾驶行为模型对目标驾驶员驾驶行为进行实时预测。
与现有技术相比,本实施例通过充足的其他驾驶员驾驶行为数据,结合少量目标驾驶员的操作信息、本车状态信息和周围环境信息,将已有驾驶员驾驶行为数据迁移至目标驾驶员处,从而建立目标驾驶员驾驶行为模型,进一步预测目标驾驶员驾驶行为;这种驾驶员驾驶行为模型自适应方法,实现了数据层面的驾驶行为模型自适应和个性化驾驶行为的准确预测,具有很强的实用性。
本发明的一个具体实施例,所述步骤S2中存储的源驾驶员历史信息数据包括其他驾驶员的操作信息、其他驾驶员驾驶本车时的状态信息和周围环境信息;
具体地,驾驶员操作信息包括但不限于:本车方向盘转角、方向盘角加速度,方向盘静止时间、制动踏板位置、加速踏板位置、离合器踏板位置和变速器档位;本车状态信息包括但不限于:本车速度、位置、加速度、横摆角速度、车辆相对周围车辆的速度,距离和加速度;周围环境信息包括但不限于:周围车辆速度、位置、加速度、道路曲率、道路宽度、交通标志、路标以及交通灯状态。
所述源驾驶员历史信息数据迁移至目标驾驶员处得到迁移学习的数据具体包括:找到与目标驾驶员样本点对应的其他驾驶员驾驶行为数据样本点;计算其他驾驶员驾驶行为数据到目标驾驶员驾驶行为数据的映射关系;根据所述映射关系将所有的其他驾驶员驾驶行为数据映射到目标驾驶员处。也就是说,所述源驾驶员历史信息数据迁移至目标驾驶员处的迁移学习数据,通过建立数据样本点的映射关系后,由其他驾驶员驾驶行为数据映射到目标驾驶员处。
本发明的一个具体实施例,所述找到与目标驾驶员样本点对应的其他驾驶员驾驶行为数据样本点具体包括:从目标驾驶员处采集的数据中均匀采样得到目标驾驶员驾驶行为数据样本点;根据动态时间规整算法对目标驾驶员驾驶行为数据样本点与所有的其他驾驶员驾驶行为数据进行一一计算,得到与目标驾驶员数据样本点对应的其他驾驶员驾驶行为数据样本点。也即,数据样本点映射的计算过程的核心是动态时间规整算法。
本发明的一个具体实施例,如图2所示,基于所述动态时间规整算法获得目标驾驶员对应的其他驾驶员驾驶行为数据样本点,具体包括:将驾驶员的操作信息、本车状态信息和周围环境信息组成矢量z,目标驾驶员驾驶在时刻j的数据为
Figure BDA0002112110740000091
其他驾驶员作为迁移的数据源在时刻i的数据为
Figure BDA0002112110740000092
Figure BDA0002112110740000093
Figure BDA0002112110740000094
构成对应点,则将其索引组成一个索引对wl=(i,j);
求解所有对应点之间的最小距离
Figure BDA0002112110740000095
得到一个最优的索引对序列
Figure BDA0002112110740000096
通过所述最优的索引对序列找到源驾驶员数据中与目标驾驶员数据的对应点,获得目标驾驶员对应的其他驾驶员驾驶行为数据样本点。
本发明的一个具体实施例,所述对应点满足以下三个约束条件:
连续条件wl+1-wl∈{(1,0),(0,1),(1,1)};
边界条件w1=(1,1),wL=(Nso,Nta),其中Nso与Nta分别为源驾驶员数据与目标驾驶员数据数量;
单调性条件wl=(i,j),wl′=(i′,j′),若l′≥l则i′≥i且j′≥j;
所述求解所有对应点之间的最小距离得到一个最优的索引对序列的公式如下:
Figure BDA0002112110740000097
需要说明的是,通过动态规划(DP)的方法,即动态时间规整算法可以在满足上述约束条件的情况下求得最优索引对序列,从而通过最优索引对序列找到源驾驶员数据中与目标驾驶员数据的对应点。其中,所述动态规划方法和结果分别如图2和图3所示。根据上述优化问题的约束条件中的wL=(Nso,Nta),首先确定最优索引对序列中的最后一点wL,并根据上述最优化问题及约束条件,在周围候选点中寻找最优点作为wL-1。类似地,通过此方法得到最优索引对序列wl,其中l按降序从L-1逐次减小到1,得到最优索引对序列如图2中的黑色实线所示。上述动态规划过程所得最优索引对序列,如图2所示,由于每个源驾驶员数据点与目标驾驶员数据点都出现于最优索引对序列中,故通常存在一点对应多点的情况,如图2中目标驾驶员的第32点。为满足局部普氏分析(LPA)一一对应的初始条件,取这些点的中间索引点作为唯一对应点,得到如图3所示的一一对应关系。再通过所述最优的索引对序列找到源驾驶员数据中与目标驾驶员数据的对应点。
本发明的一个具体实施例,基于局部普氏分析法的不同驾驶员间数据的迁移学习具体包括:通过所述动态时间规整算法获得与目标驾驶员数据样本点
Figure BDA0002112110740000101
对应的源驾驶员数据样本点
Figure BDA0002112110740000102
基于高斯混合模型对目标驾驶员数据样本点聚类,将目标驾驶员数据样本点分为K部分
Figure BDA0002112110740000103
并通过所述动态时间规整算法获得的样本点对应关系,将源驾驶员数据样本点相应地分为K部分
Figure BDA0002112110740000104
对于每一部分样本点
Figure BDA0002112110740000105
寻找一个最优映射矩阵
Figure BDA0002112110740000106
使得映射后的源驾驶员数据样本与目标驾驶员数据样本最接近,矩阵公式如下:
Figure BDA0002112110740000107
其中,
Figure BDA0002112110740000111
Figure BDA0002112110740000112
分别为源驾驶员数据样本和目标驾驶员数据样本第k部分的协方差矩阵。
优选地,通过左乘上述步骤得到的最优映射矩阵,所有源驾驶员数据可以通过此方式迁移至目标驾驶员处。
本发明的一个具体实施例,所述目标驾驶员驾驶行为模型的建立过程包括:
通过主成分分析提取当前时刻目标驾驶员的操作信息、本车状态信息和周围环境信息,得到当前时刻状态信息低维度的特征量s作为模型输入量;将下一时刻的驾驶员操作信息a作为模型输出量;将当前时刻状态量与下一时刻驾驶员操作信息组合为训练数据x=[s,a]T
训练高斯混合模型通过最大期望算法训练得到模型,公式如下:
Figure BDA0002112110740000113
其中,K为模型的预设参数;N表示多维高斯分布,共有K个高斯成分;πk,
Figure BDA0002112110740000114
Figure BDA0002112110740000115
为训练得到的模型参数,分别表示第k个高斯成分的权重,均值,向量和协方差矩阵。
需要说明的是,基于最大期望(EM)算法训练高斯混合模型的过程,具体包括:第一步,随机初始化高斯混合模型参数πk,
Figure BDA0002112110740000116
Figure BDA0002112110740000117
第二步,估算点xt属于第k个高斯成分的概率
Figure BDA0002112110740000118
第三步,更新高斯混合模型参数,
Figure BDA0002112110740000119
Figure BDA00021121107400001110
第四步,收敛检测,计算新的后验概率
Figure BDA0002112110740000121
将其与更新前的后验概率相比较,当Lnew-L≤δ时认为算法收敛,否则返回第二步继续更新参数。其中,δ为阈值,取接近于0的正数。
本发明的一个具体实施例,根据所述目标驾驶员驾驶行为模型,结合目标驾驶员驾驶时实时采集的驾驶员操作信息、本车状态信息和周围环境信息,对下一时刻目标驾驶员的操作信息进行预测,具体包括:当目标驾驶员驾驶车辆时,实时采集驾驶员驾驶行为信息,通过所述建模过程中的主成分分析得到的特征提取参数,将实时驾驶员驾驶行为信息提取为与建模过程中相同维度的实时状态信息;通过对当前时刻目标驾驶员的操作信息、本车状态信息和周围环境信息进行降维和特征提取,当前的实时数据被处理为驾驶员驾驶行为模型的输入量,预测下一时刻目标驾驶员的驾驶行为。
需要具体说明的是,目标驾驶员驾驶时实时采集的驾驶员操作信息包括本车方向盘转角、方向盘角加速度、方向盘静止时间、制动踏板位置、加速踏板位置、离合器踏板位置和变速器档位。
本发明的一个具体实施例,所述建模过程中的主成分分析提取参数的特征信息具体包括:根据采集的目标驾驶员驾驶行为数据dt(t=1…N)计算协方差矩阵:
Figure BDA0002112110740000122
其中,N是数据矢量的数量,
Figure BDA0002112110740000123
为均值矢量,由
Figure BDA0002112110740000124
计算得到;
对所述协方差矩阵进行特征值分解的公式如下:
Σui=λiui
其中,ui与λi分别是相对应的第i个特征向量与特征值;
在特征值中选择最大的D个特征值,并降序排列为λ12,…,λD,其对应的特征向量按同样的顺序组成矩阵U=[u1,u2,…,uD]T
所提取的特征信息矢量由公式
Figure BDA0002112110740000131
得到。
本发明的一个具体实施例,所述驾驶员驾驶行为模型预测过程,具体包括:实时采集驾驶员的操作信息、本车状态信息和周围环境信息z′;将实时采集的信息经过与建模过程中相同的降维过程,处理为当前时刻状态向量s′;将当前时刻状态向量作为模型输入,通过高斯混合回归过程预测得到下一时刻驾驶员驾驶行为量
Figure BDA0002112110740000132
所述高斯混合回归过程,具体包括:将模型建立过程中训练得到的高斯混合模型参数
Figure BDA0002112110740000133
Figure BDA0002112110740000134
按照模型输入s的维度和模型输出a的维度拆分为分块矩阵:
Figure BDA0002112110740000135
依据当前时刻的状态s′,按照如下公式计算高斯混合模型中每一个高斯成分的预测量加权平均值,预测下一时刻驾驶员驾驶行为量:
Figure BDA0002112110740000136
其中,
Figure BDA0002112110740000137
表示第k个高斯成分的预测量;
Figure BDA0002112110740000138
表示当前时刻的状态量s′处于第k个高斯成分的概率。
综上所述,本发明公开了一种基于迁移学习的驾驶行为预测方法,包括以下步骤:S1,采集目标驾驶员的操作信息、本车状态信息和周围环境信息;S2,基于局部普氏分析法将存储的源驾驶员历史信息数据迁移至目标驾驶员处得到迁移学习的数据;S3,根据所述迁移学习的数据并基于主成分分析法和最大期望算法训练目标驾驶员驾驶行为模型;S4,根据所述目标驾驶员驾驶行为模型对目标驾驶员驾驶行为进行实时预测。与现有技术相比,本发明实施例通过充足的其他驾驶员驾驶行为数据,结合少量目标驾驶员的操作信息、本车状态信息和周围环境信息,将已有驾驶员驾驶行为数据迁移至目标驾驶员处,从而建立目标驾驶员驾驶行为模型,进一步预测目标驾驶员驾驶行为;这种驾驶员驾驶行为模型自适应方法,实现了数据层面的驾驶行为模型自适应和个性化驾驶行为的准确预测,具有很强的实用性。
本领域技术人员可以理解,实现上述实施例中方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (9)

1.一种基于迁移学习的驾驶行为预测方法,其特征在于,包括以下步骤:
S1,采集目标驾驶员的操作信息、本车状态信息和周围环境信息;
S2,基于局部普氏分析法将存储的源驾驶员历史信息数据迁移至目标驾驶员处得到迁移学习的数据;
基于局部普氏分析法的不同驾驶员间数据的迁移学习具体包括:通过动态时间规整算法获得与目标驾驶员数据样本点
Figure FDA0002421889200000011
对应的源驾驶员数据样本点
Figure FDA0002421889200000012
基于高斯混合模型对目标驾驶员数据样本点聚类,将目标驾驶员数据样本点分为K部分
Figure FDA0002421889200000013
并通过所述动态时间规整算法获得的样本点对应关系,将源驾驶员数据样本点相应地分为K部分
Figure FDA0002421889200000014
对于每一部分样本点
Figure FDA0002421889200000015
寻找一个最优映射矩阵
Figure FDA0002421889200000016
使得映射后的源驾驶员数据样本与目标驾驶员数据样本最接近,矩阵公式如下:
Figure FDA0002421889200000017
其中,
Figure FDA0002421889200000018
Figure FDA0002421889200000019
分别为源驾驶员数据样本和目标驾驶员数据样本第k部分的协方差矩阵;
S3,根据所述迁移学习的数据并基于主成分分析法和最大期望算法训练目标驾驶员驾驶行为模型;
S4,根据所述目标驾驶员驾驶行为模型对目标驾驶员驾驶行为进行实时预测。
2.根据权利要求1所述的方法,其特征在于,所述步骤S2中存储的源驾驶员历史信息数据包括其他驾驶员的操作信息、其他驾驶员驾驶本车时的状态信息和周围环境信息;
所述源驾驶员历史信息数据迁移至目标驾驶员处得到迁移学习的数据具体包括:找到与目标驾驶员样本点对应的其他驾驶员驾驶行为数据样本点;计算其他驾驶员驾驶行为数据到目标驾驶员驾驶行为数据的映射关系;根据所述映射关系将所有的其他驾驶员驾驶行为数据映射到目标驾驶员处。
3.根据权利要求2所述的方法,其特征在于,所述找到与目标驾驶员样本点对应的其他驾驶员驾驶行为数据样本点具体包括:从目标驾驶员处采集的数据中均匀采样得到目标驾驶员驾驶行为数据样本点;根据动态时间规整算法对目标驾驶员驾驶行为数据样本点与所有的其他驾驶员驾驶行为数据进行一一计算,得到与目标驾驶员数据样本点对应的其他驾驶员驾驶行为数据样本点。
4.根据权利要求3所述的方法,其特征在于,基于所述动态时间规整算法获得目标驾驶员对应的其他驾驶员驾驶行为数据样本点,具体包括:将驾驶员的操作信息、本车状态信息和周围环境信息组成矢量z,目标驾驶员驾驶在时刻j的数据为
Figure FDA0002421889200000021
其他驾驶员作为迁移的数据源在时刻i的数据为
Figure FDA0002421889200000022
Figure FDA0002421889200000023
Figure FDA0002421889200000024
构成对应点,则将其索引组成一个索引对wl=(i,j);
求解所有对应点之间的最小距离
Figure FDA0002421889200000025
得到一个最优的索引对序列
Figure FDA0002421889200000026
通过所述最优的索引对序列找到源驾驶员数据中与目标驾驶员数据的对应点,获得目标驾驶员对应的其他驾驶员驾驶行为数据样本点。
5.根据权利要求4所述的方法,其特征在于,所述对应点满足以下三个约束条件:
连续条件wl+1-wl∈{(1,0),(0,1),(1,1)};
边界条件w1=(1,1),wL=(Nso,Nta),其中Nso与Nta分别为源驾驶员数据与目标驾驶员数据数量;
单调性条件wl=(i,j),wl′=(i′,j′),若l′≥l则i′≥i且j′≥j;
所述求解所有对应点之间的最小距离得到一个最优的索引对序列的公式如下:
Figure FDA0002421889200000031
6.根据权利要求1所述的方法,其特征在于,所述目标驾驶员驾驶行为模型的建立过程包括:
通过主成分分析提取当前时刻目标驾驶员的操作信息、本车状态信息和周围环境信息,得到当前时刻状态信息低维度的特征量s作为模型输入量;将下一时刻的驾驶员操作信息a作为模型输出量;将当前时刻状态量与下一时刻驾驶员操作信息组合为训练数据x=[s,a]T
训练高斯混合模型通过最大期望算法训练得到模型,公式如下:
Figure FDA0002421889200000032
其中,K为模型的预设参数;N表示多维高斯分布,共有K个高斯成分;πk,
Figure FDA0002421889200000033
Figure FDA0002421889200000034
为训练得到的模型参数,分别表示第k个高斯成分的权重,均值,向量和协方差矩阵。
7.根据权利要求1或6所述的方法,其特征在于,根据所述目标驾驶员驾驶行为模型,结合目标驾驶员驾驶时实时采集的驾驶员操作信息、本车状态信息和周围环境信息,对下一时刻目标驾驶员的操作信息进行预测,具体包括:当目标驾驶员驾驶车辆时,实时采集驾驶员驾驶行为信息,通过建模过程中的主成分分析得到的特征提取参数,将实时驾驶员驾驶行为信息提取为与建模过程中相同维度的实时状态信息;通过对当前时刻目标驾驶员的操作信息、本车状态信息和周围环境信息进行降维和特征提取,当前的实时数据被处理为驾驶员驾驶行为模型的输入量,预测下一时刻目标驾驶员的驾驶行为。
8.根据权利要求7所述的方法,其特征在于,所述建模过程中的主成分分析提取参数的特征信息具体包括:根据采集的目标驾驶员驾驶行为数据dt(t=1…N)计算协方差矩阵:
Figure FDA0002421889200000041
其中,N是数据矢量的数量,
Figure FDA0002421889200000042
为均值矢量,由
Figure FDA0002421889200000043
计算得到;
对所述协方差矩阵进行特征值分解的公式如下:
Σui=λiui
其中,ui与λi分别是相对应的第i个特征向量与特征值;
在特征值中选择最大的D个特征值,并降序排列为λ12,…,λD,其对应的特征向量按同样的顺序组成矩阵U=[u1,u2,…,uD]T
所提取的特征信息矢量由公式
Figure FDA0002421889200000044
得到。
9.根据权利要求7所述的方法,其特征在于,所述驾驶员驾驶行为模型预测过程,具体包括:实时采集驾驶员的操作信息、本车状态信息和周围环境信息z′;将实时采集的信息经过与建模过程中相同的降维过程,处理为当前时刻状态向量s′;将当前时刻状态向量作为模型输入,通过高斯混合回归过程预测得到下一时刻驾驶员驾驶行为量
Figure FDA0002421889200000051
所述高斯混合回归过程,具体包括:将模型建立过程中训练得到的高斯混合模型参数
Figure FDA0002421889200000052
Figure FDA0002421889200000053
按照模型输入s的维度和模型输出a的维度拆分为分块矩阵:
Figure FDA0002421889200000054
依据当前时刻的状态s′,按照如下公式计算高斯混合模型中每一个高斯成分的预测量加权平均值,预测下一时刻驾驶员驾驶行为量:
Figure FDA0002421889200000055
其中,
Figure FDA0002421889200000056
表示第k个高斯成分的预测量;
Figure FDA0002421889200000057
表示当前时刻的状态量s′处于第k个高斯成分的概率。
CN201910576216.5A 2019-06-28 2019-06-28 一种基于迁移学习的驾驶行为预测方法 Active CN110490275B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910576216.5A CN110490275B (zh) 2019-06-28 2019-06-28 一种基于迁移学习的驾驶行为预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910576216.5A CN110490275B (zh) 2019-06-28 2019-06-28 一种基于迁移学习的驾驶行为预测方法

Publications (2)

Publication Number Publication Date
CN110490275A CN110490275A (zh) 2019-11-22
CN110490275B true CN110490275B (zh) 2020-07-07

Family

ID=68546440

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910576216.5A Active CN110490275B (zh) 2019-06-28 2019-06-28 一种基于迁移学习的驾驶行为预测方法

Country Status (1)

Country Link
CN (1) CN110490275B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110991353A (zh) * 2019-12-06 2020-04-10 中国科学院自动化研究所 识别驾驶员驾驶行为及危险驾驶行为预警方法
CN111332278B (zh) * 2020-03-25 2021-05-11 北京理工大学 一种分布式驱动电动车辆横向稳定控制方法及***
CN113569674A (zh) * 2021-07-16 2021-10-29 深圳昌恩智能股份有限公司 一种基于智能车载终端的驾驶行为识别方法
CN113642682B (zh) * 2021-10-14 2021-12-31 北京理工大学 一种多车交互环境下的轨迹基元提取与分析方法和***
CN114154695B (zh) * 2021-11-19 2024-04-30 北京交通大学 一种基于迁移学习的城市轨道交通短时客流预测方法
CN117422169B (zh) * 2023-10-18 2024-06-25 酷哇科技有限公司 基于因果干预的车险用户驾驶行为分析与预测方法及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106952105A (zh) * 2017-04-26 2017-07-14 浙江大学 一种基于迁移学习的商铺最优化选址方法
CN107958269A (zh) * 2017-11-28 2018-04-24 江苏大学 一种基于隐马尔可夫模型的行车危险度预测方法
CN108446711A (zh) * 2018-02-01 2018-08-24 南京邮电大学 一种基于迁移学习的软件缺陷预测方法
CN108664607A (zh) * 2018-05-11 2018-10-16 国网江西省电力有限公司信息通信分公司 一种基于迁移学习的电力通信网数据质量提升方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106952105A (zh) * 2017-04-26 2017-07-14 浙江大学 一种基于迁移学习的商铺最优化选址方法
CN107958269A (zh) * 2017-11-28 2018-04-24 江苏大学 一种基于隐马尔可夫模型的行车危险度预测方法
CN108446711A (zh) * 2018-02-01 2018-08-24 南京邮电大学 一种基于迁移学习的软件缺陷预测方法
CN108664607A (zh) * 2018-05-11 2018-10-16 国网江西省电力有限公司信息通信分公司 一种基于迁移学习的电力通信网数据质量提升方法

Also Published As

Publication number Publication date
CN110490275A (zh) 2019-11-22

Similar Documents

Publication Publication Date Title
CN110490275B (zh) 一种基于迁移学习的驾驶行为预测方法
CN110386145B (zh) 一种目标驾驶员驾驶行为实时预测***
CN109624986B (zh) 一种基于模式切换的驾驶风格的学习巡航控制***及方法
CN110949398B (zh) 一种车辆编队行驶中头车驾驶员异常驾驶行为检测方法
CN106971194B (zh) 一种基于改进hmm和svm双层算法的驾驶意图识别方法
CN112162555B (zh) 混合车队中基于强化学习控制策略的车辆控制方法
CN108520155B (zh) 基于神经网络的车辆行为模拟方法
CN109109863B (zh) 智能设备及其控制方法、装置
CN112046489B (zh) 一种基于因子分析和机器学习的驾驶风格辨识算法
CN111127364B (zh) 图像数据增强策略选择方法及人脸识别图像数据增强方法
CN116767204B (zh) 基于车辆载荷的车速控制方法及其***
CN109635140B (zh) 一种基于深度学习和密度峰值聚类的图像检索方法
CN117611932B (zh) 基于双重伪标签细化和样本重加权的图像分类方法及***
CN113947259A (zh) 一种基于gru神经网络的不同风格驾驶员车速预测方法
CN116110022A (zh) 基于响应知识蒸馏的轻量化交通标志检测方法及***
CN112258557A (zh) 一种基于空间注意力特征聚合的视觉跟踪方法
CN106530330B (zh) 基于低秩稀疏的视频目标跟踪方法
CN113761715B (zh) 一种基于高斯混合和隐马尔可夫的个性化车辆跟驰模型的建立方法
CN117034090A (zh) 模型参数调整、模型应用方法、装置、设备及介质
EP4009245A1 (en) Machine learning method and machine learning device for eliminating spurious correlation
CN115860068A (zh) 基于模型量化的任务处理方法、装置、设备及存储介质
CN114162132A (zh) 一种基于主客观评价的驾驶模式识别方法
CN115577793A (zh) 一种面向网络结构的映射式蒸馏方法及其训练方法
CN114148349A (zh) 一种基于生成对抗模仿学习的车辆个性化跟驰控制方法
CN110751054B (zh) 一种异常驾驶行为的检测***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant