CN108710967A - 基于数据融合和支持向量机的高速路交通事故严重度预测方法 - Google Patents

基于数据融合和支持向量机的高速路交通事故严重度预测方法 Download PDF

Info

Publication number
CN108710967A
CN108710967A CN201810353803.3A CN201810353803A CN108710967A CN 108710967 A CN108710967 A CN 108710967A CN 201810353803 A CN201810353803 A CN 201810353803A CN 108710967 A CN108710967 A CN 108710967A
Authority
CN
China
Prior art keywords
accident
traffic accident
support vector
dimensionality reduction
variable factors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810353803.3A
Other languages
English (en)
Other versions
CN108710967B (zh
Inventor
章晨
何杰
刘子洋
邢璐
赵池航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201810353803.3A priority Critical patent/CN108710967B/zh
Publication of CN108710967A publication Critical patent/CN108710967A/zh
Application granted granted Critical
Publication of CN108710967B publication Critical patent/CN108710967B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于数据融合和支持向量机的高速路交通事故严重度预测方法,包括如下步骤:1、收集m个交通事故发生时的道路条件、驾驶员情况、车辆情况等l个变量因素,构成样本集,记录每个交通事故的严重度值ri;2、对收集到的m个事故样本的变量因素进行降维和归一化;3、应用支持向量机算法构建交通事故严重度预测模型;4、将降维后的待预测事故的变量因素向量x代入步骤3建立的交通事故严重度预测模型中,得到待预测事故的严重度预测结果。该方法能够精确地预测高速公路事故的严重度。

Description

基于数据融合和支持向量机的高速路交通事故严重度预测 方法
技术领域
本发明属于交通事故分析和预测领域,具体涉及一种基于数据融合和支持向量机的高速公路交通事故严重度预测方法。
背景技术
目前国内外对事故严重度的分析还主要停留在单一数据源和传统统计分析方法的层面,影响因素考虑较少,分析往往不透彻,模型误差较大。随着科技的进步,数据的收集正变得愈发容易。对交通事故有关的影响因素,如道路几何线型、线圈数据、天气状况、道路可见度、事故驾驶员状况等可以收集到海量的数据。如何通过科学的方法,基于对海量数据的分析使得事故的严重程度能够控制在一定的范围之内是当下亟待解决的一个重要议点。
发明内容
发明目的:本发明旨在提供一种高速路交通事故严重度预测方法,该方法能够精确地预测高速公路事故的严重度。
技术方案:本发明采用如下技术方案:
基于数据融合和支持向量机的高速路交通事故严重度预测方法,包括如下步骤:
(1)收集m个交通事故发生时的道路条件、驾驶员情况、车辆情况等l个变量因素,构成样本集S=(s1,s2,…,sm),其中si=(f1i,f2i,…,fli)T,fhi为编号为i的事故的第h个变量因素;记录每个交通事故的严重度值,ri为编号为i的事故的严重度值,h=1..l,i=1..m;
(2)对收集到的m个事故样本的变量因素进行降维和归一化,设降维后的样本si′为n维,即保留n个变量因素,n≤l,si′=(f1i′,f2i′,…,fni′)T,fki′为降维后保留的变量因素,k=1..n;
归一化处理的公式为:
xki=(fki′-MinValue)/(MaxValue-MinValue)
其中xki为变量因素fki′归一化后的值,MinValue为{fk1′,fk2′,…,fkm′}中的最小值,MaxValue为{fk1′,fk2′,…,fkm′}中的最大值;
(3)应用支持向量机算法构建交通事故严重度预测模型,所述模型为:
其中f(x)为待预测事故的严重度预测结果,x为降维后的待预测事故的变量因素向量;xj为降维归一化后的第j个事故样本,yj为样本集中第j个事故的严重度值;αj为第j个事故样本对应的拉格朗日乘子,b为截距,K(·)为核函数;
(4)将待预测事故的变量因素向量按照步骤(2)中的降维方法进行降维,得到降维后的待预测事故变量因素向量x,将x代入步骤(3)建立的交通事故严重度预测模型中,得到待预测事故的严重度预测结果。
所述道路条件包括坡度方向、平曲线方向,分别由0或1表示正或负。
所述驾驶员情况包括驾驶员年龄、驾驶员性别;其中驾驶员性别由0或1表示男或女。
所述车辆情况包括事故车辆车龄。
步骤(2)中采用主成分分析法或独立成分分析法对变量因素样本集S进行降维。
核函数K(·)为高斯核函数,表达式为:
其中σ为核函数宽度调节参数。
有益效果:与现有技术相比,本发明公开的基于数据融合和支持向量机的高速公路交通事故严重度预测方法具有以下优点:1、考虑多个数据源而非单一的事故数据源,多个数据源能够使得模型的建立更为精确,并且训练和测试的误差更小;2、运用支持向量机方法而非传统统计分析方法,传统的统计分析方法在处理多变量时运算速度慢,而且非线性部分较为复杂,逻辑不清晰。本发明提出的基于数据融合和支持向量机的高速公路交通事故严重度预测方法能够很好地解决上述问题。
附图说明
图1为本发明的总体控制流程图;
图2为事故数据集中事故月份分布图;
图3为车辆数据集中事故驾驶员年龄分布图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明的具体实施案例做说明。
本实施例采用的数据集为某市2011到2015年的事故、天气、驾驶员情况和道路条件多源数据集。如图1所示,基于数据融合和支持向量机的高速路交通事故严重度预测方法,包括如下步骤:
(1)收集m个交通事故发生时的道路条件、驾驶员情况、车辆情况等l个变量因素,构成样本集S=(s1,s2,…,sm),其中si=(f1i,f2i,…,fli)T,fhi为编号为i的事故的第h个变量因素;记录每个交通事故的严重度值,ri为编号为i的事故的严重度值,h=1..l,i=1..m;
事故发生的相关信息分别记录在原始事故数据集、驾驶员数据集中,此外道路相关信息记录在道路信息数据库中,部分原始数据展示见图2和图3。首先需要根据原始事故数据集中的记录,将多元数据集和数据库融合,包含数据清理,分类参数数值化,变量数值转化,运用数据库间共通的参数合并样本变量等步骤,具体如下:
(1-1)将原始事故数据集中的“事故编号”,“道路桩号”,“道路编号”等无关要素在样本变量中去除;将变量“天气”,“灯光”,“事故类型”中含有“0”,“未知”的样本删除;
(1-2)将变量“坡度方向”,“平曲线方向”由“正/负”转换为“1/0”;本实施例中,事故严重度按是否有人受伤分为2级,即将原始事故数据集中的变量“事故严重度”二值化,用1指代无人受伤的事故,0指代有人受伤的事故;将变量“事故车辆生产年份”转换为“事故车辆车龄”,具体转换公式:
其中,Vehyri表示编号为i的事故中事故车辆在事故发生年份的车龄,为该事故车辆的生产年份,val(yeari)指编号为i的事故发生的年份。
(1-3)通过标签“事故编号”将驾驶员数据集中的“驾驶员年龄”和“驾驶员性别”增添至事故数据集,同样通过标签“道路编号”将道路相关变量增添事故数据集,实现多元数据的融合。
本实施例中,道路条件包括坡度方向、平曲线方向,分别由0或1表示正或负;驾驶员情况包括驾驶员年龄、驾驶员性别;其中驾驶员性别由0或1表示男或女;车辆情况包括事故车辆车龄。
(2)对收集到的m个事故样本的变量因素进行降维和归一化,设降维后的样本si′为n维,即保留n个变量因素,n≤l,si′=(f1i′,f2i′,…,fni′)T,fki′为降维后保留的变量因素,k=1..n;
归一化处理的公式为:
xki=(fki′-MinValue)/(MaxValue-MinValue)
其中xki为变量因素fki′归一化后的值,MinValue为{fk1′,fk2′,…,fkm′}中的最小值,MaxValue为{fk1′,fk2′,…,fkm′}中的最大值;
可以采用主成分分析法(Principal Component Analysis,PCA)或独立成分分析法(Independent Component Analysis,ICA)对变量因素样本集S进行降维。
(3)应用支持向量机算法构建交通事故严重度预测模型,所述模型为:
其中f(x)为待预测事故的严重度预测结果,x为降维后的待预测事故的变量因素向量;xj为降维归一化后的第j个事故样本,yj为样本集中第j个事故的严重度值;αj为第j个事故样本对应的拉格朗日乘子,b为截距,K(·)为核函数;
本实施例应用SPSS modeler建立支持向量机回归分析模型,包括设立核函数、收敛精度等。核函数K(·)采用高斯核函数,表达式为:
其中σ为核函数宽度调节参数。
(4)将待预测事故的变量因素向量按照步骤(2)中的降维方法进行降维,得到降维后的待预测事故变量因素向量x,将x代入步骤(3)建立的交通事故严重度预测模型中,得到待预测事故的严重度预测结果。
本实施例将2015年的高速路交通事故数据作为测试样本,对本发明提供的交通事故严重度预测方法进行了验证,得到了较高的预测精度。

Claims (7)

1.基于数据融合和支持向量机的高速路交通事故严重度预测方法,其特征在于,包括如下步骤:
(1)收集m个交通事故发生时的道路条件、驾驶员情况、车辆情况等l个变量因素,构成样本集S=(s1,s2,…,sm),其中si=(f1i,f2i,…,fli)T,fhi为编号为i的事故的第h个变量因素;记录每个交通事故的严重度值,ri为编号为i的事故的严重度值,h=1..l,i=1..m;
(2)对收集到的m个事故样本的变量因素进行降维和归一化,设降维后的样本si′为n维,n≤l,si′=(f1i′,f2i′,…,fni′)T,fki′为降维后保留的变量因素,k=1..n;
归一化处理的公式为:
xki=(fki′-MinValue)/(MaxValue-MinValue)
其中xki为变量因素fki′归一化后的值,MinValue为{fk1′,fk2′,…,fkm′}中的最小值,MaxValue为{fk1′,fk2′,…,fkm′}中的最大值;
(3)应用支持向量机算法构建交通事故严重度预测模型,所述模型为:
其中f(x)为待预测事故的严重度预测结果,x为降维后的待预测事故的变量因素向量;xj为降维归一化后的第j个事故样本,yj为样本集中第j个事故的严重度值;αj为第j个事故样本对应的拉格朗日乘子,b为截距,K(·)为核函数;
(4)将待预测事故的变量因素向量按照步骤(2)中的降维方法进行降维,得到降维后的待预测事故变量因素向量x,将x代入步骤(3)建立的交通事故严重度预测模型中,得到待预测事故的严重度预测结果。
2.根据权利要求1所述的基于数据融合和支持向量机的高速路交通事故严重度预测方法,其特征在于,所述道路条件包括坡度方向、平曲线方向,分别由0或1表示正或负。
3.根据权利要求1所述的基于数据融合和支持向量机的高速路交通事故严重度预测方法,其特征在于,所述驾驶员情况包括驾驶员年龄、驾驶员性别;其中驾驶员性别由0或1表示男或女。
4.根据权利要求1所述的基于数据融合和支持向量机的高速路交通事故严重度预测方法,其特征在于,所述车辆情况包括事故车辆车龄。
5.根据权利要求1所述的基于数据融合和支持向量机的高速路交通事故严重度预测方法,其特征在于,步骤(2)中采用主成分分析法对变量因素样本集S进行降维。
6.根据权利要求1所述的基于数据融合和支持向量机的高速路交通事故严重度预测方法,其特征在于,步骤(2)中采用独立成分分析法对变量因素样本集S进行降维。
7.根据权利要求1所述的基于数据融合和支持向量机的高速路交通事故严重度预测方法,其特征在于,核函数K(·)为高斯核函数,表达式为:
其中σ为核函数宽度调节参数。
CN201810353803.3A 2018-04-19 2018-04-19 基于数据融合和支持向量机的高速路交通事故严重度预测方法 Active CN108710967B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810353803.3A CN108710967B (zh) 2018-04-19 2018-04-19 基于数据融合和支持向量机的高速路交通事故严重度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810353803.3A CN108710967B (zh) 2018-04-19 2018-04-19 基于数据融合和支持向量机的高速路交通事故严重度预测方法

Publications (2)

Publication Number Publication Date
CN108710967A true CN108710967A (zh) 2018-10-26
CN108710967B CN108710967B (zh) 2021-07-27

Family

ID=63867339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810353803.3A Active CN108710967B (zh) 2018-04-19 2018-04-19 基于数据融合和支持向量机的高速路交通事故严重度预测方法

Country Status (1)

Country Link
CN (1) CN108710967B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110110085A (zh) * 2019-04-24 2019-08-09 中电海康集团有限公司 基于字符级神经网络与svm的交通事故文本分类方法和***
CN113112794A (zh) * 2021-03-31 2021-07-13 四川省气象服务中心(四川省专业气象台 四川省气象影视中心) 基于时空气象网格的交通事故发生率预测方法
CN113506440A (zh) * 2021-09-08 2021-10-15 四川国蓝中天环境科技集团有限公司 一种拉格朗日坐标系下多源数据融合的交通状态估计方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271625A (zh) * 2008-04-03 2008-09-24 东南大学 集成支持向量机检测高速公路交通事件的方法
CN103646534A (zh) * 2013-11-22 2014-03-19 江苏大学 一种道路实时交通事故风险控制方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271625A (zh) * 2008-04-03 2008-09-24 东南大学 集成支持向量机检测高速公路交通事件的方法
CN103646534A (zh) * 2013-11-22 2014-03-19 江苏大学 一种道路实时交通事故风险控制方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110110085A (zh) * 2019-04-24 2019-08-09 中电海康集团有限公司 基于字符级神经网络与svm的交通事故文本分类方法和***
CN113112794A (zh) * 2021-03-31 2021-07-13 四川省气象服务中心(四川省专业气象台 四川省气象影视中心) 基于时空气象网格的交通事故发生率预测方法
CN113506440A (zh) * 2021-09-08 2021-10-15 四川国蓝中天环境科技集团有限公司 一种拉格朗日坐标系下多源数据融合的交通状态估计方法
CN113506440B (zh) * 2021-09-08 2021-11-30 四川国蓝中天环境科技集团有限公司 一种拉格朗日坐标系下多源数据融合的交通状态估计方法

Also Published As

Publication number Publication date
CN108710967B (zh) 2021-07-27

Similar Documents

Publication Publication Date Title
Yao et al. Clustering driver behavior using dynamic time warping and hidden Markov model
CN108665093A (zh) 基于深度学习的高速公路交通事故严重度预测方法
CN110132598A (zh) 旋转设备滚动轴承故障噪声诊断算法
CN106384282A (zh) 构建决策模型的方法和装置
CN111967910A (zh) 一种用户客群分类方法和装置
CN105488534A (zh) 交通场景深度解析方法、装置及***
CN104156734A (zh) 一种基于随机蕨分类器的全自主在线学习方法
DE112019001842T5 (de) Fahrzeugklassifizierung basierend auf Telematikdaten
CN108710967A (zh) 基于数据融合和支持向量机的高速路交通事故严重度预测方法
WO2024027027A1 (zh) 一种人工驾驶车辆换道意图识别方法和***
CN103679191A (zh) 基于静态图片的自动***检测方法
DE112021001181T5 (de) Iterativer Optimierungsalgorithmus zur Fusionsvorhersage mit Multiskalen von Fahrzeuggeschwindigkeit für intelligente vernetzte Fahrzeuge
Würtz et al. Driving style analysis using recurrent neural networks with LSTM cells
CN108805312B (zh) 一种相邻卡口的确定方法及装置
CN106600046A (zh) 基于多分类器融合的土地闲置预测方法及装置
Hamad et al. Predicting freeway incident duration using machine learning
Zhang et al. Surface and high-altitude combined rainfall forecasting using convolutional neural network
Yuan et al. End‐to‐end learning for high‐precision lane keeping via multi‐state model
CN114298679A (zh) 基于大数据的工业ai平台及其应用方法、介质及电子设备
CN109656808A (zh) 一种基于混合式主动学习策略的软件缺陷预测方法
Ding et al. An Extended Car‐Following Model in Connected and Autonomous Vehicle Environment: Perspective from the Cooperation between Drivers
CN105404858A (zh) 一种基于深度费舍尔网络的车型识别方法
CN113870052A (zh) 基于多输入lstm-cnn的工作票安全措施识别方法及终端
CN109376473A (zh) 车辆控制器、车辆及其续航里程的计算方法和装置
Parathasarathy et al. Using hybrid data mining algorithm for analysing road accidents data set

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant