CN108710967B - 基于数据融合和支持向量机的高速路交通事故严重度预测方法 - Google Patents

基于数据融合和支持向量机的高速路交通事故严重度预测方法 Download PDF

Info

Publication number
CN108710967B
CN108710967B CN201810353803.3A CN201810353803A CN108710967B CN 108710967 B CN108710967 B CN 108710967B CN 201810353803 A CN201810353803 A CN 201810353803A CN 108710967 B CN108710967 B CN 108710967B
Authority
CN
China
Prior art keywords
accident
severity
traffic accident
support vector
vector machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810353803.3A
Other languages
English (en)
Other versions
CN108710967A (zh
Inventor
章晨
何杰
刘子洋
邢璐
赵池航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201810353803.3A priority Critical patent/CN108710967B/zh
Publication of CN108710967A publication Critical patent/CN108710967A/zh
Application granted granted Critical
Publication of CN108710967B publication Critical patent/CN108710967B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于数据融合和支持向量机的高速路交通事故严重度预测方法,包括如下步骤:1、收集m个交通事故发生时的道路条件、驾驶员情况、车辆情况等l个变量因素,构成样本集,记录每个交通事故的严重度值ri;2、对收集到的m个事故样本的变量因素进行降维和归一化;3、应用支持向量机算法构建交通事故严重度预测模型;4、将降维后的待预测事故的变量因素向量x代入步骤3建立的交通事故严重度预测模型中,得到待预测事故的严重度预测结果。该方法能够精确地预测高速公路事故的严重度。

Description

基于数据融合和支持向量机的高速路交通事故严重度预测 方法
技术领域
本发明属于交通事故分析和预测领域,具体涉及一种基于数据融合和支持向量机的高速公路交通事故严重度预测方法。
背景技术
目前国内外对事故严重度的分析还主要停留在单一数据源和传统统计分析方法的层面,影响因素考虑较少,分析往往不透彻,模型误差较大。随着科技的进步,数据的收集正变得愈发容易。对交通事故有关的影响因素,如道路几何线型、线圈数据、天气状况、道路可见度、事故驾驶员状况等可以收集到海量的数据。如何通过科学的方法,基于对海量数据的分析使得事故的严重程度能够控制在一定的范围之内是当下亟待解决的一个重要议点。
发明内容
发明目的:本发明旨在提供一种高速路交通事故严重度预测方法,该方法能够精确地预测高速公路事故的严重度。
技术方案:本发明采用如下技术方案:
基于数据融合和支持向量机的高速路交通事故严重度预测方法,包括如下步骤:
(1)收集m个交通事故发生时的道路条件、驾驶员情况、车辆情况等l个变量因素,构成样本集S=(s1,s2,…,sm),其中si=(f1i,f2i,…,fli)T,fhi为编号为i的事故的第h个变量因素;记录每个交通事故的严重度值,ri为编号为i的事故的严重度值,h=1..l,i=1..m;
(2)对收集到的m个事故样本的变量因素进行降维和归一化,设降维后的样本si′为n维,即保留n个变量因素,n<l,si′=(f1i′,f2i′,…,fni′)T,fki′为降维后保留的变量因素,k=1..n;
归一化处理的公式为:
xki=(fki′-MinValue)/(MaxValue-MinValue)
其中xki为变量因素fki′归一化后的值,MinValue为{fk1′,fk2′,…,fkm′}中的最小值,MaxValue为{fk1′,fk2′,…,fkm′}中的最大值;
(3)应用支持向量机算法构建交通事故严重度预测模型,所述模型为:
Figure GDA0002996683510000021
其中f(x)为待预测事故的严重度预测结果,x为降维后的待预测事故的变量因素向量;xj为降维归一化后的第j个事故样本,yj为样本集中第j个事故的严重度值;αj为第j个事故样本对应的拉格朗日乘子,b为截距,K(·)为核函数;
(4)将待预测事故的变量因素向量按照步骤(2)中的降维方法进行降维,得到降维后的待预测事故变量因素向量x,将x代入步骤(3)建立的交通事故严重度预测模型中,得到待预测事故的严重度预测结果。
所述道路条件包括坡度方向、平曲线方向,分别由0或1表示正或负。
所述驾驶员情况包括驾驶员年龄、驾驶员性别;其中驾驶员性别由0或1表示男或女。
所述车辆情况包括事故车辆车龄。
步骤(2)中采用主成分分析法或独立成分分析法对变量因素样本集S进行降维。
核函数K(·)为高斯核函数,表达式为:
Figure GDA0002996683510000022
其中σ为核函数宽度调节参数。
有益效果:与现有技术相比,本发明公开的基于数据融合和支持向量机的高速公路交通事故严重度预测方法具有以下优点:1、考虑多个数据源而非单一的事故数据源,多个数据源能够使得模型的建立更为精确,并且训练和测试的误差更小;2、运用支持向量机方法而非传统统计分析方法,传统的统计分析方法在处理多变量时运算速度慢,而且非线性部分较为复杂,逻辑不清晰。本发明提出的基于数据融合和支持向量机的高速公路交通事故严重度预测方法能够很好地解决上述问题。
附图说明
图1为本发明的总体控制流程图;
图2为事故数据集中事故月份分布图;
图3为车辆数据集中事故驾驶员年龄分布图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明的具体实施案例做说明。
本实施例采用的数据集为某市2011到2015年的事故、天气、驾驶员情况和道路条件多源数据集。如图1所示,基于数据融合和支持向量机的高速路交通事故严重度预测方法,包括如下步骤:
(1)收集m个交通事故发生时的道路条件、驾驶员情况、车辆情况等l个变量因素,构成样本集S=(s1,s2,…,sm),其中si=(f1i,f2i,…,fli)T,fhi为编号为i的事故的第h个变量因素;记录每个交通事故的严重度值,ri为编号为i的事故的严重度值,h=1..l,i=1..m;
事故发生的相关信息分别记录在原始事故数据集、驾驶员数据集中,此外道路相关信息记录在道路信息数据库中,部分原始数据展示见图2和图3。首先需要根据原始事故数据集中的记录,将多元数据集和数据库融合,包含数据清理,分类参数数值化,变量数值转化,运用数据库间共通的参数合并样本变量等步骤,具体如下:
(1-1)将原始事故数据集中的“事故编号”,“道路桩号”,“道路编号”等无关要素在样本变量中去除;将变量“天气”,“灯光”,“事故类型”中含有“0”,“未知”的样本删除;
(1-2)将变量“坡度方向”,“平曲线方向”由“正/负”转换为“1/0”;本实施例中,事故严重度按是否有人受伤分为2级,即将原始事故数据集中的变量“事故严重度”二值化,用1指代无人受伤的事故,0指代有人受伤的事故;将变量“事故车辆生产年份”转换为“事故车辆车龄”,具体转换公式:
Figure GDA0002996683510000031
其中,Vehyri表示编号为i的事故中事故车辆在事故发生年份的车龄,
Figure GDA0002996683510000041
为该事故车辆的生产年份,val(yeari)指编号为i的事故发生的年份。
(1-3)通过标签“事故编号”将驾驶员数据集中的“驾驶员年龄”和“驾驶员性别”增添至事故数据集,同样通过标签“道路编号”将道路相关变量增添事故数据集,实现多元数据的融合。
本实施例中,道路条件包括坡度方向、平曲线方向,分别由0或1表示正或负;驾驶员情况包括驾驶员年龄、驾驶员性别;其中驾驶员性别由0或1表示男或女;车辆情况包括事故车辆车龄。
(2)对收集到的m个事故样本的变量因素进行降维和归一化,设降维后的样本si′为n维,即保留n个变量因素,n<l,si′=(f1i′,f2i′,…,fni′)T,fki′为降维后保留的变量因素,k=1..n;
归一化处理的公式为:
xki=(fki′-MinValue)/(MaxValue-MinValue)
其中xki为变量因素fki′归一化后的值,MinValue为{fk1′,fk2′,…,fkm′}中的最小值,MaxValue为{fk1′,fk2′,…,fkm′}中的最大值;
可以采用主成分分析法(Principal Component Analysis,PCA)或独立成分分析法(Independent ComponentAnalysis,ICA)对变量因素样本集S进行降维。
(3)应用支持向量机算法构建交通事故严重度预测模型,所述模型为:
Figure GDA0002996683510000042
其中f(x)为待预测事故的严重度预测结果,x为降维后的待预测事故的变量因素向量;xj为降维归一化后的第j个事故样本,yj为样本集中第j个事故的严重度值;αj为第j个事故样本对应的拉格朗日乘子,b为截距,K(·)为核函数;
本实施例应用SPSS modeler建立支持向量机回归分析模型,包括设立核函数、收敛精度等。核函数K(·)采用高斯核函数,表达式为:
Figure GDA0002996683510000043
其中σ为核函数宽度调节参数。
(4)将待预测事故的变量因素向量按照步骤(2)中的降维方法进行降维,得到降维后的待预测事故变量因素向量x,将x代入步骤(3)建立的交通事故严重度预测模型中,得到待预测事故的严重度预测结果。
本实施例将2015年的高速路交通事故数据作为测试样本,对本发明提供的交通事故严重度预测方法进行了验证,得到了较高的预测精度。

Claims (7)

1.基于数据融合和支持向量机的高速路交通事故严重度预测方法,其特征在于,包括如下步骤:
(1)收集m个交通事故发生时的道路条件、驾驶员情况、车辆情况等l个变量因素,构成样本集S=(s1,s2,…,sm),其中si=(f1i,f2i,…,fli)T,fhi为编号为i的事故的第h个变量因素;记录每个交通事故的严重度值,ri为编号为i的事故的严重度值,h=1..l,i=1..m;
(2)对收集到的m个事故样本的变量因素进行降维和归一化,设降维后的样本si′为n维,n<l,si′=(f1i′,f2i′,…,fni′)T,fki′为降维后保留的变量因素,k=1..n;
归一化处理的公式为:
xki=(fki′-MinValue)/(MaxValue-MinValue)
其中xki为变量因素fki′归一化后的值,MinValue为{fk1′,fk2′,…,fkm′}中的最小值,MaxValue为{fk1′,fk2′,…,fkm′}中的最大值;
(3)应用支持向量机算法构建交通事故严重度预测模型,所述模型为:
Figure FDA0002996683500000011
其中f(x)为待预测事故的严重度预测结果,x为降维后的待预测事故的变量因素向量;xj为降维归一化后的第j个事故样本,yj为样本集中第j个事故的严重度值;αj为第j个事故样本对应的拉格朗日乘子,b为截距,K(·)为核函数;
(4)将待预测事故的变量因素向量按照步骤(2)中的降维方法进行降维,得到降维后的待预测事故变量因素向量x,将x代入步骤(3)建立的交通事故严重度预测模型中,得到待预测事故的严重度预测结果。
2.根据权利要求1所述的基于数据融合和支持向量机的高速路交通事故严重度预测方法,其特征在于,所述道路条件包括坡度方向、平曲线方向,分别由0或1表示正或负。
3.根据权利要求1所述的基于数据融合和支持向量机的高速路交通事故严重度预测方法,其特征在于,所述驾驶员情况包括驾驶员年龄、驾驶员性别;其中驾驶员性别由0或1表示男或女。
4.根据权利要求1所述的基于数据融合和支持向量机的高速路交通事故严重度预测方法,其特征在于,所述车辆情况包括事故车辆车龄。
5.根据权利要求1所述的基于数据融合和支持向量机的高速路交通事故严重度预测方法,其特征在于,步骤(2)中采用主成分分析法对变量因素样本集S进行降维。
6.根据权利要求1所述的基于数据融合和支持向量机的高速路交通事故严重度预测方法,其特征在于,步骤(2)中采用独立成分分析法对变量因素样本集S进行降维。
7.根据权利要求1所述的基于数据融合和支持向量机的高速路交通事故严重度预测方法,其特征在于,核函数K(·)为高斯核函数,表达式为:
Figure FDA0002996683500000021
其中σ为核函数宽度调节参数。
CN201810353803.3A 2018-04-19 2018-04-19 基于数据融合和支持向量机的高速路交通事故严重度预测方法 Active CN108710967B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810353803.3A CN108710967B (zh) 2018-04-19 2018-04-19 基于数据融合和支持向量机的高速路交通事故严重度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810353803.3A CN108710967B (zh) 2018-04-19 2018-04-19 基于数据融合和支持向量机的高速路交通事故严重度预测方法

Publications (2)

Publication Number Publication Date
CN108710967A CN108710967A (zh) 2018-10-26
CN108710967B true CN108710967B (zh) 2021-07-27

Family

ID=63867339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810353803.3A Active CN108710967B (zh) 2018-04-19 2018-04-19 基于数据融合和支持向量机的高速路交通事故严重度预测方法

Country Status (1)

Country Link
CN (1) CN108710967B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110110085A (zh) * 2019-04-24 2019-08-09 中电海康集团有限公司 基于字符级神经网络与svm的交通事故文本分类方法和***
CN113112794A (zh) * 2021-03-31 2021-07-13 四川省气象服务中心(四川省专业气象台 四川省气象影视中心) 基于时空气象网格的交通事故发生率预测方法
CN113506440B (zh) * 2021-09-08 2021-11-30 四川国蓝中天环境科技集团有限公司 一种拉格朗日坐标系下多源数据融合的交通状态估计方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271625A (zh) * 2008-04-03 2008-09-24 东南大学 集成支持向量机检测高速公路交通事件的方法
CN103646534A (zh) * 2013-11-22 2014-03-19 江苏大学 一种道路实时交通事故风险控制方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271625A (zh) * 2008-04-03 2008-09-24 东南大学 集成支持向量机检测高速公路交通事件的方法
CN103646534A (zh) * 2013-11-22 2014-03-19 江苏大学 一种道路实时交通事故风险控制方法

Also Published As

Publication number Publication date
CN108710967A (zh) 2018-10-26

Similar Documents

Publication Publication Date Title
CN108665093B (zh) 基于深度学习的高速公路交通事故严重度预测方法
CN108710967B (zh) 基于数据融合和支持向量机的高速路交通事故严重度预测方法
CN108417033B (zh) 基于多维因素的高速路交通事故分析预测方法
CN107330463B (zh) 基于cnn多特征联合和多核稀疏表示的车型识别方法
CN111160401B (zh) 一种基于均值漂移和XGBoost的异常用电判别方法
CN105374209B (zh) 一种城市区域路网运行状态特征信息提取方法
CN111126868B (zh) 一种道路交通事故发生风险确定方法及***
WO2024027027A1 (zh) 一种人工驾驶车辆换道意图识别方法和***
CN116631186B (zh) 基于危险驾驶事件数据的高速公路交通事故风险评估方法、***
CN111784017A (zh) 一种基于路况因素回归分析的公路交通事故数量预测方法
CN114139624A (zh) 一种基于集成模型挖掘时间序列数据相似性信息的方法
CN113313357A (zh) 一种基于高斯过程回归分析的交通道路安全评价方法
CN108985941A (zh) 一种结合新闻文本的股票智能预测方法
CN104680185A (zh) 基于边界点重分类的高光谱图像分类方法
CN116468935A (zh) 一种基于多核卷积网络的交通标志阶梯式分类识别方法
Zhang et al. Kalman Filter-Based CNN-BiLSTM-ATT Model for Traffic Flow Prediction.
CN115271565B (zh) 基于dea的高速公路路面养护措施评价方法、装置及设备
CN111626508B (zh) 基于xgboost模型的轨道交通车载数据预测方法
CN110083637B (zh) 一种面向桥梁病害评级数据的去噪方法
CN113591780A (zh) 一种驾驶员行车风险鉴定方法及***
Xi et al. Classification and recognition model for the severity of road traffic accidents
Yaghoubi et al. Model-based clustering (MBC) for road data via multivariate mixture of normal distributions and factor analysis (FA)
CN111078882A (zh) 一种文本情感测量方法和装置
CN111554087B (zh) 一种高速公路堵塞的预警方法
CN117574982B (zh) 一种基于线性变换的预训练模型微调方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant