CN109034264B

CN109034264B - 交通事故严重性预测csp-cnn模型及其建模方法

Info

Publication number: CN109034264B
Application number: CN201810930337.0A
Authority: CN
Inventors: 李彤; 郑明�; 朱锐
Original assignee: Yunnan University YNU
Current assignee: Yunnan University YNU
Priority date: 2018-08-15
Filing date: 2018-08-15
Publication date: 2021-11-19
Anticipated expiration: 2038-08-15
Also published as: CN109034264A

Abstract

本发明公开了一种交通事故严重性预测CSP‑CNN模型及其建模方法。CSP‑CNN模型包括模型输入层，模型输入层输入交通事故数据转换的交通事故数据灰度图像集，并对其输入卷积层进行卷积计算，得到最后一个卷积层提取的特征向量，并将该特征向量输入至全连接层；全连接层对输入的特征向量进行flatten操作，将其转换成一维向量后进行线性处理，全连接层包含3个隐藏单元，输出3个线性处理结果至模型输出层；模型输出层设置3个交通事故严重性等级，并利用Softmax激活函数对交通事故严重性进行预测。本发明充分考虑了交通事故特征之间的时空关系、组合关系及更深层次的内在关系，并对交通事故严重性进行了预测。

Description

交通事故严重性预测CSP-CNN模型及其建模方法

技术领域

本发明属于数据挖掘技术领域，特别是涉及一种基于深度学习的交通事故严重性预测模型及其建模方法。

背景技术

每年，全世界超过125万人的人生因道路交通事故而终止，还有2000万至5000万人受到非致命伤害，其中许多因此而残疾。道路交通伤害给个人、家庭和整个国家带来巨大经济损失，道路交通碰撞的损失占大多数国家国内生产总值的3％。

事故严重性预测是事故管理的重要步骤之一，它为应急人员评估事故的严重性、评估事故的潜在影响、实施有效的事故管理程序提供了重要信息。由于正确预测交通事故严重性的工作将会对拯救那些事故中的生命提供了极其重要的帮助，因此，交通事故严重性的预测问题可以说是当前智能交通***领域的一大挑战。

目前交通事故严重性预测方法可分为统计学***均绝对误差(MAE)和平方误差总和(SSE)选择最佳拟合模型。实验结果表明，MLP的R最高值约为0.87，表明MLP提供了最佳预测结果。Zeng,Q.and Huang,H.,发表的名称为“A Stable andOptimized Neural Network Model for Crash Injury Severity Prediction”,AccidentAnalysis&Prevention,2014,73,351-358提出了一种凸组合(CC)方法来快速和稳定地训练用于交通事故严重性预测的神经网络(NN)模型以及经改良的NN剪枝用于函数逼近(N2PFA)方法来优化网络结构，并将它们与由传统反向传播(BP)方法和有序逻辑(OL)模型训练的NN进行比较，结果表明，CC方法在收敛能力和训练速度上优于BP方法。与完全连接的NN相比，优化的NN包含少得多的网络节点并且具有几乎差不多的分类准确度。它们都比OL模型具有更好的拟合和预测性能，这再次证明了神经网络在预测交通事故严重性方面优于统计模型。Sameen等，发表的名称为“Severity Prediction of Traffic Accidents withRecurrent Neural Networks”,Applied Sciences,2017,7,(6)通过循环神经网络(LSTM-RNN)，对2009年至2015年期间马来西亚南北高速公路发生的1130起交通事故进行分析并应用于交通事故严重性的预测。他们的实验结果表明，与MLP和贝叶斯逻辑回归(BLR)模型相比，LSTM-RNN模型优于MLP和BLR模型，LSTM-RNN模型的验证准确率为71.77％，而MLP和BLR模型分别达到65.48％和58.30％。

现在，CNN已经成为众多科学领域的研究热点之一，它是一种快速有效的前馈神经网络，被广泛应用于计算机视觉、图像识别以及语音识别领域并取得显著成果。CNN在特征提取方面具有如下特点：第一，CNN中的卷积层是局部连接还不是全连接的，这表示输出神经元只与局部相邻的输入神经元相连接；第二，CNN中的另一种层结构，池化层，它仅仅选择性地从接受区域中选择显著的特征，这大大减少了模型的参数规模；第三，全连接层只在CNN的最后阶段使用。影响交通事故严重性的因素主要包括以下五大特征：路面特征，事故特征，车辆特征，驾驶员特征以及环境因素。然而，以上相关工作并没有详细去考虑并挖掘这些影响交通事故伤亡严重性的特征之间的空间、组合和更深层次的内在关系。

发明内容

本发明的目的在于提供一种交通事故严重性预测模型及其建模方法，依据交通事故特征的重要性将交通事故数据集转化为灰度图像形式，构造基于深度学习的交通事故严重性预测CSP-CNN模型，提取交通事故伤亡严重性特征之间的空间、组合及更深层次的内在关系，对交通事故伤亡严重性进行预测。

本发明所采用的技术方案是，交通事故严重性预测CSP-CNN模型，由以下四个部分组成：模型输入层、卷积层、全连接层以及模型输出层；

所述模型输入层，用于输入交通事故数据灰度图像集，并为卷积层提供输入；

所述卷积层，用于从输入的交通事故数据集灰度图像中提取交通事故数据集的抽象特征；

所述全连接层，用于将最后一个卷积层提取和学习的交通事故数据集的特征向量转换成一维向量后，基于该一维向量进行线性处理，并输出线性处理结果；

所述模型输出层，用于对全连接层的输出利用Softmax激活函数预测交通事故严重性；

其中，所述卷积层有4个，每个卷基层设置256个filters，卷积核大小kernel size＝3，歩长stride＝1，补0参数pad＝1；

所述全连接层包含1个flatten层和128个隐藏单元；

所述模型输出层，即softmax全连接层，包含3个隐藏单元。

交通事故严重性预测CSP-CNN模型的建模方法，具体步骤如下：

步骤一：基于交通事故特征的重要性将交通事故数据转换成交通事故数据灰度图像集，并将其输入至模型输入层，交通事故严重性预测模型CSP-CNN的输入数学形式表达如下：

其中，d表示交通事故数据集x的索引，N表示交通事故数据集x的总数，PC为交通事故数据集x的父特征个数，CC为所有交通事故数据集x的父特征下最大的子特征个数，max(PC,CC)表示PC和CC两者的最大值，P_MM表示交通事故数据集的灰度图像像素矩阵x_d中的第M行M列的像素；

步骤二:卷积计算：对模型输入层提供的输入使用激活函数ReLU进行卷积计算，激活函数ReLU为：

g(h)＝max(0,h)； (2)

其中，h为卷积神经元的输入；

卷积计算公式为：

其中：a_k，l表示卷积层Feature Map的第k行第l列元素，其中，e和f的取值范围为[1,F]；C是信道个数，其与卷积层的filter个数相同；F是filter的大小，filter的宽度和高度相同；w_c，e，f表示第c个信道filter的第e行第f列权重；p_c,k,l表示输入图像的第c个信道灰度图像的第k行第l列的像素元素；p_c,k+e,l+f表示输入图像的第c个信道灰度图像的第k+e行第l+f列的像素元素；w_b表示filter的偏置项，每次模型运行时，随机初始化w_b；

为卷积神经元的输入；

步骤三：全连接层计算：将最后一个卷积层提取和学习的特征向量使用下列公式经过flatten操作转变成一维向量作为全连接层的输入：

a^flatten＝flatten([a₁,a₂,...,a_c]),c∈[1,C]； (4)

其中，a^flatten表示转变的一维向量，即为flatten后的全连接层的Feature Map；[a₁，a₂，…，a_c]为最后一个卷积层的输出，即为最后一个卷积层提取和学习的特征向量[Feature Map1,Feature Map2,…,FeatureMapc]；

全连接层的计算公式如下：

其中：

表示全连接层的线性输出，w_fl表示全连接层的权重，b_fl表示全连接层的偏置项；

步骤四：交通事故严重性预测：设置交通事故严重等级为轻微交通事故或严重交通事故或致命交通事故三类，模型输出层依据全连接层的输出

利用Softmax激活函数预测交通事故严重性，输出为设置的交通事故等级的概率值，概率值最大的交通事故等级即为预测的交通事故严重性；

步骤五：对交通事故严重性预测CSP-CNN模型进行训练，确认CSP-CNN模型超参数组合。

所述步骤一中基于交通事故特征的重要性将交通事故数据转换成交通事故数据灰度图像集实现过程如下：

步骤1：获取经过预处理的交通事故数据集的特征矩阵FM；

步骤2：依据原始交通事故数据集的总条数分配k个线程，针对每一个线程，将交通事故数据集的特征矩阵FM中相应的特征向量FV转换为灰度图像；

步骤3：将每一个线程得到的特征向量FV转换的灰度图像grayImage存储在灰度图链表grayImageList中，并返回灰度图像grayImage。

所述步骤1中交通事故数据集预处理的步骤如下：

(1)对不完整、错误和重复的交通事故数据进行删除，并对影响交通事故伤亡严重性的子特征进行删减；

(2)交通事故数据集归一化，去除数据的单位限制，将数据转化为无量纲的纯数值：利用统计学中的标准化方法Z-score Normalization对交通事故数据集x进行归一化，得到数据符号标准正态分布，Z-score Normalization的转化函数为：

其中，x^*代表单个特征下的某个数据，u为单个特征下所有数据的均值，σ为单个特征下所有数据的标注差；依次对交通事故数据集x中的每个特征分别进行计算。

所述步骤1中获取交通事故数据集的特征矩阵FM，具体步骤如下：

步骤1.1.依据是否与交通事故严重性预测相关确定原始交通事故数据集中某条数据的所有父特征fp：

fp＝{fp₁，…，fp_m}； (7)

其中，m表示原始交通事故数据集中某条数据的父特征的数量；

步骤1.2.获取数据预处理确认的原始交通事故数据集中某条数据的所有子特征fc：

其中，i∈[1，m]，j∈[1，n]，fc_i,j表示原始交通事故数据集中某条数据的第j个子特征，且该子特征的父特征为fp_i，并满足：

且

其中i≠j，即每个子特征属于且只属于1个父特征；第i个父特征的子特征数记为Np_i＝|fp_i|；

步骤1.3.确定原始交通事故数据集中某条数据的所有子特征的重要性权值向量wc：

wc＝(w_1,1，…，w_i,j)； (9)

其中，w_i，j表示原始交通事故数据集中某条数据的第j个子特征的重要性权值，且该子特征属于父特征fp_i；

步骤1.4.确定交通事故数据集中某条数据的特征向量FV，其为交通事故数据集中某条数据特征的表达形式，是一个三元组：

FV＝<fp,fc,wc>； (10)

步骤1.5.确定交通事故数据集的特征矩阵FM，其为交通事故数据集所有数据特征的表达形式，是一个特征向量的集合：

FM＝{FV₁,...,FV_k}，且FM∈R^k×n； (11)

其中，k表示原始交通事故数据集的总条数，n表示原始交通事故数据集中某条数据的子特征的数量，R^k×n表示一个k×n的矩阵。

所述步骤2中将交通事故数据集中某条数据的特征向量FV转换为灰度图像，具体包括如下步骤：

步骤2.1.归类原始交通事故数据集特征：依据交通事故数据集中某条数据的特征向量FV，将其n个子特征分别归类至相应的m个父特征中，同时初始化所有子特征fc的重要性权值向量wc；

步骤2.2.查找所有的父特征fp，找到包含子特征个数最多的父特征，并返回该父特征的子特征个数；

步骤2.3.将上述返回的子特征个数与m进行比较，两者的最大值被定义为max_dim，然后初始化一个全零矩阵Mat^{max_dim×max_dim}作为最终的交通事故数据集储存单元；

步骤2.4.根据原始交通事故数据集对全零矩阵Mat^{max_dim×max_dim}进行填充；

步骤2.5.调用图形处理的Reshap函数，给全零矩阵Mat^{max_dim×max_dim}增加一个信道，将其转换为灰度图像grayImage。

所述步骤2.4中根据原始交通事故数据集对全零矩阵Mat^{max_dim×max_dim}进行填充的具体步骤如下：

步骤2.4.1.父特征降序排列：根据每个父特征的权值wp，对所有的父特征fp进行降序排列，某个父特征的权值wp_i等于其下所有子特征的重要性权值w_i,j之和，即wp_i＝Σw_i，j；

步骤2.4.2.Mat^{max_dim×max_dim}行填充：根据每个父特征的权值wp，将所有降序排列的父特征fp由最中间向上下两边按照“上大于下”的原则外延递减填充；

步骤2.4.3.子特征降序排列：根据每个父特征下的子特征的重要性权值w_i,j，对其下的子特征进行降序排列；

步骤2.4.4.Mat^{max_dim×max_dim}列填充：在全零矩阵Mat^{max_dim×max_dim}对应的行里，即在每个父特征里，将其下所有降序排列的子特征按照“左大于右”的原则，进行列填充；

步骤2.4.5.保持全零矩阵Mat^{max_dim×max_dim}其余单元值为“0”不变，得到最终的结果矩阵。

所述原始交通事故数据集中某条数据的父特征的数量m＝5；所述原始交通事故数据集中某条数据的子特征的数量n＝12；

fp＝{事故特征₁，路面特征₂，环境因素₃，车辆特征₄，驾驶员特征₅}；

fc＝{东向位置_1,1，北向位置_1,2，1号公路类别_1,3，事故发生时间_1,4，事故涉及的车辆数量_1,5，路面情况_2,6，照明情况_3,7，天气情况_3,8，车辆类型_4,9，伤亡类别_5,10，伤亡性别_5,11，伤亡年龄_5,12}。

所述步骤1.3中确定原始交通事故数据集中某条数据的所有子特征的重要性权值向量wc，是采用XGBoost方法对交通事故数据集12个子特征进行1000次迭代得到。

所述步骤五中CSP-CNN模型超参数组合为：批量大小＝128，损失函数为Categorical crossentropy，优化器为Adagrad(梯度下降优化器)，学习率为0.001，误差项为1e-07，初始化卷积核采用Glorot正态分布初始化方法(glorot_normal)。

本发明的有益效果是：

(1)首次提出了基于交通事故特征的重要性将交通事故数据转换成灰度图像集的方法；

(2)首次将交通事故数据转换为灰度图像集并作为深度学习模型的输入来预测交通事故严重性；

(3)根据基于交通事故特征的重要性将交通事故数据转换成灰度图像集的方法和所提出的CSP-CNN模型，充分考虑了交通事故特征之间的时空关系、组合关系及更深层次的内在关系，并对交通事故严重性进行了预测。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是交通事故严重性预测CSP-CNN模型的结构示意图；

图2是英国利兹市2009-2016年的交通事故数据集伤亡严重性分布图；

图3是交通事故数据集子特征重要性分布；

图4是交通事故数据集中某条数据的特征向量转换为灰度图像过程示意图；

图5是不同深度下CSP-CNN模型的正确率；

图6是不同模型实验下的准确率；

图7是局部感知交通事故数据集；

图8(a)是轻微交通事故测试集下不同模型预测的精确率、召回率和F1 Score折线图；

图8(b)是严重交通事故测试集下不同模型预测的精确率、召回率和F1 Score折线图；

图8(c)是致命交通事故测试集下不同模型预测的精确率、召回率和F1 Score折线图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

预测交通事故伤亡的严重性，必须综合考虑具有特征信息的交通事故数据集，已知影响交通事故严重性的因素主要包括以下五个父特征：路面特征，事故特征，车辆特征，驾驶员特征以及环境因素，本文基于上述影响交通事故伤亡严重性的五个父特征，对将交通事故数据集转化为灰度图像形式的方法和CSP-CNN模型进行详细阐述。

将交通事故数据集中某条数据的特征向量FV基于交通事故特征的重要性将交通事故数据转换成灰度图像集实现过程如下：

步骤一：获取交通事故数据集的特征矩阵FM；

步骤二：依据原始交通事故数据集的总条数分配k个线程，针对每一个线程，对交通事故数据集的特征矩阵FM中相应的特征向量FV进行灰度图像转换；

步骤三：将每一个线程得到的特征向量FV转换的灰度图像grayImage存储在灰度图链表grayImageList中，并返回灰度图像grayImage。

获取交通事故数据集的特征矩阵FM，具体步骤如下：

fp＝{fp₁，…，fp_m}； (7)

步骤1.2.依据是否与交通事故严重性预测相关确定原始交通事故数据集中某条数据的所有子特征fc：

其中，i∈[1，m]，j∈[1，n]，fc_i，j表示原始交通事故数据集中某条数据的第j个子特征，且该子特征的父特征为fp_i，并满足：

且

wc＝(w_1,1，…，w_i,j)； (9)

FV＝<fp,fc,wc>； (10)

FM＝{FV₁,...,FV_k}，且FM∈R^k×n (11)

将交通事故数据集中某条数据的特征向量FV转换为灰度图像，具体包括如下步骤：

步骤1.归类原始交通事故数据集特征：依据交通事故数据集中某条数据的特征向量FV，将其n个子特征分别归类至相应的m个父特征中，同时初始化所有子特征fc的重要性权值向量wc；

步骤2.查找所有的父特征fp，找到包含子特征个数最多的父特征，并返回该父特征的子特征个数；

步骤3.将上述返回的子特征个数与m进行比较，两者的最大值被定义为max_dim，然后初始化一个全零矩阵Mat^{max_dim×max_dim}作为最终的交通事故数据集储存单元；

步骤4.根据原始交通事故数据集对全零矩阵Mat^{max_dim×max_dim}进行填充；

步骤5.调用图形处理的Reshap函数，给全零矩阵Mat^{max_dim×max_dim}增加一个信道，将其转换为灰度图像grayImage。

根据原始交通事故数据集对全零矩阵Mat^{max_dim×max_dim}进行填充的步骤如下：

步骤4.1.父特征降序排列：根据每个父特征的权值wp，对所有的父特征fp进行降序排列，某个父特征的权值wp_i等于其下所有子特征的重要性权值w_i，j之和，即wp_i＝Σw_i，j；

步骤4.2.Mat^{max_dim×max_dim}行填充：根据每个父特征的权值wp，将所有降序排列的父特征fp由最中间向上下两边按照“上大于下”的原则外延递减填充；如全零矩阵Mat^max ^{_dim×max_dim}的行数为奇数，则权值最大的父特征被放置在最中间一行，权值第二大的父特征将被置入最中间一行的上一行，权值第三大的父特征将被置入最中间一行上面第二行，最中间一行的上面填充完成后，继续从最中间一行的下一行填充，如此递减填充；如全零矩阵Mat^{max_dim×max_dim}的行数为偶数，则权值最大的父特征被放置在最中间两行中上边的一行，权值第二大的父特征将被置入最中间两行中下边的一行；

步骤4.3.子特征降序排列：由于当前每个父特征所包含的子特征是无序的，进而在以上步骤完成后，同样需要根据每个父特征下的子特征的重要性权值w_i，j，对其下的子特征进行降序排列；

步骤4.4.Mat^{max_dim×max_dim}列填充：在全零矩阵Mat^{max_dim×max_dim}对应的行里，即在每个父特征里，将其下所有降序排列的子特征按照“左大于右”的原则，进行列填充；如第2大的父特征下可能存在3个子特征，第2大的父特征置于全零矩阵Mat^{max_dim×max_dim}的第二行，那么此时，这三个子特征将分别置于矩阵的(2，3)，(2，2)，(2，4)单元；

步骤4.5.保持全零矩阵Mat^{max_dim×max_dim}其余单元值为“0”不变，得到最终的结果矩阵。

本发明的交通事故数据集中某条数据的特征向量FV中，m＝5，n＝12：

fc＝{东向位置_1,1，北向位置_1,2，1号公路类别_1,3，事故发生时间_1,4，事故涉及的车辆数量_1,5，路面情况_2,6，照明情况_3,7，天气情况_3,8，车辆类型_4,9，伤亡类别_5,10，伤亡性别_5,11，伤亡年龄_5,12}；

wc＝(0.165774538_1,1，0.171530785_1,2，0.082228259_1,3，0.047771472_1,4，0.060763375_1,5，0.048847406_2,6，0.041826936_3,7，0.04354843_3,8，0.126314657_4,9，0.067057589_5,10，0.049116389_5,11，0.095220163_5,12)。

建立交通事故严重性预测CSP-CNN模型

由于CNN是有其独特的图像关键特征的提取方法，使得CNN在图像识别和理解方面表现出了较强的学习能力。与其他深度学习模型相比，CNN具有两个独特的特征：局部连接和权值共享。局部连接指的是每个神经元仅与输入神经元的一块称作感受野的区域连接，而权值共享指的是提取图像特征神经元采用的滤波器是共享的。这两个独特的特征共同决定了CNN的参数相比较其他深度学习模型较少。

为了适应交通环境，本文提出CSP-CNN模型。与传统的CNN模型相比在以下几个方面具有特异性：(1)模型的输入不同，即CSP-CNN模型输入的交通事故图像只有一个通道，即灰度图，它本质上是一个像素矩阵，并且像素值范围从0到交通事故特征标准化后的数值。相反，在图像识别和分类问题中的CNN模型中，输入图像通常具有三个通道，即RGB，并且像素值的范围是从0到255；(2)从12个父特征中，根据本文选取的5个父特征：事故特征、路面特征、环境因素、车辆特征及驾驶员特征，将其转换为矩阵时，矩阵维度为5x5，对其进行向下采样操作会破坏本来就不多的交通事故伤亡严重性的特征信息，因此，CSP-CNN中并没有传统CNN模型中的向下采样操作(池化层Pooling)；(3)模型输出是不同的，在交通环境中，CSP-CNN的输出是交通事故伤亡严重性的预测，而在图像识别和分类问题中，CNN的输出是图像类别标签。

如图1所示，设置卷积核大小kernel size＝3，歩长stride＝1，补0参数pad＝1，交通事故严重性预测CSP-CNN模型的结构包含了四个主要部分：模型的输入、卷积层、全连接层以及模型输出层。

首先，CSP-CNN的输入为基于交通事故特征的重要性对交通事故数据进行转换所得交通事故数据集灰度图像，它包含了交通事故的5个父特征和12个子特征。相应地，模型的输入数学形式表达如下：

其中，d表示交通事故数据集x的索引，N表示交通事故数据集的总数，PC为交通事故数据集的父特征个数，CC为所有父特征下最大的子特征个数，P_MM表示交通事故数据集的灰度图像像素矩阵x_d中的第M行M列的像素，卷积层作为CSP-CNN的核心层，其目的是为了提取交通事故数据集中的抽象特征，为了清楚的描述卷积层的计算过程，首先对交通事故数据集灰度图像的每个像素进行编号，P_c,k,l表示输入图像的第c个信道灰度图像的第k行第l列的像素元素；然后对filter的每个权重进行编号，用w_c，e，f表示第c个信道filter的第e行第f列权重；最后，使用激活函数Rectified Linear Unit(ReLU)计算卷积：

激活函数ReLU为：g(h)＝max(0,h) (2)

其中，h表示神经元的输入，卷积计算公式为：

其中：a_k，l表示Feature Map的第k行第l列元素；C是信道个数，其与卷积层的filter个数相同；F是filter的大小(宽度或高度，两者相同)；p_c,k+e,l+f表示输入图像的第c个信道灰度图像的第k+e行第l+f列的像素元素；e和f的取值范围为[1,F]；w_b表示filter的偏置项，每次模型运行时，随机初始化w_b；

为卷积神经元的输入。

每个卷积层可以有多个filter，每个filter和原始交通事故图像进行卷积后，都可以得到一个Feature Map。因此，卷积后的Feature Map的信道个数和卷积层的filter个数是相同的。

全连接层的设置，将最后一个卷积层提取和学习的特征向量使用下列公式经过flatten操作转变成一维向量作为第一个全连接层的输入：

a^flatten＝flatten([a₁,a₂,...,a_c]),c∈[1,C]； (4)

其中，a^flatten表示转变的一维向量，即为flatten后的Feature Map，[a₁，a₂，…，a_c]为最后一个卷积层提取和学习的特征向量[Feature Map1,Feature Map2,…,FeatureMapc]；

全连接层的计算公式如下：

其中：

最后，将上一层全连接层的输出作为下一个全连接层的输入，并最终输出

到输出层，输出层利用Softmax激活函数对交通事故伤亡严重性进行分类，Softmax函数会对设置的每个类别输出一个概率值，概率值最大的类别即为预测的类别，模型的输出为相应的交通事故伤亡严重性等级，包括轻微交通事故、严重交通事故及致命交通事故。

除此之外，卷积层和卷积层之间，卷积层和全连接层之间以及全连接层与全连接层之间都用了Batch Normalization来进行加速模型的训练和防止过拟合。

实验结果与分析

本文所提出的CSP-CNN模型是在Python中使用Google开发的开源深度学习框架TensorFlow实现的，这是因为TensorFlow具有可用性、灵活性、高效率等优势，可以方便地定义和执行多种深度学习网络。具体配置为Intel Xeon E5-2682 V4(Broadwell)处理器，2.5GHz主频，Nvidia P100GPU，12GiB显存，具有9.3TFLOPS单精度浮点和4.7TFLOPS双精度浮点计算能力的GPU服务器上基于TensorFlow框架使用CSP-CNN模型实验100epochs对39403个样本(数据集的80％)进行训练，并用9851个样本(数据集的20％)进行验证。

(1)数据收集

英国利兹市议会8年(2009-2016年)的交通事故数据被用于这项实验。这一时期获得的事故记录总数为21436份。利兹市交通事故信息，每一次事故记录中，在交通事故发生的同时，收集15个不同的子特征，包括地点、涉及的人数和车辆、路面、天气状况等。为了考察各种因素对交通事故伤亡严重程度的影响，将伤亡严重程度分为轻微、严重和致命三个级别。

(2)数据预处理

在将交通事故数据集作为输入应用到CSP-CNN之前，需要对数据集进行预处理，步骤包括：数据前期处理、数据类别不平衡处理和数据转换成图像，具体步骤如下：

1)数据前期的处理包括了对不完整、错误和重复的交通事故数据进行删除、影响交通事故伤亡严重性的子特征删减以及交通事故数据集的归一化。删除不完整、错误和重复的数据之后可以训练的整个数据集共有18727条数据。其中，不同交通事故严重程度数据集所占总数据集的比例如图2所示，其中，88％的交通事故属于轻微事故，11％的交通事故属于严重事故，1％的交通事故属于致命事故。

其次，交通事故数据集15个不同的子特征依其与交通事故严重性预测是否关联被简化为12个，涵盖路面特征，事故特征，车辆特征，驾驶员特征以及环境因素，如表1所示。

表1交通事故数据集的12个子特征和相应描述

由于交通事故12个子特征每个特征的量纲都不一样，因此需要对每个特征下的数据进行归一化，去除数据的单位限制，将其转化为无量纲的纯数值，便于不同单位或量级的特征能够进行比较。除此之外，交通事故数据集的归一化还能带来提升模型的收敛速度和精度的作用。通过利用统计学中的标准化方法Z-score Normalization(Zero-MeanNormalization)对交通事故数据集x进行归一化之后得到数据符号标准正态分布，即均值为0，标准差为1，其转化函数为：

其中，x^*代表单个特征下的某个数据，u为单个特征下所有数据的均值，σ为单个特征下所有数据的标注差；计算时对每个特征分别进行；

2)根据图2可知，致命和严重的交通事故只占交通事故总数的一小部分，如果不针对交通事故数据集不平衡的情况进行处理，模型的训练将会重视占总数据比例大的数据类别，而忽略了占总数据比例较小的数据类别，并最终导致训练的模型对所占比例较大的样本类别过拟合，而对所占比例较小的样本类别欠拟合。一般来说，通过采样方法对于不平衡数据的处理方式有两种，即欠采样和过采样，由于欠采样会丢失一部分数据集，导致不能充分地利用数据集，为了充分地利用交通事故数据集，本文采用过采样的方法来解决数据不平衡的问题。简单的过采样方法就是随机过采样，通过简单复制样本的策略来增加少数类样本，但该方法很容易导致模型学习到的信息过于特别而不能够泛化，即模型的训练出现过拟合，为此，我们使用基于合成少数类过采样技术(Synthetic Minority OversamplingTechnique，SMOTE)改进的Borderline-SMOTE2方法来解决该问题，通过使用该方法，我们最终获得的交通事故数据集为49254条，其中轻微事故、严重事故和致命事故数据集的比例为1：1：1，即各16418条。

3)为了更好的提取交通事数据集特征的空间、组合和更深层次的内在关系，根据交通事故的五大父特征和相应的子特征将其转换为灰度图像形式，作为CSP-CNN模型的输入变量，利用CNN的特点，从底层到高层，从抽象到具体来更好的学习交通事故数据集特征之间的空间、组合和更深层次的内在关系，并最终得到一个交通事故伤亡严重性预测的模型。将交通事故数据集转换成灰度图像主要包括以下几个步骤：(1)基于XGBoost对交通事故12个子特征进行1000次迭代得到重要性分布结果，分布结果如下图3和表2所示；(2)将交通事故数据集子特征的重要性和交通事故数据集作为方法FM2GI的输入，输出交通事故数据集的灰度图像形式。

表2交通事故数据集重要性数值

图4显示了如何将交通事故数据集中某条数据的特征向量转换为灰度图像。

(3)CSP-CNN的超参数

通过scikit-learn提供的接口，结合GridSearchCV和RandomizeSearchCV方法对CSP-CNN的参数组合进行100epochs的搜索，确定了最优的CSP-CNN超参数组合。仅使用GridSearchCV需要高额的计算成本，而仅使用RandomizeSearchCV会找到局部最优的超参数组合，为了更好的利用它们，在全局搜索最优超参数组合的时候使用RandomizeSearchCV，而在局部搜索最优超参数组合的时候使用GridSearchCV，这样需要的计算成本就会降低一些而也不容易陷入局部最优超参数组合的情况中，通过这种交叉结合的方法调整超参数的组合可以获得更优的结果。通过建立具有各种超参数组合的模型，并利用5-fold cross-validation来评估每个模型，最终得到准确度最高的超参数组合。表3显示了使用该混合方法搜索后CSP-CNN中使用的超参数组合。

表3 CSP-CNN模型的超参数组合

(4)CSP-CNN深度分析

通常，在深度学习模型中，多个模块和多层可以堆叠在一起，因此分析网络深度以了解网络行为非常重要，一般来说，CNN的深度不应该太大也不能太小，因此CNN能够学习更复杂的关系，同时保持模型的收敛性。将不同的深度值从小到大分配给CSP-CNN模型进行测试。表4列出了CSP-CNN的不同深度下的网络结构，根据表4中的CSP-CNN网络结构进行实验得到图5所示的CSP-CNN在不同深度结构下的训练集和验证集的准确率。当CSP-CNN的深度为5时，训练集和验证集的准确性分别为96.24％和92％；当深度为7时，验证集的准确率达到最高93.42％，相应的，训练集的准确率为97.45％；当CSP-CNN模型的深度为7以上时，虽然模型的训练集的准确率在逐渐上升，但验证集的准确率却逐渐降低，这表明CSP-CNN模型开始进入过拟合的情形，深度为9，11，13的CSP-CNN模型训练集和验证集的正确率分别为97.91％，98.03％，98.27％和93.36％，93.34％，93.23％。通过使用具有256个filters的4个卷积层，1个faltten层，1个包含128个隐藏单元的全连接层和1个包含3个隐藏单元的softmax全连接层实现了最佳准确率，该模型的训练集和验证集准确率分别达到了93.42％和97.45％。因此本文采用深度为7的CSP-CNN模型进行实验。

表4不同深度下的CSP-CNN模型

(5)实验结果与其他模型比较

为了说明本文所提CSP-CNN模型的有效性，本实验将该模型与6个统计学模型和3个深度学习模型进行比较。其中，6个统计学模型分别是：K近邻方法(KNN)是一种用于分类和回归的非参数方法；决策树(DT)是将一个复杂的决策分解成几个简单决策的结合，希望通过这种方式得到的最终解决方案类似于预期的解决方案；朴素贝叶斯分类器(NBC)是一个简单的“概率分类器”族，基于应用Bayes定理，特征之间具有强(幼稚)独立性假设；logistic回归(LR)通过使用logistic函数(即累积logistic分布)估计概率来测量范畴因变量与一个或多个自变量之间的关系；梯度增强(GB)是一种用于回归和分类问题的统计学习技术，它以弱预测模型集合的形式产生预测模型，梯度增强的思想源于利奥·布雷曼的观察；支持向量机(SVMs，也叫支持向量网络)是带有关联学习方法的监督学习模型，用于分析用于分类和回归分析的数据。相应地，3个深度学习方法分别为：神经网络(NNs)或连接主义***是一种计算***，它模糊地受到构成动物大脑的生物神经网络的启发，代表传统的神经网络，并试图通过隐藏的层来学习特征；长短期记忆递归神经网络(LSTM-RNN)是RNN的扩展，并且由于该架构能够处理长期记忆并且避免传统RNN所遭受的消失梯度问题而变得流行；一维卷积(Conv1D)是卷积神经网络(CNNs)的卷积形式，常用于序列模型和自然语言处理。

更多地，通过scikit-learn提供的接口实现上述6个统计学模型，且参数设置为默认参数。神经网络模型设置为4个隐藏层且每个隐藏层对应245个神经元，1个softmax全连接层，激活函数是relu且优化器是随机梯度下降法(SGD)，除此之外，每一层的初始参数是uniform。长短期记忆递归神经网络包含了一个LSTM层并带有128个隐藏单元和三个分别有128，256，512个神经单元的隐藏层，相应地，最后一层是softmax全连接层，优化器是SGD，参数为learning rate＝0.01，decay＝0.9，momentum＝0.8。Conv1D的参数设置为包含4个隐藏层且分别具有256个隐藏神经单元，最后一层是softmax全连接层，激活函数是relu且优化器是Adam。

表5和图6展示了对交通事故数据集应用6个统计学模型、3个深度学习模型及CSP-CNN得到的训练集和验证集正确率的实验结果。结果表明，在测试集的正确率上，我们提出的CSP-CNN模型优于其他的统计学模型和深度学习模型，这说明，CSP-CNN能很好的泛化在新的交通事故数据集上。虽然在训练集上的正确率，CSP-CNN不是最高，但训练集正确率最高的DT模型明显出现了过拟合现象，而训练集第二高的CSP-CNN则没有。一个可能的原因是因为统计学模型对待交通事故数据集向量的时候，会认为交通事故数据集的特征之间不存在局部相关性，忽略了交通事故数据集特征之间的空间、组合和更深层次的内在关系。同样，对于深度学习模型来说，这些深度学习模型也并不能从模型结构的角度来分析交通事故数据集特征之间的空间关系，而这些交通事故数据集特征之间存在很强的相关性和内在关系。而本文所提的CSP-CNN模型，它是局部感知的，能充分提取到交通事故数据集特征之间的空间关系、组合关系以及更深层次的内在关系，简单说明如图7所示。图7是交通事故数据集图像的像素矩阵形式，从图7可以看出，CSP-CNN模型通过特定size的滤波器(卷积核)，一方面，它能够根据子特征(例如图7中的12个交通事故子特征)的不同重要性提取到相应的交通事故特征，另一方面，CSP-CNN模型充分发挥了局部感知的特异性能力，不会认为特征之间是毫无关联的，它能够提取具有空间关系和内在关系的子特征组合后的特征，比如，图7中，滤波器正在学习提取滑窗下子特征照明情况，天气情况，伤亡类别，伤亡年龄，涉及的车辆数，东方向及北方向组合后的交通事故特征，该图清楚地展示了本文所提CSP-CNN模型是如何提取到富有空间关系、组合关系以及更深层次的内在关系的交通事故特征。

表5不同模型实验下的准确率

对交通事故伤亡严重性预测的本质目的是为了及时地对发生交通事故所涉及的人员提供相应的医疗救助，减少事故人员伤亡，及时地通知相应的紧急决策部门，避免引起更大的财产损失。为此，我们进一步将预测的交通事故伤亡严重性分为三种程度来进行分析：即轻微交通事故、严重交通事故及致命交通事故。由于正确性不是评价模型预测能力的唯一指标，且为了结合模型的实际应用情景，我们引入精确率、召回率及F1 Score来对交通事故测试集进行分析，其中精确率的计算公式如下：

其中，TP(True Positive)表示真正例，即真实类别为正例，预测类别为负例；FP(False Positive)表示假正例，即真实类别为负例，预测类别为正例。

召回率的计算公式如下：

其中，FN(False Negative)表示假负例，即真实类别为正例，预测类别为负例。

F1 Score的计算公式如下：

表6和图8为轻微、严重和致命交通事故下不同模型的精确率、召回率和F1 Score在交通事故测试集的实验结果。

表6不同交通事故伤亡严重性下不同模型预测的精确率、召回率和F1 Score

由表6和图8可知，对于轻微交通事故测试集上的结果显示，CSP-CNN模型的精确率与其他模型相比是最高的，而召回率是统计学模型GB最高；对于严重交通事故测试集上的结果说明，CSP-CNN的精确率、召回率与其他九个模型相比都是最高的；而对于致命交通事故测试集上的结果表明，CSP-CNN、NN和Conv1D的精确率、召回率与其他模型相比，并列第一。结合实际情景分析，对于轻微交通事故的预测，我们能够允许预测的精确率存在一定的误差，因为轻微交通事故并不会在很大概率上引起受伤人员重大伤亡和重大财产损失，而对于严重和致命交通事故来说，对预测的精确度要求就必须比较高，因为只要稍微预测不准确，可能就不能提供相应的紧急医疗支持和相应的紧急部门的决策，最终带来重大的人员伤亡和财产损失，那么从这个结合具体情景角度来分析的话，CSP-CNN模型的性能优于其他模型。一般来说，准确率和召回率是相互影响的，准确率高，召回率就低；召回率低，准确率就高，理想情况下肯定是两者都比较高，而为了公平客观起见，普遍认为，用一个与准确率和召回率这两个指标密切相关的综合指标F1 Score来评价模型的性能是常用的方法。从结果可以看出，在轻微和严重交通事故测试集中，本文所提CSP-CNN模型的F1 Score都高于其他模型，而在致命交通事故测试集中，CSP-CNN模型的F1 Score与NN、Conv1D并列第1。

综上，不管是从模型预测的正确率分析，还是考虑到具体的应用情景对不同严重程度下的交通事故进行分析，本文所提的CSP-CNN模型的性能均优于其他模型。

本文提出了一个深度学习方CSP-CNN模型来预测交通事故严重性。和以往只关注于交通事故数据的简单结构不同，所提方法能够成功发行交通事故严重性的特征表达，比如交通事故特征之间非线性的时空关系、组合关系以及更深层次的内在关系。我们基于利兹市议会的2009-2016之间8年的交通事故数据集进行实验，将本文所提模型CSP-CNN与NBC，KNN，LR，DT，GB，SVM，Conv1D，NN和LSTM-RNN模型进行比较，实验结果表明本文所提模型性能优于上述其他模型。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.交通事故严重性预测CSP-CNN模型的建模方法，其特征在于，具体步骤如下：

其中，d表示交通事故数据集x的索引，N表示交通事故数据集x的总数，PC为交通事故数据集x的父特征个数，CC为所有交通事故数据集x的父特征下最大的子特征个数，max(PC，CC)表示PC和CC两者的最大值，P_MM表示交通事故数据集的灰度图像像素矩阵x_d中的第M行M列的像素；

g(h)＝max(0，h)； (2)

其中，h为卷积神经元的输入；

卷积计算公式为：

其中：a_k，l表示卷积层Feature Map的第k行第l列元素，其中，k和l的取值范围为[1，F]；C是信道个数，其与卷积层的filter个数相同；F是filter的大小，filter的宽度和高度相同；w_c，e，f表示第c个信道filter的第e行第f列权重；p_c，e，f表示第c个信道灰度图像的第e行第f列的像素元素；w_b表示filter的偏置项，每次模型运行时，随机初始化w_b；

为卷积神经元的输入；

a^flatten＝flatten([a₁，a₂，...，a_c])，c∈[1，C]； (4)

其中，a^flatten表示转变的一维向量，即为flatten后的全连接层的Feature Map；[a₁，a₂，…，a_c]为最后一个卷积层的输出，即为最后一个卷积层提取和学习的特征向量[FeatureMap1，Feature Map2，…，FeatureMapc]；

全连接层的计算公式如下：

其中：

步骤五：对交通事故严重性预测CSP-CNN模型进行训练，确认CSP-CNN模型超参数组合；

步骤1：获取经过预处理的交通事故数据集的特征矩阵FM；

2.根据权利要求1所述交通事故严重性预测CSP-CNN模型的建模方法，其特征在于，所述步骤1中交通事故数据集预处理的步骤如下：

3.根据权利要求1所述交通事故严重性预测CSP-CNN模型的建模方法，其特征在于，所述步骤1中获取交通事故数据集的特征矩阵FM，具体步骤如下：

fp＝{fp₁，…，fp_m}； (7)

且

wc＝(w_1，1，…，w_i，j)； (9)

FV＝<fp，fc，wc>； (10)

FM＝{FV₁，...，FV_k}，且FM∈R^k×n； (11)

4.根据权利要求1所述交通事故严重性预测CSP-CNN模型的建模方法，其特征在于，所述步骤2中将交通事故数据集中某条数据的特征向量FV转换为灰度图像，具体包括如下步骤：

5.根据权利要求4所述交通事故严重性预测CSP-CNN模型的建模方法，其特征在于，所述步骤2.4中根据原始交通事故数据集对全零矩阵Mat^{max_dim×max_dim}进行填充的具体步骤如下：

步骤2.4.1.父特征降序排列：根据每个父特征的权值wp，对所有的父特征fp进行降序排列，某个父特征的权值wp_i等于其下所有子特征的重要性权值w_i，j之和，即wp_i＝∑w_i，j；

步骤2.4.3.子特征降序排列：根据每个父特征下的子特征的重要性权值w_i，j，对其下的子特征进行降序排列；

6.根据权利要求3～5任一项所述交通事故严重性预测CSP-CNN模型的建模方法，其特征在于，所述原始交通事故数据集中某条数据的父特征的数量m＝5；所述原始交通事故数据集中某条数据的子特征的数量n＝12；

fc＝{东向位置_1.1，北向位置_1.2，1号公路类别_1.3，事故发生时间_1.4，事故涉及的车辆数量_1.5，路面情况_2.6，照明情况_3.7，天气情况_3.8，车辆类型_4.9，伤亡类别_5.10，伤亡性别_5.11，伤亡年龄_5.12}。

7.根据权利要求3所述交通事故严重性预测CSP-CNN模型的建模方法，其特征在于，所述步骤1.3中确定原始交通事故数据集中某条数据的所有子特征的重要性权值向量wc，是采用XGBoost方法对交通事故数据集12个子特征进行1000次迭代得到。

8.根据权利要求1所述交通事故严重性预测CSP-CNN模型的建模方法，其特征在于，所述步骤五中CSP-CNN模型超参数组合为：批量大小＝128，损失函数为Categoricalcrossentropy，优化器为梯度下降优化器，学习率为0.001，误差项为1e-07，初始化卷积核采用Glorot正态分布初始化方法。