CN114169426A - 一种基于北斗位置数据的公路交通安全隐患排查方法 - Google Patents
一种基于北斗位置数据的公路交通安全隐患排查方法 Download PDFInfo
- Publication number
- CN114169426A CN114169426A CN202111465617.7A CN202111465617A CN114169426A CN 114169426 A CN114169426 A CN 114169426A CN 202111465617 A CN202111465617 A CN 202111465617A CN 114169426 A CN114169426 A CN 114169426A
- Authority
- CN
- China
- Prior art keywords
- position data
- attribute
- decision
- decision tree
- road traffic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000011835 investigation Methods 0.000 title description 2
- 238000003066 decision tree Methods 0.000 claims abstract description 43
- 238000012549 training Methods 0.000 claims abstract description 37
- 238000005070 sampling Methods 0.000 claims abstract description 11
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 230000011218 segmentation Effects 0.000 claims abstract description 4
- 238000012360 testing method Methods 0.000 claims description 16
- 238000007637 random forest analysis Methods 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 10
- 238000000926 separation method Methods 0.000 claims description 8
- 238000013024 troubleshooting Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000002790 cross-validation Methods 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 5
- 239000004576 sand Substances 0.000 claims description 4
- 230000007547 defect Effects 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 abstract description 2
- 230000006399 behavior Effects 0.000 description 6
- 206010039203 Road traffic accident Diseases 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种基于北斗位置数据的公路交通安全隐患排查方法,涉及交通安全技术领域。本发明包括以下步骤:步骤一:将车辆的北斗位置数据进行预处理;步骤二:根据进行预处理后的数据集,采用bootstrap采方法有放回地重随机抽取样本生成N个训练样本集合,构成N棵决策树组成的决策森林;步骤三:设训练样本集中特征的个数为M,决策树的节点分割时,在M个特征中随机的选择M个特征,然后从M个特征中选择一个最优的特征的进行切分;步骤四:对每棵决策树的节点不断分割,直至该节点的所有训练样本属于同一类。实现了车辆行驶监测***和驾驶行为分析,从而能够有效的实现对道路交通安全隐患的排查,大大提高了道路交通的安全性。
Description
技术领域
本发明属于交通安全技术领域,特别是涉及一种基于北斗位置数据的公路交通安全隐患排查方法。
背景技术
近年来,汽车已经成为我们日常出行必不可少的交通工具。随着汽车保有量的不断增加,对车辆的定位监管也成为当下的一个趋势。
汽车的发明不仅给人们的出行带来了巨大的方便,更使得交通运输行业蓬勃发展。但是由于车辆众多,再加上驾驶员并不能保证每时每刻都能规范驾驶。汽车数量的增长所带来的交通事故隐患不容乐观,而绝大多数交通事故产生的原因与驾驶员的不良驾驶行为密切相关。正确高效地监测车辆、及时发现驾驶员的不良驾驶行为、规范驾驶员的驾驶行为习惯,则显得尤为重要。有效的管理运输车辆、监测车辆动态、规范驾驶员的驾驶行为、确保车辆安全出行,已经成为交通运输切解决的问题之一。因此本文提出一种基于北斗位置数据的公路交通安全隐患排查方法。
发明内容
本发明的目的在于提供一种基于北斗位置数据的公路交通安全隐患排查方法,解决了上述技术背景中的问题。
为解决上述技术问题,本发明是通过以下技术方案实现的:
本发明为一种基于北斗位置数据的公路交通安全隐患排查方法,包括以下步骤:
步骤一:将车辆的北斗位置数据进行预处理;
步骤二:根据进行预处理后的数据集,采用bootstrap采方法有放回地重随机抽取样本生成N个训练样本集合,构成N棵决策树组成的决策森林;
步骤三:设训练样本集中特征的个数为M,决策树的节点分割时,在M个特征中随机的选择M个特征,然后从M个特征中选择一个最优的特征的进行切分;
步骤四:对每棵决策树的节点不断分割,直至该节点的所有训练样本属于同一类;
步骤五:收集每一棵决策树的分类结果,随机森林选取分类最多的类别作为最终的结果。
优选的,所述步骤三中,决策树的构建方法为:
优选的,所述步骤二中,设训练样本集为D,属性为A,决策树的构造流程包括以下步骤:
S1:创建节点N;
S2:若D都在同一个类C中,则返回N作为叶节点,用类C标记;
S3:若A为空,则返回N作为叶节点,标记D为样本树种最多的类;
S4:若是通过增益率选取最佳属性,则将a0标记为N,并在属性集中去掉a0;
S5:N根据a0的值划分成不同的子集Ds,若Ds为空,则将N标记为叶节点,标记D为样本树种最多的类;若Ds不为空,在子集Ds和剔除了a0的新的属性集Aa0中再选出最佳属性a1,标记为新的节点N,并在属性集中剔除a1;
S6:重复执行以上步骤n次,生成n棵决策树,形成随机森林,经过每棵决策树对测试数据的决策投票,分析判断最终得出决策分类结果。
优选的,所述步骤一中:车辆的北斗位置数据包括车辆的行驶速度,行驶方向,经纬度,地理位置和定位时间。
优选的,所述步骤四中,对每棵决策树的节点不断分割分类结果为,特征权重,决策树数目,数据分离比和交叉验证。
优选的,所述交叉验证包括以下步骤:
S1:采用随机采样的方法,且不重复地将原始数据分为5组;
S2:选取其中的1组作为测试集,剩下的作为训练集;
S3:重复所述S2五次选取,每次选取的数据具有相同的几率成为测试集或训练集;
S4:在每个训练集上进行训练并得到一个模型,然后通过与得到模型对应的测试集进行测试,计算并保存参数和模型评估指标;
S5:取5组验证结果的平均值,作为精度的估计和性能指标。
本发明具有以下有益效果:
本发明通过对车辆的北斗位置数据预处理统计形成散列数据,使用随机森林对数据构建模型进行分析,从而决策出未知数据的分类类别,实现了车辆行驶监测***和驾驶行为分析,从而能够有效的实现对道路交通安全隐患的排查,大大提高了道路交通的安全性。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一种基于北斗位置数据的公路交通安全隐患排查方法的结构示意图;
图2为本发明决策树数目与模型精度的关系图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本发明为一种基于北斗位置数据的公路交通安全隐患排查方法,包括以下步骤:
步骤一:将车辆的北斗位置数据进行预处理,选取车辆的速度、漂移数据、定位时间,作为管件分析特征,由于原始数据大量且没有任何标记,选取车辆的速度平均值、速度数据中位值、速度最大值、速度0值次数和超速次数进行预处理,并储存,进行模型训练和评估。
步骤二:根据进行预处理后的数据集,采用bootstrap采方法有放回地重随机抽取样本生成N个训练样本集合,构成N棵决策树组成的决策森林。
步骤三:设训练样本集中特征的个数为M,决策树的节点分割时,在M个特征中随机的选择M个特征,然后从M个特征中选择一个最优的特征的进行切分。
步骤四:对每棵决策树的节点不断分割,直至该节点的所有训练样本属于同一类。
步骤五:收集每一棵决策树的分类结果,随机森林选取分类最多的类别作为最终的结果。
其中,所述步骤三中,决策树的构建方法为:
其中,所述步骤二中,设训练样本集为D,属性为A,决策树的构造流程包括以下步骤:
S1:创建节点N;
S2:若D都在同一个类C中,则返回N作为叶节点,用类C标记;
S3:若A为空,则返回N作为叶节点,标记D为样本树种最多的类;
S4:若是通过增益率选取最佳属性,则将a0标记为N,并在属性集中去掉a0;
S5:N根据a0的值划分成不同的子集Ds,若Ds为空,则将N标记为叶节点,标记D为样本树种最多的类;若Ds不为空,在子集Ds和剔除了a0的新的属性集Aa0中再选出最佳属性a1,标记为新的节点N,并在属性集中剔除a1;
S6:重复执行以上步骤n次,生成n棵决策树,形成随机森林,经过每棵决策树对测试数据的决策投票,分析判断最终得出决策分类结果。
其中,所述步骤一中:车辆的北斗位置数据包括车辆的行驶速度,行驶方向,经纬度,地理位置和定位时间。
其中,所述步骤四中,对每棵决策树的节点不断分割分类结果为,特征权重,决策树数目,数据分离比和交叉验证。
其中,特征权重,包括准确率、精确率、召回率和Fl_scorc,以及ROC和AUC。评价指标是通过指示标签和预测标签之间形成的混淆矩阵的计算方式得到的,“O”代表负样本,“l”代表正样本,TP表示正确的预测为正例,FN表示正确的预测为反例,TN表示错误的预测为反例,FP表示错误的预测为正例。
其中,数据分离比,将数据集分为训练集和测试集两部分,训练集所占总体数据集的比例不同,预测的精确度也不同,将训练集占总体数据集的比例作为分离比,当分离比为70%左右时,生成的随机森林模型的性能最好,精确度最高,本实施列中,设置不同的数据集分离比,当分离比为72%时精确度最高,最高精确度可达85%左右。
其中如图2所示,决策树数目,在随机森林中,决策树的数量会影响随机森林模型预测的精准度,本实施列中,决策树的棵数从0开始,每次增加50棵树,当随机森林模型中决策树较少时,模型整体精准度会随着决策树数目的增加而提高,当决策树达到500棵时,模型的精准度变化较小,继续增加决策树数目,模型的精准度不会有所提高,反而会增加模型的复杂性和计算量,致使模型效率降低。
其中,所述交叉验证包括以下步骤:
S1:采用随机采样的方法,且不重复地将原始数据分为5组;
S2:选取其中的1组作为测试集,剩下的作为训练集;
S3:重复所述S2五次选取,每次选取的数据具有相同的几率成为测试集或训练集;
S4:在每个训练集上进行训练并得到一个模型,然后通过与得到模型对应的测试集进行测试,计算并保存参数和模型评估指标;
S5:取5组验证结果的平均值,作为精度的估计和性能指标。
根据嫡权法选取最权重最大的六个特征,对于每一个特征,都要进行评分,每一项都是0到100分,总计六项,最后算的平均也即综合评分。对于每一项都有一个参考数据,介于判定稳定性和适中型的数据之间,分数计算公式为:Scored=II-Datas/Datac|·100,其中Scored表示某一特征维度得分,d表示维度,Data,表示参考值,Data表示当前数据,如平均速度参考值,根据车队企业提供的驾驶员资料,并选取正常稳定性的驾驶数据,计算平均速度,最后设置为35km/h,假设当前平均速度为60km/h,则根据分数计算公式该驾驶员平均速度得分为41.7分,综合评分计算方法如为:分数越高,说明驾驶员的驾驶风格越稳定,驾驶行为越符合标准,根据评断,对公路交通安全隐患进行排查。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (7)
1.一种基于北斗位置数据的公路交通安全隐患排查方法,其特征在于:包括以下步骤:
步骤一:将车辆的北斗位置数据进行预处理;
步骤二:根据进行预处理后的数据集,采用bootstrap采方法有放回地重随机抽取样本生成N个训练样本集合,构成N棵决策树组成的决策森林;
步骤三:设训练样本集中特征的个数为M,决策树的节点分割时,在M个特征中随机的选择M个特征,然后从M个特征中选择一个最优的特征的进行切分;
步骤四:对每棵决策树的节点不断分割,直至该节点的所有训练样本属于同一类;
步骤五:收集每一棵决策树的分类结果,随机森林选取分类最多的类别作为最终的结果。
4.根据权利要求1所述的一种基于北斗位置数据的公路交通安全隐患排查方法,其特征在于,所述步骤二中,设训练样本集为D,属性为A,决策树的构造流程包括以下步骤:
S1:创建节点N;
S2:若D都在同一个类C中,则返回N作为叶节点,用类C标记;
S3:若A为空,则返回N作为叶节点,标记D为样本树种最多的类;
S4:若是通过增益率选取最佳属性,则将a0标记为N,并在属性集中去掉a0;
S5:N根据a0的值划分成不同的子集Ds,若Ds为空,则将N标记为叶节点,标记D为样本树种最多的类;若Ds不为空,在子集Ds和剔除了a0的新的属性集Aa0中再选出最佳属性a1,标记为新的节点N,并在属性集中剔除a1;
S6:重复执行以上步骤n次,生成n棵决策树,形成随机森林,经过每棵决策树对测试数据的决策投票,分析判断最终得出决策分类结果。
5.根据权利要求1所述的一种基于北斗位置数据的公路交通安全隐患排查方法,其特征在于,所述步骤一中:车辆的北斗位置数据包括车辆的行驶速度,行驶方向,经纬度,地理位置和定位时间。
6.根据权利要求1所述的一种基于北斗位置数据的公路交通安全隐患排查方法,其特征在于,所述步骤四中,对每棵决策树的节点不断分割分类结果为,特征权重,决策树数目,数据分离比和交叉验证。
7.根据权利要求6所述的一种基于北斗位置数据的公路交通安全隐患排查方法,其特征在于,所述交叉验证包括以下步骤:
S1:采用随机采样的方法,且不重复地将原始数据分为5组;
S2:选取其中的1组作为测试集,剩下的作为训练集;
S3:重复所述S2五次选取,每次选取的数据具有相同的几率成为测试集或训练集;
S4:在每个训练集上进行训练并得到一个模型,然后通过与得到模型对应的测试集进行测试,计算并保存参数和模型评估指标;
S5:取5组验证结果的平均值,作为精度的估计和性能指标。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111465617.7A CN114169426A (zh) | 2021-12-02 | 2021-12-02 | 一种基于北斗位置数据的公路交通安全隐患排查方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111465617.7A CN114169426A (zh) | 2021-12-02 | 2021-12-02 | 一种基于北斗位置数据的公路交通安全隐患排查方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114169426A true CN114169426A (zh) | 2022-03-11 |
Family
ID=80482786
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111465617.7A Pending CN114169426A (zh) | 2021-12-02 | 2021-12-02 | 一种基于北斗位置数据的公路交通安全隐患排查方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114169426A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117077042A (zh) * | 2023-10-17 | 2023-11-17 | 北京鑫贝诚科技有限公司 | 一种农村平交路口安全预警方法及*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150098609A1 (en) * | 2013-10-09 | 2015-04-09 | Honda Motor Co., Ltd. | Real-Time Multiclass Driver Action Recognition Using Random Forests |
CN109017799A (zh) * | 2018-04-03 | 2018-12-18 | 张锐明 | 一种新能源汽车驾驶行为预测方法 |
CN110519128A (zh) * | 2019-09-20 | 2019-11-29 | 西安交通大学 | 一种基于随机森林的操作***识别方法 |
CN112699793A (zh) * | 2020-12-29 | 2021-04-23 | 长安大学 | 一种基于随机森林的疲劳驾驶检测优化识别方法 |
CN113516173A (zh) * | 2021-05-27 | 2021-10-19 | 江西五十铃汽车有限公司 | 一种基于随机森林与决策树的整车静动态干涉的测评方法 |
-
2021
- 2021-12-02 CN CN202111465617.7A patent/CN114169426A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150098609A1 (en) * | 2013-10-09 | 2015-04-09 | Honda Motor Co., Ltd. | Real-Time Multiclass Driver Action Recognition Using Random Forests |
CN109017799A (zh) * | 2018-04-03 | 2018-12-18 | 张锐明 | 一种新能源汽车驾驶行为预测方法 |
CN110519128A (zh) * | 2019-09-20 | 2019-11-29 | 西安交通大学 | 一种基于随机森林的操作***识别方法 |
CN112699793A (zh) * | 2020-12-29 | 2021-04-23 | 长安大学 | 一种基于随机森林的疲劳驾驶检测优化识别方法 |
CN113516173A (zh) * | 2021-05-27 | 2021-10-19 | 江西五十铃汽车有限公司 | 一种基于随机森林与决策树的整车静动态干涉的测评方法 |
Non-Patent Citations (1)
Title |
---|
陈东攀: "基于北斗车辆定位数据的驾驶行为分析", 《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117077042A (zh) * | 2023-10-17 | 2023-11-17 | 北京鑫贝诚科技有限公司 | 一种农村平交路口安全预警方法及*** |
CN117077042B (zh) * | 2023-10-17 | 2024-01-09 | 北京鑫贝诚科技有限公司 | 一种农村平交路口安全预警方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | A graphical modeling method for individual driving behavior and its application in driving safety analysis using GPS data | |
CN109840660B (zh) | 一种车辆特征数据处理方法及车辆风险预测模型训练方法 | |
CN109635830B (zh) | 用于估算汽车质量的有效数据的筛选方法 | |
CN110544373B (zh) | 一种基于北斗车联网的货车预警信息提取与风险识别方法 | |
CN109493566B (zh) | 一种基于gps数据的疲劳驾驶预测方法 | |
CN109635852B (zh) | 一种基于多维属性的用户画像构建与聚类方法 | |
CN108769104B (zh) | 一种基于车载诊断***数据的路况分析预警方法 | |
CN109117869B (zh) | 用户画像方法、介质及*** | |
CN111688713B (zh) | 驾驶行为分析方法和装置 | |
Zhou et al. | Comparing factors affecting injury severity of passenger car and truck drivers | |
CN109886724B (zh) | 一种鲁棒性的居民出行轨迹识别方法 | |
CN114299742B (zh) | 一种高速公路的限速信息动态识别与更新推荐方法 | |
CN111563555A (zh) | 一种司机驾驶行为分析方法及*** | |
CN113657432A (zh) | 一种基于车联网数据的商用车驾驶行为风险等级辨识方法 | |
Halim et al. | Deep neural network-based identification of driving risk utilizing driver dependent vehicle driving features: A scheme for critical infrastructure protection | |
CN115422747A (zh) | 一种机动车尾气污染物排放量的计算方法和计算装置 | |
CN114169426A (zh) | 一种基于北斗位置数据的公路交通安全隐患排查方法 | |
CN113095387B (zh) | 基于联网车载adas的道路风险识别方法 | |
Yahaya et al. | Ensemble-based model selection for imbalanced data to investigate the contributing factors to multiple fatality road crashes in Ghana | |
Li et al. | Predicting the severity of traffic accidents on mountain freeways with dynamic traffic and weather data | |
Du et al. | Learning‐Based Lane‐Change Behaviour Detection for Intelligent and Connected Vehicles | |
Pandey et al. | Assessment of Level of Service on urban roads: a revisit to past studies. | |
CN116753938A (zh) | 车辆测试场景生成方法、装置、存储介质及设备 | |
Chen et al. | The impact of truck proportion on traffic safety using surrogate safety measures in China | |
CN116798223A (zh) | 基于宏观基本图/fcm聚类的子区划分及状态识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220311 |
|
RJ01 | Rejection of invention patent application after publication |