CN116386339B - 一种省际客运未按线路行驶违法行为智能检测方法 - Google Patents
一种省际客运未按线路行驶违法行为智能检测方法 Download PDFInfo
- Publication number
- CN116386339B CN116386339B CN202310657816.0A CN202310657816A CN116386339B CN 116386339 B CN116386339 B CN 116386339B CN 202310657816 A CN202310657816 A CN 202310657816A CN 116386339 B CN116386339 B CN 116386339B
- Authority
- CN
- China
- Prior art keywords
- line
- track
- lof
- vehicle
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 36
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 51
- 238000000034 method Methods 0.000 claims abstract description 41
- 230000006399 behavior Effects 0.000 claims abstract description 40
- 238000002955 isolation Methods 0.000 claims abstract description 20
- 230000005856 abnormality Effects 0.000 claims abstract description 15
- 238000013480 data collection Methods 0.000 claims abstract description 6
- 238000004364 calculation method Methods 0.000 claims description 37
- 230000002159 abnormal effect Effects 0.000 claims description 17
- 230000009471 action Effects 0.000 claims description 14
- 239000013598 vector Substances 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 9
- 238000012544 monitoring process Methods 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 6
- 239000002131 composite material Substances 0.000 claims description 3
- 238000003064 k means clustering Methods 0.000 claims description 3
- 239000000463 material Substances 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 238000005192 partition Methods 0.000 claims 1
- 238000007619 statistical method Methods 0.000 abstract description 5
- 230000000694 effects Effects 0.000 description 7
- 238000005457 optimization Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/017—Detecting movement of traffic to be counted or controlled identifying vehicles
- G08G1/0175—Detecting movement of traffic to be counted or controlled identifying vehicles by photographing vehicles, e.g. when violating traffic rules
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Chemical & Material Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Probability & Statistics with Applications (AREA)
- Navigation (AREA)
- Auxiliary Drives, Propulsion Controls, And Safety Devices (AREA)
Abstract
本发明提出了一种省际客运未按线路行驶违法行为智能检测方法。该方法包括:数据收集与预处理;线路聚类与优化;轨迹异常检测;违法行为证据收集;违法行为处理与统计分析。通过使用DTW算法和MiniBatchKMeans聚类算法进行轨迹比对和聚类,结合LOF和Isolation Forest两种异常检测算法实现异常预警,发现车辆未按约定线路行驶的违法行为,从而提高道路安全和交通管理水平。
Description
技术领域
本发明属于交通管理和车辆监控领域,具体涉及一种省际客运未按线路行驶违法行为智能检测方法。
背景技术
现有的省际客运车辆管理***主要依赖于人工监管和简单的轨迹比对来确保车辆按照约定线路行驶。一般情况下,管理部门会使用监控设备的数据进行异常检测,如使用ETC***,进行车辆通行的记录。同时,车辆会安装卫星定位设备,用于实时监控车辆的位置。然而,现有技术存在以下不足:
(1)人工监管效率低:由于省际客运车辆数量庞大,人工监管的效率较低,难以实时发现并处理违法行为。
(2)轨迹比对方法简单:主要通过人工进行班线审批单中规定线路与车辆定位轨迹或在ETC数据中的记录简单对比。
(3)异常检测方法不足:现有的省际客运车辆管理***缺乏针对车辆行驶轨迹的异常检测方法,难以及时发现并处理违法行为。
(4)缺乏对违法行为的证据收集和处理能力:一旦发现车辆未按照约定线路行驶,现有的管理***缺乏有效的证据收集和处理能力,导致违法行为难以被查处。
相对于现有技术,本发明的优点如下:
(1)自动化和智能化监管:本发明利用先进的数据分析和机器学习方法,实现了对省际客运车辆的自动化和智能化监管,大大提高了监管效率和准确性。
(2)高效准确的轨迹比对和聚类方法:本发明采用DTW算法和MiniBatchKMeans聚类算法,有效地处理了不同密度和速度的轨迹数据,提高了车辆合规线路的识别准确性。
(3)有效的异常检测和预警机制:本发明结合LOF和Isolation Forest两种异常检测算法,实现了对车辆未按线路行驶违法行为的实时监测和预警,有助于降低违法行为的发生率。
(4)违法行为证据收集与处理:本发明在发现车辆未按约定线路行驶时,可以调取周边监控视频和提取ETC出入口数据等作为证据,有力地支持违法行为的查处和处理。
(5)为交通管理部门提供决策支持:通过对违法行为的统计分析,本发明可以为交通管理部门提供有力的决策支持,有助于提高道路安全和交通管理水平。
发明内容
本发明提供了提出了一种省际客运未按线路行驶违法行为智能检测方法。基于数据分析和机器学***。
为了解决上述技术问题,本发明提出一种省际客运未按线路行驶违法行为智能检测方法,包括如下步骤:
步骤1:数据收集与预处理;
1.1 收集省际客运车辆的历史行驶数据和约定线路数据;上述数据通过车载卫星定位设备或车辆追踪***获得;
1.2 对收集到的数据进行预处理,所述预处理包括去除异常点、填补缺失值;
步骤2:线路聚类与优化;
2.1 使用聚类算法MiniBatchKMeans对提取的车辆卫星定位数据X进行聚类,X包括车辆的经度、纬度等属性;设定聚类数目k,进行k-means聚类,将行驶轨迹划分为k个簇;设定聚类簇中心C i ,计算每个数据点与簇中心的距离,选择距离最近的簇中心作为所属簇;距离越小,表示数据点更接近该簇中心,归属于同一类;所述距离的计算公式为:
,
其中i = 1,2,...,k
2.2 根据班次和班线信息将聚类结果分组,识别出同一班线下多个班次车辆的潜在合规出行线路;对每个班线,计算各个簇中的行驶轨迹数量占比P i ;P i 值越大,表示该簇中的轨迹在该班线中占据更大比例,更可能是合规线路,所述P i 值计算公式为:
P
i =
N
i
/N
total
其中N i 为簇i中的轨迹数量,N total 为总轨迹数量;
2.3采用动态时间规整算法来计算相似度,两条轨迹之间的时间和空间变化;
步骤3:轨迹异常检测;
步骤4:违法行为证据收集;
4.1 当判断出车辆未按线路行驶后,基于该车卫星定位数据调取周边监控视频,进行违法行为的抓拍;
4.2 提取该车的ETC出入口数据、ETC门架通行数据,作为未按线路行驶违法行为的证据材料;
步骤5:违法行为处理与统计分析;
5.1 当发现车辆存在违法行为时发出预警信息,立即通知交通管理部门或车辆所属公司,采取相应措施;
5.2 对违法行为进行标记并统计分析,为交通管理部门提供决策支持,提高道路安全和交通管理水平。
可选地,所述步骤2.3具体还包括,
2.3.1 使用动态时间规整算法计算潜在合规出行线路与途径路由轨迹之间的相似度;动态时间规整通过寻找两条轨迹之间的最优匹配路径来计算所述两条轨迹之间的距离,从而得到相似度;
2.3.2 对于每条潜在合规线路,计算与途径路由轨迹之间的动态时间规整距离D,取距离最小的线路作为优化后的合规线路;动态时间规整距离越小,表示潜在合规线路与途径路由轨迹越接近,所述动态时间规整距离D的计算公式为:
,
其中A i 为潜在合规线路的点,B j 为途径路由轨迹的点;
2.3.3 将动态时间规整距离转换为相似度,使用以下公式:
S=exp( -α* D )
其中α为一个正的常数,用于调整相似度的范围;
取相似度最高的线路作为优化后的合规线路。
可选地,所述步骤3具体还包括,
3.1 将每天的车辆卫星定位轨迹与合规出行线路进行比对;计算每条实际行驶轨迹与合规线路之间的相似度S t ,通过计算实际行驶轨迹向量和合规出行线路向量的余弦相似度,得到车辆是否按照规定的线路行驶的度量。相似度S t 的计算公式为:
,
其中A t 为实际行驶轨迹向量,B代表合规出行线路向量,θ t 表示实际行驶轨迹与合规线路之间的夹角,θ t 越小,表示实际行驶轨迹与合规线路越接近,车辆按照规定线路行驶的可能性更大;
3.2 使用异常检测算法判断车辆是否有未按线路行驶的违法行为;计算每个轨迹的异常得分E,设定阈值T,当E>T时,认为车辆存在未按约定线路行驶的违法行为;
3.3:算法结果比对与优化。
可选地,所述步骤3.2具体还包括,
3.2.1 使用LOF算法进行异常检测;于每个轨迹点x,计算其k近邻距离和局部可达密度L(x),然后计算其邻居的局部可达密度之比LOF(x);如果LOF(x)大于阈值T LOF ,则认为该轨迹点存在异常;
计算轨迹点x到其k近邻中距离最远的那个近邻的距离;所述k近邻指的是在数据空间中与x最近的k个轨迹点d k (x)。d k (x)计算公式如下:
,
通过计算x到所有k近邻y的距离,然后取最大值,得到x到其k近邻中距离最远的那个近邻的距离;
计算局部可达密度L(x),L(x)计算公式如下:
,
对所有的k近邻y,计算x到y的距离,并求和。和除以k,得到x到其k近邻的平均距离,然后取其倒数,得到局部可达密度L(x);
LOF,(局部异常因子)的计算涉及到轨迹点x的局部可达密度和它的k近邻的局部可达密度。L(x)代表轨迹点x的局部可达密度,L(y)代表x的k近邻之一的局部可达密度。LOF(x)是衡量轨迹点x的局部可达密度和它的邻居们的局部可达密度之间的相对关系。如果LOF(x)大于1,说明轨迹点x的局部密度比其邻居们低,以此判断可能是一个异常点。LOF(x)计算公式如下:
,
其中y为x的k近邻之一,在计算L(x)时,需要计算轨迹点x到其每一个k近邻y的距离d k (x,y),然后取这些距离的平均值。在计算L(y)时,需要计算数据点y到其每一个k近邻(包括x)的距离,此时需要用到d k (x),然后取这些距离的平均值;d k (x,y)和d k (x)都是计算LOF的基础,它们的计算结果反映了轨迹点x的局部密度和它的邻居们的局部密度。
3.2.2 使用Isolation Forest算法进行异常检测。通过随机选择特征和划分值来构建一棵孤立树,将数据点分离到叶节点。计算每个数据点的孤立程度,即从根节点到叶节点的路径长度h(x);如果h(x)小于阈值T IF ,则该轨迹点存在异常;
所述孤立程度计算公式如下:
h(x) =E[H(x)]
其中H(x)为从根节点到叶节点的路径长度,E[∙]表示期望值。
可选地,所述步骤3.3具体还包括,
3.3.1 对LOF和Isolation Forest算法的异常检测结果进行比对;对于同时被两种算法标记为异常的数据点,其异常程度较高,需要特别关注;
3.3.2 根据实际情况,对两种算法的结果进行加权,形成综合评分;设置权重w LOF 和w IF ,使得w LOF +w IF =1;然后,计算每个数据点的综合评分E combined =w LOF * E LOF +w IF * E IF ,其中E LOF 和E IF 分别表示LOF和Isolation Forest算法得到的异常评分;当E combined >T combined 时,车辆存在违法行为。
通过以上省际客运未按线路行驶违法行为智能检测方法,本发明相较于现有技术,具有更高的监管效率、准确性和实用性,可以在省际客运车辆管理领域发挥重要作用。
附图说明
为了使本发明所解决的技术问题、采用的技术手段及取得的技术效果更加清楚,下面将参照附图详细描述本发明的具体实施例。但需声明的是,下面描述的附图仅仅是本发明的示例性实施例的附图,对于本领域的技术人员来讲,在不付出创造性劳动的前提下,可以根据这些附图获得其他实施例的附图。
图1是基于ETC数据和卫星定位数据的未按线路行驶违法行为识别方法的总体流程。
图2是线路聚类与优化的详细步骤的流程图。
图3是轨迹异常检测与违法行为证据收集与处理流程图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照参考附图来全面地描述本发明的示例性实施例。虽然各示例性实施例能够以多种具体的方式实施,但不应理解为本发明仅限于在此阐述的实施例。相反,提供这些示例性实施例是为了使本发明的内容更加完整,更加便于将发明构思全面地传达给本领域的技术人员。
在符合本发明的技术构思的前提下,在某个特定的实施例中描述的结构、性能、效果或者其他特征可以任何合适的方式结合到一个或更多其他的实施例中。
在对于具体实施例的介绍过程中,对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是,并不排除本领域技术人员可以在特定情况下,以不含有上述结构、性能、效果或者其他特征的技术方案来实施本发明。
附图中的流程图仅是一种示例性的流程演示,不代表本发明的方案中必须包括流程图中的所有的内容、操作和步骤,也不代表必须按照图中所显示的顺序执行。例如,流程图中有的操作/步骤可以分解,有的操作/步骤可以合并或部分合并,等等。在不脱离本发明的发明主旨的情况下,流程图中显示的执行顺序可以根据实际情况改变。
附图中的框图一般表示的是功能实体,并不一定必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
各附图中相同的附图标记表示相同或类似的元件、组件或部分,因而下文中可能省略了对相同或类似的元件、组件或部分的重复描述。还应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但是这些器件、元件、组件或部分不应受这些定语的限制。也就是说,这些定语仅是用来将一者与另一者区分。例如,第一器件亦可称为第二器件,但不偏离本发明实质的技术方案。此外,术语“和/或”、“及/或”是指包括所列出项目中的任何一个或多个的所有组合。
本实施例提供了一种省际客运未按线路行驶违法行为智能检测方法,具体包括如下方法,如图1-3所示。
图1展示了基于ETC数据和卫星定位数据的未按线路行驶违法行为识别方法的总体流程。从数据收集与预处理、线路聚类与优化、轨迹异常检测、违法行为证据收集到违法行为处理与统计分析,整个过程分为五个步骤。
步骤一:数据收集与预处理
1.1 收集省际客运车辆的历史行驶数据和约定线路数据。这些数据可以通过车载卫星定位设备或车辆追踪***获得。
1.2 对收集到的数据进行预处理,如去除异常点、填补缺失值等,以便后续分析。
步骤2:线路聚类与优化
图2展示了线路聚类与优化的详细步骤,包括使用MiniBatchKMeans聚类算法对提取的车辆卫星定位数据进行聚类,根据班次和班线信息将聚类结果分组,以及采用动态时间规整(DTW)算法来计算相似度。
2.1 使用聚类算法MiniBatchKMeans对提取的车辆卫星定位数据X进行聚类,X包括车辆的经度、纬度等属性。设定聚类数目k,进行k-means聚类,将行驶轨迹划分为k个簇。设定聚类簇中心C i ,计算每个数据点与簇中心的距离,选择距离最近的簇中心作为所属簇。距离越小,表示数据点更接近该簇中心,归属于同一类。公式:
,
其中i = 1,2,...,k
2.2 根据班次和班线信息将聚类结果分组,识别出同一班线下多个班次车辆的潜在合规出行线路。对每个班线,计算各个簇中的行驶轨迹数量占比P i 。P i 值越大,表示该簇中的轨迹在该班线中占据更大比例,更可能是合规线路。公式:
P
i =
N
i
/N
total
其中N i 为簇i中的轨迹数量,N total 为总轨迹数量。
2.3 将潜在合规出行线路与途径路由字段转换后的经纬度轨迹进行对比,优化形成合规出行线路。
考虑到途径路由语义理解转换为经纬度点稀疏的问题,采用动态时间规整(Dynamic Time Warping, DTW)算法来计算相似度。DTW可以更有效地处理不同密度和速度的轨迹数据,并考虑到两条轨迹之间的时间和空间变化。
2.3.1 使用动态时间规整(DTW)算法计算潜在合规出行线路与途径路由轨迹之间的相似度。DTW通过寻找两条轨迹之间的最优匹配路径来计算它们之间的距离,从而得到相似度。
2.3.2 对于每条潜在合规线路,计算与途径路由轨迹之间的DTW距离D,取距离最小的线路作为优化后的合规线路。DTW距离越小,表示潜在合规线路与途径路由轨迹越接近。公式:
,
其中A i 为潜在合规线路的点,B j 为途径路由轨迹的点。
2.3.3 将DTW距离转换为相似度,使用以下公式:
S=exp( -α* D )
其中α为一个正的常数,用于调整相似度的范围。取相似度最高的线路作为优化后的合规线路。
步骤3:轨迹异常检测
图3展示了轨迹异常检测、违法行为证据收集与处理的详细步骤。包括计算实际行驶轨迹与合规线路之间的相似度,使用异常检测算法(如LOF、Isolation Forest等)判断车辆是否有未按线路行驶的违法行为,对算法结果进行比对与优化,以及基于车辆卫星定位数据调取周边监控视频,提取ETC出入口数据和ETC门架通行数据,通知交通管理部门或车辆所属公司采取相应措施。
3.1 将每天的车辆卫星定位轨迹与合规出行线路进行比对。计算每条实际行驶轨迹与合规线路之间的相似度S t ,通过计算实际行驶轨迹向量和合规出行线路向量的余弦相似度,得到车辆是否按照规定的线路行驶的度量。公式:
,
其中A t 为实际行驶轨迹向量,B代表合规出行线路向量,θ t 表示实际行驶轨迹与合规线路之间的夹角,θ t 越小,表示实际行驶轨迹与合规线路越接近,车辆按照规定线路行驶的可能性更大。
3.2 使用异常检测算法(如LOF、Isolation Forest等)判断车辆是否有未按线路行驶的违法行为。计算每个轨迹的异常得分E,设定阈值T,当E>T时,认为车辆存在未按约定线路行驶的违法行为。
3.2.1 使用LOF算法进行异常检测;于每个轨迹点x,计算其k近邻距离和局部可达密度L(x),然后计算其邻居的局部可达密度之比LOF(x);如果LOF(x)大于阈值T LOF ,则认为该轨迹点存在异常。
计算轨迹点x到其k近邻中距离最远的那个近邻的距离;所述k近邻指的是在数据空间中与x最近的k个轨迹点d k (x)。d k (x)计算公式如下:
,
通过计算x到所有k近邻y的距离,然后取最大值,得到x到其k近邻中距离最远的那个近邻的距离;
计算局部可达密度L(x),L(x)计算公式如下:
,
对所有的k近邻y,计算x到y的距离,并求和。和除以k,得到x到其k近邻的平均距离,然后取其倒数,得到局部可达密度L(x);
LOF(局部异常因子)的其计算涉及到轨迹点x的局部可达密度和它的k近邻的局部可达密度。L(x)代表轨迹点x的局部可达密度,L(y)代表x的k近邻之一的局部可达密度。LOF(x)是衡量轨迹点x的局部可达密度和它的邻居们的局部可达密度之间的相对关系。如果LOF(x)大于1,说明轨迹点x的局部密度比其邻居们低,以此判断可能是一个异常点。LOF(x)计算公式如下:
,
其中y为x的k近邻之一,在计算L(x)时,需要计算轨迹点x到其每一个k近邻y的距离d k (x,y),然后取这些距离的平均值。在计算L(y)时,需要计算数据点y到其每一个k近邻(包括x)的距离,此时需要用到d k (x),然后取这些距离的平均值;d k (x,y)和d k (x)都是计算LOF的基础,它们的计算结果反映了轨迹点x的局部密度和它的邻居们的局部密度。
3.2.2 使用Isolation Forest算法进行异常检测。通过随机选择特征和划分值来构建一棵孤立树,将数据点分离到叶节点。计算每个数据点的孤立程度,即从根节点到叶节点的路径长度h(x)。如果h(x)小于阈值T IF ,则认为该轨迹点存在异常。
孤立程度:
h(x) =E[H(x)]
其中H(x)为从根节点到叶节点的路径长度,E[∙]表示期望值。
步骤3.3:算法结果比对与优化
3.3.1 对LOF和Isolation Forest算法的异常检测结果进行比对。对于同时被两种算法标记为异常的数据点,可以认为其异常程度较高,需要特别关注。
3.3.2 根据实际情况,对两种算法的结果进行加权,形成综合评分;设置权重w LOF 和w IF ,使得w LOF +w IF =1;然后,计算每个数据点的综合评分E combined =w LOF * E LOF +w IF * E IF ,其中E LOF 和E IF 分别表示LOF和Isolation Forest算法得到的异常评分;当E combined >T combined 时,车辆存在违法行为。
步骤4:违法行为证据收集
4.1 当判断出车辆未按线路行驶后,基于该车卫星定位数据调取周边监控视频,进行违法行为的抓拍。
4.2 提取该车的ETC出入口数据、ETC门架通行数据,作为未按线路行驶违法行为的证据材料。
步骤5:违法行为处理与统计分析
5.1 当发现车辆存在违法行为时发出预警信息,进行自动预警,立即通知交通管理部门或车辆所属公司,采取相应措施。
5.2 对违法行为进行标记并统计分析,为交通管理部门提供决策支持,提高道路安全和交通管理水平。
通过以上实施方式,本发明通过聚类算法分析省际客运车辆的历史行驶数据,形成潜在合规线路并进行优化。然后利用异常检测算法检测车辆是否存在未按约定线路行驶的违法行为,并在发现违法行为时采取相应措施。这种方法有助于提高道路安全,降低交通事故的发生率,并为交通管理部门提供有效的决策支持。
以上说明书及附图中如此叙述仅仅是为了清楚起见,本领域技术人员应当将说明书作为一个整体加以理解,以上所述仅为本发明示意性的具体实施方式,并非用以限定本发明的范围。任何本领域的技术人员,在不脱离本发明的构思和原则的前提下所作的等同变化、修改与结合,均应属于本发明保护的范围。
Claims (3)
1.一种省际客运未按线路行驶违法行为智能检测方法,其特征在于,包括如下步骤:
步骤1:数据收集与预处理;
1.1 收集省际客运车辆的历史行驶数据和约定线路数据;上述数据通过车载卫星定位设备或车辆追踪***获得;
1.2 对收集到的数据进行预处理,所述预处理包括去除异常点、填补缺失值;
步骤2:线路聚类与优化;
2.1 使用聚类算法MiniBatchKMeans对提取的车辆卫星定位数据X进行聚类,X包括车辆的经度、纬度的属性;设定聚类数目k,进行k-means聚类,将行驶轨迹划分为k个簇;设定聚类簇中心C i ,计算每个数据点与簇中心的距离,选择距离最近的簇中心作为所属簇;距离越小,表示数据点更接近该簇中心,归属于同一类;所述距离的计算公式为:
,
其中i = 1,2,...,k
2.2 根据班次和班线信息将聚类结果分组,识别出同一班线下多个班次车辆的潜在合规出行线路;对每个班线,计算各个簇中的行驶轨迹数量占比P i ;P i 值越大,表示该簇中的轨迹在该班线中占据更大比例,更可能是合规线路,所述P i 值计算公式为:
P i = N i / N total
其中N i 为簇i中的轨迹数量,N total 为总轨迹数量;
2.3采用动态时间规整算法来计算相似度,两条轨迹之间的时间和空间变化;
步骤3:轨迹异常检测;
所述步骤3具体还包括,
3.1 将每天的车辆卫星定位轨迹与合规出行线路进行比对;计算每条实际行驶轨迹与合规线路之间的相似度S t ,通过计算实际行驶轨迹向量和合规出行线路向量的余弦相似度,得到车辆是否按照规定的线路行驶的度量;
相似度S t 的计算公式为:
;
其中A t 为实际行驶轨迹向量,B代表合规出行线路向量,θ t 表示实际行驶轨迹与合规线路之间的夹角,θ t 越小,表示实际行驶轨迹与合规线路越接近,车辆按照规定线路行驶的可能性更大;
3.2 使用异常检测算法判断车辆是否有未按线路行驶的违法行为;计算每个轨迹的异常得分E,设定阈值T,当E > T时,认为车辆存在未按约定线路行驶的违法行为;
所述步骤3.2具体还包括,
3.2.1 使用LOF算法进行异常检测;于每个轨迹点x,计算其k近邻距离和局部可达密度L(x),然后计算其邻居的局部可达密度之比LOF(x);如果LOF(x)大于阈值T LOF ,则认为该轨迹点存在异常;
计算轨迹点x到其k近邻中距离最远的那个近邻的距离;所述k近邻指的是在数据空间中与x最近的k个轨迹点d k (x),d k (x)计算公式如下:
;
通过计算x到所有k近邻y的距离,然后取最大值,得到x到其k近邻中距离最远的那个近邻的距离;
计算局部可达密度L(x),L(x)计算公式如下:
;
对所有的k近邻y,计算x到y的距离,并求和,和除以k,得到x到其k近邻的平均距离,然后取其倒数,得到局部可达密度L(x);
LOF,即局部异常因子,其计算涉及到轨迹点x的局部可达密度和它的k近邻的局部可达密度;L(x)代表轨迹点x的局部可达密度,L(y)代表x的k近邻之一的局部可达密度;LOF(x)是衡量轨迹点x的局部可达密度和它的邻居们的局部可达密度之间的相对关系;如果LOF(x)大于1,说明轨迹点x的局部密度比其邻居们低,以此判断可能是一个异常点;
LOF(x)计算公式如下:
;
其中y为x的k近邻之一,在计算L(x)时,需要计算轨迹点x到其每一个k近邻y的距离d k (x,y),然后取这些距离的平均值;在计算L(y)时,需要计算数据点y到其每一个k近邻包括x的距离,此时需要用到d k (x),然后取这些距离的平均值;d k (x,y)和d k (x)都是计算LOF的基础,它们的计算结果反映了轨迹点x的局部密度和它的邻居们的局部密度;
3.2.2 使用Isolation Forest算法进行异常检测,通过随机选择特征和划分值来构建一棵孤立树,将数据点分离到叶节点,计算每个数据点的孤立程度,即从根节点到叶节点的路径长度h(x);如果h(x)小于阈值T IF ,则该轨迹点存在异常;
所述孤立程度计算公式如下:
h(x) = E[H(x)]
其中H(x)为从根节点到叶节点的路径长度,E[·]表示期望值;
3.3 算法结果比对与优化;
步骤4:违法行为证据收集;
4.1 当判断出车辆未按线路行驶后,基于该车卫星定位数据调取周边监控视频,进行违法行为的抓拍;
4.2 提取该车的ETC出入口数据、ETC门架通行数据,作为未按线路行驶违法行为的证据材料;
步骤5:违法行为处理与统计分析;
5.1 当发现车辆存在违法行为时发出预警信息,立即通知交通管理部门或车辆所属公司,采取相应措施;
5.2 对违法行为进行标记并统计分析,为交通管理部门提供决策支持,提高道路安全和交通管理水平。
2.根据权利要求1所述的一种省际客运未按线路行驶违法行为智能检测方法,其特征在于,所述步骤2.3具体还包括,
2.3.1 使用动态时间规整算法计算潜在合规出行线路与途径路由轨迹之间的相似度;动态时间规整通过寻找两条轨迹之间的最优匹配路径来计算所述两条轨迹之间的距离,从而得到相似度;
2.3.2 对于每条潜在合规线路,计算与途径路由轨迹之间的动态时间规整距离D,取距离最小的线路作为优化后的合规线路;动态时间规整距离越小,表示潜在合规线路与途径路由轨迹越接近,所述动态时间规整距离D的计算公式为:
,
其中A i 为潜在合规线路的点,B j 为途径路由轨迹的点;
2.3.3 将动态时间规整距离转换为相似度,使用以下公式:
S=exp( -α* D )
其中α为一个正的常数,用于调整相似度的范围;
取相似度最高的线路作为优化后的合规线路。
3.根据权利要求1所述的一种省际客运未按线路行驶违法行为智能检测方法,其特征在于,所述步骤3.3具体还包括,
3.3.1 对LOF和Isolation Forest算法的异常检测结果进行比对;对于同时被两种算法标记为异常的数据点,其异常程度较高,需要特别关注;
3.3.2 根据实际情况,对两种算法的结果进行加权,形成综合评分;设置权重w LOF 和w IF ,使得w LOF + w IF =1;然后,计算每个数据点的综合评分E combined = w LOF * E LOF + w IF * E IF ,其中E LOF 和E IF 分别表示LOF和Isolation Forest算法得到的异常评分;当E combined >T combined 时,车辆存在违法行为。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310657816.0A CN116386339B (zh) | 2023-06-06 | 2023-06-06 | 一种省际客运未按线路行驶违法行为智能检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310657816.0A CN116386339B (zh) | 2023-06-06 | 2023-06-06 | 一种省际客运未按线路行驶违法行为智能检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116386339A CN116386339A (zh) | 2023-07-04 |
CN116386339B true CN116386339B (zh) | 2023-08-15 |
Family
ID=86969816
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310657816.0A Active CN116386339B (zh) | 2023-06-06 | 2023-06-06 | 一种省际客运未按线路行驶违法行为智能检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116386339B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011070332A (ja) * | 2009-09-25 | 2011-04-07 | Secom Co Ltd | 異常検知装置 |
CN103942533A (zh) * | 2014-03-24 | 2014-07-23 | 河海大学常州校区 | 一种基于视频监控***的城市交通违规行为检测方法 |
CN106960006A (zh) * | 2017-02-24 | 2017-07-18 | 河海大学 | 一种不同轨迹间相似度度量***及其度量方法 |
WO2017157119A1 (zh) * | 2016-03-18 | 2017-09-21 | 中兴通讯股份有限公司 | 一种车辆异常行为的识别方法及装置 |
CN108120991A (zh) * | 2017-12-06 | 2018-06-05 | 上海评驾科技有限公司 | 一种行车轨迹优化方法 |
CN110570658A (zh) * | 2019-10-23 | 2019-12-13 | 江苏智通交通科技有限公司 | 基于层次聚类的路口异常车辆轨迹识别分析方法 |
CN111930791A (zh) * | 2020-05-28 | 2020-11-13 | 中南大学 | 一种车辆轨迹的相似度计算方法、***及存储介质 |
CN111986226A (zh) * | 2020-08-25 | 2020-11-24 | 浙江工业大学 | 一种目标轨迹异常检测方法 |
CN113011367A (zh) * | 2021-03-31 | 2021-06-22 | 广州大学 | 一种基于目标轨迹的异常行为分析方法 |
CN114841712A (zh) * | 2022-03-01 | 2022-08-02 | 北京北大千方科技有限公司 | 网约车巡游违规运营状态的确定方法和装置及电子设备 |
-
2023
- 2023-06-06 CN CN202310657816.0A patent/CN116386339B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011070332A (ja) * | 2009-09-25 | 2011-04-07 | Secom Co Ltd | 異常検知装置 |
CN103942533A (zh) * | 2014-03-24 | 2014-07-23 | 河海大学常州校区 | 一种基于视频监控***的城市交通违规行为检测方法 |
WO2017157119A1 (zh) * | 2016-03-18 | 2017-09-21 | 中兴通讯股份有限公司 | 一种车辆异常行为的识别方法及装置 |
CN106960006A (zh) * | 2017-02-24 | 2017-07-18 | 河海大学 | 一种不同轨迹间相似度度量***及其度量方法 |
CN108120991A (zh) * | 2017-12-06 | 2018-06-05 | 上海评驾科技有限公司 | 一种行车轨迹优化方法 |
CN110570658A (zh) * | 2019-10-23 | 2019-12-13 | 江苏智通交通科技有限公司 | 基于层次聚类的路口异常车辆轨迹识别分析方法 |
CN111930791A (zh) * | 2020-05-28 | 2020-11-13 | 中南大学 | 一种车辆轨迹的相似度计算方法、***及存储介质 |
CN111986226A (zh) * | 2020-08-25 | 2020-11-24 | 浙江工业大学 | 一种目标轨迹异常检测方法 |
CN113011367A (zh) * | 2021-03-31 | 2021-06-22 | 广州大学 | 一种基于目标轨迹的异常行为分析方法 |
CN114841712A (zh) * | 2022-03-01 | 2022-08-02 | 北京北大千方科技有限公司 | 网约车巡游违规运营状态的确定方法和装置及电子设备 |
Non-Patent Citations (1)
Title |
---|
考虑轨迹分析的车辆异常行为辨识;丁华 等;《重庆理工大学学报(自然科学)》;第36卷(第7期);第62-69页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116386339A (zh) | 2023-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | A fast trajectory outlier detection approach via driving behavior modeling | |
Saunier et al. | Probabilistic collision prediction for vision-based automated road safety analysis | |
CN112597822A (zh) | 车辆的轨迹确定方法、装置、电子设备及计算机存储介质 | |
CN105138982A (zh) | 一种基于多特征聚类及分类的人群异常检测与评估方法 | |
CN104750800A (zh) | 一种基于出行时间特征的机动车聚类方法 | |
Guo et al. | Short-term traffic prediction under normal and incident conditions using singular spectrum analysis and the k-nearest neighbour method | |
CN111582380A (zh) | 一种基于时空特征的船舶轨迹密度聚类方法及装置 | |
CN111768619A (zh) | 一种基于卡口数据的快速路车辆od点确定方法 | |
CN113610188B (zh) | 弓网接触力非区段异常识别方法及装置 | |
CN111640304A (zh) | 面向连续流交通设施的交通拥堵传播特征自动化量化提取方法 | |
Wu et al. | Traffic pattern modeling, trajectory classification and vehicle tracking within urban intersections | |
Lu et al. | Shape-based vessel trajectory similarity computing and clustering: A brief review | |
CN116386339B (zh) | 一种省际客运未按线路行驶违法行为智能检测方法 | |
Thu et al. | Multi-source data analysis for bike sharing systems | |
CN111860383B (zh) | 一种群体异常行为识别方法、装置、设备及存储介质 | |
Wang et al. | Classification of ship trajectories by using naive Bayesian algorithm | |
Dadras et al. | Novel stop sign detection algorithm based on vehicle speed profile | |
CN117251722A (zh) | 一种基于大数据的智慧交通管理*** | |
CN116845863A (zh) | 基于时空轨迹的末端电网异常设备接入告警方法及装置 | |
Ismail et al. | Automated detection of spatial traffic violations through use of video sensors | |
CN110941278A (zh) | 一种站内动态安全分析方法 | |
Elnekave et al. | Discovering regular groups of mobile objects using incremental clustering | |
CN113345220B (zh) | 一种高速公路稽查车辆跟踪与预测分析*** | |
Yang et al. | Dynamic safety estimation of airport pick-up area based on video trajectory data | |
CN117610971B (zh) | 一种高速公路机电***健康指数评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |