CN111192452B - 行程数据分段方法、装置、存储介质和电子设备 - Google Patents
行程数据分段方法、装置、存储介质和电子设备 Download PDFInfo
- Publication number
- CN111192452B CN111192452B CN201911382449.8A CN201911382449A CN111192452B CN 111192452 B CN111192452 B CN 111192452B CN 201911382449 A CN201911382449 A CN 201911382449A CN 111192452 B CN111192452 B CN 111192452B
- Authority
- CN
- China
- Prior art keywords
- data
- target
- vehicle
- data points
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Computational Linguistics (AREA)
- Remote Sensing (AREA)
- Traffic Control Systems (AREA)
Abstract
本公开涉及一种行程数据分段方法、装置、存储介质和电子设备,该方法包括:将车辆的目标行程数据集中的每两个相邻的数据点之间的平均速度和第一速度阈值进行对比,为该目标行程数据集中的每个数据点添加状态标记;根据该状态标记从该目标行程数据集中标记出用于表征该车辆处于行驶状态的行驶段和用于表征该车辆处于停止状态的停留段;识别每个行驶段中的用于表征该车辆出现信号收发异常且处于停止状态的异常段;获取标记有行驶段、停留段和异常段的目标行程数据集,作为分段结果。能够根据每个数据点的状态标记确定车辆行程中的行驶段和停留段,进而根据数据点本身的特性对信号缺失的异常段进行识别,提高行程数据分段的效率和智能化程度。
Description
技术领域
本公开涉及智能驾驶领域,具体地,涉及一种行程数据分段方法、装置、存储介质和电子设备。
背景技术
目前,海量的数据充斥着我们的生活,对数据加以利用显得愈发重要。在驾驶行为分析领域,车载GPS(Global Positioning System,全球定位***)采集了大量的数据点,对这些数据点的研究可以帮助开发人员分析驾驶行为,进一步可以协助进行危险识别、危险预警和危险规避等。通常通过车载GPS采集的数据点对用户的行程进行识别和拆分(当车辆到达一个地点后,进行长时间的停留,就认为这个地点是一个行程的终点),但是GPS原始数据比较粗糙,有许多的异常数据点,该异常数据点包括:噪声数据点(具体表现在不同时刻不同地点的经纬度数据会存在重合或交叉等)和缺失数据点(当汽车行驶在隧道、车库或没有信号覆盖的偏远地区中时,由于接收不到信号,数据采集不到,从而导致数据所采集数据存在缺失点)。这些异常数据点往往导致行程识别具有较大的偏差,比如行程的误识别、漏识别等。相关技术中,通常需要在获取机器自动标注的行程分段结果后,通过人工对这些异常点进行识别和重新标注,导致整个行程数据分段过程的实施成本较高,同时效率和智能化程度较低。
发明内容
为克服相关技术中存在的问题,本公开的目的是提供一种行程数据分段方法、装置、存储介质和电子设备。
为了实现上述目的,根据本公开实施例的第一方面,提供一种行程数据分段方法,所述方法包括:
将车辆的目标行程数据集中的每两个相邻的数据点之间的平均速度和预先确定的目标阈值组中的第一速度阈值进行对比,以为所述目标行程数据集中的每个数据点添加状态标记,所述目标行程数据集包含以时间顺序排列的多个数据点,所述数据点由时间点和所述车辆在所述时间点所处的地理位置组成,所述状态标记为行驶状态标记和停止状态标记中的一者;
根据所述状态标记从所述目标行程数据集中标记出用于表征所述车辆处于行驶状态的行驶段和用于表征所述车辆处于停止状态的停留段;
识别每个所述行驶段中的用于表征所述车辆出现信号收发异常且处于停止状态的异常段,其中,所述异常段两端的数据点之间的时间间隔大于所述目标阈值组中的第一时间阈值,并且,所述车辆在所述异常段两端的数据点之间的平均速度大于所述目标阈值组中的第二速度阈值;
获取标记有所述行驶段、所述停留段和所述异常段的所述目标行程数据集,作为所述目标行程数据集的第一分段结果。
可选的,在所述将车辆的目标行程数据集中的每两个相邻的数据点之间的平均速度和预先确定的目标阈值组中的第一速度阈值进行对比,以为所述目标行程数据集中的每个数据点添加状态标记之前,所述方法还包括:
根据所述车辆的历史行程数据集的实际分段结果,确定第一阈值组,所述第一阈值组包括第三速度阈值、第四速度阈值和第二时间阈值;
根据所述第一阈值组,生成预设数量的第二阈值组;
将所述历史行程数据集作为所述目标行程数据集,通过每个所述第二阈值组替代所述目标阈值组,执行从所述将车辆的目标行程数据集中的每两个相邻的数据点之间的平均速度和预先确定的目标阈值组中的第一速度阈值进行对比,以为所述目标行程数据集中的每个数据点添加状态标记至所述识别每个所述行驶段中的用于表征所述车辆出现信号收发异常且处于停止状态的异常段的步骤,以获取所述历史行程数据集对应的所述预设数量的第二分段结果;
将每个所述第二分段结果和所述实际分段结果进行对比,以将与所述实际分段结果的重合度最高的第二分段结果对应的第二阈值组作为所述目标阈值组。
可选的,所述将车辆的目标行程数据集中的每两个相邻的数据点之间的平均速度和预先确定的目标阈值组中的第一速度阈值进行对比,以为所述目标行程数据集中的每个数据点添加状态标记,包括:
为所述目标行程数据集中的首个数据点添加停止状态标记;
根据两个第一数据点中的每个第一数据点包含的时间点和所述时间点对应的地理位置信息,确定所述车辆在所述两个第一数据点之间的第一平均速度,所述两个第一数据点为所述第一行程数据集中的任意两个相邻的数据点;
若所述第一平均速度大于或等于所述第一速度阈值,为所述两个第一数据点中的后一个数据点添加行驶状态标记;或者,
若所述第一平均速度小于所述第一速度阈值,为所述两个第一数据点中的后一个数据点添加停止状态标记。
可选的,所述根据所述状态标记从所述目标行程数据集中标记出用于表征所述车辆处于行驶状态的行驶段和用于表征所述车辆处于停止状态的停留段,包括:
若所述两个第一数据点中的前一个第一数据点的状态标记为行驶状态标记,并且所述两个第一数据点中的后一个第一数据点的状态标记为停止状态标记,将所述前一个第一数据点标记为行程终点;
若所述两个第一数据点中的前一个第一数据点的状态标记为停止状态标记,并且所述两个第一数据点中的后一个第一数据点的状态标记为行驶状态标记,将所述后一个第一数据点标记为行程起点;
根据所述目标行程数据集中的行程起点和行程终点确定所述行驶段和所述停留段,其中,所述行驶段包括所述目标行程数据集中相邻的行程起点和行程终点之间的多个数据点,所述停留段包括所述目标行程数据集中相邻的行程终点和行程起点和所述相邻的行程终点和行程起点之间的一个或多个数据点。
可选的,所述识别每个所述行驶段中的用于表征所述车辆出现信号收发异常且处于停止状态的异常段,包括:
识别所述行驶段中的信号缺失段,所述信号缺失段由所述行驶段中的相邻的两个目标数据点组成,所述两个目标数据点之间的时间间隔大于所述第一时间阈值;
根据所述第二速度阈值,确定所述信号缺失段是否为所述异常段。
可选的,所述根据所述第二速度阈值,确定所述信号缺失段是否为所述异常段,包括:
确定所述车辆在所述两个目标数据点之间的第二平均速度;
若所述第二平均速度小于所述第二速度阈值,将所述信号缺失段中的前一个目标数据点标记为行程终点,并将所述信号缺失段中的后一个目标数据点标记为行程起点,以将所述信号缺失段作为所述异常段。
可选的,所述实际分段结果包括:通过对所述历史行程数据集中的多个数据点中的行程起点和行程终点进行人工标注后确定的标记有所述行驶段、所述停留段和所述异常段的所述历史行程数据集,所述根据所述历史行程数据集的实际分段结果,确定第一阈值组,包括:
针对于所述第三速度阈值:
获取所述车辆在所述历史行程数据集中的每个停留段中的每两个数据点之间的平均速度,以获取第一平均速度集;
获取所述车辆在所述历史行程数据集中的每个行驶段中的每两个数据点之间的平均速度,以获取第二平均速度集;
将所述第一平均速度集和所述第二平均速度集的交集的中位数,作为所述第三速度阈值;以及,
针对于所述第四速度阈值:
获取所述车辆在所述历史行程数据集中的每个异常段两端的数据点之间的平均速度,以获取第三平均速度集;
将所述第三平均速度集和所述第二平均速度集的交集的中位数,作为所述第四速度阈值;以及,
针对于所述第二时间阈值:
获取所述历史行程数据集中的每个停留段两端的数据点之间的时长间隔,以获取第一时长间隔集;
获取所述历史行程数据集中的每个异常段两端的数据点之间的时长间隔,以获取第二时长间隔集;
将所述第二时长间隔集和所述第二时长间隔集中的最小的时长间隔,作为所述第二时间阈值。
可选的,所述根据所述第一阈值组,生成预设数量的第二阈值组,包括:
获取与所述第三速度阈值的差值小于第一预设差值的多个第五速度阈值;
获取与所述第四速度阈值的差值小于第二预设差值的多个第六速度阈值;
获取与所述第二时间阈值的差值小于第三预设差值的多个第三时间阈值;
根据第三速度阈值、第四速度阈值和第二时间阈值,以及所述多个第五速度阈值、所述多个第六速度阈值和所述多个第三时间阈值,生成所述预设数量的第二阈值组;其中,
所述第二阈值组包括:第七速度阈值、第八速度阈值和第四时间阈值,所述第七速度阈值为所述第三速度阈值和所述多个第五速度阈值中的任一速度阈值,所述第七速度阈值为所述第四速度阈值和所述多个第六速度阈值中的任一速度阈值,所述第四时间阈值为所述第二时间阈值和所述多个第三时间阈值中的任一速度阈值。
根据本公开实施例的第二方面,提供一种行程数据分段装置,所述装置包括:
第一行程标记模块,用于将车辆的目标行程数据集中的每两个相邻的数据点之间的平均速度和预先确定的目标阈值组中的第一速度阈值进行对比,以为所述目标行程数据集中的每个数据点添加状态标记,所述目标行程数据集包含以时间顺序排列的多个数据点,所述数据点由时间点和所述车辆在所述时间点所处的地理位置组成,所述状态标记为行驶状态标记和停止状态标记中的一者;
第二行程标记模块,用于根据所述状态标记从所述目标行程数据集中标记出用于表征所述车辆处于行驶状态的行驶段和用于表征所述车辆处于停止状态的停留段;
异常段标记模块,用于识别每个所述行驶段中的用于表征所述车辆出现信号收发异常且处于停止状态的异常段,其中,所述异常段两端的数据点之间的时间间隔大于所述目标阈值组中的第一时间阈值,并且,所述车辆在所述异常段两端的数据点之间的平均速度大于所述目标阈值组中的第二速度阈值;
第一分段结果获取模块,用于获取标记有所述行驶段、所述停留段和所述异常段的所述目标行程数据集,作为所述目标行程数据集的第一分段结果。
可选的,所述方法还包括:
第一阈值确定模块,用于根据所述车辆的历史行程数据集的实际分段结果,确定第一阈值组,所述第一阈值组包括第三速度阈值、第四速度阈值和第二时间阈值;
阈值组生成模块,用于根据所述第一阈值组,生成预设数量的第二阈值组;
第二分段结果获取模块,用于将所述历史行程数据集作为所述目标行程数据集,通过每个所述第二阈值组替代所述目标阈值组,执行从所述将车辆的目标行程数据集中的每两个相邻的数据点之间的平均速度和预先确定的目标阈值组中的第一速度阈值进行对比,以为所述目标行程数据集中的每个数据点添加状态标记至所述识别每个所述行驶段中的用于表征所述车辆出现信号收发异常且处于停止状态的异常段的步骤,以获取所述历史行程数据集对应的所述预设数量的第二分段结果;
第二阈值确定模块,用于将每个所述第二分段结果和所述实际分段结果进行对比,以将与所述实际分段结果的重合度最高的第二分段结果对应的第二阈值组作为所述目标阈值组。
可选的,所述第一行程标记模块,用于:
为所述目标行程数据集中的首个数据点添加停止状态标记;
根据两个第一数据点中的每个第一数据点包含的时间点和所述时间点对应的地理位置信息,确定所述车辆在所述两个第一数据点之间的第一平均速度,所述两个第一数据点为所述第一行程数据集中的任意两个相邻的数据点;
若所述第一平均速度大于或等于所述第一速度阈值,为所述两个第一数据点中的后一个数据点添加行驶状态标记;或者,
若所述第一平均速度小于所述第一速度阈值,为所述两个第一数据点中的后一个数据点添加停止状态标记。
可选的,所述第二行程标记模块,用于:
若所述两个第一数据点中的前一个第一数据点的状态标记为行驶状态标记,并且所述两个第一数据点中的后一个第一数据点的状态标记为停止状态标记,将所述前一个第一数据点标记为行程终点;
若所述两个第一数据点中的前一个第一数据点的状态标记为停止状态标记,并且所述两个第一数据点中的后一个第一数据点的状态标记为行驶状态标记,将所述后一个第一数据点标记为行程起点;
根据所述目标行程数据集中的行程起点和行程终点确定所述行驶段和所述停留段,其中,所述行驶段包括所述目标行程数据集中相邻的行程起点和行程终点之间的多个数据点,所述停留段包括所述目标行程数据集中相邻的行程终点和行程起点和所述相邻的行程终点和行程起点之间的一个或多个数据点。
可选的,所述异常段标记模块,用于:
识别所述行驶段中的信号缺失段,所述信号缺失段由所述行驶段中的相邻的两个目标数据点组成,所述两个目标数据点之间的时间间隔大于所述第一时间阈值;
根据所述第二速度阈值,确定所述信号缺失段是否为所述异常段。
可选的,所述异常段标记模块,用于:
确定所述车辆在所述两个目标数据点之间的第二平均速度;
若所述第二平均速度小于所述第二速度阈值,将所述信号缺失段中的前一个目标数据点标记为行程终点,并将所述信号缺失段中的后一个目标数据点标记为行程起点,以将所述信号缺失段作为所述异常段。
可选的,所述实际分段结果包括:通过对所述历史行程数据集中的多个数据点中的行程起点和行程终点进行人工标注后确定的标记有所述行驶段、所述停留段和所述异常段的所述历史行程数据集,所述第一阈值确定模块,用于:
针对于所述第三速度阈值:
获取所述车辆在所述历史行程数据集中的每个停留段中的每两个数据点之间的平均速度,以获取第一平均速度集;
获取所述车辆在所述历史行程数据集中的每个行驶段中的每两个数据点之间的平均速度,以获取第二平均速度集;
将所述第一平均速度集和所述第二平均速度集的交集的中位数,作为所述第三速度阈值;以及,
针对于所述第四速度阈值:
获取所述车辆在所述历史行程数据集中的每个异常段两端的数据点之间的平均速度,以获取第三平均速度集;
将所述第三平均速度集和所述第二平均速度集的交集的中位数,作为所述第四速度阈值;以及,
针对于所述第二时间阈值:
获取所述历史行程数据集中的每个停留段两端的数据点之间的时长间隔,以获取第一时长间隔集;
获取所述历史行程数据集中的每个异常段两端的数据点之间的时长间隔,以获取第二时长间隔集;
将所述第二时长间隔集和所述第二时长间隔集中的最小的时长间隔,作为所述第二时间阈值。
可选的,所述阈值组生成模块,用于:
获取与所述第三速度阈值的差值小于第一预设差值的多个第五速度阈值;
获取与所述第四速度阈值的差值小于第二预设差值的多个第六速度阈值;
获取与所述第二时间阈值的差值小于第三预设差值的多个第三时间阈值;
根据第三速度阈值、第四速度阈值和第二时间阈值,以及所述多个第五速度阈值、所述多个第六速度阈值和所述多个第三时间阈值,生成所述预设数量的第二阈值组;其中,
所述第二阈值组包括:第七速度阈值、第八速度阈值和第四时间阈值,所述第七速度阈值为所述第三速度阈值和所述多个第五速度阈值中的任一速度阈值,所述第七速度阈值为所述第四速度阈值和所述多个第六速度阈值中的任一速度阈值,所述第四时间阈值为所述第二时间阈值和所述多个第三时间阈值中的任一速度阈值。
根据本公开实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本公开实施例第一方面提供的行程数据分段方法的步骤。
根据本公开实施例的第四方面,提供一种电子设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现本公开实施例第一方面提供的行程数据分段方法的步骤。
通过上述技术方案,本公开能够将车辆的目标行程数据集中的每两个相邻的数据点之间的平均速度和预先确定的目标阈值组中的第一速度阈值进行对比,以为该目标行程数据集中的每个数据点添加状态标记,该目标行程数据集包含以时间顺序排列的多个数据点,该数据点由时间点和该车辆在该时间点所处的地理位置组成,该状态标记为行驶状态标记和停止状态标记中的一者;根据该状态标记从该目标行程数据集中标记出用于表征该车辆处于行驶状态的行驶段和用于表征该车辆处于停止状态的停留段;识别每个该行驶段中的用于表征该车辆出现信号收发异常且处于停止状态的异常段,其中,该异常段两端的数据点之间的时间间隔大于该目标阈值组中的第一时间阈值,并且,该车辆在该异常段两端的数据点之间的平均速度大于该目标阈值组中的第二速度阈值;获取标记有该行驶段、该停留段和该异常段的该目标行程数据集,作为该目标行程数据集的第一分段结果。能够根据每个数据点的状态标记确定车辆行程中的行驶段和停留段,进而根据数据点本身的特性对信号缺失的异常段进行识别,提高行程数据分段的效率和智能化程度。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1是根据一示例性实施例示出的一种行程数据分段方法的流程图;
图2是根据图1所示实施例示出的另一种行程数据分段方法的流程图;
图3是根据图2所示实施例示出的一种为数据点添加标记的方法的流程图;
图4是根据图2所示实施例示出的一种确定行驶段和停留段的方法的流程图;
图5是根据图2所示实施例示出的一种识别异常段的方法的流程图;
图6是根据一示例性实施例示出的一种行程数据分段装置的框图;
图7是根据图6所示实施例示出的另一种行程数据分段装置的框图;
图8是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种行程数据分段方法的流程图,如图1所示,该方法包括:
步骤101,将车辆的目标行程数据集中的每两个相邻的数据点之间的平均速度和预先确定的目标阈值组中的第一速度阈值进行对比,以为该目标行程数据集中的每个数据点添加状态标记。
其中,该目标行程数据集包含以时间顺序排列的多个数据点,该数据点由时间点和该车辆在该时间点所处的地理位置组成,该状态标记为行驶状态标记和停止状态标记中的一者。
示例地,该目标行程数据集为在预设时间段内采集到的车辆的行程数据的集合,其中的多个数据点通过时间点和地理位置的组合可以反映出车辆的行驶状态。该预设时间段可以为,例如,一天或者一周等,该地理位置可以为经纬度坐标。可以理解的是,基于该目标行程数据集中相邻的两个数据点中包含的时间点和地理位置,可以确定车辆在两个数据点之间的平均速度。具体地,可以将两个数据点中的两个经纬度坐标之间的距离,作为车辆在这两个数据点间的行驶距离,该行驶距离优选为根据预设的地图***确定的实际行驶距离,而非直线距离。根据该行驶距离和两个数据点中的两个时间点之间的时间间隔可以确定车辆在两个数据点之间的平均速度。此后,可以对该平均速度与该第一速度阈值的大小关系进行判断,进而将这两个数据点中的任一数据点标记为停止状态或行驶状态。需要说明的是,由于两个数据点之间的时间间隔较小(时间间隔较大的相邻两个数据点会在下列步骤103中被判断为异常段),因此被标记的数据点可以为这两个数据点中的任一个数据点,而不影响最后的分段结果的准确度。但是,每次判断后被标记的数据点的位置选择应当一致,即,每次对相邻的两个数据点的平均速度进行判断后被标记的数据点应当都为这两个数据点中的前一个数据点,或者,都为这两个数据点中的后一个数据点。在步骤101之后,该目标行程数据集中的所有数据点都变成了附带行驶状态标记或停止状态标记的数据点。
步骤102,根据该状态标记从该目标行程数据集中标记出用于表征该车辆处于行驶状态的行驶段和用于表征该车辆处于停止状态的停留段。
示例地,在上述步骤101后,该目标行程数据集中的某一段附带状态标记的数据点可以表示为,例如,“…(3A)(4B)(5B)(6B)(7A)(8A)(9A)(10A)(11A)(12A)(13B)…”,其中,3-13表示数据点的时间顺序,A表示行驶状态标记,B表示停止状态标记。如此,这一段数据点,可以被划分为,停留段(4B)(5B)(6B),行驶段Y(7A)(8A)(9A)(10A)(11A)(12A)。具体地,可以将其中的(3A)(4B)、(6B)(7A)或(12A)(13B)称为一组状态转换点,在具体的行程起/终点的判断过程中,可以统一将每组状态转换点中的停止状态的数据点确定为行程起/终点,或者也可以统一将每组状态转换点中的行驶状态的数据点确定为行程起/终点。例如,行驶段Y(7A)(8A)(9A)(10A)(11A)(12A)中的(7A)被标记为行程起点,(12A)被标记为行程终点。如此,行程终点和行程起点之间的多个数据点构成停留段,该行程起点和该行程终点以及该行程起点和该行程终点之间的多个数据点构成该行驶段。
步骤103,识别每个该行驶段中的用于表征该车辆出现信号收发异常且处于停止状态的异常段。
其中,该异常段两端的数据点之间的时间间隔大于该目标阈值组中的第一时间阈值,并且,该车辆在该异常段两端的数据点之间的平均速度大于该目标阈值组中的第二速度阈值。
示例地,当车辆进入地库或者进入信号无法覆盖的偏远地区时,会出现车辆无法正常收发信号的情况,在这种情况下,这一段时间内的数据点是缺失的。而基于上述步骤102中,行驶段和停留段是根据该状态标记确定,因此可能出现信号缺失段包含在行驶段内部的情况。在这种情况下,如果车辆是在信号无法覆盖的偏远地区行驶,那么该行驶段的判断依然是正确的;而如果车辆是进入地库,那么车辆在这段信号缺失段对应的时间段中大概率处于停止状态,进而可以确定该行驶段的判断是错误的。因此,在步骤103中,需要从划分好的行驶段中确定表明该车辆既出现信号收发异常又处于停止状态的一段数据点(由于信号缺失,这段数据点通常只包含信号缺失前和信号恢复后的两个数据点)。这段数据点实际上也是停留段,但没有在步骤102中被识别出,为了与上述步骤102中直接识别出的停留段进行区分,在本公开实施例中,将这段数据点称为异常段。
步骤104,获取标记有该行驶段、该停留段和该异常段的该目标行程数据集,作为该目标行程数据集的第一分段结果。
示例地,在步骤101至103之后,实际上该目标行程中的多个数据点中的某些数据点被认定为行程起点和行程终点,通过这些行程起点和行程终点可以直接分辨其中的行驶段、停留段和异常段。需要说明的是,基于这些行程起点和行程终点,停留段和异常段的区分方法为,仅包含两个数据点(前为行程终点后为行程起点),并且两个数据点之间的时间间隔较大(这些条件都是可以根据数据点的实际数据直观地看出的)的两个数据点为异常段,其他则为停留段。因此,可以认为附带行程起/终点标记的该目标行程数据段,即为该第一分段结果。在此之后,可以根据该分段结果分析该车辆驾驶者的出行习惯和频繁活动轨迹。
综上所述,本公开能够将车辆的目标行程数据集中的每两个相邻的数据点之间的平均速度和预先确定的目标阈值组中的第一速度阈值进行对比,以为该目标行程数据集中的每个数据点添加状态标记,该目标行程数据集包含以时间顺序排列的多个数据点,该数据点由时间点和该车辆在该时间点所处的地理位置组成,该状态标记为行驶状态标记和停止状态标记中的一者;根据该状态标记从该目标行程数据集中标记出用于表征该车辆处于行驶状态的行驶段和用于表征该车辆处于停止状态的停留段;识别每个该行驶段中的用于表征该车辆出现信号收发异常且处于停止状态的异常段,其中,该异常段两端的数据点之间的时间间隔大于该目标阈值组中的第一时间阈值,并且,该车辆在该异常段两端的数据点之间的平均速度大于该目标阈值组中的第二速度阈值;获取标记有该行驶段、该停留段和该异常段的该目标行程数据集,作为该目标行程数据集的第一分段结果。能够根据每个数据点的状态标记确定车辆行程中的行驶段和停留段,进而根据数据点本身的特性对信号缺失的异常段进行识别,提高行程数据分段的效率和智能化程度。
图2是根据图1所示实施例示出的另一种行程数据分段方法的流程图,如图2所示,在上述步骤101之前,该方法还可以包括:步骤105-108。
步骤105,根据该车辆的历史行程数据集的实际分段结果,确定第一阈值组。
其中,该第一阈值组包括第三速度阈值、第四速度阈值和第二时间阈值。
示例地,在步骤101之前,需要先根据已经人工标注好的历史行程数据集确定步骤101-104中所使用的三种阈值(即上述的第一速度阈值、第二速度阈值和第一时间阈值),以确保步骤104中的第一分段结果的正确性。该步骤101-104可以被称为实际应用过程,该步骤105-108为用于确定实际应用过程所采用的目标阈值组的测试过程。该实际分段结果包括:通过对该历史行程数据集中的多个数据点中的行程起点和行程终点进行人工标注后确定的标记有该行驶段、该停留段和该异常段的该历史行程数据集。需要说明的是,该历史行程数据集的实际分段结果包含多个数据点,这些数据点中的某些数据点被认定为行程起点和行程终点,并且这些人工标注的行程起/终点可以认为是完全准确的。与上述目标行程数据集的第一分段结果相同,通过这些被标注为行程起点和行程终点的数据点,可以直接地分辨出其中的行驶段、停留段和异常段。
示例地,基于历史行程数据集中的行驶段、停留段和异常段,可以确定一个在理论上使行程数据的分段结果具备较高正确度的阈值组(即第三速度阈值、第四速度阈值和第二时间阈值)。具体地,针对于该第三速度阈值,该步骤105可以包括:获取该车辆在该历史行程数据集中的每个停留段中的每两个数据点之间的平均速度,以获取第一平均速度集;获取该车辆在该历史行程数据集中的每个行驶段中的每两个数据点之间的平均速度,以获取第二平均速度集;将该第一平均速度集和该第二平均速度集的交集的中位数,作为该第三速度阈值。需要说明的是,两个数据点之间的平均速度不一定为0,具体地,例如,两个数据点之间的时间间隔为2秒,其中,在前0.2秒车辆处于行驶状态,但移动距离很小(例如,在调整停车位置),在后1.8秒车辆处于停止状态。如此,车辆在这段时间内的既有行驶状态又有停止状态,但是由于平均速度过小,因此依然认为这两个数据点是停留段中的数据点。
示例地,针对于该第四速度阈值,该步骤105可以包括:获取该车辆在该历史行程数据集中的每个异常段两端的数据点之间的平均速度,以获取第三平均速度集;将该第三平均速度集和该第二平均速度集的交集的中位数,作为该第四速度阈值。以及,针对于该第二时间阈值,该步骤105可以包括:获取该历史行程数据集中的每个停留段两端的数据点之间的时长间隔,以获取第一时长间隔集;获取该历史行程数据集中的每个异常段两端的数据点之间的时长间隔,以获取第二时长间隔集;将该第一时长间隔集和该第二时长间隔集中的最小的时长间隔,作为该第二时间阈值。
步骤106,根据该第一阈值组,生成预设数量的第二阈值组。
示例地,如上所述,该第一阈值组仅是在理论上使行程数据的分段结果具备较高正确度。但经过大量试验后确认,由于阈值生成的依据(即行程数据)可能存在噪声点,因此生成的第一阈值组可能存在一定的误差。在这种情况下,能使分段结果具备高正确率的也可能是该第一阈值组中的每个阈值周边的点,或者说,即针对于上述每个阈值,与该阈值的差值在预设范围内的某一个阈值。因此,在该步骤106中,针对于上述每个阈值,可以获取与其差值小于某预设差值的多个阈值,进而生成预设数量的,例如,100个该第二阈值组。具体地,该步骤106可以包括:获取与该第三速度阈值的差值小于第一预设差值的多个第五速度阈值;获取与该第四速度阈值的差值小于第二预设差值的多个第六速度阈值;获取与该第二时间阈值的差值小于第三预设差值的多个第三时间阈值;根据第三速度阈值、第四速度阈值和第二时间阈值,以及所述多个第五速度阈值、所述多个第六速度阈值和所述多个第三时间阈值,生成该预设数量的第二阈值组;其中,该第二阈值组包括:第七速度阈值、第八速度阈值和第四时间阈值,该第七速度阈值为该第三速度阈值和上述多个第五速度阈值中的任一速度阈值,该第八速度阈值为该第四速度阈值和上述多个第六速度阈值中的任一速度阈值,该第四时间阈值为该第二时间阈值和上述多个第三时间阈值中的任一速度阈值。
示例地,可以理解的是,针对第一阈值组中的三种阈值,可以由第三速度阈值、第四速度阈值和第二时间阈值,以及所述多个第五速度阈值、所述多个第六速度阈值和所述多个第三时间阈值进行随机组合。具体来说,可以在第三速度阈值和所述多个第五速度阈值任选一个,作为用于在下列步骤107中替代目标阈值组中第一速度阈值的速度阈值。以及,可以在第四速度阈值和所述多个第六速度阈值任选一个,作为用于在下列步骤107中替代目标阈值组中第二速度阈值的速度阈值。以及,可以在第二时间阈值和所述多个第三时间阈值任选一个,作为用于在下列步骤107中替代目标阈值组中第二速度阈值的速度阈值。重复执行上述过程,直至该第二阈值组的数量达到该预设数量。
步骤107,将该历史行程数据集作为该目标行程数据集,通过每个该第二阈值组替代该目标阈值组,执行从该将车辆的目标行程数据集中的每两个相邻的数据点之间的平均速度和预先确定的目标阈值组中的第一速度阈值进行对比,以为所述目标行程数据集中的每个数据点添加状态标记至该识别每个该行驶段中的用于表征该车辆出现信号收发异常且处于停止状态的异常段的步骤,以获取该历史行程数据集对应的该预设数量的第二分段结果。
示例地,在确定上述预设数量的第二阈值组后,可以用每个第二阈值组替代目标阈值组,对该历史行程数据集执行上述步骤101-103的步骤(执行预设数量,例如100次),以获得100个第二分段结果。
步骤108,将每个该第二分段结果和该实际分段结果进行对比,以将与该实际分段结果的重合度最高的第二分段结果对应的第二阈值组作为该目标阈值组。
示例地,该重合度可以通过预设的查全率函数和查准率函数确定。该查全率函数可以包括:1、在所有的行程起点中,被正确识别的个数所占得比例函数:len1(实际分段结果中的行程起点和第二分段结果中的行程起点的交集的数量)/len2(实际分段结果中的行程起点的数量);2、在所有的行程终点中,被正确识别的个数所占的比例函数:len3(实际分段结果中的行程终点和第二分段结果中的行程终点的交集的数量)/len4(实际分段结果中的行程起点的数量);3、在所有的行程中,被正确识别的个数所占的比例函数:len5(实际分段结果中的行驶段、异常段和停留段和第二分段结果中行驶段、异常段和停留段的交集的数量)/len6(实际分段结果中的行驶段、异常段和停留段的总数量)。该查准率函数可以包括:4、在所有识别出的行程起点中,真起点所占的比例函数:len1/len7(第二分段结果中的行程起点的数量);5、在所有识别出的行程终点中,真终点所占的比例函数:len3/len8(第二分段结果中的行程终点的数量);6、在所有的行程中,真行程的个数所占的比例函数:len5/len9(第二分段结果中的行驶段、异常段和停留段的总数量)。
示例地,将上述的实际分段结果和预设数量的第二分段结果分别代入上述6个函数,再获取根据6个函数得出的比例值的总和。其中,具备比例值总和最大的第二分段结果即为与该实际分段结果的重合度最高的第二分段结果,进而可以将该第二分段结果对应的第二阈值组,作为实际计算过程中的目标阈值组。
示例地,该第一速度阈值用于识别停留段,该第二速度阈值用于识别异常段,如上所述,异常段是一种特殊的停留段。理论上来说,如果该第二速度阈值小于该第一速度阈值,异常段两端的数据点会在步骤101后被标记为停止状态,进而作为停留段被识别出,也就不会出现异常段包含于行驶段的情况(即所有停留段,无论是特殊的还是一般的停留段都会在102后被识别出)。而步骤103则无法实现,如此则无法体现出异常段相对于停留段的差异性。步骤108中得到的结果也印证了上述理论,即,该目标阈值组中的第二速度阈值略大于第一速度阈值。
图3是根据图2所示实施例示出的一种为数据点添加标记的方法的流程图,如图3所示,上述步骤101可以包括:下列步骤1011至1013,或者,下列步骤1011、1012和1014。
步骤1011,为该目标行程数据集中的首个数据点添加停止状态标记。
步骤1012,根据两个第一数据点中的每个第一数据点包含的时间点和该时间点对应的地理位置信息,确定该车辆在上述两个第一数据点之间的第一平均速度。
其中,上述两个第一数据点为该第一行程数据集中的任意两个相邻的数据点。
该步骤1013,若该第一平均速度大于或等于该第一速度阈值,为上述两个第一数据点中的后一个数据点添加行驶状态标记。
该步骤1014,若该第一平均速度小于该第一速度阈值,为上述两个第一数据点中的后一个数据点添加停止状态标记。
示例地,如果每次对相邻的两个数据点的平均速度进行判断后被添加状态标记的数据点都为这两个数据点中的后一个数据点,那么可以直接将该目标行程数据集中的首个数据点设定为停止状态。反之,如果每次对相邻的两个数据点的平均速度进行判断后被添加状态标记的数据点都为这两个数据点中的前一个数据点,那么可以直接将该目标行程数据集中的最后一个数据点设定为停止状态。如此,可以保证数据点状态标记的完整性。
图4是根据图2所示实施例示出的一种确定行驶段和停留段的方法的流程图,如图4所示,上述步骤102可以包括:
步骤1021,若上述两个第一数据点中的前一个第一数据点的状态标记为行驶状态标记,并且上述两个第一数据点中的后一个第一数据点的状态标记为停止状态标记,将上述后一个第一数据点标记为行程终点。
步骤1022,若上述两个第一数据点中的前一个第一数据点的状态标记为停止状态标记,并且上述两个第一数据点中的后一个第一数据点的状态标记为行驶状态标记,将上述前一个第一数据点标记为行程起点。
依然以上述的一段附带状态标记的数据点“…(3A)(4B)(5B)(6B)(7A)(8A)(9A)(10A)(11A)(12A)(13B)…”为例,可以将其中的(3A)(4B)、(6B)(7A)或(12A)(13B)称为一组状态转换点,在具体的行程起/终点的判断过程中,可以统一将每组状态转换点中的停止状态的数据点确定为作为行程起/终点(如上述步骤1021和1022所示),或者也可以统一将每组状态转换点中的行驶状态的数据点确定为作为行程起/终点。
步骤1023,根据该目标行程数据集中的行程起点和行程终点确定该行驶段和该停留段,其中,该行驶段包括该目标行程数据集中相邻的行程起点和行程终点之间的多个数据点,该停留段包括该目标行程数据集中相邻的行程终点和行程起点和所述相邻的行程终点和行程起点之间的一个或多个数据点。
示例地,可以理解的是,由于在上述步骤1021和1022中,统一将行驶状态的数据点确定为作为行程起/终点,因此,该行驶段包括该目标行程数据集中相邻的行程终点和行程起点和所述相邻的行程终点和行程起点之间的多个数据点,而该停留段仅包括该目标行程数据集中相邻的行程终点和行程起点之间的多个数据点。依然以上述的一段数据点“…(3A)(4B)(5B)(6B)(7A)(8A)(9A)(10A)(11A)(12A)(13B)…”为例,在统一将停止状态的数据点确定为作为行程起/终点的情况下,针对于(3A)(4B)、(6B)(7A)或(12A)(13B)这三组状态转换点,可以将数据点(4B)作为行程段X的行程终点,将(6B)作为行程段Y的行程起点,将(13B)作为行程段Y的行程终点。如此,可以确定停留段为该目标行程数据集中相邻的行程终点(4B)和行程起点(6B)和所述相邻的行程终点(4B)和行程起点(6B)之间的一个或多个数据点(5B),进而可以确定停留段(4B)(5B)(6B)。同时可以确定行驶段Y为该目标行程数据集中相邻的行程起点(6B)和行程终点(13B)之间的多个数据点(7A)(8A)(9A)(10A)(11A)(12A)。
图5是根据图2所示实施例示出的一种识别异常段的方法的流程图,如图5所示,上述步骤103可以包括:
步骤1031,识别该行驶段中的信号缺失段。
其中,该信号缺失段由该行驶段中的相邻的两个目标数据点组成,上述两个目标数据点之间的时间间隔大于该第一时间阈值。
示例地,通常情况下,在本公开实施例中,在上述的预设时间段内,***被设定为每隔预设时长采集一次时间信息和车辆的地理位置信息。但是,由于行车环境的复杂性,采集到的目标行程数据集中的每两个数据点之间的时间间隔并不一定都为该预设时长,即,目标行程数据集中的每两个数据点之间的时间间隔可以处在一个可接受的时间范围内。但是当该时间间隔大于上述可接受的时间范围(该第一时间阈值)时,例如,相邻的两个数据点之间的时间间隔为3小时,那么,可以认为在这三小时中该车辆出现了信号收发异常的情况,即这两个数据点之间为上述的信号缺失段。需要说明的是,在进行信号缺失段的判断时,可以忽略行驶段中已经被认定为行程起/终点的数据点,或者说,在行驶段的第二个数据点和倒数第二个数据点之间进行上述的信号缺失段的识别。
步骤1032,根据该第二速度阈值,确定该信号缺失段是否为该异常段。
示例地,可以理解的是,如果车辆在信号缺失段内的平均速度较大,可以确定车辆在信号缺失段中依然保持行驶;如果车辆在信号缺失段内的平均速度较小,可以确定车辆在信号缺失段中处于停止状态。具体地,该步骤1032可以包括:确定该车辆在上述两个目标数据点之间的第二平均速度;若该第二平均速度小于该第二速度阈值,将该信号缺失段中的前一个目标数据点标记为行程终点,并将该信号缺失段中的后一个目标数据点标记为行程起点,以将该信号缺失段作为该异常段。
综上所述,本公开能够将车辆的目标行程数据集中的每两个相邻的数据点之间的平均速度和预先确定的目标阈值组中的第一速度阈值进行对比,以为该目标行程数据集中的每个数据点添加状态标记,该目标行程数据集包含以时间顺序排列的多个数据点,该数据点由时间点和该车辆在该时间点所处的地理位置组成,该状态标记为行驶状态标记和停止状态标记中的一者;根据该状态标记从该目标行程数据集中标记出用于表征该车辆处于行驶状态的行驶段和用于表征该车辆处于停止状态的停留段;识别每个该行驶段中的用于表征该车辆出现信号收发异常且处于停止状态的异常段,其中,该异常段两端的数据点之间的时间间隔大于该目标阈值组中的第一时间阈值,并且,该车辆在该异常段两端的数据点之间的平均速度大于该目标阈值组中的第二速度阈值;获取标记有该行驶段、该停留段和该异常段的该目标行程数据集,作为该目标行程数据集的第一分段结果。能够在通过测试过程得到准确的速度阈值和时间阈值后,根据每个数据点的状态标记确定车辆在行程中的状态转换点,进而根据该状态转换点车辆行程中的行驶段和停留段,避免噪声数据点对行程数据分段的影响,同时根据数据点本身的特性对信号缺失的异常段进行识别和重新分段,在保证行程数据准确度的同时,提高行程数据分段的效率和智能化程度。
图6是根据一示例性实施例示出的一种行程数据分段装置的框图,如图6所示,该装置600包括:
第一行程标记模块610,用于将车辆的目标行程数据集中的每两个相邻的数据点之间的平均速度和预先确定的目标阈值组中的第一速度阈值进行对比,以为所述目标行程数据集中的每个数据点添加状态标记,该目标行程数据集包含以时间顺序排列的多个数据点,该数据点由时间点和该车辆在该时间点所处的地理位置组成,该状态标记为行驶状态标记和停止状态标记中的一者;
第二行程标记模块620,用于根据该状态标记从该目标行程数据集中标记出用于表征该车辆处于行驶状态的行驶段和用于表征该车辆处于停止状态的停留段;
异常段标记模块630,用于识别每个该行驶段中的用于表征该车辆出现信号收发异常且处于停止状态的异常段,其中,该异常段两端的数据点之间的时间间隔大于该目标阈值组中的第一时间阈值,并且,该车辆在该异常段两端的数据点之间的平均速度大于该目标阈值组中的第二速度阈值;
第一分段结果获取模块640,用于获取标记有该行驶段、该停留段和该异常段的该目标行程数据集,作为该目标行程数据集的第一分段结果。
图7是根据图6所示实施例示出的另一种行程数据分段装置的框图,如图7所示,该装置600还包括:
第一阈值确定模块650,用于根据该车辆的历史行程数据集的实际分段结果,确定第一阈值组,该第一阈值组包括第三速度阈值、第四速度阈值和第二时间阈值;
阈值组生成模块660,用于根据该第一阈值组,生成预设数量的第二阈值组;
第二分段结果获取模块670,用于将该历史行程数据集作为该目标行程数据集,通过每个该第二阈值组替代该目标阈值组,执行从该将车辆的目标行程数据集中的每两个相邻的数据点之间的平均速度和预先确定的目标阈值组中的第一速度阈值进行对比,以为所述目标行程数据集中的每个数据点添加状态标记至该识别每个该行驶段中的用于表征该车辆出现信号收发异常且处于停止状态的异常段的步骤,以获取该历史行程数据集对应的该预设数量的第二分段结果;
第二阈值确定模块680,用于将每个该第二分段结果和该实际分段结果进行对比,以将与该实际分段结果的重合度最高的第二分段结果对应的第二阈值组作为该目标阈值组。
可选的,该第一行程标记模块610,用于:
为该目标行程数据集中的首个数据点添加停止状态标记;
根据两个第一数据点中的每个第一数据点包含的时间点和该时间点对应的地理位置信息,确定该车辆在上述两个第一数据点之间的第一平均速度,上述两个第一数据点为该第一行程数据集中的任意两个相邻的数据点;
若该第一平均速度大于或等于该第一速度阈值,为上述两个第一数据点中的后一个数据点添加行驶状态标记;或者,
若该第一平均速度小于该第一速度阈值,为上述两个第一数据点中的后一个数据点添加停止状态标记。
可选的,该第二行程标记模块620,用于:
若上述两个第一数据点中的前一个第一数据点的状态标记为行驶状态标记,并且上述两个第一数据点中的后一个第一数据点的状态标记为停止状态标记,将上述前一个第一数据点标记为行程终点;
若上述两个第一数据点中的前一个第一数据点的状态标记为停止状态标记,并且上述两个第一数据点中的后一个第一数据点的状态标记为行驶状态标记,将上述后一个第一数据点标记为行程起点;
根据该目标行程数据集中的行程起点和行程终点确定该行驶段和该停留段,其中,该行驶段包括该目标行程数据集中相邻的行程起点和行程终点之间的多个数据点,该停留段包括该目标行程数据集中相邻的行程终点和行程起点和所述相邻的行程终点和行程起点之间的一个或多个数据点。
可选的,该异常段标记模块630,用于:
识别该行驶段中的信号缺失段,该信号缺失段由该行驶段中的相邻的两个目标数据点组成,上述两个目标数据点之间的时间间隔大于该第一时间阈值;
根据该第二速度阈值,确定该信号缺失段是否为该异常段。
可选的,该异常段标记模块630,用于:
确定该车辆在上述两个目标数据点之间的第二平均速度;
若该第二平均速度小于该第二速度阈值,将该信号缺失段中的前一个目标数据点标记为行程终点,并将该信号缺失段中的后一个目标数据点标记为行程起点,以将该信号缺失段作为该异常段。
可选的,该实际分段结果包括:通过对该历史行程数据集中的多个数据点中的行程起点和行程终点进行人工标注后确定的标记有该行驶段、该停留段和该异常段的该历史行程数据集,该第一阈值确定模块650,用于:
针对于该第三速度阈值:
获取该车辆在该历史行程数据集中的每个停留段中的每两个数据点之间的平均速度,以获取第一平均速度集;
获取该车辆在该历史行程数据集中的每个行驶段中的每两个数据点之间的平均速度,以获取第二平均速度集;
将该第一平均速度集和该第二平均速度集的交集的中位数,作为该第三速度阈值;以及,
针对于该第四速度阈值:
获取该车辆在该历史行程数据集中的每个异常段两端的数据点之间的平均速度,以获取第三平均速度集;
将该第三平均速度集和该第二平均速度集的交集的中位数,作为该第四速度阈值;以及,
针对于该第二时间阈值:
获取该历史行程数据集中的每个停留段两端的数据点之间的时长间隔,以获取第一时长间隔集;
获取该历史行程数据集中的每个异常段两端的数据点之间的时长间隔,以获取第二时长间隔集;
将该第二时长间隔集和该第二时长间隔集中的最小的时长间隔,作为该第二时间阈值。
可选的,该阈值组生成模块660,用于:
获取与该第三速度阈值的差值小于第一预设差值的多个第五速度阈值;
获取与该第四速度阈值的差值小于第二预设差值的多个第六速度阈值;
获取与该第二时间阈值的差值小于第三预设差值的多个第三时间阈值;
对第三速度阈值、第四速度阈值和第二时间阈值,以及上述多个第五速度阈值、上述多个第六速度阈值和上述多个第三时间阈值进行排列组合,以生成该预设数量的第二阈值组;其中,
该第二阈值组包括:第七速度阈值、第八速度阈值和第四时间阈值,该第七速度阈值为该第三速度阈值和上述多个第五速度阈值中的任一速度阈值,该第七速度阈值为该第四速度阈值和上述多个第六速度阈值中的任一速度阈值,该第四时间阈值为该第二时间阈值和上述多个第三时间阈值中的任一速度阈值。
综上所述,本公开能够将车辆的目标行程数据集中的每两个相邻的数据点之间的平均速度和预先确定的目标阈值组中的第一速度阈值进行对比,以为该目标行程数据集中的每个数据点添加状态标记,该目标行程数据集包含以时间顺序排列的多个数据点,该数据点由时间点和该车辆在该时间点所处的地理位置组成,该状态标记为行驶状态标记和停止状态标记中的一者;根据该状态标记从该目标行程数据集中标记出用于表征该车辆处于行驶状态的行驶段和用于表征该车辆处于停止状态的停留段;识别每个该行驶段中的用于表征该车辆出现信号收发异常且处于停止状态的异常段,其中,该异常段两端的数据点之间的时间间隔大于该目标阈值组中的第一时间阈值,并且,该车辆在该异常段两端的数据点之间的平均速度大于该目标阈值组中的第二速度阈值;获取标记有该行驶段、该停留段和该异常段的该目标行程数据集,作为该目标行程数据集的第一分段结果。能够在通过测试过程得到准确的速度阈值和时间阈值后,根据每个数据点的状态标记确定车辆在行程中的状态转换点,进而根据该状态转换点车辆行程中的行驶段和停留段,避免噪声数据点对行程数据分段的影响,同时根据数据点本身的特性对信号缺失的异常段进行识别和重新分段,在保证行程数据准确度的同时,提高行程数据分段的效率和智能化程度。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图8是根据一示例性实施例示出的一种电子设备800的框图。如图8所示,该电子设备800可以包括:处理器801,存储器802,多媒体组件803,输入/输出(I/O)接口804,以及通信组件805。
其中,处理器801用于控制该电子设备800的整体操作,以完成上述的行程数据分段方法中的全部或部分步骤。存储器802用于存储各种类型的数据以支持在该电子设备800的操作,这些数据例如可以包括用于在该电子设备800上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器802可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件803可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器802或通过通信组件805发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口804为处理器801和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件805用于该电子设备800与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near FieldCommunication,简称NFC),2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信组件805可以包括:Wi-Fi模块,蓝牙模块,NFC模块。
在一示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的行程数据分段方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,例如包括程序指令的存储器802,上述程序指令可由电子设备800的处理器801执行以完成上述的行程数据分段方法。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,本领域技术人员在考虑说明书及实践本公开后,容易想到本公开的其它实施方案,均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。同时本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。本公开并不局限于上面已经描述出的精确结构,本公开的范围仅由所附的权利要求来限制。
Claims (10)
1.一种行程数据分段方法,其特征在于,所述方法包括:
将车辆的目标行程数据集中的每两个相邻的数据点之间的平均速度和预先确定的目标阈值组中的第一速度阈值进行对比,以为所述目标行程数据集中的每个数据点添加状态标记,所述目标行程数据集包含以时间顺序排列的多个数据点,所述数据点由时间点和所述车辆在所述时间点所处的地理位置组成,所述状态标记为行驶状态标记和停止状态标记中的一者;
根据所述状态标记从所述目标行程数据集中标记出用于表征所述车辆处于行驶状态的行驶段和用于表征所述车辆处于停止状态的停留段;
识别每个所述行驶段中的用于表征所述车辆出现信号收发异常且处于停止状态的异常段,其中,所述异常段两端的数据点之间的时间间隔大于所述目标阈值组中的第一时间阈值,并且,所述车辆在所述异常段两端的数据点之间的平均速度大于所述目标阈值组中的第二速度阈值;
获取标记有所述行驶段、所述停留段和所述异常段的所述目标行程数据集,作为所述目标行程数据集的第一分段结果。
2.根据权利要求1所述的方法,其特征在于,在所述将车辆的目标行程数据集中的每两个相邻的数据点之间的平均速度和预先确定的目标阈值组中的第一速度阈值进行对比,以为所述目标行程数据集中的每个数据点添加状态标记之前,所述方法还包括:
根据所述车辆的历史行程数据集的实际分段结果,确定第一阈值组,所述第一阈值组包括第三速度阈值、第四速度阈值和第二时间阈值;
根据所述第一阈值组,生成预设数量的第二阈值组;
将所述历史行程数据集作为所述目标行程数据集,通过每个所述第二阈值组替代所述目标阈值组,执行从所述将车辆的目标行程数据集中的每两个相邻的数据点之间的平均速度和预先确定的目标阈值组中的第一速度阈值进行对比,以为所述目标行程数据集中的每个数据点添加状态标记至所述识别每个所述行驶段中的用于表征所述车辆出现信号收发异常且处于停止状态的异常段的步骤,以获取所述历史行程数据集对应的所述预设数量的第二分段结果;
将每个所述第二分段结果和所述实际分段结果进行对比,以将与所述实际分段结果的重合度最高的第二分段结果对应的第二阈值组作为所述目标阈值组。
3.根据权利要求1所述的方法,其特征在于,所述将车辆的目标行程数据集中的每两个相邻的数据点之间的平均速度和预先确定的目标阈值组中的第一速度阈值进行对比,以为所述目标行程数据集中的每个数据点添加状态标记,包括:
为所述目标行程数据集中的首个数据点添加停止状态标记;
根据两个第一数据点中的每个第一数据点包含的时间点和所述时间点对应的地理位置信息,确定所述车辆在所述两个第一数据点之间的第一平均速度,所述两个第一数据点为所述目标行程数据集中的任意两个相邻的数据点;
若所述第一平均速度大于或等于所述第一速度阈值,为所述两个第一数据点中的后一个数据点添加行驶状态标记;或者,
若所述第一平均速度小于所述第一速度阈值,为所述两个第一数据点中的后一个数据点添加停止状态标记。
4.根据权利要求3所述的方法,其特征在于,所述根据所述状态标记从所述目标行程数据集中标记出用于表征所述车辆处于行驶状态的行驶段和用于表征所述车辆处于停止状态的停留段,包括:
若所述两个第一数据点中的前一个第一数据点的状态标记为行驶状态标记,并且所述两个第一数据点中的后一个第一数据点的状态标记为停止状态标记,将所述前一个第一数据点标记为行程终点;
若所述两个第一数据点中的前一个第一数据点的状态标记为停止状态标记,并且所述两个第一数据点中的后一个第一数据点的状态标记为行驶状态标记,将所述后一个第一数据点标记为行程起点;
根据所述目标行程数据集中的行程起点和行程终点确定所述行驶段和所述停留段,其中,所述行驶段包括所述目标行程数据集中相邻的行程起点和行程终点之间的多个数据点,所述停留段包括所述目标行程数据集中相邻的行程终点和行程起点和所述相邻的行程终点和行程起点之间的一个或多个数据点。
5.根据权利要求1所述的方法,其特征在于,所述识别每个所述行驶段中的用于表征所述车辆出现信号收发异常且处于停止状态的异常段,包括:
识别所述行驶段中的信号缺失段,所述信号缺失段由所述行驶段中的相邻的两个目标数据点组成,所述两个目标数据点之间的时间间隔大于所述第一时间阈值;
根据所述第二速度阈值,确定所述信号缺失段是否为所述异常段。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第二速度阈值,确定所述信号缺失段是否为所述异常段,包括:
确定所述车辆在所述两个目标数据点之间的第二平均速度;
若所述第二平均速度小于所述第二速度阈值,将所述信号缺失段中的前一个目标数据点标记为行程终点,并将所述信号缺失段中的后一个目标数据点标记为行程起点,以将所述信号缺失段作为所述异常段。
7.根据权利要求2所述的方法,其特征在于,所述实际分段结果包括:通过对所述历史行程数据集中的多个数据点中的行程起点和行程终点进行人工标注后确定的标记有所述行驶段、所述停留段和所述异常段的所述历史行程数据集,所述根据所述历史行程数据集的实际分段结果,确定第一阈值组,包括:
针对于所述第三速度阈值:
获取所述车辆在所述历史行程数据集中的每个停留段中的每两个数据点之间的平均速度,以获取第一平均速度集;
获取所述车辆在所述历史行程数据集中的每个行驶段中的每两个数据点之间的平均速度,以获取第二平均速度集;
将所述第一平均速度集和所述第二平均速度集的交集的中位数,作为所述第三速度阈值;以及,
针对于所述第四速度阈值:
获取所述车辆在所述历史行程数据集中的每个异常段两端的数据点之间的平均速度,以获取第三平均速度集;
将所述第三平均速度集和所述第二平均速度集的交集的中位数,作为所述第四速度阈值;以及,
针对于所述第二时间阈值:
获取所述历史行程数据集中的每个停留段两端的数据点之间的时长间隔,以获取第一时长间隔集;
获取所述历史行程数据集中的每个异常段两端的数据点之间的时长间隔,以获取第二时长间隔集;
将所述第二时长间隔集和所述第二时长间隔集中的最小的时长间隔,作为所述第二时间阈值。
8.一种行程数据分段装置,其特征在于,所述装置包括:
第一行程标记模块,用于将车辆的目标行程数据集中的每两个相邻的数据点之间的平均速度和预先确定的目标阈值组中的第一速度阈值进行对比,以为所述目标行程数据集中的每个数据点添加状态标记,所述目标行程数据集包含以时间顺序排列的多个数据点,所述数据点由时间点和所述车辆在所述时间点所处的地理位置组成,所述状态标记为行驶状态标记和停止状态标记中的一者;
第二行程标记模块,用于根据所述状态标记从所述目标行程数据集中标记出用于表征所述车辆处于行驶状态的行驶段和用于表征所述车辆处于停止状态的停留段;
异常段标记模块,用于识别每个所述行驶段中的用于表征所述车辆出现信号收发异常且处于停止状态的异常段,其中,所述异常段两端的数据点之间的时间间隔大于所述目标阈值组中的第一时间阈值,并且,所述车辆在所述异常段两端的数据点之间的平均速度大于所述目标阈值组中的第二速度阈值;
第一分段结果获取模块,用于获取标记有所述行驶段、所述停留段和所述异常段的所述目标行程数据集,作为所述目标行程数据集的第一分段结果。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。
10.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911382449.8A CN111192452B (zh) | 2019-12-27 | 2019-12-27 | 行程数据分段方法、装置、存储介质和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911382449.8A CN111192452B (zh) | 2019-12-27 | 2019-12-27 | 行程数据分段方法、装置、存储介质和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111192452A CN111192452A (zh) | 2020-05-22 |
CN111192452B true CN111192452B (zh) | 2021-06-18 |
Family
ID=70707865
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911382449.8A Active CN111192452B (zh) | 2019-12-27 | 2019-12-27 | 行程数据分段方法、装置、存储介质和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111192452B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113704643B (zh) | 2021-09-03 | 2022-10-18 | 北京百度网讯科技有限公司 | 确定目标物体状态的方法、装置、电子设备以及存储介质 |
CN114419875B (zh) * | 2021-12-08 | 2023-12-22 | 斑马网络技术有限公司 | 车辆行程切分方法、装置及存储介质 |
CN114841679B (zh) * | 2022-06-29 | 2022-10-18 | 陕西省君凯电子科技有限公司 | 车辆行驶数据的智能管理*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050273247A1 (en) * | 2003-05-23 | 2005-12-08 | Vitaliy Lyakir | Methods to move plural sets of transportation objects through a single route in uniformed skip-stop patterns based on scheduling described by linear function equation |
US20170300049A1 (en) * | 2016-04-15 | 2017-10-19 | Podway Ltd | System for and method of maximizing utilization of a closed transport system in an on-demand network |
CN108447263A (zh) * | 2018-04-18 | 2018-08-24 | 北京交通大学 | 基于浮动车的干线协调控制交叉口的信号控制评价方法 |
CN109035787A (zh) * | 2018-09-10 | 2018-12-18 | 华南理工大学 | 一种利用移动通信数据识别交通工具类别的方法 |
CN109215347A (zh) * | 2018-10-22 | 2019-01-15 | 北京航空航天大学 | 一种基于众包轨迹数据的交通数据质量控制方法 |
-
2019
- 2019-12-27 CN CN201911382449.8A patent/CN111192452B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050273247A1 (en) * | 2003-05-23 | 2005-12-08 | Vitaliy Lyakir | Methods to move plural sets of transportation objects through a single route in uniformed skip-stop patterns based on scheduling described by linear function equation |
US20170300049A1 (en) * | 2016-04-15 | 2017-10-19 | Podway Ltd | System for and method of maximizing utilization of a closed transport system in an on-demand network |
CN108447263A (zh) * | 2018-04-18 | 2018-08-24 | 北京交通大学 | 基于浮动车的干线协调控制交叉口的信号控制评价方法 |
CN109035787A (zh) * | 2018-09-10 | 2018-12-18 | 华南理工大学 | 一种利用移动通信数据识别交通工具类别的方法 |
CN109215347A (zh) * | 2018-10-22 | 2019-01-15 | 北京航空航天大学 | 一种基于众包轨迹数据的交通数据质量控制方法 |
Non-Patent Citations (2)
Title |
---|
A Study of Algorithms for Traveling Segment;Wang lijuan et.al;《2017 6th International Conference on Computer Science and Network Technology (ICCSNT)》;20180423;第63-67页 * |
基于随机事变路网的运输路径选择;刘帅 等;《重庆交通大学学报(自然科学版)》;20171231;第36卷(第12期);第110-114页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111192452A (zh) | 2020-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111192452B (zh) | 行程数据分段方法、装置、存储介质和电子设备 | |
EP3322960B1 (en) | Methods and systems for detecting a closure and/or opening of a navigable element | |
CN103270393B (zh) | 导航装置以及导航方法 | |
CN108701405A (zh) | 车载装置和道路异常警示*** | |
EP3344951B1 (en) | Method and system for detecting an open navigable element | |
EP3143368B1 (en) | Methods and systems for detecting a partial closure of a navigable element | |
CN113847925A (zh) | 基于轨迹数据检测车辆偏航的方法、装置、设备及介质 | |
CN104050832A (zh) | 位置信息的补全方法和装置 | |
US11002553B2 (en) | Method and device for executing at least one measure for increasing the safety of a vehicle | |
CN112581763A (zh) | 道路事件检测的方法、装置、设备和存储介质 | |
CN110837539B (zh) | 一种铁路电子地图构建方法及电子地图位置匹配方法 | |
CN109767030A (zh) | 道路拥堵检测方法、装置、计算机设备及存储介质 | |
CN113811830B (zh) | 轨迹预测方法、装置、计算机设备和存储介质 | |
CN103115626B (zh) | 计算拥堵信息并基于其进行导航的方法、装置和设备 | |
CN105424051B (zh) | 一种确定车辆行驶路径的方法和设备 | |
CN107871400B (zh) | 路网信息更新方法及装置 | |
CN109211255B (zh) | 用于为具有自动车辆***的机动车规划路线的方法 | |
CN104121915A (zh) | 一种道路实时导航方法及*** | |
US20210375135A1 (en) | Method for indicating parking position and vehicle-mounted device | |
CN109407131A (zh) | 车头朝向确定方法、装置及设备 | |
CN109716416B (zh) | 自动报站方法、装置、智能设备及存储介质 | |
CN112163063B (zh) | 生成高精度地图的方法、装置和计算机可读存储介质 | |
US12013881B2 (en) | Method, device, and system for determining a weather area | |
CN107202997B (zh) | 定位***的测试方法及控制终端、具有存储功能的装置 | |
CN114004566A (zh) | 危险告警的方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |