CN114331477A - 一种异常轨迹识别方法、装置、电子设备及存储介质 - Google Patents
一种异常轨迹识别方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114331477A CN114331477A CN202111676512.6A CN202111676512A CN114331477A CN 114331477 A CN114331477 A CN 114331477A CN 202111676512 A CN202111676512 A CN 202111676512A CN 114331477 A CN114331477 A CN 114331477A
- Authority
- CN
- China
- Prior art keywords
- data
- group
- mileage
- getting
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Traffic Control Systems (AREA)
Abstract
本申请提供一种异常轨迹识别方法、装置、电子设备及存储介质,涉及信息处理技术领域,可以有效识别异常行驶里程。具体方案包括:获取车辆的出行数据;出行数据包括上车位置、下车位置和行驶里程;确定上车位置所属的第一区域和下车位置所属的第二区域;获取以第一区域和第二区域为起止点的、出行数据对应的里程上界值;若行驶里程大于或等于出行数据对应的里程上界值,则确定出行数据是异常出行数据。
Description
技术领域
本申请涉及信息处理技术领域,尤其涉及一种异常轨迹识别方法、装置、电子设备及存储介质。
背景技术
目前,网约车每完成一个订单,可以向网约车平台上报行驶里程、以及乘客的上下车位置等出行数据。然后,网约车平台可以根据行驶里程计算出该订单的行驶费用。其中,一些网约车为了增加行驶费用,会篡改生成一个虚高的行驶里程,并上报。网约车平台根据该虚高的行驶里程计算出的行驶费用就超出了真实的行驶费用。
由于网约车的一些特点,例如,乘客的上下车位置灵活多变,不固定;网约车的行驶路径受路况、以及乘客指定路线等因素的影响而发生变化。这些都导致不同的出行数据中的行驶里程都是千差万变。进而,针对每个出行数据,没有一个标准的行驶里程可以参照。也就是说,目前无法识别出网约车谎报行驶里程的问题。
发明内容
本申请提供一种异常轨迹识别方法、装置、电子设备及存储介质,可以有效识别异常行驶里程。
为实现上述技术目的,本申请采用如下技术方案:
第一方面,本申请实施例提供了一种异常轨迹识别方法,该方法包括:先获取车辆的出行数据;出行数据包括上车位置、下车位置和行驶里程;确定上车位置所属的第一区域和下车位置所属的第二区域;获取以第一区域和第二区域为起止点的、该出行数据对应的里程上界值;若行驶里程大于或等于该出行数据对应的里程上界值,则确定该出行数据是异常出行数据。
可以理解的是,电子设备可以根据目标时长内的多个历史出行数据确定至少一个里程上界值并保存。然后,电子设备可以利用保存的里程上界值,判断一个车辆的出行数据中的行驶里程是否异常。
电子设备可以先确定出行数据中的上车位置所属的第一区域和下车位置所属的第二区域。这样就实现了对***的上下车位置进行归类。然后,电子设备可以获取以第一区域和第二区域为起止点的、该出行数据对应的里程上界值。由于出行数据中的上车位置在第一区域内、以及出行数据中的下车位置在第二区域内,则可知从该上车位置到该下车位置的行驶里程,与以第一区域和第二区域为起止点的里程上界值差不多。因此,利用以第一区域和第二区域为起止点的里程上界值,可以判断从该上车位置到该下车位置的行驶里程是否过高。如果该行驶里程大于或等于该里程上界值,表示该行驶里程过高,则可以确定该出行数据中的行驶里程异常,即该出行数据是异常出行数据。也就是说,采用本申请实施例提供的方法实现了识别行驶里程异常的出行数据。
在一种可能的实现方式中,该出行数据还包括驾驶员信息。该方法还包括:根据驾驶员信息,统计驾驶员信息所指示的驾驶员在预设时长内的异常出行数据的个数;若异常出行数据的个数大于或等于预设次数,发出提示信息。
可以理解的是,为了排除该驾驶员出现一次或几次异常出行数据是偶然发生的,可以设置一个预设时长内发生异常出行数据的预设次数。进而,电子设备可以针对异常的出行数据中的驾驶员,统计其异常出行数据的个数。若其异常出行数据的总个数大于或等于预设次数,表示该驾驶员有意篡改行驶里程的可能性较大,需要被重点关注。因此,电子设备可以发出提示信息,用于提示重点关注该驾驶员。
另一种可能的实现方式中,该方法还包括:获取目标区域内的车辆的多个历史出行数据;还确定目标区域中的至少一个区域各自的位置信息;然后,根据多个历史出行数据中的上车位置和下车位置、以及至少一个区域各自的位置信息,确定至少一组区域、以及至少一组区域中每组区域对应的目标历史出行数据;最后,针对每组区域,根据每组区域对应的目标历史出行数据中的行驶里程,确定每组区域对应的里程上界值。
其中,历史出行数据包括:上车位置、下车位置和行驶里程。每组区域中的一个区域和另一个区域分别包括目标历史出行数据中的上车位置和下车位置。每组区域对应的里程上界值是以每组区域中的两个区域为起止点的里程上界值。
可以理解的是,本申请实施例中,先将目标区域划分为至少一个区域,并获取行驶在任意两个区域之间的车辆的历史出行数据。其中,通过将目标区域划分成至少一个区域,实现了对上下车位置不同的历史出行数据进行归类。例如,上下车位置在任一组区域包括的两个区域内的历史出行数据都可以认为是行驶在这一组区域之间的车辆的历史出行数据,即都是与这一组区域对应的目标历史出行数据。这样就可以得到上下车位置属于这一组区域的多个目标历史出行数据。然后,根据上下车位置属于这一组区域的多个目标历史出行数据,就可以确定以这一组区域中的两个区域为起止点的行驶里程的上界值(即这一组区域对应的里程上界值)。利用这一组区域对应的里程上界值,可以判断一个上下车位置属于这一组区域的车辆的行驶里程是否过高,即实现了识别异常行驶里程。
另一种可能的实现方式中,上述确定目标区域中的至少一个区域各自的位置信息,包括:采用预设编码算法,将目标区域划分成尺寸相同的至少一个区域,并确定至少一个区域中每个区域的第一编码数据。其中,每个区域的第一编码数据是每个区域的位置信息。预设编码算法可以包括GeoHash算法。
上述根据多个历史出行数据中的上车位置和下车位置、以及至少一个区域各自的位置信息,确定至少一组区域、以及与至少一组区域中每组区域对应的目标历史出行数据,包括:针对多个历史出行数据中的每个历史出行数据,采用预设编码算法,分别对历史出行数据中的上车位置和下车位置进行转换,得到一对第二编码数据;根据一对第二编码数据,从至少一个区域中确定一组区域,并确定历史出行数据属于与一组区域对应的目标历史出行数据;一组区域的第一编码数据包括一对第二编码数据。
在该设计方式中,描述了一种将目标区域划分成至少一个区域的一种实现方式。
另一种可能的实现方式中,上述采用预设编码算法,将目标区域划分成尺寸相同的至少一个区域,并确定至少一个区域中每个区域的第一编码数据,包括:采用预设编码算法,对目标区域内的经纬度进行转换,并对转换后的编码数据提取其前预设位数的GeoHash字符,得到至少一个区域和每个区域的第一编码数据;每个区域的第一编码数据是每个区域内的转换后的编码数据中前预设位数的GeoHash字符。
上述根据一对第二编码数据,从至少一个区域中确定一组区域,包括:从至少一个区域中,确定第一编码数据等于一对第二编码数据中任一个第二编码数据的前预设位数的字符的区域属于该一组区域。
在该设计方式中,描述了将目标区域划分成至少一个区域的具体实现过程。
另一种可能的实现方式中,上述针对每组区域,根据每组区域对应的目标历史出行数据中的行驶里程,确定每组区域对应的里程上界值,包括:在每组区域对应的目标历史出行数据的总个数大于或等于预设置信度阈值的情况下,对每组区域对应的目标历史出行数据中的行驶里程进行排序,得到排序后的行驶里程;从排序后的行驶里程中确定第一数值和第二数值;其中,第一数值小于排序后的行驶里程的中位数;第二数值大于排序后的行驶里程的中位数;对第二数值减去第一数值的差乘以预设倍数,再与第二数值进行求和,得到每组区域对应的里程上界值。
可以理解的是,虽然与任一组区域对应的多个目标历史出行数据中的行驶里程,都是车辆在这一组区域中的两个区域之间的行驶里程。但是,由于不同的目标历史出行数据中的上下车位置可能不同;上下车位置相近的目标历史出行数据中的行驶路径还受乘客指定路线和路况等因素的影响,也可能不同。这些都会使得在这一组区域中的两个区域之间的不同的出行数据中的行驶里程有一些差距。那么,如果目标历史出行数据较多,就能够更准确反映出在这一组区域中的两个区域之间的行驶里程的分布情况。如果目标历史出行数据较少,表示这一组区域中的两个区域之间的路线是冷门路线,并且,较少的目标历史出行数据所反映的在这一组区域中的两个区域之间的行驶里程的分布情况也不准确。因此可知,电子设备根据较多的目标历史出行数据,确定的这一组区域中的两个区域之间的行驶里程的上界值(即这一组区域对应的里程上界值)的准确度较高。
进而,电子设备可以在与这一组区域对应的目标历史出行数据的总个数大于或等于预设置信度阈值的情况下,根据所有目标历史出行数据中的行驶里程,确定这一组区域对应的里程上界值。若该总个数小于预设置信度阈值的情况下,则电子设备可以不确定这一组区域对应的里程上界值。
第二方面,本申请提供一种异常轨迹识别装置。该异常轨迹识别装置包括用于执行第一方面或第一方面中任一种可能的设计方式所述的方法的各个模块。
第三方面,本申请提供一种电子设备,该电子设备包括存储器和处理器。上述存储器和处理器耦合。该存储器用于存储计算机程序代码,该计算机程序代码包括计算机指令。当处理器执行该计算机指令时,使得电子设备执行如第一方面及其任一种可能的设计方式所述的异常轨迹识别方法。
第四方面,本申请提供一种芯片***,该芯片***应用于异常轨迹识别装置;芯片***包括一个或多个接口电路,以及一个或多个处理器。接口电路和处理器通过线路互联;接口电路用于从异常轨迹识别装置的存储器接收信号,并向处理器发送信号,信号包括存储器中存储的计算机指令。当处理器执行计算机指令时,使得电子设备执行如第一方面及其任一种可能的设计方式所述的异常轨迹识别方法。
第五方面,本申请提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令,当所述计算机指令在电子设备上运行时,使得电子设备执行如第一方面及其任一种可能的设计方式所述的异常轨迹识别方法。
第六方面,本申请提供一种计算机程序产品,该计算机程序产品包括计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行如第一方面及其任一种可能的设计方式所述的异常轨迹识别方法。
本申请中第二方面到第六方面及其各种实现方式的具体描述,可以参考第一方面及其各种实现方式中的详细描述;并且,第二方面到第六方面及其各种实现方式的有益效果,可以参考第一方面及其各种实现方式中的有益效果分析,此处不再赘述。
本申请的这些方面或其他方面在以下的描述中会更加简明易懂。
附图说明
图1为本申请实施例提供的一种异常轨迹识别方法所涉及的实施环境示意图一;
图2为本申请实施例提供的一种异常轨迹识别方法所涉及的实施环境示意图二;
图3为本申请实施例提供的一种异常轨迹识别方法所涉及的实施环境示意图三;
图4为本申请实施例提供的一种异常轨迹识别方法的流程图一;
图5为本申请实施例提供的将目标区域划分成尺寸相同的多个区域的示意图;
图6为本申请实施例提供的一种四分位数的箱型图一;
图7为本申请实施例提供的一种基于三西格玛准则的数据分步图;
图8为本申请实施例提供的一种四分位数的箱型图二;
图9为本申请实施例提供的一种异常轨迹识别方法的流程图二;
图10为本申请实施例提供的一种异常轨迹识别方法的流程图三;
图11为本申请实施例提供的一种异常轨迹识别方法的流程图四;
图12为本申请实施例提供的一种异常轨迹识别装置的结构示意图;
图13为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
以下,术语“第一”、“第二”和“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”或“第三”等的特征可以明示或者隐含地包括一个或者更多个该特征。
目前,网约车的兴起及推广,为用户的出行带来了极大的便利。其中,存在一些网约车篡改出行数据中的行驶里程,以提高根据篡改后的行驶里程计算出的行驶费用。由于不同的出行数据中的行驶里程是千差万变的,因此,针对每个行驶里程,没有一个标准的行驶里程可以参照。也就是说,目前无法识别出网约车谎报行驶里程的问题。
针对该问题,本申请实施例提供一种异常轨迹识别方法,将目标区域划分为至少一个区域;然后,获取行驶在任意两个区域之间的车辆的历史出行数据。其中,通过将目标区域划分成至少一个区域,实现了对上下车位置不同的历史出行数据进行归类。例如,上下车位置在任意两个区域内的历史出行数据都可以认为是行驶在这两个区域之间的车辆的历史出行数据,即都是与这两个区域对应的目标历史出行数据。这样就可以得到上下车位置属于这两个区域的多个目标历史出行数据。然后,根据上下车位置属于这两个区域的多个目标历史出行数据,就可以确定这两个区域之间的里程上界值。利用这两个区域之间的里程上界值,可以判断一个上下车位置属于这两个区域的车辆的行驶里程是否过高,即实现了识别异常的行驶里程。
下面将结合附图对本申请实施例的实施方式进行详细描述。
请参考图1,其示出本申请实施例提供的一种异常轨迹识别方法所涉及的实施环境示意图。如图1所示,该实施环境可以包括:服务器100、终端110、以及多个用于采集车辆的出行数据的采集设备120。其中,多个采集设备120分别安装在多个车辆内。
示例性地,每个采集设备120可以包括GPS模块、计时模块和输入模块(如,触摸屏)。图1中未示出采集模块120中的GPS模块、计时模块和输入模块。GPS模块用于采集行驶路径和乘客的上下车经纬度;还用于确定行驶里程。计时模块用于采集乘客的上下车时间。输入模块用于采集驾驶员输入的驾驶员信息、车辆信息等。
服务器100可以从多个采集设备120接收车辆的出行数据。该出行数据可以包括:乘客的上下车经纬度、上下车时间、行驶路径、行驶里程、驾驶员信息、以及车辆信息等。
如图2所示,终端110可以接收用户输入的第一操作,该第一操作用于指示目标区域、目标车辆类型(如,网约车,出租车)、目标时长和区域划分参数等。然后,终端110响应于该第一操作,可以从服务器100获取目标时长内的、行驶在目标区域内的、属于目标车辆类型的车辆的历史出行数据。终端110还可以根据区域划分参数,将目标区域划分为至少一个区域。终端110再根据获取到的历史出行数据,确定至少一个区域中的两个区域之间的里程上界值。终端110得到里程上界值之后,可以从服务器100获取一个车辆的出行数据,并根据里程上界值,判断该出行数据中的行驶里程是否异常。若该出行数据中的行驶里程异常,可以发出提示信息,该提示信息用于表征该车辆的行驶里程异常。例如,终端110可以通过显示屏显示该提示信息。
或者,如图3所示,终端110响应于该第一操作,可以向服务器100发送包括目标信息。该目标信息包括目标区域、目标车辆类型、目标时长和区域划分参数等。然后,终端110可以根据区域划分参数,将目标区域划分为至少一个区域。服务器100还获取目标时长内的、行驶在目标区域内的、属于目标车辆类型的车辆的历史出行数据。服务器100再根据获取到的历史出行数据,确定至少一个区域中的两个区域之间的里程上界值。服务器100得到里程上界值之后,可以接收一个采集设备120发送的一个车辆的出行数据,并根据里程上界值,判断该出行数据中的行驶里程是否异常。若该出行数据中的行驶里程异常,可以向终端110发送上述提示信息。终端110可以发出该提示信息。
其中,目标时长可以为一个月、一个季度等等。区域划分参数可以表征至少一个区域的尺寸,例如,1.2公里(km)*0.6km。
示例性的,本申请实施例中的终端110可以是手机、平板电脑、桌面型、膝上型、笔记本电脑、上网本等,本申请实施例对该终端110的具体形态不作特殊限制。
需要说明的是,本申请实施例提供的异常轨迹识别方法可以应用于上述服务器100,也可以应用于上述终端110,还可以应用于上述服务器100和终端110。该服务器100和该终端110可以统称为电子设备。本申请实施例提供的异常轨迹识别方法的执行主体还可以为异常轨迹识别装置。该装置可以为电子设备;或者,该装置可以为该电子设备安装的提供异常轨迹识别功能的应用程序(application,APP);或者,该装置可以为该电子设备中的中央处理器(Central Processing Unit,CPU);又或者,该装置可以为该电子设备中的用于执行异常轨迹识别方法的控制模块。下面以电子设备为例,对本申请实施例提供的异常轨迹识别进行详细说明。
请参考图4,为本申请实施例提供的一种异常轨迹识别方法的流程图。如图4所示,该方法可以包括S401-S404。
S401、电子设备获取目标区域内的车辆的多个历史出行数据;历史出行数据包括:上车位置、下车位置和行驶里程。
电子设备可以获取目标时长内的所有历史出行数据。其中,每个历史出行数据除了包括上车位置(如,上车经纬度)、下车位置(如,下车经纬度)和行驶里程,还可以包括上车时间、下车时间、驾驶员信息和车辆信息等。
其中,目标区域可以是任一个区域,例如,陕西省,北京市等。
S402、电子设备确定目标区域中的至少一个区域各自的位置信息。
电子设备可以将目标区域划分成至少一个区域,并获取至少一个区域中每个区域的位置信息。
在一些实施例中,电子设备可以采用预设编码算法,将目标区域划分成尺寸相同的至少一个区域,并确定至少一个区域中每个区域的第一编码数据。
其中,每个区域的第一编码数据是每个区域的位置信息。每个区域的第一编码数据可以表征该区域内的任一个点的位置。
其中,预设编码算法可以包括GeoHash算法。GeoHash算法是一种地址编码方法,其能够将二维空间中的一个经纬度编码成一个字符串,并且,该字符串越长,表示的范围越小,位置越精准。也就是说,一个字符串中的前几位字符可以表示字符串包括该前几位字符的所有位置。例如,将一个点的经纬度转换为wx4g0ec1,wx4g0ec1的前缀wx4g0e可以表示包含wx4g0ec1在内的更大的范围。
在一些实施例中,电子设备可以采用预设编码算法(如,GeoHash算法),对目标区域内的经纬度进行转换,并对转换后的编码数据提取其前预设位数m的GeoHash字符,得到至少一个区域和每个区域的第一编码数据。每个区域的第一编码数据是每个区域内的转换后的编码数据中前预设位数m的GeoHash字符。
电子设备通过对转换后的编码数据提取其前m位的GeoHash字符,将目标区域划分成尺寸相同的网格。一个网格就是一个区域。其中,m越小,区域的尺寸越小。例如,n取6的时候,每个区域的尺寸是1.2km*0.6km,每个区域的第一编码数据是一个6位的GeoHash字符。
示例性地,以如图5所示的目标区域为上海市徐州区,以及m等于6为例,电子设备可以采用GeoHash算法,对该目标区域的经纬度进行转换,并对转换后的编码数据提取其前6位的GeoHash字符,得到该目标区域中的9个区域、以及9个区域的第一编码数据。其中,n取6的时候,每个区域的尺寸是1.2km*0.6km,每个区域的第一编码数据是一个6位的GeoHash字符。9个区域的第一编码数据分别是wtw37p、wtw37r、wtw37x、wtw37n、wtw37q、wtw37w、wtw37j、wtw37m、wtw37t。
其中,以区域55中的一个点,该点的经纬度坐标是(39.923201,116.390705)为例,说明采用Geohash算法对该点的经纬度进行转换的过程。
(1)电子设备可以先将该点的经纬度转换为二进制。具体包括:纬度的范围是(-90,90),(-90,90)的中间值为0。由于该点的纬度39.923201大于0,因此,先得到一个1;(0,90)的中间值为45,纬度39.923201小于45;因此,得到一个0;依次计算下去,即可得到纬度39.923201对应的二进制表示。同理,可以得到经度116.390705的二进制表示。
(2)电子设备可以再对经纬度的二进制表示进行合并。其中,经度在偶数位,纬度在奇数位。电子设备可以得到该点的合并后的二进制数是11100 11001 11100 0001100111 10110。
(3)电子设备可以采用Base32编码,对合并后的二进制数进行编码。Base32编码是指采用0-9和b-z(去掉a,i,l,o)这32个字符编码。具体包括:电子设备可以先将合并后的二进制数转换为十进制数;再根据这32个字符对应的字符,生成该十进制数对应的字符串。例如,电子设备对上述合并后的二进制数转换成十进制数,该十进制数是28 25 28 37 22;然后,从这32个字符对应的字符中查找可以得到该十进制数对应的字符串为wtw37q。
可以看出,区域55的第一编码数据是wtw37q,区域55中的一个点的前6位字符也是wtw37q。每个区域内的所有点的转换后的编码数据中前6位的GeoHash字符都和该区域的第一编码数据相同。
S403、电子设备根据多个历史出行数据中的上车位置和下车位置、以及至少一个区域各自的位置信息,确定至少一组区域、以及与至少一组区域中每组区域对应的目标历史出行数据;其中,每组区域中的一个区域和另一个区域分别包括每组区域对应的目标历史出行数据中的上车位置和下车位置。
电子设备可以根据每个历史出行数据中的上车位置和下车位置,从至少一个区域中确定包括该上车位置的一个区域、包括该下车位置的另一个区域。包括该上车位置的一个区域和包括该下车位置的另一个区域组成一组区域。进而,电子设备可以得到多组区域,每组区域包括两个区域。
本申请实施例中,电子设备采用预设编码算法得到每个区域的第一编码数据之后,针对多个历史出行数据中的每个历史出行数据,也可以采用预设编码算法,分别对历史出行数据中的上车位置和下车位置进行转换,得到一对第二编码数据。电子设备再根据这一对第二编码数据,从至少一个区域中确定一组区域,并确定该历史出行数据属于与这一组区域对应的目标历史出行数据。
其中,该上车位置可以是上车经纬度,该下车位置可以是下车经纬度。这一对第二编码数据包括:该上车位置对应的第二编码数据和该下车位置对应的第二编码数据。
其中,一组区域的第一编码数据包括一对第二编码数据可以是指:这一组区域中的一个区域的第一编码数据包括该上车位置对应的第二编码数据,这一组区域中的另一个区域的第一编码数据包括该下车位置对应的第二编码数据。
在一些实施例中,电子设备可以从至少一个区域中,确定第一编码数据等于一对第二编码数据中任一个第二编码数据的前预设位数的字符的区域属于这一组区域。
示例性地,图5中的区域52的第一编码数据是wtw37r,区域55的第一编码数据是wtw37q。一个历史出行数据中的上车位置对应的第二编码数据是wtw37qd2,下车位置对应的第二编码数据是wtw37re1。此时,电子设备可以确定区域52的第一编码数据包括该历史出行数据中的下车位置对应的第二编码数据,区域55的第一编码数据包括该历史出行数据中的上车位置对应的第二编码数据。进而,电子设备可以确定区域52和区域55组成一组区域,并且,该历史出行数据属于与区域52和区域55对应的目标历史出行数据。
S404、电子设备针对每组区域,根据每组区域对应的目标历史出行数据中的行驶里程,确定每组区域对应的里程上界值;每组区域对应的里程上界值是以每组区域中的两个区域为起止点的里程上界值。
电子设备可以针对至少一组区域中的每组区域,根据其对应的目标历史出行数据中的行驶里程,确定每组区域对应的里程上界值。进而,电子设备可以确定出至少一个里程上界值,并且,不同的里程上界值对应的区域不完全相同。然后,电子设备可以利用确定的里程上界值,判断一个车辆的出行数据中的行驶里程是否异常。
本申请实施例中,虽然与任一组区域对应的多个目标历史出行数据中的行驶里程,都是车辆在这一组区域中的两个区域之间的行驶里程。但是,由于不同的目标历史出行数据中的上下车位置可能不同;上下车位置相近的目标历史出行数据中的行驶路径还受乘客指定路线和路况等因素的影响,也可能不同。这些都会使得在这一组区域中的两个区域之间的不同的出行数据中的行驶里程有一些差距。那么,如果目标历史出行数据较多,就能够更准确反映出在这一组区域中的两个区域之间的行驶里程的分布情况。如果目标历史出行数据较少,表示在这一组区域中的两个区域之间的路线是冷门路线,并且,较少的目标历史出行数据所反映的在这一组区域中的两个区域之间的行驶里程的分布情况也不准确。因此可知,电子设备根据较多的目标历史出行数据,确定的这一组区域中的两个区域之间的行驶里程的上界值(即这一组区域对应的里程上界值)的准确度较高。
进而,电子设备可以在与任一组区域对应的目标历史出行数据的总个数大于或等于预设置信度阈值的情况下,根据所有目标历史出行数据中的行驶里程,确定这一组区域对应的里程上界值。若该总个数小于预设置信度阈值的情况下,则电子设备可以不确定这一组区域对应的里程上界值;或者,电子设备根据所有目标历史出行数据中的行驶里程,确定这一组区域对应的里程上界值,并将该总个数作为这一组区域对应的里程上界值的置信度。
其中,该预设置信度阈值可以是上述用户输入的第一操作所指示的。里程上界值的置信度可表征被用于确定该里程上界值的行驶里程的个数。
在一些实施例中,电子设备可以采用四分法或三西格玛法等,根据与每组区域对应的所有目标历史出行数据中的行驶里程,确定每组区域对应的里程上界值。
其中,四分法是将一组数据的进行四等分,得到处在各分位点的数值(即四分位数);再利用四分位数确定这一组数据对应的上界值。
示例性地,如图6所示的四分位数的箱型图可知,四分位数有三个。第一四分位数Q1,又可以称为较小四分位或下四分位数,是指在升序排列后的所有数据中位于25%处的数字。第二四分位数Q2,又可以称“中位数”,是指在升序排列后的所有数据中位于50%处的数字。第三四分位数Q3,又可以称“较大四分位数”,是指在升序排列后的所有数据中位于75%处的数字。
电子设备可以将第一四分位数Q1和第三四分位数Q3代入如下式(1)中,计算得到上界值Z:
Z=Q3+k*(Q3-Q1)=Q3+k*IQR (1)
其中,第三四分位数Q3与第一四分位数Q1的差值可以称为四分位距(InterQuartile Range,IQR)。预设倍数k在一定范围内取值,例如,k可以取值为1.5或3。
可以理解的是,若一个数值超过上界值Z,或者,小于Q1-k*IQR的数值,都可以确认该数值是异常值。用于表征四分位数的箱型图是根据真实的数据绘制得到的,并且,对数据没有任何要求,则可知该箱形图可以真实直观地表现所有真实的数据。
其次,一些异常值通常是过大或过小,过小的话距离第一四分位数Q1较远,过大的话距离第三四分位数Q1较远。也就是说,异常值通常和四分位数距离较远,对四分位数的干扰较小。或者说,四分位数的抗干扰能力比较强。然后,上界值是根据四分位数和四分位距计算得到的,而四分位距也是根据四分位数计算得到的,则可知,上界值是根据四分位数计算得到的。那么,异常值对四分位数的干扰较小,对根据四分位数计算得到的上界值的干扰也较小。采用四分法得到的上界值可以更准确地检测出较大的异常值。
其中,三西格玛法是根据三西格玛准则,确定一组数据的上界值。如图7所示,三西格玛准则指出,在统计学中,如果一组数据的分布近似正态分步,则这组数据中大约68%的数据会在这组数据的平均值mean的一个标准差Std范围内,大约95%的数据会在这组数据的平均值mean的两个标准差Std范围内,大约99.7%的数据会在这组数据的平均值的三个标准差Std范围内。因此,如果任一个数据相较于这组数据的平均值mean超过标准差Std的3倍,则该数据很有可能是异常值。
例如,电子设备可以将一组数据的平均值mean与这组数据的标准差Std代入如下式(2)中,计算得到上界值Z:
Z=mean+3*Std (2)
可知,电子设备利用该公式(2)计算得到的上界值判断异常值的准确率较高。
在一些实施例中,电子设备可以先对每组区域对应的目标历史出行数据中的行驶里程进行排序,得到排序后的行驶里程。然后,电子设备可以从排序后的行驶里程中确定第一数值和第二数值。最后,电子设备可以对第二数值减去第一数值的差乘以预设倍数k,再与第二数值进行求和,得到每组区域对应的里程上界值。
其中,第一数值小于排序后的行驶里程的中位数。第二数值大于排序后的行驶里程的中位数。例如,第一数值是上述第一四分位数Q1,第二数值是上述第三四分位数Q3,预设倍数可以是1.5或3。
示例性地,以电子设备采用四分法确定每组区域对应的里程上界值为例,电子设备可以先对每组区域对应的所有目标历史出行数据中的行驶里程进行升序排序,得到升序的行驶里程。假设每组区域对应的所有目标历史出行数据中的行驶里程的总个数是n。第一四分位数Q1在升序的行驶里程中的位置可以等于(n+1)*0.25,第三四分位数Q3在升序的行驶里程中的位置可以等于(n+1)*0.75。
其中,若(n+1)*0.25是一个整数,则第一四分位数Q1等于升序的行驶里程中第(n+1)*0.25个数据。若(n+1)*0.25是一个小数,则可以对(n+1)*0.25进行取整(如,四舍五入取整,舍去小数点后的数字取整),得到h。第一四分位数Q1等于升序的行驶里程中第h个数据。同理地,电子设备可以确定第三四分位数Q3。
例如,n=11,11个行驶里程包括:6,47,49,15,42,41,7,39,43,40,36。电子设备对这11个行驶里程进行升序排序,得到升序的行驶里程为:6,7,15,36,39,40,41,42,43,47,49。(11+1)*0.25=3,则第一四分位数Q1=15。(11+1)*0.75=6,则第三四分位数Q3=43。
又例如,n=9,升序的行驶里程为:6,7,15,36,39,40,41,42,43。(9+1)*0.25=2.5,则电子设备对2.5取整可以得到2或3,第一四分位数Q1是7或15。(9+1)*0.75=7.5,则电子设备对7.5取整可以得到7或8,第三四分位数Q3是41或42。
在一些实施例中,电子设备可以先对每组区域对应的目标历史出行数据中的行驶里程,计算平均值mean和标准差Std。然后,电子设备可以将标准差Std的3倍与平均值mean的和,作为每组区域对应的里程上界值。
示例性地,以杭州市中的一组区域为例,这组区域中的一个区域的第一编码数据为wtmsh8,这组区域中的另一个区域的第一编码数据为wtmk72。电子设备可以获取与这组区域对应的所有目标历史出行数据。然后,电子设备可以对所有目标历史出行数据中的行驶里程,计算得到平均值mean等于58.542279,标准差Std等于9.675643。电子设备再将该平均值mean和该标准差Std代入上述公式(2),得到这组区域对应的里程上界值等于87.5692。
或者,电子设备可以根据所有目标历史出行数据中的行驶里程,确定第一四分位数Q1等于52km,第二四分位数Q2等于53.1km,第三四分位数Q3等于65.6km,如图8所示。假设预设倍数k取值为1.5,电子设备可以将52km,65.6km和1.5代入上述公式(1),得到这组区域对应的里程上界值等于86。
本申请实施例中,电子设备可以按照预设更新周期更新每组区域对应的里程上界值,或者,接收并响应用于触发更新的请求操作,更新每组区域对应的里程上界值。其中,预设更新周期可以是上述第一操作所指示的。
例如,预设更新周期可以为一个季度,则电子设备可以根据2021年1月至2021年3月的历史出行数据,确定每组区域对应的里程上界值。然后,电子设备可以再根据2021年4月至2021年6月的历史出行数据,确定新的里程上界值。
本申请实施例中,电子设备可以根据目标时长内的多个历史出行数据确定至少一组区域中每组区域对应的里程上界值,并保存。然后,电子设备可以利用保存的里程上界值,判断一个车辆的出行数据中的行驶里程是否异常。
具体地,如图9所示,本申请实施例提供的异常轨迹识别方法还可以包括S601-S604。
S601、电子设备获取目标区域内的车辆的出行数据;出行数据包括上车位置、下车位置和行驶里程。
电子设备可以在该目标时长后,获取车辆的出行数据。例如,电子设备可以获取目标区域内的车辆的出行数据。
S602、电子设备确定上车位置所属的第一区域和下车位置所属的第二区域。
电子设备可以根据该出行数据中的上车位置(如,上车经纬度)和下车位置(如,下车经纬度),确定第一区域和第二区域。其中,第一区域包括上车位置,第二区域包括下车位置。
需要说明的是,电子设备可以根据上车位置和下车位置确定第一区域和第二区域的具体过程,可以参见上述电子设备确定包括该上车位置和该下车位置的一组区域的详细介绍,本申请实施例这里不予赘述。
S603、电子设备获取以第一区域和第二区域为起止点的、出行数据对应的里程上界值。
电子设备可以从保存的至少一组区域对应的至少一个里程上界值中,确定以第一区域和第二区域为起止点的里程上界值为该出行数据对应的里程上界值。
在一些实施例中,该出行数据对应的里程上界值的置信度大于或等于预设置信度阈值。如果电子设备从至少一个里程上界值中,确定的以第一区域和第二区域为起止点的里程上界值的置信度小于预设置信度阈值,则电子设备可以确定没有该出行数据对应的里程上界值。
S604、若行驶里程大于或等于出行数据对应的里程上界值,则电子设备确定出行数据是异常出行数据。
电子设备在该出行数据中的行驶里程大于或等于该出行数据对应的里程上界值的时候,确定该出行数据是行驶里程异常的异常出行数据,并对该出行数据标记异常后保存。电子设备在出行数据中的行驶里程小于该出行数据对应的里程上界值的时候,确定该出行数据不是异常出行数据,还可以保存该出行数据,即该出行数据为新的历史出行数据。
本申请实施例中,电子设备在确定出行数据是异常出行数据之后,还可以针对该出行数据中的驾驶员,统计其异常出行数据的个数。若其异常出行数据的总个数大于或等于预设次数,表示该驾驶员出现异常的行驶里程的次数较多,需要被重点关注。进而,电子设备可以发出提示信息,用于提示重点关注该驾驶员。
具体地,如图10所示,在S604之后,该方法还可以包括S605-S606。
S605、电子设备根据出行数据中的驾驶员信息,统计驾驶员信息所指示的驾驶员在预设时长内的异常出行数据的个数。
电子设备可以保存确定出的异常出行数据。然后,电子设备可以从保存的异常出行数据中,确定该驾驶员信息所指示的驾驶员的所有异常出行数据,并统计其个数。
其中,预设时长可以是指获取该出行数据之前的一段时间。例如,在获取该出行数据之前的一个月,一个季度等。
S606、若异常出行数据的个数大于或等于预设次数,电子设备发出提示信息;提示信息表征驾驶员信息指示的驾驶员的行驶里程异常。
电子设备可以通过显示屏显示该提示信息,或者通过语音播放该提示信息等等。
其中,预设次数和预设时长是相关的。预设时长越长,预设次数越大。预设时长和预设次数都可以是上述第一操作所指示的。
其中,该提示信息可以包括该驾驶员在预设时长内的异常出行数据的具体内容、异常出行数据的个数等。
可以理解的是,为了排除该驾驶员出现一次或几次异常出行数据是偶然发生的,可以设置一个预设时长内发生异常出行数据的预设次数。如果一个驾驶员在一个预设时长内发生异常出行数据的次数超出预设次数,可以确认该驾驶员有意篡改行驶里程,则电子设备可以发出提示信息。
需要说明的是,在S605-S606中,电子设备以驾驶员为维度,统计异常出行数据的个数。除此之外,电子设备也可以以车辆为维度,统计异常出行数据的个数。电子设备以车辆为维度统计异常出行数据的个数的过程,可以参见S605-S606的具体介绍,本申请实施例这里不予赘述。
本申请实施例中,一组区域可以包括区域A和区域B,则与这组区域对应的目标历史出行数据中可以包括:车辆从区域A到区域B的第一个目标历史出行数据,还可以包括车辆从区域B到区域A的第二个目标历史出行数据。其中,第一个目标历史出行数据和第二目标历史出行数据对应相同的一组区域(即区域A和区域B)。那么,电子设备可以用一个关键字key(可以称为第一关键字)表示这组区域,并且,无论是第一目标历史出行数据还是第二目标历史出行数据,其对应的一组区域都可以用第一关键字key表示。
其中,电子设备可以用这组区域中的两个区域的第一编码数据,按照预设的字符的先后顺序,组成唯一表征这组区域的第一关键字key。具体地,第一编码数据中的字符都属于0-9和b-z(去掉a,i,l,o)这32个字符中,则该字符的先后顺序可以包括:从0到9的先后顺序,以及从b到z(去掉a,i,l,o)的先后顺序。该字符的先后顺序还可以包括:0-9的顺序在b-z(去掉a,i,l,o)之前。然后,电子设备基于该字符的先后顺序,可以从区域A的第一编码数据的第一个字符和区域B的第一编码数据的第一个字符开始,比较每两个字符的先后顺序,将字符排序在前的第一编码数据拼接在字符排序在后的第一编码数据前面,得到第一关键字key。
示例性地,区域A的第一编码数据是wtmsh8,区域B的第一编码数据为wtmk72。其中,wtmsh8中的前3个字符和wtmk72中的前3个字符相同,wtmsh8中的第四个字符s的顺序在wtmk72中的第四个字符k之后,则电子设备可以得到表示区域A和区域B的第一关键字key是wtmk72+wtmsh8。进而,上述第一个目标历史出行数据和上述第二个目标历史出行数据,其对应的一组区域都可以用wtmk72+wtmsh8表示。
在一些实施例中,电子设备可以确定用每组区域中的两个区域的第一编码数据组成的第一关键字。进而,电子设备可以得到多个第一关键字。然后,电子设备对多个第一关键字和每个关键字对应的里程上界值对应保存在数据库中。进而,电子设备获取一个车辆的出行数据后,可以确定该出行数据对应的关键字(可以称为第二关键字)。该第二关键字表征该出行数据中的上下车位置分别所属的第一区域和第二区域。电子设备再利用该第二关键字,从数据库中查找与该第二关键字对应的里程上界值。
具体地,如图11所示,该方法中的S402可以包括S701,S403可以包括S702,S404可以包括S703-S704。该方法还可以包括S601-S606。其中,S602可以包括S705,S603可以包括S706,S604可以包括S709,S606可以包括S711。
S701、电子设备确定目标区域中的至少一个区域各自的第一编码数据;第一编码数据用于表征区域的位置。
需要说明的是,S701的具体过程,可以参见上述S402中对第一编码数据的详细介绍,本申请实施例这里不予赘述。
S702、电子设备根据多个历史出行数据中的上车位置和下车位置、以及至少一个区域各自的位置信息,确定多个第一关键字、以及与多个第一关键字中每个第一关键字对应的目标历史出行数据;其中,每个第一关键字用于表征一组区域。
其中,每组区域对应的第一关键字可以是按照上述预设的字符的先后顺序,对每组区域中的两个区域的第一编码数据进行拼接组成的。
需要说明的是,S702的具体过程,可以参见上述S403中对确定每组区域和其对应的目标历史出行数据的详细介绍,以及上述电子设备生成第一关键字的详细介绍,本申请实施例这里不予赘述。
S703、电子设备根据每个关键字对应的目标历史出行数据中的行驶里程,确定每个关键字对应的里程上界值、里程上界值的置信度。
其中,每个关键字对应的里程上界值的置信度可以是每个关键字对应的目标历史出行数据的个数。
S704、电子设备保存每个关键字对应的里程上界值。
需要说明的是,S703-S704的具体过程,可以参见上述S404中对确定每组区域对应的里程上界值和里程上界值的置信度的详细介绍,本申请实施例这里不予赘述。
S705、电子设备从至少一个区域中确定上车位置所属的第一区域和下车位置所属的第二区域,并确定与第一区域和第二区域对应的第二关键字。
电子设备可以先确定上车位置所属的第一区域的第二编码数据、和下车位置所属的两个第二区域的第二编码数据。电子设备再根据第一区域的第二编码数据和第二区域的第二编码数据,得到第二关键字。
其中,与第一区域和第二区域对应的第二关键字可以是按照上述预设的字符的先后顺序,对第一区域的第二编码数据中前预设位数的字符和第二区域的第二编码数据中前预设位数的字符进行拼接组成的。
例如,预设位数m=6,两个第二区域的第二编码数据包括:wtw37qd2、wtw37re1。电子设备按照上述预设的字符的先后顺序,对wtw37qd2中的wtw37q和wtw37re1中的wtw37r进行拼接。其中,wtw37q中的前5个字符和wtw37q中的前5个字符相同。wtw37q中的第6个字符q的顺序在wtw37r中的第6个字符r之后,则电子设备可以拼接wtw37q和wtw37r,可以得到第二关键字是wtw37r+wtw37q。
S706、电子设备从多个第一关键字各自对应的里程上界值中,获取与第二关键字对应的里程上界值和里程上界值的置信度。
其中,与第二关键字对应的里程上界值是多个第一关键字各自对应的里程上界值中,以第一区域和第二区域为起止点的里程上界值。
需要说明的是,S706的具体过程,可以参见上述S603中对确定每组区域对应的里程上界值和里程上界值的置信度的详细介绍,本申请实施例这里不予赘述。
S707、电子设备判断与第二关键字对应的里程上界值的置信度是否不小于预设置信度阈值。
若与第二关键字对应的里程上界值的置信度不小于(即大于或等于)预设置信度阈值,则电子设备执行S708。若与第二关键字对应的里程上界值的置信度小于预设置信度阈值,则电子设备可以结束识别过程。
S708、电子设备判断出行数据中的行驶里程是否不小于与第二关键字对应的里程上界值。
若出行数据中的行驶里程不小于(即大于或等于)与第二关键字对应的里程上界值,则电子设备执行S709。若出行数据中的行驶里程小于与第二关键字对应的里程上界值,则电子设备可以结束识别过程。
S709、电子设备确定出行数据是异常出行数据,并将出行数据作为异常出现数据保存。
需要说明的是,S709的具体过程,可以参见上述S604中对确定出行数据是异常出行数据的详细介绍,本申请实施例这里不予赘述。
S710、电子设备判断异常出行数据的个数是否不小于预设次数。
若异常出行数据的个数不小于(即大于或等于)预设次数,则电子设备执行S711。若异常出行数据的个数小于预设次数,则电子设备可以结束识别过程。
S711、电子设备发出提示信息。
需要说明的是,S711的具体过程,可以参见上述S606中对发出提示信息的详细介绍,本申请实施例这里不予赘述。
上述主要从方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术目标应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术目标可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例还提供一种异常轨迹识别装置。如图12所示,为本申请实施例提供的一种异常轨迹识别装置800的结构示意图。该装置800可以包括:数据获取模块801、位置分析模块802和异常识别模块803。
其中,数据获取模块801,用于获取车辆的出行数据;出行数据包括上车位置、下车位置和行驶里程。位置分析模块802,还用于确定上车位置所属的第一区域和下车位置所属的第二区域。异常识别模块803,用于获取以第一区域和第二区域为起止点的、出行数据对应的里程上界值;若行驶里程大于或等于出行数据对应的里程上界值,则确定出行数据是异常出行数据。
另一种可能的实现方式中,出行数据还包括驾驶员信息。
异常识别模块803,还用于:根据驾驶员信息,统计驾驶员信息所指示的驾驶员在预设时长内的异常出行数据的个数;若异常出行数据的个数大于或等于预设次数,发出提示信息。
在一种可能的实现方式中,该装置800还包括上界值确定模块804。
其中,数据获取模块801,还用于获取目标区域内的车辆的多个历史出行数据;历史出行数据包括:上车位置、下车位置和行驶里程。位置分析模块802,还用于:确定目标区域中的至少一个区域各自的位置信息;根据多个历史出行数据中的上车位置和下车位置、以及至少一个区域各自的位置信息,确定至少一组区域、以及与至少一组区域中每组区域对应的目标历史出行数据。上界值确定模块804,用于针对每组区域,根据每组区域对应的目标历史出行数据中的行驶里程,确定每组区域对应的里程上界值。
其中,每组区域中的一个区域和另一个区域分别包括目标历史出行数据中的上车位置和下车位置。每组区域对应的里程上界值是以每组区域中的两个区域为起止点的里程上界值。
另一种可能的实现方式中,位置分析模块802,具体用于:采用预设编码算法,将目标区域划分成尺寸相同的至少一个区域,并确定至少一个区域中每个区域的第一编码数据;其中,每个区域的第一编码数据是每个区域的位置信息;预设编码算法包括GeoHash算法;针对多个历史出行数据中的每个历史出行数据,采用预设编码算法,分别对历史出行数据中的上车位置和下车位置进行转换,得到一对第二编码数据;根据一对第二编码数据,从至少一个区域中确定一组区域,并确定历史出行数据属于与这一组区域对应的目标历史出行数据;一组区域的第一编码数据包括一对第二编码数据。
另一种可能的实现方式中,位置分析模块802,具体用于:采用预设编码算法,对目标区域内的经纬度进行转换,并对转换后的编码数据提取其前预设位数的GeoHash字符,得到至少一个区域和每个区域的第一编码数据;每个区域的第一编码数据是每个区域内的转换后的编码数据中前预设位数的GeoHash字符;从至少一个区域中,确定第一编码数据等于一对第二编码数据中任一个第二编码数据的前预设位数的字符的区域属于一组区域。
另一种可能的实现方式中,上界值确定模块804,具体用于:在每组区域对应的目标历史出行数据的总个数大于或等于预设置信度阈值的情况下,对每组区域对应的目标历史出行数据中的行驶里程进行排序,得到排序后的行驶里程;从排序后的行驶里程中确定第一数值和第二数值;其中,第一数值小于排序后的行驶里程的中位数;第二数值大于排序后的行驶里程的中位数;对第二数值减去第一数值的差乘以预设倍数,再与第二数值进行求和,得到每组区域对应的里程上界值。
当然,本申请实施例提供的异常轨迹识别装置800包括但不限于上述模块。
本申请另一实施例还提供一种电子设备。如图13所示,电子设备900包括存储器901和处理器902;存储器901和处理器902耦合;存储器901用于存储计算机程序代码,计算机程序代码包括计算机指令。其中,当处理器902执行计算机指令时,使得电子设备900执行上述方法实施例所示的方法流程中电子设备执行的各个步骤。
在实际实现时,数据获取模块801、位置分析模块802、异常识别模块803和上界值确定模块804可以由图9所示的处理器902调用存储器901中的计算机程序代码来实现。其具体的执行过程可参考上述异常轨迹识别方法部分的描述,这里不再赘述。
本申请另一实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行上述方法实施例所示的方法流程中电子设备执行的各个步骤。
本申请另一实施例还提供一种芯片***,该芯片***应用于电子设备。该芯片***包括一个或多个接口电路,以及一个或多个处理器。接口电路和处理器通过线路互联。接口电路用于从电子设备的存储器接收信号,并向处理器发送所述信号,所述信号包括所述存储器中存储的计算机指令。当电子设备的处理器执行计算机指令时,电子设备执行上述方法实施例所示的方法流程中电子设备执行的各个步骤。
在本申请另一实施例中还提供一种计算机程序产品,该计算机程序产品包括计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行上述方法实施例所示的方法流程中电子设备执行的各个步骤。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机执行指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digitalsubscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
以上所述,仅为本申请的具体实施方式。熟悉本技术领域的技术人员根据本申请提供的具体实施方式,可想到变化或替换,都应涵盖在本申请的保护范围之内。
Claims (10)
1.一种异常轨迹识别方法,其特征在于,所述方法包括:
获取车辆的出行数据;所述出行数据包括上车位置、下车位置和行驶里程;
确定所述上车位置所属的第一区域和所述下车位置所属的第二区域;
获取以所述第一区域和所述第二区域为起止点的、所述出行数据对应的里程上界值;
若所述行驶里程大于或等于所述出行数据对应的里程上界值,则确定所述出行数据是异常出行数据。
2.根据权利要求1所述的方法,其特征在于,所述出行数据还包括驾驶员信息;
所述方法还包括:
根据所述驾驶员信息,统计所述驾驶员信息所指示的驾驶员在预设时长内的异常出行数据的个数;
若所述异常出行数据的个数大于或等于预设次数,发出提示信息。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
获取目标区域内的车辆的多个历史出行数据;所述历史出行数据包括:上车位置、下车位置和行驶里程;
确定所述目标区域中的至少一个区域各自的位置信息;
根据所述多个历史出行数据中的上车位置和下车位置、以及所述至少一个区域各自的位置信息,确定至少一组区域、以及所述至少一组区域中每组区域对应的目标历史出行数据;其中,所述每组区域中的一个区域和另一个区域分别包括所述每组区域对应的目标历史出行数据中的上车位置和下车位置;
针对所述每组区域,根据所述每组区域对应的目标历史出行数据中的行驶里程,确定所述每组区域对应的里程上界值;所述每组区域对应的里程上界值是以所述每组区域中的两个区域为起止点的里程上界值。
4.根据权利要求3所述的方法,其特征在于,所述确定所述目标区域中的至少一个区域各自的位置信息,包括:
采用预设编码算法,将所述目标区域划分成尺寸相同的所述至少一个区域,并确定所述至少一个区域中每个区域的第一编码数据;其中,所述每个区域的第一编码数据是所述每个区域的位置信息;
所述根据所述多个历史出行数据中的上车位置和下车位置、以及所述至少一个区域各自的位置信息,确定至少一组区域、以及与所述至少一组区域中每组区域对应的目标历史出行数据,包括:
针对所述多个历史出行数据中的每个历史出行数据,采用所述预设编码算法,分别对所述历史出行数据中的上车位置和下车位置进行转换,得到一对第二编码数据;
根据所述一对第二编码数据,从所述至少一个区域中确定一组区域,并确定所述历史出行数据属于与所述一组区域对应的目标历史出行数据;所述一组区域的第一编码数据包括所述一对第二编码数据。
5.根据权利要求4所述的方法,其特征在于,所述采用预设编码算法,将所述目标区域划分成尺寸相同的所述至少一个区域,并确定所述至少一个区域中每个区域的第一编码数据,包括:
采用所述预设编码算法,对所述目标区域内的经纬度进行转换,并对转换后的编码数据提取其前预设位数的GeoHash字符,得到所述至少一个区域和所述每个区域的第一编码数据;所述每个区域的第一编码数据是所述每个区域内的转换后的编码数据中前预设位数的GeoHash字符;
所述根据所述一对第二编码数据,从所述至少一个区域中确定一组区域,包括:
从所述至少一个区域中,确定所述第一编码数据等于所述一对第二编码数据中任一个第二编码数据的前预设位数的字符的区域属于所述一组区域。
6.根据权利要求3所述的方法,其特征在于,所述针对所述每组区域,根据所述每组区域对应的目标历史出行数据中的行驶里程,确定所述每组区域对应的里程上界值,包括:
在所述每组区域对应的目标历史出行数据的总个数大于或等于预设置信度阈值的情况下,对所述每组区域对应的目标历史出行数据中的行驶里程进行排序,得到排序后的行驶里程;
从所述排序后的行驶里程中确定第一数值和第二数值;其中,所述第一数值小于所述排序后的行驶里程的中位数;所述第二数值大于所述排序后的行驶里程的中位数;
对所述第二数值减去所述第一数值的差乘以预设倍数,再与所述第二数值进行求和,得到所述每组区域对应的里程上界值。
7.一种异常轨迹识别装置,其特征在于,所述装置包括:
数据获取模块,用于获取车辆的出行数据;所述出行数据包括上车位置、下车位置和行驶里程;
位置分析模块,用于确定所述上车位置所属的第一区域和所述下车位置所属的第二区域;
异常识别模块,用于:获取以所述第一区域和所述第二区域为起止点的、所述出行数据对应的里程上界值;若所述行驶里程大于或等于所述出行数据对应的里程上界值,则确定所述出行数据是异常出行数据。
8.根据权利要求7所述的装置,其特征在于,
所述出行数据还包括驾驶员信息;所述异常识别模块,还用于:根据所述驾驶员信息,统计所述驾驶员信息所指示的驾驶员在预设时长内的异常出行数据的个数;若所述异常出行数据的个数大于或等于预设次数,发出提示信息;
所述识别装置还包括上界值确定模块;
所述数据获取模块,还用于获取目标区域内的车辆的多个历史出行数据;所述历史出行数据包括:上车位置、下车位置和行驶里程;
所述位置分析模块,还用于:确定所述目标区域中的至少一个区域各自的位置信息;根据所述多个历史出行数据中的上车位置和下车位置、以及所述至少一个区域各自的位置信息,确定至少一组区域、以及所述至少一组区域中每组区域对应的目标历史出行数据;其中,所述每组区域中的一个区域和另一个区域分别包括所述每组区域对应的目标历史出行数据中的上车位置和下车位置;
所述异常识别模块,用于针对所述每组区域,根据所述每组区域对应的目标历史出行数据中的行驶里程,确定所述每组区域对应的里程上界值;所述每组区域对应的里程上界值是以所述每组区域中的两个区域为起止点的里程上界值;
所述位置分析模块,具体用于:
采用预设编码算法,将所述目标区域划分成尺寸相同的所述至少一个区域,并确定所述至少一个区域中每个区域的第一编码数据;其中,所述每个区域的第一编码数据是所述每个区域的位置信息;
针对所述多个历史出行数据中的每个历史出行数据,采用所述预设编码算法,分别对所述历史出行数据中的上车位置和下车位置进行转换,得到一对第二编码数据;
根据所述一对第二编码数据,从所述至少一个区域中确定一组区域,并确定所述历史出行数据属于与所述一组区域对应的目标历史出行数据;所述一组区域的第一编码数据包括所述一对第二编码数据;
所述位置分析模块,具体用于:
采用所述预设编码算法,对所述目标区域内的经纬度进行转换,并对转换后的编码数据提取其前预设位数的GeoHash字符,得到所述至少一个区域和所述每个区域的第一编码数据;所述每个区域的第一编码数据是所述每个区域内的转换后的编码数据中前预设位数的GeoHash字符;
从所述至少一个区域中,确定所述第一编码数据等于所述一对第二编码数据中任一个第二编码数据的前预设位数的字符的区域属于所述一组区域;
所述上界值确定模块,具体用于:
在所述每组区域对应的目标历史出行数据的总个数大于或等于预设置信度阈值的情况下,对所述每组区域对应的目标历史出行数据中的行驶里程进行排序,得到排序后的行驶里程;
从所述排序后的行驶里程中确定第一数值和第二数值;其中,所述第一数值小于所述排序后的行驶里程的中位数;所述第二数值大于所述排序后的行驶里程的中位数;
对所述第二数值减去所述第一数值的差乘以预设倍数,再与所述第二数值进行求和,得到所述每组区域对应的里程上界值。
9.一种电子设备,其特征在于,所述电子设备包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;
其中,当所述处理器执行所述计算机指令时,使得所述电子设备执行如权利要求1-6中任意一项所述的异常轨迹识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在电子设备上运行时,使得所述电子设备执行如权利要求1-6中任一项所述的异常轨迹识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111676512.6A CN114331477A (zh) | 2021-12-31 | 2021-12-31 | 一种异常轨迹识别方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111676512.6A CN114331477A (zh) | 2021-12-31 | 2021-12-31 | 一种异常轨迹识别方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114331477A true CN114331477A (zh) | 2022-04-12 |
Family
ID=81022366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111676512.6A Pending CN114331477A (zh) | 2021-12-31 | 2021-12-31 | 一种异常轨迹识别方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114331477A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11505199B1 (en) * | 2021-06-18 | 2022-11-22 | Zhiji Automotive Technology Co., Ltd. | Method, apparatus and device for cleaning up vehicle driving data and storage medium thereof |
-
2021
- 2021-12-31 CN CN202111676512.6A patent/CN114331477A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11505199B1 (en) * | 2021-06-18 | 2022-11-22 | Zhiji Automotive Technology Co., Ltd. | Method, apparatus and device for cleaning up vehicle driving data and storage medium thereof |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2018197962A1 (en) | Verifying sensor data using embeddings | |
CN111861643A (zh) | 一种乘车位置的推荐方法、装置、电子设备及存储介质 | |
US20160247096A1 (en) | Systems and Methods for Managing Networked Vehicle Resources | |
CN112734242A (zh) | 一种车辆运行轨迹数据的可用度分析方法、装置、存储介质及终端 | |
CN111397625A (zh) | 车辆导航方法及相关装置 | |
CN114331477A (zh) | 一种异常轨迹识别方法、装置、电子设备及存储介质 | |
CN111859172B (zh) | 信息推送方法、装置、电子设备和计算机可读存储介质 | |
CN114201571B (zh) | 加油站推荐方法、装置、电子设备及存储介质 | |
Deng et al. | Modeling and prediction of bus operation states for bunching analysis | |
CN117445677A (zh) | 车辆行驶预测方法、装置、电子设备及存储介质 | |
CN111369790B (zh) | 过车记录校正方法、装置、设备及存储介质 | |
CN117146848A (zh) | 路径规划方法、装置及电子设备 | |
CN113570004B (zh) | 一种乘车热点区域预测方法、装置、设备及可读存储介质 | |
CN111339468B (zh) | 信息推送方法、装置、电子设备和存储介质 | |
Kalila et al. | Big data fusion to estimate urban fuel consumption: a case study of riyadh | |
CN116929383A (zh) | 车辆行驶路径的确定方法、路径分类模型的获取方法及装置 | |
CN114674327A (zh) | 行驶轨迹的推送方法、装置、电子设备和导航设备 | |
CN114485826A (zh) | 一种车辆里程油耗数据确定方法及装置 | |
CN111597277B (zh) | 电子地图中的站点聚合方法、装置、计算机设备和介质 | |
CN113449002A (zh) | 车辆推荐方法、装置、电子设备及存储介质 | |
CN113052397A (zh) | 上车信息的确定方法、装置、电子设备和存储介质 | |
CN111783037A (zh) | 一种车辆里程预估模型优化方法、装置、设备及存储介质 | |
CN106781470B (zh) | 城市道路的运行速度的处理方法及装置 | |
CN112052276A (zh) | 乘车路线的挖掘方法和装置 | |
CN112729325B (zh) | 线路规划方法、装置、***、服务器及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |