CN113810992B - 数据处理方法及装置 - Google Patents
数据处理方法及装置 Download PDFInfo
- Publication number
- CN113810992B CN113810992B CN202111346095.9A CN202111346095A CN113810992B CN 113810992 B CN113810992 B CN 113810992B CN 202111346095 A CN202111346095 A CN 202111346095A CN 113810992 B CN113810992 B CN 113810992B
- Authority
- CN
- China
- Prior art keywords
- signaling data
- target
- timestamp
- signaling
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W64/00—Locating users or terminals or network equipment for network management purposes, e.g. mobility management
- H04W64/006—Locating users or terminals or network equipment for network management purposes, e.g. mobility management with additional information processing, e.g. for direction or speed determination
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mobile Radio Communication Systems (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请提供一种数据处理方法及装置。本申请的技术方案中,在获取到第一信令数据集包括的N2个第一信令数据之后,还获取了第一信令数据集中满足条件的N2个第一信令数据对应的第一目标信令数据,之后,通过第一信令数据集和第一目标信令数据获得第二信令数据集并基于该第二信令数据集确定终端的停留点。该方法中,获得的第二信令数据集中不包括第一信令数据集按照时间戳先后顺序排列时位于第一个第一信令数据和最后一个第一信令数据之间的所有第一信令数据。该方法能够减少漂移数据对手机的停留点的准确性的影响,从而提升确定终端的停留点的准确性。
Description
技术领域
本申请涉及大数据分析领域,尤其涉及一种数据处理方法及装置。
背景技术
手机的信令数据直接来源于运营商的移动通信***。当手机发生打电话、收发短信、挂机、位置更新、基站切换或者连接互联网等行为时,就会产生信令数据。典型的信令数据通常包括手机的标识信息,例如用户识别卡(subscriber identity module,SIM)信息、时间戳信息(包括信令数据产生的起始时间和结束时间)以及手机在对应时间戳内的位置信息等,其中,信令数据中为手机记录的位置信息通常是手机的服务基站的位置信息。
由于手机的信令数据具有覆盖范围广、实名和实施成本低等优势,因此,在城市规划或者交通规划与管理等规划工作中,通过对大量的信令数据进行分析以确定手机的停留点对于宏观掌握和把控任意时间段内用户的流动动向具有不可替代的重要性。停留点可以理解为手机停留的位置和/或在该位置停留的时长。
但是,手机在与当前服务基站通信过程中,会出现基站的非常规跳转,例如随时跳转至其他基站,然后再跳转至原服务基站的现象,这导致该手机在一段时长内的信令数据会包含漂移数据,该漂移数据是指记录的位置信息为该其他基站的位置信息的信令数据。
手机在与当前服务基站连接过程中出现基站的非常规跳转的情况下,手机的合理停留点信息应为:该时长内停留在原服务基站的位置。但是因为漂移数据的存在,会导致基于该时长内的信令数据为手机确定出如下不准确的停留点信息:手机在跳转至其他基站之前的停留点为原服务基站的位置,手机跳转至其他基站之后的停留点为该其他基站的位置,手机跳转至原服务基站之后的停留点为原服务基站的位置。
因此,在确定手机的停留点时,如何减少漂移数据对手机的停留点的准确性的影响,称为亟待解决的技术问题。
发明内容
本申请提供一种数据处理方法及装置,能够减少漂移数据对手机的停留点的准确性的影响,进一步地,还能够压缩信令数据的数量。
第一方面,本申请提供一种数据处理方法,该方法包括:获取第一信令数据集,该第一信令数据集包括终端的N1个第一信令数据,所述N1个第一信令数据中每个第一信令数据包括第一时间戳和第一位置信息,所述第一位置信息指示终端在第一时间戳指示的时长内的第一位置,N1为正整数;获取第一信令数据集中的N2个第一信令数据对应的第一目标信令数据,所述N2个第一信令数据至少满足如下条件:N2个第一信令数据中第i个第一信令数据中的第一时间戳的结束时间与第i+1个第一信令数据中的第一时间戳的起始时间之间的差值小于第一预设值,N2个第一信令数据中任意两个第一信令数据的第一位置信息相同,i为整数,且i从1取至N1-1,第一目标信令数据包括第一目标时间戳和第一目标位置信息,第一目标时间戳的起始时间为N2个第一信令数据第一个第一信令数据的起始时间,第一目标时间戳的结束时间为N2个第一信令数据最后一个第一信令数据的结束时间,第一目标位置信息与N2个第一信令数据中任意一个第一信令数据的第一位置信息相同,N2为小于或等于N1的正整数;根据第一信令数据集和第一目标信令数据获取第二信令数据集,第二信令数据集包括第一目标信令数据和第一信令数据集中除N3个第一信令数据之外的其他第一信令数据,N3个第一信令数据包括第一信令数据集按照时间戳先后顺序排列时位于第一个第一信令数据和最后一个第一信令数据之间的所有第一信令数据;根据第二信令数据集确定终端的停留点。
本申请实施例提供的数据处理方法,在获取到第一信令数据集包括的N2个第一信令数据之后,还获取了第一信令数据集中满足条件的N2个第一信令数据对应的第一目标信令数据,该第一目标信令数据包括的第一目标时间戳的起始时间为N2个第一信令数据第一个第一信令数据的起始时间,第一目标时间戳的结束时间为N2个第一信令数据最后一个第一信令数据的结束时间。之后,由于通过第一信令数据集和第一目标信令数据获得第二信令数据集时,获得的第二信令数据集中不包括第一信令数据集按照时间戳先后顺序排列时位于第一个第一信令数据和最后一个第一信令数据之间的所有第一信令数据,可以理解的是,第一信令数据集按照时间戳先后顺序排列时位于第一个第一信令数据和最后一个第一信令数据之间的所有第一信令数据可能是包括了多个漂移数据的,因此,通过该方法获得的第二信令数据集中相比于第一信令数据集,减少了漂移数据。进一步地,基于第二信令数据集中信令数据来确定终端的停留点会提升准确性。
结合第一方面,在一种可能的实现方式中,获取第一信令数据集中的N2个第一信令数据对应的目标第一信令数据,包括:从第一信令数据集中获取N2个第一信令数据;从N2个第一信令数据中的第一个第一信令数据开始,执行如下处理以得到目标第一信令数据:若第i个第一信令数据中的第一时间戳的结束时间与第i+1个第一信令数据中的第一时间戳的起始时间之间的差值小于第一预设值,更新第i个第一信令数据中的第一时间戳的结束时间为第i+1个第一信令数据中的第一时间戳的结束时间,并删除第i+1个第一信令数据继续执行,直至执行到N2个第一信令数据中的最后一个第一信令数据;相应地,根据第一信令数据集和目标第一信令数据获取第二信令数据集,包括:获取N3个第一信令数据;从第一信令数据集中删除N3个第一信令数据,获得除N3个第一信令数据之外的其他第一信令数据;将除N3个第一信令数据之外的其他第一信令数据和第一目标信令数据组成第二信令数据集。
该实现方式中,由于删除了N3个第一信令数据,而该N3个第一信令数据中可能存在漂移数据,因此,使用除N3个第一信令数据之外的其他第一信令数据和第一目标信令数据组成第二信令数据集中可以减少漂移数据的数量,从而提升了基于第二信令数据集中信令数据来确定终端的停留点会提升准确性。
结合第一方面,在一种可能的实现方式中,在获取第一信令数据集之前,所述方法还包括:获取终端的M个第二信令数据,所述M个第二信令数据中每个第二信令数据包括第一时间戳和第二位置信息,第二位置信息指示终端在第一时间戳指示的时长内的第二位置,M为正整数;根据预设地理范围信息确定终端在每个第二信令数据中的第二位置信息所对应的中心位置,预设地理范围信息包括多个位置信息中每个位置信息与每个位置信息所属的地理范围之间的映射关系以及多个地理范围中每个地理范围与每个地理范围的中心位置的映射关系;根据M个第二信令数据确定N1个第一信令数据,N1个第一信令数据中第j个第一信令数据包括M个第二信令数据中第j个第二信令数据中的第一时间戳和所述第一位置信息,所述第一位置信息指示第j个第一信令数据中的第二位置信息所对应的中心位置,j为整数且从1取至M。
本实施例提供的数据处理方法,在获取N1个第一信令数据之前,先获取了M个第二信令数据,然后根据多个位置信息中每个位置信息与每个位置信息所属的地理范围之间的映射关系以及多个地理范围中每个地理范围与每个地理范围的中心位置的映射关系来将M个第二信令数据中的每个第二信令数据的第二位置信息更换为中心位置,这样的话,位于同一个地理范围的多个第二信令中的位置信息将会对应同一个位置信息,从而降低了存在漂移数据的概率,进一步地提升了基于第二信令数据集中信令数据来确定终端的停留点会提升准确性。
结合第一方面,在一种可能的实现方式中,根据第二信令数据集确定终端的停留点,包括:获取第二信令数据集中的N4个信令数据对应的第二目标信令数据,所述N4个信令数据至少满足如下条件:所述N4个信令数据中任意一个信令数据中的第一位置信息与N4个信令数据中除任意一个信令数据之外的其他信令数据的第一位置信息之差小于预设的距离阈值,所述N4个信令数据在第一信令数据集按照时间戳先后顺序排列时处于相邻位置,第二目标信令数据包括第二目标时间戳和第二目标位置信息,第二目标时间戳的起始时间为N4个信令数据中对应的N4个时间戳中的起始时间的最小值,第二目标时间戳的结束时间为N4个信令数据对应的N4个时间戳中的结束时间的最大值,第二目标位置信息为N4个信令数据对应的N4个第一位置信息的加权平均值;根据第二信令数据集和第二目标信令数据获取第三信令数据集,第三信令数据集包括第二目标信令数据和第二信令数据集中除N4个信令数据之外的其他信令数据;基于第三信令数据集,确定目标用户的停留点。
本实施例提供的数据处理方法,在获得第二数据集之后,若N4个信令数据中任意一个信令数据中的第一位置信息与N4个信令数据中除任意一个信令数据之外的其他信令数据的第一位置信息之差小于预设的距离阈值,且N4个信令数据在第一信令数据集按照时间戳先后顺序排列时处于相邻位置时,则将该N4个第一信令数据中的位置信息全部替换为N4个信令数据对应的N4个第一位置信息的加权平均值,之后将该N4个信令数据合并为一个新的信令数据,该新的信令数据的时间戳的起始时间为N4个信令数据中对应的N4个时间戳中的起始时间的最小值,第二目标时间戳的结束时间为N4个信令数据对应的N4个时间戳中的结束时间的最大值。可以理解的是,由于该实施例中根据满足条件的不同位置信息的第一信令数据获得了一个第二目标信令数据,从而减少了信令数据的数量,进一步减轻计算复杂度。
结合第一方面,在一种可能的实现方式中,所述第一位置信息为经纬度信息。
第二方面,本申请提供一种数据处理装置,包括:获取模块,用于获取第一信令数据集,第一信令数据集包括终端的N1个第一信令数据,N1个第一信令数据中每个第一信令数据包括第一时间戳和第一位置信息,第一位置信息指示终端在第一时间戳指示的时长内的第一位置,N1为正整数;获取模块,还用于获取第一信令数据集中的N2个第一信令数据对应的第一目标信令数据,N2个第一信令数据至少满足如下条件:N2个第一信令数据中第i个第一信令数据中的第一时间戳的结束时间与第i+1个第一信令数据中的第一时间戳的起始时间之间的差值小于第一预设值,N2个第一信令数据中任意两个第一信令数据的第一位置信息相同,i为整数,且i从1取至N1-1,第一目标信令数据包括第一目标时间戳和第一目标位置信息,第一目标时间戳的起始时间为N2个第一信令数据第一个第一信令数据的起始时间,第一目标时间戳的结束时间为N2个第一信令数据最后一个第一信令数据的结束时间,第一目标位置信息与N2个第一信令数据中任意一个第一信令数据的第一位置信息相同,N2为小于或等于N1的正整数;所述获取模块,还用于根据第一信令数据集和第一目标信令数据获取第二信令数据集,述第二信令数据集包括第一目标信令数据和第一信令数据集中除N3个第一信令数据之外的其他第一信令数据,所述N3个第一信令数据包括第一信令数据集按照时间戳先后顺序排列时位于第一个第一信令数据和最后一个第一信令数据之间的所有第一信令数据;处理模块,用于根据第二信令数据集确定所述终端的停留点。
结合第二方面,在一种可能的实现方式中,所述获取模块具体用于:从第一信令数据集中获取N2个第一信令数据;从N2个第一信令数据中的第一个第一信令数据开始,执行如下处理以得到目标第一信令数据:若第i个第一信令数据中的第一时间戳的结束时间与第i+1个第一信令数据中的第一时间戳的起始时间之间的差值小于第一预设值,更新第i个第一信令数据中的第一时间戳的结束时间为第i+1个第一信令数据中的第一时间戳的结束时间,并删除第i+1个第一信令数据继续执行,直至执行到N2个第一信令数据中的最后一个第一信令数据;相应地,获取模块还用于:获取N3个第一信令数据;从第一信令数据集中删除N3个第一信令数据,获得除N3个第一信令数据之外的其他第一信令数据;将除N3个第一信令数据之外的其他第一信令数据和第一目标信令数据组成第二信令数据集。
结合第二方面,在一种可能的实现方式中,所述获取模块还用于:获取终端的M个第二信令数据,M个第二信令数据中每个第二信令数据包括第一时间戳和第二位置信息,第二位置信息指示终端在第一时间戳指示的时长内的第二位置,M为正整数;根据预设地理范围信息确定终端在每个第二信令数据中的第二位置信息所对应的中心位置,预设地理范围信息包括多个位置信息中每个位置信息与所述每个位置信息所属的地理范围之间的映射关系以及多个地理范围中每个地理范围与所述每个地理范围的中心位置的映射关系;
根据M个第二信令数据确定N1个第一信令数据,N1个第一信令数据中第j个第一信令数据包括M个第二信令数据中第j个第二信令数据中的第一时间戳和第一位置信息,所述第一位置信息指示第j个第一信令数据中的第二位置信息所对应的中心位置,j为整数且从1取至M。
结合第二方面,在一种可能的实现方式中,所述处理模块具体用于:获取第二信令数据集中的N4个信令数据对应的第二目标信令数据,N4个信令数据至少满足如下条件:所述N4个信令数据中任意一个信令数据中的第一位置信息与N4个信令数据中除任意一个信令数据之外的其他信令数据的第一位置信息之差小于预设的距离阈值,N4个信令数据在第一信令数据集按照时间戳先后顺序排列时处于相邻位置,第二目标信令数据包括第二目标时间戳和第二目标位置信息,第二目标时间戳的起始时间为N4个信令数据中对应的N4个时间戳中的起始时间的最小值,第二目标时间戳的结束时间为N4个信令数据对应的N4个时间戳中的结束时间的最大值,第二目标位置信息为N4个信令数据对应的N4个第一位置信息的加权平均值;根据第二信令数据集和第二目标信令数据获取第三信令数据集,第三信令数据集包括第二目标信令数据和第二信令数据集中除N4个信令数据之外的其他信令数据;基于所述第三信令数据集,确定目标用户的停留点。
结合第二方面,在一种可能的实现方式中,所述第一位置信息为经纬度信息。
第三方面,本申请提供一种数据处理装置,包括:存储器和处理器;所述存储器用于存储程序指令;所述处理器用于调用存储器中的程序指令以执行如第一方面或其中任意一种可能的实现方式所述的方法。
在一些实现方式中,该装置可以是芯片。这种实现方式中,可选地,该装置还可以包括通信接口,用于与其他装置或设备进行通信。
第四方面,本申请提供一种数据处理***,包括第二方面或者第三方面或其中任意一种可能的实现方式中所述的数据处理装置。
第五方面,本申请提供一种计算机可读介质,所述计算机可读介质存储用于计算机执行的程序代码,该程序代码包括用于执行如第一方面或其中任意一种可能的实现方式所述的方法的指令。
其中,第三方面至第五方面中任一种实现方式所带来的技术效果可参见上述第一方面的任一种可能的实现方法所带来的技术效果,不予赘述。
附图说明
图1为本申请一个实施例提供的终端连接基站的结构示意图;
图2为本申请一个实施例提供的数据处理方法的示意性流程图;
图3为本申请一个实施例提供的第一信令的一种结构性示意图;
图4为本申请一个实施例提供的获取第二信令数据集的示意性流程图;
图5为本申请一个实施例提供的获取第三信令数据集的示意性流程图;
图6为本申请一个实施例提供的数据处理装置的结构性示意图;
图7为本申请另一个实施例提供的数据处理装置的结构性示意图。
具体实施方式
手机的信令数据直接来源于运营商的移动通信***。当手机发生打电话、收发短信、挂机、位置更新、基站切换或者连接互联网等行为时,就会产生信令数据。典型的信令数据通常包括手机的标识信息,例如用户识别卡(subscriber identity module,SIM)信息、时间戳信息(包括信令数据产生的起始时间和结束时间)以及手机在对应时间戳内的位置信息等,其中,信令数据中为手机记录的位置信息通常是手机的服务基站的位置信息。为便于描述,本实施例中也将手机称为终端。
由于手机的信令数据具有覆盖范围广、实名和实施成本低等优势,因此,在城市规划或者交通规划与管理等规划工作中,通过对大量的信令数据进行分析以确定手机的停留点对于宏观掌握和把控任意时间段内用户的流动动向具有不可替代的重要性。停留点可以理解为手机停留的位置和/或在该位置停留的时长。
但是,手机在与当前服务基站通信过程中,会出现基站的非常规跳转,例如随时跳转至其他基站,然后再跳转至原服务基站的现象,这导致该手机在一段时长内的信令数据会包含漂移数据,该漂移数据是指记录的位置信息为该其他基站的位置信息的信令数据。
示例性地,图1为本申请一个实施例提供的终端连接基站的结构示意图。如图1所示,终端原本与基站1相连,但可能由于一些非常规跳转,会出现终端连接到基站2上,之后又跳转回基站1上的现象。此时终端会与基站2之间产生信令数据。若将终端与基站1相连时的信令数据称为信令数据1,将终端与基站2之间产生的信令数据称为信令数据2,由于不论哪一个信令数据,信令数据中包括的位置信息实际上是基站的位置信息,因此,在出现非常规跳转这种情况下,虽然终端处于同一个位置,但是却出现了信令数据2这种不准确的信令数据(即漂移数据)。
可以理解的是,当终端在与当前服务基站连接过程中出现基站的非常规跳转的情况下,手机的合理停留点信息应为:该时长内停留在原服务基站的位置。但是因为漂移数据的存在,会导致基于该时长内的信令数据为手机确定出如下不准确的停留点信息:手机在跳转至其他基站之前的停留点为原服务基站的位置,手机跳转至其他基站之后的停留点为该其他基站的位置,手机跳转至原服务基站之后的停留点为原服务基站的位置。
鉴于此,本申请提出一种数据处理方法,在基于获取到的多个信令数据来确定停留点时,通过对获取到的信令数据进行预处理,来减少多个信令数据中的漂移数据,以提升确定的停留点的准确性。
下面,结合图2,说明本申请实施例提供的数据处理方法。
S201,获取第一信令数据集,所述第一信令数据集包括终端的N1个第一信令数据,所述N1个第一信令数据中每个第一信令数据包括第一时间戳和第一位置信息,第一位置信息指示终端在第一时间戳指示的时长内的第一位置,N1为正整数。
其中,第一信令数据集可以认为是终端的N1个第一信令数据组成的数据集合,并且该N1个第一信令数据是属于同一个终端的信令数据。第一时间戳用于指示第一信令产生的起始时间和结束时间,第一位置信息用于指示在该第一时间戳内时终端所处的位置。
示例性地,图3为本实施例提供的第一信令的一种结构性示意图。如图3所示,该第一信令包括终端标识,时间戳,经度和纬度,可以理解的是,时间戳中可以包括起始时间和结束时间,而经度和纬度描述了终端标识对应的终端所处的位置。在此说明的是,图3提供的第一信令的结构只是一种示例性结构,并不构成对本申请的限制。例如,该第一信令中还可以包括小区描述信息、信令类型等各种信息。
在此说明的是,本实施例对如何获取终端的N1个第一信令数据的形式不做限定。例如可以直接获取,或者可以从运营商处获取。
S202,获取第一信令数据集中的N2个第一信令数据对应的第一目标信令数据,N2个第一信令数据至少满足如下条件:N2个第一信令数据中第i个第一信令数据中的第一时间戳的结束时间与第i+1个第一信令数据中的第一时间戳的起始时间之间的差值小于第一预设值,N2个第一信令数据中任意两个第一信令数据的第一位置信息相同,i为整数,且i从1取至N1-1,第一目标信令数据包括第一目标时间戳和第一目标位置信息,第一目标时间戳的起始时间为N2个第一信令数据第一个第一信令数据的起始时间,第一目标时间戳的结束时间为N2个第一信令数据最后一个第一信令数据的结束时间,第一目标位置信息与N2个第一信令数据中任意一个第一信令数据的第一位置信息相同,N2为小于或等于N1的正整数。
本实施例中,当获取到终端的N1个第一信令数据之后,将该N1个第一信令数据中的N2个第一信令数据从时间上进行合并。但在进行合并时,并不是随意选择N2个第一信令数据,该N2个第一信令数据需要符合一定的条件。本实施例中,进行合并的N2个第一信令数据之间需要符合如下条件:N2个第一信令数据中第i个第一信令数据中的第一时间戳的结束时间与第i+1个第一信令数据中的第一时间戳的起始时间之间的差值小于第一预设值,N2个第一信令数据中任意两个第一信令数据的第一位置信息相同。可以理解的是,N2个第一信令数据中,若第i个第一信令数据中的第一时间戳的结束时间与第i+1个第一信令数据中的第一时间戳的起始时间之间的差值小于第一预设值,就说明第i个第一信令数据与第i+1个第一信令数据在时间上相距较近,而N2个第一信令数据中任意两个第一信令数据的第一位置信息相同就说明终端一直在一个位置上。即,当N2个第一信令数据同时满足上述时间条件和位置条件时,说明该N2个第一信令数据可能是终端在同一个位置上连续产生的信令数据,此时,就可以进行合并。
若确定了符合条件的N2个第一信令数据,就可以合并该N2个第一信令数据为第一目标信令数据。本实施例中,合并该N2个第一信令数据是指将N2个第一信令数据中的第一个第一信令数据的起始时间作为第一目标信令数据的起始时间,N2个第一信令数据最后一个第一信令数据的结束时间作为第一目标信令数据的技术时间,而由于N2个第一信令中的位置信息是相同的,因此,合并后的第一目标信令数据的位置信息(第一目标位置信息)也为第一位置信息。
示例性地,假设满足条件的N2个数据总共有5个,分别称为第一信令数据A1、第一信令数据A2、第一信令数据A3、第一信令数据A4和第一信令数据A5。并且该5个第一信令数据是按照时间由小到大进行排列的,此时,在将该5个第一信令数据合并后,合并后的第一目标信令数据包括的第一目标时间戳中的起始时间就是第一信令数据A1包括的第一时间戳中的起始时间,第一目标时间戳中的结束时间就是第一信令数据A5包括的第一时间戳中的结束时间。
S203,根据第一信令数据集和第一目标信令数据获取第二信令数据集,所述第二信令数据集包括第一目标信令数据和第一信令数据集中除N3个第一信令数据之外的其他第一信令数据,N3个第一信令数据包括第一信令数据集按照时间戳先后顺序排列时位于第一个第一信令数据和最后一个第一信令数据之间的所有第一信令数据。
可以理解的是,在将N2个第一信令数据合并为第一目标信令数据后,对于原来的第一信令数据集就需要进行更新,本实施例中,将更新后的第一信令数据集称为第二信令数据集。
此外,还可以理解的是,在将N2个第一信令数据合并为第一目标信令数据后,有可能会出现第一信令数据集中的某个第一信令数据的时间戳位于第一目标信令数据的时间戳之内,但是该某个第一信令数据的第一位置信息与第一目标信令数据不同,即可以认为是夹杂在该N2个第一信令数据中的漂移数据。
因此,本实施例中,在更新第一信令数据集时,除了删掉第一信令数据集中的该N2个第一信令数据,还删掉时间戳位于第一目标信令数据的时间戳之内,但是第一位置信息与第一目标信令数据不同的第一信令数据,然后再将第一目标信令数据增加到第一信令数据集中。也就是说,本实施例中的第二信令数据集包括第一目标信令数据和第一信令数据集中除N3个第一信令数据之外的其他第一信令数据,该N3个第一信令数据包括第一信令数据集按照时间戳先后顺序排列时位于第一个第一信令数据和最后一个第一信令数据之间的所有第一信令数据。
示例性地,假设第一数据集包括第一信令数据A1、第一信令数据A2、第一信令数据A3、第一信令数据A4、第一信令数据A5、第一信令数据A6、第一信令数据A7、第一信令数据A8、第一信令数据A9和第一信令数据A10,并且该10个第一信令数据是按照时间戳由小到大进行排序的。其中,第一信令数据A1、第一信令数据A2、第一信令数据A3、第一信令数据A4和第一信令数据A6为上述S202中满足条件的N2个第一信令,因此,首先将该N2个第一信令数据合并,获得第一目标信令数据,可以理解的是,该第一目标信令数据的时间戳中的起始时间为第一信令数据A1的起始时间,结束时间为第一信令数据A6的结束时间。此时,如果第一信令数A5的时间戳位于该一目标信令数据的时间戳之内,但是位置信息与第一目标信令数据的位置信息不同,那么第一信令数据A5就可以认为是漂移数据。进一步地,当更新第一数据集,获得第二数据集时,第二数据集包括:第一目标信令数据、第一信令数据A7、第一信令数据A8、第一信令数据A9和第一信令数据A10这5个信令数据。
S204,根据第二信令数据集确定终端的停留点。
本实施例中,在确定终端的停留点时,是基于第二信令数据集中的信令数据确定的。可以理解的是,由于第二数据集中的信令数据相比于第一信令数据集中的第一信令数据,是去除了一些漂移数据的,因此,基于第二信令数据集确定出的终端的停留点相比于使用第一信令数据集确定出的终端的停留点,准确性更高。
在此说明的是,关于如何使用多个信令数据来确定终端的停留点可以参考相关技术中的描述,此处不再赘述。例如,在得到第二信令数据集中,可以将该第二信令数据集中位于同一个位置信息的所有信令数据的时间戳相加得到总时间,若该总时间大于10分钟,则就可以认为该位置信息指示的位置为终端的一个停留点。
可以理解的是,要获取第一信令数据集,就需要先获取到N1个第一信令数据。本申请中,作为一个可选的实施例,在S201之前,还可以包括:获取终端的M个第二信令数据,M个第二信令数据中每个第二信令数据包括第一时间戳和第二位置信息,所述第二位置信息指示终端在第一时间戳指示的时长内的第二位置,M为正整数;根据预设地理范围信息确定终端在每个第二信令数据中的第二位置信息所对应的中心位置,预设地理范围信息包括多个位置信息中每个位置信息与每个位置信息所属的地理范围之间的映射关系以及多个地理范围中每个地理范围与每个地理范围的中心位置的映射关系;根据M个第二信令数据确定N1个第一信令数据,所述N1个第一信令数据中第j个第一信令数据包括M个第二信令数据中第j个第二信令数据中的第一时间戳和第一位置信息,第一位置信息指示第j个第一信令数据中的第二位置信息对应的中心位置,j为整数且从1取至M。
该实现方式中,M个第二信令数据可以认为是终端的M个原始的信令数据。可以理解的是,终端很可能会产生漂移数据。因此,本实施例中,在获取到M个第二信令数据后,根据预设地理范围信息确定终端在每个第二信令数据中的第二位置信息所对应的中心位置。其中,预设地理范围信息包括多个位置信息中每个位置信息与每个位置信息所属的地理范围之间的映射关系以及多个地理范围中每个地理范围与每个地理范围的中心位置的映射关系。即,对于某一个第二信令数据中的第二位置信息,可以先根据该第二位置信息与该第二位置信息所属的地理范围之间的映射关系确定出该第二位置信息位于的目标地理范围,然后再根据该目标地理范围与每个地理范围的中心位置的映射关系确定出目标地理范围对应的中心位置,最后将该某一个第二信令数据中的第二位置信息替换目标地理范围对应的中心位置。
可以理解的是,将每个第二信令的位置信息替换为每个第二信令所属的地理范围的中心位置能够减小漂移数据。以图1为例,假设基站1和基站2位于同一个地理范围,那么即使终端与基站2产生了漂移数据,但由于该漂移数据中的第二位置信息与终端与基站1之间产生的第二信令数据中的位置信息都对应于该中心位置,因此,终端与基站1产生的信令数据和终端与基站2产生的信令数据最终都会对应同一个位置信息,因此,减少了漂移数据。
可选地,可以理解的是,每个终端产生的信令数据通常是大量的,因此,为了能够压缩信令数据的数量,还可以将上述最终获得的N1个第一信令数据按照发生时间进行排序,然后将属于同一个第一位置信息的所有相邻的第一信令数据合并为一条新的第一信令数据,该新的第一信令数据中的时间戳的开始时间为这些所有相邻的第一信令数据的开始时间的最小值,该新的第一信令数据中的时间戳的结束时间为这些所有相邻的第一信令数据的结束时间的最大值,以更新所述N1个第一信令数据。
在此说明的是,本实施例对如何获取到上述M个第二信令数据的具体方式不做限定。例如,当有些信令数据只给出了发生时间,那么为了获得该信令数据的结束时间,可以在发生时间上加上一个极小的时间段(例如20秒)生成结束时间。
本实施例提供的数据处理方法,通过将M个第二信令数据中的第二位置信息更新为
作为S202的一种可实现方式,获取第一信令数据集中的N2个第一信令数据对应的目标第一信令数据,包括:从第一信令数据集中获取N2个第一信令数据;从N2个第一信令数据中的第一个第一信令数据开始,执行如下处理以得到目标第一信令数据:若第i个第一信令数据中的第一时间戳的结束时间与第i+1个第一信令数据中的第一时间戳的起始时间之间的差值小于第一预设值,更新第i个第一信令数据中的第一时间戳的结束时间为第i+1个第一信令数据中的第一时间戳的结束时间,并删除第i+1个第一信令数据继续执行,直至执行到N2个第一信令数据中的最后一个第一信令数据;相应地,根据第一信令数据集和目标第一信令数据获取第二信令数据集,包括:获取N3个第一信令数据;从第一信令数据集中删除N3个第一信令数据,获得除N3个第一信令数据之外的其他第一信令数据;将除N3个第一信令数据之外的其他第一信令数据和第一目标信令数据组成第二信令数据集。
在此说明的是,上述实现方式中,只是实现了一次获取第一信令数据集中的N2个第一信令数据对应的目标第一信令数据以及根据第一信令数据集和目标第一信令数据获取第二信令数据集,还可以循环多次。下面,以图4示例,详细说明一种获取第二信令数据集的方法。该方法中,通过多次循环迭代以获得第二信令数据集。如图4所示,该方法包括S401,S402,S403,S404,S405,S406和S407。
S401,将第一信令数据集设定为当前数据记录集,第二信令数据集设定为空集。
S402,从当前数据记录集中获得记录最多的第一位置信息指示的位置点p,提取出位置点为p的所有数据形成数据记录子集X。
也就是说,该步骤中,从当前数据记录集中获得的数据记录子集X中的所有第一信令数据中的第一位置信息相同。
S403,从数据记录子集X中的第一个第一信令数据开始,若当前第一信令数据的结束时间与下一个第一信令数据的起始时间之差小于时间阈值T,则更新当前第一信令数据的结束时间为下一个第一信令数据的结束时间并删除下一个第一信令数据,否则将下一个第一信令数据作为当前第一信令数据,执行完毕生成数据集X1。
示例性地,若数据记录子集X中包括第一信令数据1,第一信令数据2,第一信令数据3。则从第一信令数据1开始,若第一信令数据1的结束时间与第一信令数据2的起始时间之差小于时间阈值T,则更新第一信令数据1的结束时间为第一信令数据2的结束时间并删除第一信令数据2。进一步地,若更新后的第一信令数据1的结束时间与第一信令数据3的起始时间仍小于时间阈值T,则继续更新第一信令数据1的结束时间为第一信令数据3的结束时间。
S404,在第二信令数据集中加入数据集X1中的所有第一信令数据。
S405,若第一信令数据集中任意一个第一信令数据的时间戳包含于数据集X1中的任意一个第一信令数据的时间戳内,删除第一信令数据集中的任意一个第一信令数据。
可以理解的是,该步骤可以用于去除第一信令数据集中的某些漂移数据。详细原理可以参考上述实施例中的描述,此处不再赘述。
S406,判断第一信令数据集是否为空,若不为空,重新从S402开始执行,否则,执行S407。
S407,基于第二信令数据集中的第一信令数据确定终端的停留点。
本实施例提供的数据处理方法,由于循环执行了多次,因此,能够更加提升基于第二信令数据集中的第一信令数据确定终端的停留点的准确性。
可选地,在获得第二信令数据集后,所述方法还可以包括:获取第二信令数据集中的N4个信令数据对应的第二目标信令数据,N4个信令数据至少满足如下条件:N4个信令数据中任意一个信令数据中的第一位置信息与N4个信令数据中除任意一个信令数据之外的其他信令数据的第一位置信息之差小于预设的距离阈值,N4个信令数据在第一信令数据集按照时间戳先后顺序排列时处于相邻位置,第二目标信令数据包括第二目标时间戳和第二目标位置信息,第二目标时间戳的起始时间为N4个信令数据中对应的N4个时间戳中的起始时间的最小值,第二目标时间戳的结束时间为N4个信令数据对应的N4个时间戳中的结束时间的最大值,第二目标位置信息为N4个信令数据对应的N4个第一位置信息的加权平均值;根据第二信令数据集和第二目标信令数据获取第三信令数据集,第三信令数据集包括第二目标信令数据和第二信令数据集中除N4个信令数据之外的其他信令数据;基于第三信令数据集,确定目标用户的停留点。
本实施例中,当获取到第二信令数据集之后,将该第二信令数据集包括的信令数据中的N4个信令数据从位置上进行合并。但在进行合并时,并不是随意选择N4个信令数据,该N4个信令数据需要符合一定的条件。本实施例中,进行合并的N4个信令数据之间需要符合如下条件:N4个信令数据中任意一个信令数据中的第一位置信息与N4个信令数据中除任意一个信令数据之外的其他信令数据的第一位置信息之差小于预设的距离阈值,N4个信令数据在第一信令数据集按照时间戳先后顺序排列时处于相邻位置。可以理解的是,N4个信令数据中,若任意一个信令数据中的第一位置信息与N4个信令数据中除任意一个信令数据之外的其他信令数据的第一位置信息之差小于预设的距离阈值,就说明任意一个信令数据与其他信令数据在位置上相距较近,而N4个信令数据在第一信令数据集按照时间戳先后顺序排列时处于相邻位置就说明该N4个信令数据在时间上也距离较近。
本实施例中,在根据该N4个信令数据获得第二目标信令数据时,该第二目标信令数据中的第二目标位置信息为N4个信令数据对应的N4个第一位置信息的加权平均值,该第二目标信令数据中的第二目标时间戳的起始时间为N4个信令数据中对应的N4个时间戳中的起始时间的最小值,第二目标时间戳的结束时间为N4个信令数据对应的N4个时间戳中的结束时间的最大值。可以理解的是,该步骤能够减轻第二信令数据集中包括的信令数据的数量,从而可以进一步减轻计算的复杂度。
在此说明的是,上述只是实现了一次获取第二信令数据集中的N4个信令数据对应的第二目标信令数据以及基于第三信令数据集,确定目标用户的停留点,还可以循环多次。下面,以图5示例,详细说明一种获取第三信令数据集的方法。该方法中,通过多次循环迭代以获得第二信令数据集。如图5所示,该方法包括S501,S502,S503和S504。
S501,计算第二信令数据集中各个位置点的总停留时间。
示例性地,假设第二信令数据集中包括10个信令数据,都包括位置1的信令数据有5个,那么就可以确定终端在该位置1的总停留时间为都包括位置1的这5个信令数据中的时间戳的总和。
S502,将各个位置点的总停留时间从大到小进行排序,形成位置点集合L。
S503,将位置点集合L中的各个位置点按照聚类算法进行聚类。
在此说明的是,本实施例对使用的聚类算法不做限定。
示例性地,说明聚类的一种可实现方式:在位置点集合 L中按顺序取位置点 、Li进入类Ch ,以 Li作为Ch 中心,依次计算位置点集合L中除位置点Li 以外的任意一个位置点Lj距离位置点Li 的距离,若任意一个位置点Lj 距离位置点Li 的距离小于预设的距离阈值,将位置点Lj 加入到类Ch ,更新类Ch 的中心坐标为Ch 类包括的位置点坐标的加权平均值,否则继续进行,直到位置点集合L 中任意一点至Ch 中心的距离不小于预设的距离阈值,生成类Ch ;之后,从位置点集合L中删除Ch 中包括的位置点,若从位置点集合L 中删除Ch类包括的位置点后,位置点集合L 不为空,则继续开始执行上述步骤,直至执行到位置点集合L 为空。
S504,将第二信令数据集中的各个信令数据对应的位置信息替换为各信令数据所属的类的中心坐标,并将属于同一个中心坐标的所有相邻的信令数据合并为一个新的信令数据(可以认为是第二目标信令数据),以获得第三信令数据集,该新的信令数据的起始时间为属于同一个中心坐标的所有相邻的信令数据中的起始时间的最小值,该新的信令数据的结束时间为属于同一个中心坐标的所有相邻的信令数据中的结束时间的最大值。
本实施例提供的数据处理方法,可以减少了信令数据的数量,进一步减轻计算复杂度。
图6为本申请一个实施例提供的数据处理装置。该数据处理装置600包括获取模块601和处理模块602。
其中,获取模块601,用于获取第一信令数据集,第一信令数据集包括终端的N1个第一信令数据,N1个第一信令数据中每个第一信令数据包括第一时间戳和第一位置信息,第一位置信息指示终端在第一时间戳指示的时长内的第一位置,N1为正整数;所述获取模块601,还用于获取第一信令数据集中的N2个第一信令数据对应的第一目标信令数据,N2个第一信令数据至少满足如下条件:N2个第一信令数据中第i个第一信令数据中的第一时间戳的结束时间与第i+1个第一信令数据中的第一时间戳的起始时间之间的差值小于第一预设值,N2个第一信令数据中任意两个第一信令数据的第一位置信息相同,i为整数,且i从1取至N1-1,第一目标信令数据包括第一目标时间戳和第一目标位置信息,第一目标时间戳的起始时间为N2个第一信令数据第一个第一信令数据的起始时间,第一目标时间戳的结束时间为N2个第一信令数据最后一个第一信令数据的结束时间,第一目标位置信息与N2个第一信令数据中任意一个第一信令数据的第一位置信息相同,N2为小于或等于N1的正整数;所述获取模块601,还用于根据第一信令数据集和第一目标信令数据获取第二信令数据集,述第二信令数据集包括第一目标信令数据和第一信令数据集中除N3个第一信令数据之外的其他第一信令数据,所述N3个第一信令数据包括第一信令数据集按照时间戳先后顺序排列时位于第一个第一信令数据和最后一个第一信令数据之间的所有第一信令数据。
处理装置602,用于根据第二信令数据集确定所述终端的停留点。
在一种可能的实现方式中,所述获取模块601具体用于:从第一信令数据集中获取N2个第一信令数据;从N2个第一信令数据中的第一个第一信令数据开始,执行如下处理以得到目标第一信令数据:若第i个第一信令数据中的第一时间戳的结束时间与第i+1个第一信令数据中的第一时间戳的起始时间之间的差值小于第一预设值,更新第i个第一信令数据中的第一时间戳的结束时间为第i+1个第一信令数据中的第一时间戳的结束时间,并删除第i+1个第一信令数据继续执行,直至执行到N2个第一信令数据中的最后一个第一信令数据;相应地,获取模块601还用于:获取N3个第一信令数据;从第一信令数据集中删除N3个第一信令数据,获得除N3个第一信令数据之外的其他第一信令数据;将除N3个第一信令数据之外的其他第一信令数据和第一目标信令数据组成第二信令数据集。
在一种可能的实现方式中,所述获取模块601还用于:获取终端的M个第二信令数据,M个第二信令数据中每个第二信令数据包括第一时间戳和第二位置信息,第二位置信息指示终端在第一时间戳指示的时长内的第二位置,M为正整数;根据预设地理范围信息确定终端在每个第二信令数据中的第二位置信息所对应的中心位置,预设地理范围信息包括多个位置信息中每个位置信息与所述每个位置信息所属的地理范围之间的映射关系以及多个地理范围中每个地理范围与所述每个地理范围的中心位置的映射关系;根据M个第二信令数据确定N1个第一信令数据,N1个第一信令数据中第j个第一信令数据包括M个第二信令数据中第j个第二信令数据中的第一时间戳和第一位置信息,所述第一位置信息指示第j个第一信令数据中的第二位置信息所对应的中心位置,j为整数且从1取至M。
在一种可能的实现方式中,所述处理模块602具体用于:获取第二信令数据集中的N4个信令数据对应的第二目标信令数据,N4个信令数据至少满足如下条件:所述N4个信令数据中任意一个信令数据中的第一位置信息与N4个信令数据中除任意一个信令数据之外的其他信令数据的第一位置信息之差小于预设的距离阈值,N4个信令数据在第一信令数据集按照时间戳先后顺序排列时处于相邻位置,第二目标信令数据包括第二目标时间戳和第二目标位置信息,第二目标时间戳的起始时间为N4个信令数据中对应的N4个时间戳中的起始时间的最小值,第二目标时间戳的结束时间为N4个信令数据对应的N4个时间戳中的结束时间的最大值,第二目标位置信息为N4个信令数据对应的N4个第一位置信息的加权平均值;根据第二信令数据集和第二目标信令数据获取第三信令数据集,第三信令数据集包括第二目标信令数据和第二信令数据集中除N4个信令数据之外的其他信令数据;基于所述第三信令数据集,确定目标用户的停留点。
在一种可能的实现方式中,所述第一位置信息为经纬度信息。
图7为本申请另一个实施例提供的数据处理装置的结构性示意图。图7所示的装置可以用于执行前述任意一个实施例所述的方法。
如图7所示,本实施例的装置700包括:存储器701、处理器702、通信接口703以及总线704。其中,存储器701、处理器702、通信接口703通过总线704实现彼此之间的通信连接。
存储器701可以是只读存储器(read only memory,ROM),静态存储设备,动态存储设备或者随机存取存储器(random access memory,RAM)。存储器701可以存储程序,当存储器701中存储的程序被处理器702执行时,处理器702用于执行图2至图5所示的方法的各个步骤。
处理器702可以采用通用的中央处理器(central processing unit,CPU),微处理器,应用专用集成电路(application specific integrated circuit,ASIC),或者一个或多个集成电路,用于执行相关程序,以实现本申请图2至图5所示的方法。
处理器702还可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,本申请实施例图2至图5的方法的各个步骤可以通过处理器702中的硬件的集成逻辑电路或者软件形式的指令完成。
上述处理器702还可以是通用处理器、数字信号处理器(digital signalprocessing,DSP)、专用集成电路(ASIC)、现成可编程门阵列(field programmable gatearray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器701,处理器702读取存储器701中的信息,结合其硬件完成本申请装置包括的单元所需执行的功能,例如,可以执行图2至图5所示实施例的各个步骤/功能。
通信接口703可以使用但不限于收发器一类的收发装置,来实现装置700与其他设备或通信网络之间的通信。
总线704可以包括在装置700各个部件(例如,存储器701、处理器702、通信接口703)之间传送信息的通路。
应理解,本申请实施例所示的装置700可以是电子设备,或者,也可以是配置于电子设备中的芯片。
上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质。半导体介质可以是固态硬盘。
应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况,其中A,B可以是单数或者复数。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系,但也可能表示的是一种“和/或”的关系,具体可参考前后文进行理解。
本申请中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a, b, c, a-b, a-c, b-c, 或a-b-c,其中a,b,c可以是单个,也可以是多个。
应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (12)
1.一种数据处理方法,其特征在于,包括:
获取终端的M个第二信令数据,所述M个第二信令数据中每个第二信令数据包括第一时间戳和第二位置信息,所述第二位置信息指示所述终端在所述第一时间戳指示的时长内的第二位置,M为正整数;
根据预设地理范围信息确定所述终端在所述每个第二信令数据中的第二位置信息所对应的中心位置,所述预设地理范围信息包括多个位置信息中每个位置信息与所述每个位置信息所属的地理范围之间的映射关系以及多个地理范围中每个地理范围与所述每个地理范围的中心位置的映射关系;
根据所述M个第二信令数据确定N1个第一信令数据,所述N1个第一信令数据中第j个第一信令数据包括所述M个第二信令数据中第j个第二信令数据中的第一时间戳和第一位置信息,所述第一位置信息指示所述第j个第一信令数据中的第二位置信息所对应的中心位置,j为整数且从1取至M;
获取第一信令数据集,所述第一信令数据集包括所述N1个第一信令数据;
获取所述第一信令数据集中的N2个第一信令数据对应的第一目标信令数据,所述N2个第一信令数据至少满足如下条件:所述N2个第一信令数据中第i个第一信令数据中的第一时间戳的结束时间与第i+1个第一信令数据中的第一时间戳的起始时间之间的差值小于第一预设值,所述N2个第一信令数据中任意两个第一信令数据的第一位置信息相同,i为整数,且i从1取至N1-1,所述第一目标信令数据包括第一目标时间戳和第一目标位置信息,所述第一目标时间戳的起始时间为所述N2个第一信令数据第一个第一信令数据的起始时间,所述第一目标时间戳的结束时间为所述N2个第一信令数据最后一个第一信令数据的结束时间,所述第一目标位置信息与所述N2个第一信令数据中任意一个第一信令数据的第一位置信息相同,N2为小于或等于N1的正整数;
根据所述第一信令数据集和所述第一目标信令数据获取第二信令数据集,所述第二信令数据集包括所述第一目标信令数据和所述第一信令数据集中除N3个第一信令数据之外的其他第一信令数据,所述N3个第一信令数据包括所述第一信令数据集按照时间戳先后顺序排列时位于所述第一个第一信令数据和所述最后一个第一信令数据之间的所有第一信令数据,N3为大于或等于N2的正整数;
根据所述第二信令数据集确定所述终端的停留点。
2.根据权利要求1所述的方法,其特征在于,所述获取所述第一信令数据集中的N2个第一信令数据对应的第一目标信令数据,包括:
从所述第一信令数据集中获取所述N2个第一信令数据;
从所述N2个第一信令数据中的第一个第一信令数据开始,执行如下处理以得到第一目标信令数据:若所述第i个第一信令数据中的第一时间戳的结束时间与第i+1个第一信令数据中的第一时间戳的起始时间之间的差值小于第一预设值,更新所述第i个第一信令数据中的第一时间戳的结束时间为所述第i+1个第一信令数据中的第一时间戳的结束时间,并删除所述第i+1个第一信令数据继续执行,直至执行到所述N2个第一信令数据中的最后一个第一信令数据;
相应地,根据所述第一信令数据集和所述第一目标信令数据获取第二信令数据集,包括:
获取所述N3个第一信令数据;
从所述第一信令数据集中删除所述N3个第一信令数据,获得除所述N3个第一信令数据之外的其他第一信令数据;
将除所述N3个第一信令数据之外的其他第一信令数据和所述第一目标信令数据组成所述第二信令数据集。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第二信令数据集确定所述终端的停留点,包括:
获取所述第二信令数据集中的N4个信令数据对应的第二目标信令数据,所述N4个信令数据至少满足如下条件:所述N4个信令数据中任意一个信令数据中的第一位置信息与所述N4个信令数据中除所述任意一个信令数据之外的其他信令数据的第一位置信息之差小于预设的距离阈值,所述N4个信令数据在所述第一信令数据集按照时间戳先后顺序排列时处于相邻位置,所述第二目标信令数据包括第二目标时间戳和第二目标位置信息,所述第二目标时间戳的起始时间为所述N4个信令数据中对应的N4个时间戳中的起始时间的最小值,所述第二目标时间戳的结束时间为所述N4个信令数据对应的N4个时间戳中的结束时间的最大值,所述第二目标位置信息为所述N4个信令数据对应的N4个第一位置信息的加权平均值;
根据所述第二信令数据集和所述第二目标信令数据获取第三信令数据集,所述第三信令数据集包括所述第二目标信令数据和所述第二信令数据集中除所述N4个信令数据之外的其他信令数据;
基于所述第三信令数据集,确定所述目标用户的停留点。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述第一位置信息为经纬度信息。
5.一种数据处理装置,其特征在于,包括:
获取模块,用于获取终端的M个第二信令数据,所述M个第二信令数据中每个第二信令数据包括第一时间戳和第二位置信息,所述第二位置信息指示所述终端在所述第一时间戳指示的时长内的第二位置,M为正整数;
所述获取模块,还用于根据预设地理范围信息确定所述终端在所述每个第二信令数据中的第二位置信息所对应的中心位置,所述预设地理范围信息包括多个位置信息中每个位置信息与所述每个位置信息所属的地理范围之间的映射关系以及多个地理范围中每个地理范围与所述每个地理范围的中心位置的映射关系;
所述获取模块,还用于根据所述M个第二信令数据确定N1个第一信令数据,所述N1个第一信令数据中第j个第一信令数据包括所述M个第二信令数据中第j个第二信令数据中的第一时间戳和第一位置信息,所述第一位置信息指示所述第j个第一信令数据中的第二位置信息所对应的中心位置,j为整数且从1取至M;
所述获取模块,还用于获取第一信令数据集,所述第一信令数据集包括所述N1个第一信令数据;
所述获取模块,还用于获取所述第一信令数据集中的N2个第一信令数据对应的第一目标信令数据,所述N2个第一信令数据至少满足如下条件:所述N2个第一信令数据中第i个第一信令数据中的第一时间戳的结束时间与第i+1个第一信令数据中的第一时间戳的起始时间之间的差值小于第一预设值,所述N2个第一信令数据中任意两个第一信令数据的第一位置信息相同,i为整数,且i从1取至N1-1,所述第一目标信令数据包括第一目标时间戳和第一目标位置信息,所述第一目标时间戳的起始时间为所述N2个第一信令数据第一个第一信令数据的起始时间,所述第一目标时间戳的结束时间为所述N2个第一信令数据最后一个第一信令数据的结束时间,所述第一目标位置信息与所述N2个第一信令数据中任意一个第一信令数据的第一位置信息相同,N2为小于或等于N1的正整数;
所述获取模块,还用于根据所述第一信令数据集和所述第一目标信令数据获取第二信令数据集,所述第二信令数据集包括所述第一目标信令数据和所述第一信令数据集中除N3个第一信令数据之外的其他第一信令数据,所述N3个第一信令数据包括所述第一信令数据集按照时间戳先后顺序排列时位于所述第一个第一信令数据和所述最后一个第一信令数据之间的所有第一信令数据;
处理模块,用于根据所述第二信令数据集确定所述终端的停留点。
6.根据权利要求5所述的装置,其特征在于,所述获取模块具体用于:
从所述第一信令数据集中获取所述N2个第一信令数据;
从所述N2个第一信令数据中的第一个第一信令数据开始,执行如下处理以得到第一目标信令数据:若所述第i个第一信令数据中的第一时间戳的结束时间与第i+1个第一信令数据中的第一时间戳的起始时间之间的差值小于第一预设值,更新所述第i个第一信令数据中的第一时间戳的结束时间为所述第i+1个第一信令数据中的第一时间戳的结束时间,并删除所述第i+1个第一信令数据继续执行,直至执行到所述N2个第一信令数据中的最后一个第一信令数据;
相应地,所述获取模块还用于:
获取所述N3个第一信令数据;
从所述第一信令数据集中删除所述N3个第一信令数据,获得除所述N3个第一信令数据之外的其他第一信令数据;
将除所述N3个第一信令数据之外的其他第一信令数据和所述第一目标信令数据组成所述第二信令数据集。
7.根据权利要求6所述的装置,其特征在于,所述处理模块具体用于:
获取所述第二信令数据集中的N4个信令数据对应的第二目标信令数据,所述N4个信令数据至少满足如下条件:所述N4个信令数据中任意一个信令数据中的第一位置信息与所述N4个信令数据中除所述任意一个信令数据之外的其他信令数据的第一位置信息之差小于预设的距离阈值,所述N4个信令数据在所述第一信令数据集按照时间戳先后顺序排列时处于相邻位置,所述第二目标信令数据包括第二目标时间戳和第二目标位置信息,所述第二目标时间戳的起始时间为所述N4个信令数据中对应的N4个时间戳中的起始时间的最小值,所述第二目标时间戳的结束时间为所述N4个信令数据对应的N4个时间戳中的结束时间的最大值,所述第二目标位置信息为所述N4个信令数据对应的N4个第一位置信息的加权平均值;
根据所述第二信令数据集和所述第二目标信令数据获取第三信令数据集,所述第三信令数据集包括所述第二目标信令数据和所述第二信令数据集中除所述N4个信令数据之外的其他信令数据;
基于所述第三信令数据集,确定所述目标用户的停留点。
8.根据权利要求5至7中任一项所述的装置,其特征在于,所述第一位置信息为经纬度信息。
9.一种数据处理装置,其特征在于,包括:存储器和处理器;
所述存储器用于存储程序指令;
所述处理器用于调用所述存储器中的程序指令执行如权利要求1至4中任一项所述的方法。
10.一种数据处理***,其特征在于,包括权利要求5至8中任一项所述的数据处理装置。
11.一种芯片,其特征在于,包括至少一个处理器和通信接口,所述通信接口和所述至少一个处理器通过线路互联,所述至少一个处理器用于运行计算机程序或指令,以执行如权利要求1至4中任一项所述的方法。
12.一种计算机可读介质,其特征在于,所述计算机可读介质存储用于计算机执行的程序代码,该程序代码包括用于执行如权利要求1至4中任一项所述的方法的指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111346095.9A CN113810992B (zh) | 2021-11-15 | 2021-11-15 | 数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111346095.9A CN113810992B (zh) | 2021-11-15 | 2021-11-15 | 数据处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113810992A CN113810992A (zh) | 2021-12-17 |
CN113810992B true CN113810992B (zh) | 2022-02-11 |
Family
ID=78898537
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111346095.9A Active CN113810992B (zh) | 2021-11-15 | 2021-11-15 | 数据处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113810992B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111770452A (zh) * | 2020-05-27 | 2020-10-13 | 中山大学 | 一种基于个人出行轨迹特征的手机信令停留点识别方法 |
WO2020215783A1 (zh) * | 2019-04-25 | 2020-10-29 | 华为技术有限公司 | 定位方法、装置及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018150227A1 (en) * | 2017-02-17 | 2018-08-23 | Dataspark Pte, Ltd | Mobility gene for trajectory data |
CN111464950B (zh) * | 2020-03-31 | 2021-03-30 | 天津市城市规划设计研究总院有限公司 | 一种使用手机信令数据提取出行停驻点的方法 |
CN113271557A (zh) * | 2021-04-20 | 2021-08-17 | 中山大学 | 一种手机信令数据处理方法、装置及存储介质 |
CN113473398B (zh) * | 2021-06-02 | 2022-08-30 | 中山大学 | 一种手机信令数据停留点识别方法、装置及存储介质 |
-
2021
- 2021-11-15 CN CN202111346095.9A patent/CN113810992B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020215783A1 (zh) * | 2019-04-25 | 2020-10-29 | 华为技术有限公司 | 定位方法、装置及存储介质 |
CN111770452A (zh) * | 2020-05-27 | 2020-10-13 | 中山大学 | 一种基于个人出行轨迹特征的手机信令停留点识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113810992A (zh) | 2021-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110035388B (zh) | 确定用户区域的方法、计算机可读存储介质及终端设备 | |
CN107395252B (zh) | 跳频方法、跳频装置、终端和基带芯片 | |
CN110046179B (zh) | 一种报警维度的挖掘方法、装置及设备 | |
CN108770057B (zh) | 预定指纹库的确定方法及指纹定位方法、装置、存储介质 | |
CN112954626A (zh) | 手机信令数据分析方法、装置、电子设备及存储介质 | |
CN113763034B (zh) | 广告数据的处理方法及装置 | |
CN108008973B (zh) | 一种关联应用程序的方法、装置及服务器 | |
CN111428197B (zh) | 数据处理方法、装置及设备 | |
CN113810992B (zh) | 数据处理方法及装置 | |
US10015727B2 (en) | Automatic detection of a network operator for a mobile network device | |
CN112699196A (zh) | 轨迹生成方法、装置、终端设备及存储介质 | |
CN107040603B (zh) | 用于确定应用程序App活跃场景的方法和装置 | |
CN113329094B (zh) | 信息推送时间确定方法、装置、设备、介质及产品 | |
CN115391317A (zh) | 信息处理方法、装置、设备、***及存储介质 | |
CN115905280A (zh) | 手机号码归属运营商查询方法、装置、存储介质及设备 | |
CN113573263B (zh) | 基于信令数据确定出行时间的方法及相关装置 | |
CN113076451B (zh) | 异常行为识别和风险模型库的建立方法、装置及电子设备 | |
CN110677446A (zh) | 一种家庭群组用户的识别方法及装置 | |
CN114205820A (zh) | 携带伪基站的可疑用户检测方法、装置、计算机设备 | |
CN113347574B (zh) | 一种确定常驻地的方法和装置 | |
CN110519686B (zh) | 预设地点识别方法、装置、设备及计算机可读存储介质 | |
US20130288707A1 (en) | Information processing device and method for estimating number of terminals | |
CN111127065A (zh) | 用户职住地的获取方法和装置 | |
CN114040462B (zh) | 基于手机信令的出行链识别方法及相关装置 | |
CN112752252B (zh) | 小区归属地识别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: Data processing methods and devices Effective date of registration: 20230412 Granted publication date: 20220211 Pledgee: Bank of China Limited Dongshan Branch of Guangzhou Pledgor: Guangzhou Ruifan Technology Co.,Ltd. Registration number: Y2023980037877 |
|
PE01 | Entry into force of the registration of the contract for pledge of patent right |