CN114339642B - 伴随用户的识别方法、装置、设备及介质 - Google Patents

伴随用户的识别方法、装置、设备及介质 Download PDF

Info

Publication number
CN114339642B
CN114339642B CN202111619444.XA CN202111619444A CN114339642B CN 114339642 B CN114339642 B CN 114339642B CN 202111619444 A CN202111619444 A CN 202111619444A CN 114339642 B CN114339642 B CN 114339642B
Authority
CN
China
Prior art keywords
user
accompanying
time
positioning information
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111619444.XA
Other languages
English (en)
Other versions
CN114339642A (zh
Inventor
黄堃洋
傅强
徐涛
梁彧
阿曼太
蔡琳
杨满智
田野
王杰
金红
陈晓光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eversec Beijing Technology Co Ltd
Original Assignee
Eversec Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eversec Beijing Technology Co Ltd filed Critical Eversec Beijing Technology Co Ltd
Priority to CN202111619444.XA priority Critical patent/CN114339642B/zh
Publication of CN114339642A publication Critical patent/CN114339642A/zh
Application granted granted Critical
Publication of CN114339642B publication Critical patent/CN114339642B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明实施例公开了一种伴随用户的识别方法、装置、设备及介质,该方法包括:获取与多个用户分别对应的信令话单数据,并根据各信令话单数据中包括的定位信息以及时间点信息,获取各用户在监控时间段内的每个时间分片下的均衡定位信息;进而根据监控用户与其他用户在各时间分片下均衡定位信息的关联程度,在各其他用户中筛选得到监控用户的伴随用户。本实施例的技术方案,通过在信令话单数据中获取各用户的定位信息,并基于该定位信息进行伴随用户识别,可以实现对伴随用户的准确识别,可以降低伴随用户识别的数据计算量,提升识别效率,可以避免外界因素对伴随识别结果的影响,实现在任意场景下对伴随用户的准确识别。

Description

伴随用户的识别方法、装置、设备及介质
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种伴随用户的识别方法、装置、设备及介质。
背景技术
通过对重点监控人员进行实时的伴随人员检测,对实现安全预警,有效防控犯罪发生具有重要意义。
目前,现有的伴随检测方法,主要包括基于轨迹相似度的伴随检测方法和基于伴随模型的伴随检测方法。其中,基于轨迹相似度的伴随检测方法,主要基于网际协议地址获取人员的位置信息,进而通过余弦相似度的衡量算法推荐出轨迹相似的人员;然而对于网际协议地址的位置活动性不强,人员位置变动多的场景,例如,移动的电信诈骗分子等,其检测准确度较低。而对于基于伴随模型的伴随检测方法,其伴随检测性能易受天气以及视频清晰度等因素的影响,且数据计算量大,易耗费大量的计算和时间资源。
发明内容
本发明实施例提供一种伴随用户的识别方法、装置、设备及介质,可以实现对伴随用户的准确识别,可以降低伴随用户识别的数据计算量,提升识别效率,可以避免外界因素对伴随识别结果的影响,实现在任意场景下对伴随用户的准确识别。
第一方面,本发明实施例提供了一种伴随用户的识别方法,包括:
获取与多个用户分别对应的信令话单数据,多个用户中包括监控用户;
根据各所述信令话单数据中包括的定位信息以及时间点信息,获取各用户在监控时间段内的每个时间分片下的均衡定位信息;
根据所述监控用户与其他用户在各所述时间分片下均衡定位信息的关联程度,在各所述其他用户中筛选得到所述监控用户的伴随用户。
第二方面,本发明实施例还提供了一种伴随用户的识别装置,包括:
信令话单数据获取模块,用于获取与多个用户分别对应的信令话单数据,多个用户中包括监控用户;
均衡定位信息获取模块,用于根据各所述信令话单数据中包括的定位信息以及时间点信息,获取各用户在监控时间段内的每个时间分片下的均衡定位信息;
伴随用户获取模块,用于根据所述监控用户与其他用户在各所述时间分片下均衡定位信息的关联程度,在各所述其他用户中筛选得到所述监控用户的伴随用户。
第三方面,本发明实施例还提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机程序;
当所述一个或多个计算机程序被所述一个或多个处理器执行,使得所述一个或多个处理器执行所述计算机程序时实现本发明任意实施例提供的伴随用户的识别方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,该存储介质上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例提供的伴随用户的识别方法。
本发明实施例提供的技术方案,通过获取与多个用户分别对应的信令话单数据,并根据各信令话单数据中包括的定位信息以及时间点信息,获取各用户在监控时间段内的每个时间分片下的均衡定位信息;进而根据监控用户与其他用户在各时间分片下均衡定位信息的关联程度,在各其他用户中筛选得到监控用户的伴随用户;通过在信令话单数据中获取各用户的定位信息,并基于该定位信息进行伴随用户识别,可以实现对伴随用户的准确识别,可以降低伴随用户识别的数据计算量,提升识别效率,可以避免外界因素对伴随识别结果的影响,实现在任意场景下对伴随用户的准确识别。
附图说明
图1A是本发明一实施例中的一种伴随用户的识别方法的流程图;
图1B是本发明一实施例中的一种时间分片的示意图;
图1C是本发明一实施例中的一种球体模型的示意图;
图1D是本发明一实施例中的一种伴随范围的示意图;
图1E是本发明一实施例中的一种伴随人员的识别流程示意图;
图2A是本发明另一实施例中的一种伴随用户的识别方法的流程图;
图2B是本发明另一实施例中的一种用户运动轨迹示意图;
图2C是本发明另一实施例中的一种伴随人员的识别流程示意图;
图3是本发明另一实施例中的一种伴随用户的识别装置的结构示意图;
图4是本发明另一实施例中的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的实施例。虽然附图中显示了本发明的某些实施例,然而应当理解的是,本发明可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本发明。应当理解的是,本发明的附图及实施例仅用于示例性作用,并非用于限制本发明的保护范围。
应当理解,本发明的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本发明的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本发明中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本发明中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术用户应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本发明实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
图1A为本发明一实施例提供的一种伴随用户的识别方法的流程图,本发明实施例可适用于利用信令话单数据中的用户定位信息,确定监控用户的伴随用户的情况;该方法可以由伴随用户的识别装置来执行,该装置可由硬件和/或软件组成,并一般可集成在电子设备中,典型的,可以集成在计算机设备或者服务器中。如图1A所示,该方法具体包括如下步骤:
S110、获取与多个用户分别对应的信令话单数据。
其中,多个用户中包括监控用户和其他用户;在本实施例中,监控用户为预先确定的需要进行伴随检测的用户;其他用户,可以是与监控用户处于同一基站或者位于附近基站的用户。
在本实施例中,可以通过运营商获取各用户分别对应的信令话单数据,其中,信令话单数据可以包括开始时间、结束时间、手机号、经度、纬度、跟踪区编码(Tracking AreaCode,TAC)、小区标识(E-UTRAN Cell Identifier,ECI)、基站标识(Identification,ID)、基站名称、小区经度和小区纬度等信息。
可以理解的是,当前每个用户通常拥有两个甚至多个手机号,由此,每个用户可以对应多种类型的信令话单数据。在本实施例中,可以预先获取用户与手机号的对应关系,进而根据信令话单数据中的手机号,确定每个信令话单数据对应的用户。
S120、根据各所述信令话单数据中包括的定位信息以及时间点信息,获取各用户在监控时间段内的每个时间分片下的均衡定位信息。
其中,定位信息,可以是信令话单数据中的经度和纬度信息,时间点信息可以是信令话单数据中的开始时间。监控时间段,可以是预先设置的一个时间区间,例如,一个月或者一个星期等。
在本实施例中,在获取到各用户的信令话单数据之后,可以首先在各信令话单数据中,提取出包含的经纬度信息和时间点信息,以获取各用户在不同时间点的定位信息;然后,按照时间顺序对经纬度信息进行排序,以获取各用户在监控时间段内的连续定位信息。最后,可以根据各经纬度信息对应的时间点信息,将各经纬度信息分别映射至对应的时间分片中。
需要说明的是,在本实施例中,可以预先对监控时间段进行时间切片处理,以获取监控时间段对应的多个时间分片。其中,每个时间分片的时间长度相同,时间长度可以根据任务需求进行自适应调整。
进一步的,可以对各时间分片中每个用户对应的多个定位信息进行汇总处理,以获取各用户在每个时间分片中的一个均衡定位信息;例如,可以计算每个时间分片中的多个经度和维度的平均值,以获取平均经度和平均维度作为对应时间分片中的均衡定位信息;或者,可以对每个时间分片中的各经度和维度进行加权求和,以获取加权求和经度和维度作为对应的均衡定位信息。
在本实施例的一个可选的实施方式中,根据各所述信令话单数据中包括的定位信息以及时间点信息,获取各用户在监控时间段内的每个时间分片下的均衡定位信息,可以包括:获取与当前处理用户对应的各目标信令话单数据;根据各目标信令话单数据中的时间点信息,将各目标信令话单数据中的定位信息,分别映射至所述监控时间段内匹配的时间分片中;根据每个时间分片中包括的定位信息,计算得到所述当前处理用户在每个时间分片下的均衡定位信息。
在本实施例中,可以如图1B所示,将监控时间段切分为多个时间分片;进而根据当前处理用户对应的各目标信令话单数据中的时间点信息,确定分别对应的时间分片,以将各目标信令话单数据中的定位信息,划分至各时间分片中。由此,在每个时间分片中,可以获取当前处理用户对应的多个定位信息。进一步的,可以在每个时间分片中,根据多个定位信息,获取对应的均衡定位信息。
其中,根据每个时间分片中包括的定位信息,计算得到所述当前处理用户在每个时间分片下的均衡定位信息,可以包括:分别对每个时间分片中包括的各定位信息进行取平均值处理,计算得到所述当前处理用户在每个时间分片下的各定位信息的平均值作为均衡定位信息。
在本实施例中,可以将一个用户在一个时间分片中的各定位信息的平均值,作为该用户在当前时间分片中的均衡定位信息;例如,将多个经度的平均值,作为均衡经度,并将对应的多个维度的平均值,作为均衡维度。
上述设置的好处在于:通过将用户在一个时间分片中的多个位置信息汇总为一个均衡定位信息,可以对信令话单数据中零散且不规则的定位信息进行规范化。
在本实施例的另一个可选的实施方式中,在根据各目标信令话单数据中的时间点信息,将各目标信令话单数据中的定位信息,分别映射至所述监控时间段内匹配的时间分片中之后,还可以包括:获取与当前处理用户对应的各目标信令话单数据的接收时间,并根据所述接收时间和预设时间容忍范围,确定对应的数据滑窗;判断是否存在对应时间区间小于所述数据滑窗的最小时间边界的异常时间分片;若是,则将所述异常时间分片中的定位信息删除。
需要说明的是,在实际环境中,存在时间维度上的信令话单数据波动,即当前接收的信令话单数据,可能是之前的历史信令话单数据。例如,信令话单数据的获取时间为9:00,但获取的各信令话单数据对应的时间信息可能为7:00-10:00的时间范围,此时,对于时间过早的信令话单数据,无法体现用户的伴随情况。
针对上述问题,在本实施例中,可以以信令话单数据的接收时间为窗中心,以预设时间容忍范围作为滑窗的前后时间范围,建立对应的数据滑窗;例如,信令话单数据的接收时间为8:00,预设时间容忍范围为1小时,则对应的数据滑窗的时间范围为7:00-9:00。由此,对于对应时间小于该数据滑窗最小时间边界的时间分片中的定位信息,进行直接删除。
上述设置的好处在于:可以消除时间维度波动对伴随用户的识别的影响,可以避免对无效历史信令话单数据的处理,降低数据处理量,提升伴随用户的识别效率。
S130、根据所述监控用户与其他用户在各所述时间分片下均衡定位信息的关联程度,在各所述其他用户中筛选得到所述监控用户的伴随用户。
在本实施例中,可以在每个时间分片中,根据监控用户与其他用户在当前时间分片下的均衡定位信息,计算监控用户与其他用户之间的距离,并根据监控用户与其他用户间的距离,确定两者之间的关联程度。例如,若一个用户与监控用户间的距离越近,则可以认为两者的关联程度越高;若一个用户与监控用户间的距离越远,则可以认为两者的关联程度越低。
进一步的,可以根据其他用户与监控用户的关联程度,以确定监控用户的伴随用户;例如,如果一个用户与监控用户的关联程度大于预设的关联程度阈值,则可以确定该用户为监控用户的伴随用户。此外,需要说明的是,当一个用户与监控用户仅在一个时间分片中的关联程度较高,而在其它时间分片中的关联程度较低,此时仍可以将该用户确定为监控用户的伴随用户;或者,进一步判断该用户与监控用户在后续时间分片中的关联程度,最终如果在监控时间段内,检测到该用户在多个(例如,大于3个)时间分片内与监控用户的关联程度均较高,则可以将该用户确定为监控用户的伴随用户。
上述设置的好处在于:通过将与监控用户在任意时间分片中关联程度较高的用户作为伴随用户,可以避免对伴随用户的漏检,实现对全部伴随用户的准确检测。
其中,在根据监控用户与其他用户在当前时间分片下的均衡定位信息,计算监控用户与其他用户之间的距离时,可以假设地球是一个球形(实际为椭球型),如图1C所示根据两点经纬度A[lat1,lng1]和B[lat2,lng2],计算两点间的球面距离。其中,lat是维度latitude的缩写,lng是经度longitude的缩写。
首先,可以根据两点的经纬度信息,计算得到两点的位置坐标;例如,假设地球半径为1,则A点三维坐标可以表示为(cos lat1×cos lng1,cos lat1×sin lng1,sinlat1),对应的,B点三维坐标可以表示为(cos lat2×cos lng2,cos lat2×sin lng2,sinlat2)。然后,可以根据两点的坐标,计算两点的弧度;具体的,可以根据公式:cos<AOB=coslat1×cos lng1×cos lat2×cos lng2+cos lat1×sin lng1×cos lat2×sin lng2+sinlat1×sin lat2=cos lat1×cos lat2(cos lng1×cos lng2+sin lng1×sin lng2)+sinlat1×sin lat2=cos lat1×cos lat2×cos(lng1-lng2)+sin lat1×sin lat2,计算得到A和B两点的弧度cos<AOB。最终,根据两点之间的弧度,计算得到两点之间的球面距离;具体的,可以根据公式:球面距离=R×arcos(cos<AOB),计算得到A和B两点间的球面距离。
可选的,可以采用欧式距离模型,根据监控用户与其他用户间的距离,确定两者之间的关联程度;即如图1D所示的圆形伴随范围,如果一个用户与监控用户间的距离,小于预设距离阈值,则认为该用户为监控用户的伴随用户。
可选的,还可以将监控用户在各时间分片中的均衡定位信息(经纬度信息)作为被伴随点,并根据该被伴随点和预先设置的伴随距离阈值,确定一个矩形的伴随范围;例如,如图1D所示的球面矩形模型,监控用户在一个时间分片中的均衡定位信息为(x,y),预先设置的定值为Deltay,则对应的伴随范围的经纬度边界可以表示为(x+Deltax,x-Deltax,y+Deltay,y-Deltay);此时,只要对应经纬度信息位于该伴随范围的用户,则可以视为监控用户的伴随用户。
上述设置的好处在于:可以省去监控用户与其他用户两两之间距离的计算步骤,可以极大降低数据计算量,进一步提高伴随用户的识别效率,实现对监控用户的伴随的实时检测。
其中,欧式距离模型和球面矩形模型的特点对比如表1所示。对于欧式距离模型,其需要计算所有其他用户均衡定位信息与监控用户均衡定位信息之间的距离,计算量较大,计算速度较慢,但其覆盖的伴随范围较小。而对于球面矩形模型,其覆盖的伴随范围较大,但极大精简了数据计算量,提高了运行效率。在本实施例中,可以根据实际场景选择适用的模型。
表1欧式距离模型和球面矩形模型的特点对比
对比属性 欧式距离模型 球面矩形模型
覆盖范围 100% 127%
计算速度 较慢
本发明实施例提供的技术方案,通过获取与多个用户分别对应的信令话单数据,并根据各信令话单数据中包括的定位信息以及时间点信息,获取各用户在监控时间段内的每个时间分片下的均衡定位信息;进而根据监控用户与其他用户在各时间分片下均衡定位信息的关联程度,在各其他用户中筛选得到监控用户的伴随用户;通过在信令话单数据中获取各用户的定位信息,并基于该定位信息进行伴随用户识别,可以实现对伴随用户的准确识别,可以降低伴随用户识别的数据计算量,提升识别效率,可以避免外界因素对伴随识别结果的影响,实现在任意场景下对伴随用户的准确识别。
在本实施例的一个具体的实施方式中,伴随人员的识别流程如图1E所示。具体的,首先,获取全量重点人员(包括监控用户和其他用户)的信令话单数据并提取位置数据;其中,单条信令话单数据可以包括开始时间、结束时间、手机号、经度、纬度、TAC、ECI、基站标识、基站名称、小区经度和小区纬度等信息。通过获取用户信令话单数据,并从中提取出位置信息与时间信息,可以汇总生成全量重点人员的经纬度信息。
然后,采用时间分片的方案,对信令话单数据进行切分,在每一个时间分片中判断人员伴随情况,以保留有效伴随用户(备选用户)的信令话单数据,并剔除掉无效伴随用户的信令话单数据。进一步的,通过伴随模型计算备选用户在当前时间分片下的伴随特征值,并合并当前伴随特征值与历史伴随特征值,生成各备选用户的伴随特征矩阵,进而输出符合条件的伴随结果。在计算得到备选用户在当前时间分片下的伴随特征值的同时,还可以将各备选用户对应的信令话单数据存储在历史数据存储器中。
最终,可以通过伴随结果,从历史数据存储器中提取相关数据合成伴随检测结果,并对该伴随检测结果进行输出展示。伴随检测结果可以包括被伴随号码、被伴随号码经度、被伴随号码纬度、伴随号码、伴随号码经度、伴随号码纬度、伴随时间、开始时间、结束时间、基站标识、基站名称和单次伴随的持续时间等信息。
图2A为本发明另一实施例提供的一种伴随用户的识别方法的流程图,本实施例是对上述技术方案的进一步细化,本实施例中的技术方案可以与上述一个或者多个实施方式结合。具体的,参考图2A,该方法具体包括如下步骤:
S210、获取与多个用户分别对应的信令话单数据。
其中,多个用户中包括监控用户。
S220、根据各所述信令话单数据中包括的定位信息以及时间点信息,获取各用户在监控时间段内的每个时间分片下的均衡定位信息。
在本实施例中,在获取到各用户的定位信息和时间点信息之后,可以在经度、纬度和时间的三维坐标系中,对各用户的运动轨迹进行展示。例如,如图2B所示的用户运动轨迹;其中,连线为对监控人员在不同时间点的定位信息进行连接,以得到的监控人员运动轨迹;其他坐标点为其他用户在不同时间点的位置记录打点。
S230、将所述其他用户在每个时间分片下均衡定位信息,与所述监控用户在每个时间分片下均衡定位信息分别进行比对。
S240、如果确定目标用户在目标时间分片下,与监控用户的均衡定位信息之间的差异值位于预设的伴随范围内,则将目标用户确定为监控用户的备选用户。
其中,预设的伴随范围,可以是预先设置的经纬度信息差值。在本实施例中,若检测到目标用户在目标时间分片下,与监控用户的经纬度信息的经度差值和维度差值,均小于预先设置的经度差值阈值和维度差值阈值,则可以确定目标用户在当前时间分片下位于监控用户的伴随范围内,此时可以将该目标用户确定为备选用户。
S250、根据各所述备选用户在每个时间分片下与所述监控用户的均衡定位信息之间的差异值,生成与各所述备选用户分别对应的伴随特征矩阵。
进一步的,可以将每个备选用户在每个时间分片下与监控用户的均衡定位信息之间的差异值,直接作为对应的伴随特征值,进而获取各备选用户对应的伴随特征矩阵;或者,可以将对应备选用户与监控用户的均衡定位信息之间的差异值位于预设的伴随范围内的时间分片的伴随特征值,设置为第一预设数值(例如,1),并将其他时间分片的伴随特征值,设置为第二预设数值(例如,0),以获取各备选用户对应的伴随特征矩阵。
在本实施例的一个可选的实施方式中,根据各所述备选用户在每个时间分片下与所述监控用户的均衡定位信息之间的差异值,生成与各所述备选用户分别对应的伴随特征矩阵,可以包括:
若检测到一个备选用户在当前时间分片下,与监控用户的均衡定位信息之间的差异值位于预设的伴随范围内,则将所检测备选用户在当前时间分片下的伴随特征值设置为1;若检测到一个备选用户在当前时间分片下,与监控用户的均衡定位信息之间的差异值不位于预设的伴随范围内,则将所检测备选用户在当前时间分片下的伴随特征值设置为0;依次获取各所述备选用户在每个时间分片下的伴随特征值,并根据所述各特征值,获取与各所述备选用户分别对应的伴随特征矩阵。
具体的,针对每一个备选用户,判断在各时间分片中与监控用户的均衡定位信息之间的差异值是否位于预设的伴随范围内,若是,则确定在当前时间分片中,该备选用户与监控用户伴随,将当前时间分片对应的伴随特征值设置为1;否则,则确定在当前时间分片中,该备选用户与监控用户不伴随,将当前时间分片对应的伴随特征值设置为0。由此,获取每个备选用户对应的伴随特征矩阵。进而,可以获取全部备选用户对应的伴随特征矩阵如表2所示。其中,将一个号码视为一个用户,1表示伴随,0表示未伴随。
表2伴随特征矩阵
Figure BDA0003437397350000141
需要说明的是,考虑到无法同时对全部时间切片中各备选用户对应的特征值进行计算,在本实施例中,在获取到每个备选用户在一个时间切片下的伴随特征值后,对该伴随特征值进行存储,并在获取到相邻下一时间切片下的伴随特征值后,合并当前时间切片和上一时间切片的伴随特征值,最终获取各备选用户对应的伴随特征矩阵。
S260、根据各所述伴随特征矩阵,在各所述备选用户中识别所述伴随用户。
在本实施例中,在获取到伴随特征矩阵之后,可以对各备选用户对应的伴随特征矩阵进行连续伴随判断,以在备选用户中进一步筛选得到伴随用户。具体的,对于每一个备选用户的伴随特征矩阵,判断是否在连续的多个时间分片中均被确定为伴随(伴随特征矩阵存在连续的多个1),若是,则可以将该备选用户确定为伴随用户。例如,如表2所示的伴随特征矩阵,对于第三个号码,其每一个时间分片对应的伴随特征值均为1,表示其在每个时间分片中均与监控用户伴随,此时可以直接将该号码对应的用户确定为伴随用户;又如,对于第五个号码,其在前三个时间分片对应的伴随特征值均为1,此时也可以将该号码对应的用户确定为伴随用户。
在本实施例的一个可选的实施方式中,根据各所述伴随特征矩阵,在各所述备选用户中识别所述伴随用户,可以包括:在各所述备选用户中,获取对应伴随特征值连续为1的数量大于预设数量阈值的备选用户作为伴随用户。
其中,预设数量阈值,可以根据任务需求进行自适应设置;例如,若需要较高的伴随识别准确度,则可以设置较大的预设数量阈值;若需要较全的伴随用户识别,则可以设置较小的预设数量阈值。
在本实施例中,如果检测到一个备选用户对应伴随特征值连续为1的数量大于预设数量阈值,则可以确定该备选用户满足连续伴随事件判断条件,将该备选用户确定为伴随用户。
可选的,在确定出监控用户的备选用户后,可以将各备选对应的信令话单数据存储至中间存储器中。具体的,可以生成信令话单数据对应号码和存储标识的对应关系,作为各信令话单数据的索引。由此,在确定出监控用户的伴随用户后,可以首先根据伴随用户的号码,在中间存储器中提取对应的存储标识,进而根据存储标识获取对应的信令话单数据;最后可以在信令话单数据中提取预设字段信息,例如,号码、经度、维度、基站标识和基站名称等信息。
进一步的,在提取到预设字段信息之后,还可以根据伴随用户的伴随特征矩阵,确定伴随信息;其中,伴随信息可以包括伴随开始时间、伴随结束时间,单次伴随的持续时间等信息。最终可以结合预设字段信息和伴随信息,输出针对监控用户的伴随检测报告。
本发明实施例提供的技术方案,通过将其他用户在每个时间分片下均衡定位信息,与监控用户在每个时间分片下均衡定位信息分别进行比对;如果确定目标用户在目标时间分片下,与监控用户的均衡定位信息之间的差异值位于预设的伴随范围内,则将目标用户确定为监控用户的备选用户;进一步的,根据各备选用户在每个时间分片下与监控用户的均衡定位信息之间的差异值,生成与各备选用户分别对应的伴随特征矩阵;并根据各伴随特征矩阵,在各备选用户中识别伴随用户;通过根据预设伴随范围,在其它用户中筛选备选用户,进而根据各备选用户的伴随特征矩阵,确定最终的伴随用户,进一步提升了伴随用户的识别准确度。
在本实施例的一个具体的实施方式中,伴随人员的识别流程如图2C所示。具体的,首先,采用数据初筛模块对获取的信令话单数据进行筛选,包括从各用户的信令话单数据中获取定位信息和时间信息,并按照时间分片对定位信息进行切分,进而在每个时间分片中,筛选得到与监控用户伴随的备选用户和对应的信令话单数据。然后,将获取的时间切片输入至数据滑窗,窗口按最新输入数据的时间分片为准,仅沿着时间向未来方向滑动(如果有历史数据且历史数据时间早于时间窗口最早时间,则直接舍去),如果有时间分片的数据滑出窗口,则进入模型进行计算。
其次,将数据滑窗输出的时间分片中备选用户对应的信令话单数据输入至数据分割器,以将上述信令话单数据存储至对应的多个历史数据分组。同时,对当前时间分片中的均衡定位信息进行伴随特征计算,以获取当前时间分片中各备选用户对应的伴随特征值,进而结合历史特征存储器中存储的历史时间分片中各备选用户对应伴随特征值,获取各备选用户对应的伴随特征矩阵。
进一步的,对伴随特征矩阵中,各备选用户对应的无伴随时间段的伴随特征值进行回填,以获取各备选用户对应的完整伴随特征矩阵。然后,对各备选用户的伴随特征矩阵进行连续伴随时间判断,以在备选用户中确定伴随用户,并记录伴随用户对应的号码和时间分片数。最终,采用历史数据提取标识提取器,根据伴随用户对应的号码,获取对应的历史数据提取标识,并根据该历史数据提取标识,提取对应的信令话单数据中的预设字段内容;同时,根据时间分片数,确定伴随时间、开始时间和结束时间等伴随检测信息,进而结合上述预设字段内容和伴随检测信息合成输出数据。其中,输出数据可以包括:被伴随号码、被伴随号码经度、被伴随号码纬度、伴随号码、伴随号码经度、伴随号码纬度、伴随时间、开始时间、结束时间、基站标识、基站名称以及单次伴随的持续时间等。
需要说明的是,本实施例的技术方案中,所涉及的用户个人信息的获取、存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
图3为本发明另一实施例提供的一种伴随用户的识别装置的结构示意图。如图3所示,该装置包括:信令话单数据获取模块310、均衡定位信息获取模块320和伴随用户获取模块330。其中,
信令话单数据获取模块310,用于获取与多个用户分别对应的信令话单数据,多个用户中包括监控用户;
均衡定位信息获取模块320,用于根据各所述信令话单数据中包括的定位信息以及时间点信息,获取各用户在监控时间段内的每个时间分片下的均衡定位信息;
伴随用户获取模块330,用于根据所述监控用户与其他用户在各所述时间分片下均衡定位信息的关联程度,在各所述其他用户中筛选得到所述监控用户的伴随用户。
本发明实施例提供的技术方案,通过获取与多个用户分别对应的信令话单数据,并根据各信令话单数据中包括的定位信息以及时间点信息,获取各用户在监控时间段内的每个时间分片下的均衡定位信息;进而根据监控用户与其他用户在各时间分片下均衡定位信息的关联程度,在各其他用户中筛选得到监控用户的伴随用户;通过在信令话单数据中获取各用户的定位信息,并基于该定位信息进行伴随用户识别,可以实现对伴随用户的准确识别,可以降低伴随用户识别的数据计算量,提升识别效率,可以避免外界因素对伴随识别结果的影响,实现在任意场景下对伴随用户的准确识别。
可选的,在上述技术方案的基础上,均衡定位信息获取模块320,包括:
目标信令话单数据获取单元,用于获取与当前处理用户对应的各目标信令话单数据;
定位信息映射单元,用于根据各目标信令话单数据中的时间点信息,将各目标信令话单数据中的定位信息,分别映射至所述监控时间段内匹配的时间分片中;
均衡定位信息计算单元,用于根据每个时间分片中包括的定位信息,计算得到所述当前处理用户在每个时间分片下的均衡定位信息。
可选的,在上述技术方案的基础上,均衡定位信息计算单元,包括:
平均值计算子单元,用于分别对每个时间分片中包括的各定位信息进行取平均值处理,计算得到所述当前处理用户在每个时间分片下的各定位信息的平均值作为均衡定位信息。
可选的,在上述技术方案的基础上,伴随用户获取模块330,包括:
信息比对单元,用于将所述其他用户在每个时间分片下均衡定位信息,与所述监控用户在每个时间分片下均衡定位信息分别进行比对;
备选用户确定单元,用于如果确定目标用户在目标时间分片下,与监控用户的均衡定位信息之间的差异值位于预设的伴随范围内,则将目标用户确定为监控用户的备选用户;
伴随特征矩阵生成单元,用于根据各所述备选用户在每个时间分片下与所述监控用户的均衡定位信息之间的差异值,生成与各所述备选用户分别对应的伴随特征矩阵;
伴随用户识别单元,用于根据各所述伴随特征矩阵,在各所述备选用户中识别所述伴随用户。
可选的,在上述技术方案的基础上,伴随特征矩阵生成单元,包括:
特征值设置子单元,用于若检测到一个备选用户在当前时间分片下,与监控用户的均衡定位信息之间的差异值位于预设的伴随范围内,则将所检测备选用户在当前时间分片下的伴随特征值设置为1;以及
若检测到一个备选用户在当前时间分片下,与监控用户的均衡定位信息之间的差异值不位于预设的伴随范围内,则将所检测备选用户在当前时间分片下的伴随特征值设置为0;
伴随特征矩阵获取子单元,用于依次获取各所述备选用户在每个时间分片下的伴随特征值,并根据所述各特征值,获取与各所述备选用户分别对应的伴随特征矩阵。
可选的,在上述技术方案的基础上,伴随用户识别单元具体用于:在各所述备选用户中,获取对应伴随特征值连续为1的数量大于预设数量阈值的备选用户作为伴随用户。
可选的,在上述技术方案的基础上,均衡定位信息获取模块320,还包括:
数据滑窗确定单元,用于获取与当前处理用户对应的各目标信令话单数据的接收时间,并根据所述接收时间和预设时间容忍范围,确定对应的数据滑窗;
定位信息删除单元,用于判断是否存在对应时间区间小于所述数据滑窗的最小时间边界的异常时间分片;若是,则将所述异常时间分片中的定位信息删除。
上述装置可执行本发明前述实施例所提供的伴随用户的识别方法,具备执行上述方法相应的功能模块和有益效果。未在本发明实施例中详尽描述的技术细节,可参见本发明前述实施例所提供的伴随用户的识别方法。
图4为本发明另一实施例提供的一种电子设备的结构示意图,如图4所示,该电子设备包括处理器410、存储器420、输入装置430和输出装置440;电子设备中处理器410的数量可以是一个或多个,图4中以一个处理器410为例;电子设备中的处理器410、存储器420、输入装置430和输出装置440可以通过总线或其他方式连接,图4中以通过总线连接为例。存储器420作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明任意实施例中的一种伴随用户的识别方法对应的程序指令/模块(例如,一种伴随用户的识别装置中的信令话单数据获取模块310、均衡定位信息获取模块320和伴随用户获取模块330)。处理器410通过运行存储在存储器420中的软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述的一种伴随用户的识别方法。也即,该程序被处理器执行时实现:
获取与多个用户分别对应的信令话单数据,多个用户中包括监控用户;
根据各所述信令话单数据中包括的定位信息以及时间点信息,获取各用户在监控时间段内的每个时间分片下的均衡定位信息;
根据所述监控用户与其他用户在各所述时间分片下均衡定位信息的关联程度,在各所述其他用户中筛选得到所述监控用户的伴随用户。
存储器420可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器420可进一步包括相对于处理器410远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置430可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入,可以包括键盘和鼠标等。输出装置440可包括显示屏等显示设备。
可选的,该电子设备可以为服务器,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所述方法。当然,本发明实施例所提供的一种计算机可读存储介质,其可以执行本发明任意实施例所提供的一种伴随用户的识别方法中的相关操作。也即,该程序被处理器执行时实现:
获取与多个用户分别对应的信令话单数据,多个用户中包括监控用户;
根据各所述信令话单数据中包括的定位信息以及时间点信息,获取各用户在监控时间段内的每个时间分片下的均衡定位信息;
根据所述监控用户与其他用户在各所述时间分片下均衡定位信息的关联程度,在各所述其他用户中筛选得到所述监控用户的伴随用户。
通过以上关于实施方式的描述,所属领域的技术用户可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述伴随用户的识别装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术用户会理解,本发明不限于这里所述的特定实施例,对本领域技术用户来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (9)

1.一种伴随用户的识别方法,其特征在于,包括:
获取与多个用户分别对应的信令话单数据,多个用户中包括监控用户;
获取与当前处理用户对应的各目标信令话单数据;
根据任务需求对监控时间段进行时间切片处理,以获取所述监控时间段对应的多个时间分片;按照时间顺序,对各所述目标信令话单数据中的定位信息进行排序,获取各用户在所述监控时间段内的连续定位信息;
根据各所述目标信令话单数据中的时间点信息,将各所述用户在监控时间段内的连续定位信息,分别映射至所述监控时间段内匹配的时间分片中;
根据各所述时间分片中包括的定位信息,计算得到所述当前处理用户在各所述时间分片下的均衡定位信息;
根据所述监控用户与其他用户在各所述时间分片下均衡定位信息的关联程度,在各所述其他用户中筛选得到所述监控用户的伴随用户;
其中,所述根据所述监控用户与其他用户在各所述时间分片下均衡定位信息的关联程度,在各所述其他用户中筛选得到所述监控用户的伴随用户,包括:
将所述监控用户在各所述时间分片中的均衡定位信息作为被伴随点;
根据所述被伴随点和预先设置的伴随距离阈值,确定一个矩形的伴随范围;
计算所述均衡定位信息位于所述伴随范围内的用户与所述监控用户间的距离;
根据所述监控用户与所述用户间的距离,确定两者的关联程度;
若所述用户与所述监控用户仅在一个或三个以上的所述时间分片内与所述监控用户的关联程度均大于预设的关联程度阈值,则将所述用户确定为所述监控用户的伴随用户。
2.根据权利要求1所述的方法,其特征在于,根据各所述时间分片中包括的定位信息,计算得到所述当前处理用户在各所述时间分片下的均衡定位信息,包括:
分别对每个时间分片中包括的各定位信息进行取平均值处理,计算得到所述当前处理用户在每个时间分片下的各定位信息的平均值作为均衡定位信息。
3.根据权利要求1所述的方法,其特征在于,根据所述监控用户与其他用户在各所述时间分片下均衡定位信息的关联程度,在各所述其他用户中筛选得到所述监控用户的伴随用户,还包括:
将所述其他用户在每个时间分片下均衡定位信息,与所述监控用户在每个时间分片下均衡定位信息分别进行比对;
如果确定目标用户在目标时间分片下,与监控用户的均衡定位信息之间的差异值位于预设的伴随范围内,则将目标用户确定为监控用户的备选用户;
根据各所述备选用户在每个时间分片下与所述监控用户的均衡定位信息之间的差异值,生成与各所述备选用户分别对应的伴随特征矩阵;
根据各所述伴随特征矩阵,在各所述备选用户中识别所述伴随用户。
4.根据权利要求3所述的方法,其特征在于,根据各所述备选用户在每个时间分片下与所述监控用户的均衡定位信息之间的差异值,生成与各所述备选用户分别对应的伴随特征矩阵,包括:
若检测到一个备选用户在当前时间分片下,与监控用户的均衡定位信息之间的差异值位于预设的伴随范围内,则将所检测备选用户在当前时间分片下的伴随特征值设置为1;
若检测到一个备选用户在当前时间分片下,与监控用户的均衡定位信息之间的差异值不位于预设的伴随范围内,则将所检测备选用户在当前时间分片下的伴随特征值设置为0;
依次获取各所述备选用户在每个时间分片下的伴随特征值,并根据所述各特征值,获取与各所述备选用户分别对应的伴随特征矩阵。
5.根据权利要求3所述的方法,其特征在于,根据各所述伴随特征矩阵,在各所述备选用户中识别所述伴随用户,包括:
在各所述备选用户中,获取对应伴随特征值连续为1的数量大于预设数量阈值的备选用户作为伴随用户。
6.根据权利要求1所述的方法,其特征在于,在根据各所述目标信令话单数据中的时间点信息,将各所述用户在监控时间段内的连续定位信息,分别映射至所述监控时间段内匹配的时间分片中之后,还包括:
获取与当前处理用户对应的各目标信令话单数据的接收时间,并根据所述接收时间和预设时间容忍范围,确定对应的数据滑窗;
判断是否存在对应时间区间小于所述数据滑窗的最小时间边界的异常时间分片;若是,则将所述异常时间分片中的定位信息删除。
7.一种伴随用户的识别装置,其特征在于,包括:
信令话单数据获取模块,用于获取与多个用户分别对应的信令话单数据,多个用户中包括监控用户;
均衡定位信息获取模块,用于根据各所述信令话单数据中包括的定位信息以及时间点信息,获取各用户在监控时间段内的每个时间分片下的均衡定位信息;
伴随用户获取模块,用于根据所述监控用户与其他用户在各所述时间分片下均衡定位信息的关联程度,在各所述其他用户中筛选得到所述监控用户的伴随用户;
所述均衡定位信息获取模块包括:
目标信令话单数据获取单元,用于获取与当前处理用户对应的各目标信令话单数据;
定位信息映射单元,用于根据任务需求对监控时间段进行时间切片处理,以获取所述监控时间段对应的多个时间分片;按照时间顺序,对各所述目标信令话单数据中的定位信息进行排序,获取各用户在所述监控时间段内的连续定位信息;根据各所述目标信令话单数据中的时间点信息,将各所述用户在监控时间段内的连续定位信息,分别映射至所述监控时间段内匹配的时间分片中;
均衡定位信息计算单元,用于根据各所述时间分片中包括的定位信息,计算得到所述当前处理用户在各所述时间分片下的均衡定位信息;
所述伴随用户获取模块,具体用于将所述监控用户在各所述时间分片中的均衡定位信息作为被伴随点;根据所述被伴随点和预先设置的伴随距离阈值,确定一个矩形的伴随范围;计算所述均衡定位信息位于所述伴随范围内的用户与所述监控用户间的距离;根据所述监控用户与所述用户间的距离,确定两者的关联程度;若所述用户与所述监控用户仅在一个或三个以上的所述时间分片内与所述监控用户的关联程度均大于预设的关联程度阈值,则将所述用户确定为所述监控用户的伴随用户。
8.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机程序;
当所述一个或多个计算机程序被所述一个或多个处理器执行,使得所述一个或多个处理器执行所述计算机程序时实现如权利要求1-6中任一所述的伴随用户的识别方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-6中任一所述的伴随用户的识别方法。
CN202111619444.XA 2021-12-27 2021-12-27 伴随用户的识别方法、装置、设备及介质 Active CN114339642B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111619444.XA CN114339642B (zh) 2021-12-27 2021-12-27 伴随用户的识别方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111619444.XA CN114339642B (zh) 2021-12-27 2021-12-27 伴随用户的识别方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN114339642A CN114339642A (zh) 2022-04-12
CN114339642B true CN114339642B (zh) 2023-06-02

Family

ID=81014832

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111619444.XA Active CN114339642B (zh) 2021-12-27 2021-12-27 伴随用户的识别方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN114339642B (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111008323A (zh) * 2019-11-29 2020-04-14 北京明略软件***有限公司 一种身份标识的伴随关系确定方法及装置
CN111294742B (zh) * 2020-02-10 2020-11-10 邑客得(上海)信息技术有限公司 基于信令cdr数据识别伴随手机号码的方法与***
CN112788524B (zh) * 2020-12-28 2022-12-16 ***通信集团江苏有限公司 对象查询方法、装置、设备及存储介质
CN112711710A (zh) * 2021-01-05 2021-04-27 北京红山信息科技研究院有限公司 多号码终端的追踪方法、***、服务器和存储介质
CN113706578B (zh) * 2021-08-03 2024-07-23 杭州数梦工场科技有限公司 一种基于轨迹的移动对象伴随关系的确定方法和装置

Also Published As

Publication number Publication date
CN114339642A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
CN107566358B (zh) 一种风险预警提示方法、装置、介质及设备
CN107819631B (zh) 一种设备异常检测方法、装置及设备
CN107872772B (zh) 诈骗短信的检测方法及装置
CN104539514B (zh) 消息过滤方法和装置
CN108491720B (zh) 一种应用识别方法、***以及相关设备
CN111274340B (zh) 人流密度的监控处理方法、设备及存储介质
CN110784355B (zh) 一种故障识别方法及装置
CN108076012B (zh) 异常登录判断方法及装置
CN112311617A (zh) 一种配置化数据监控告警方法及***
CN108090359B (zh) 一种应用程序监测方法及应用服务器
CN108366052B (zh) 验证短信的处理方法及***
US11727419B2 (en) Realtime busyness for places
CN112770129A (zh) 基于直播的群聊建立方法、相关装置、设备及介质
CN105578434B (zh) 一种检测伪基站运动轨迹的方法及服务器
CN108764369A (zh) 基于数据融合的人物识别方法、装置和计算机存储介质
CN114339642B (zh) 伴随用户的识别方法、装置、设备及介质
CN108804501A (zh) 一种检测有效信息的方法及装置
CN111368858B (zh) 用户满意度评估方法及装置
EP3783543A1 (en) Learning system, learning method, and program
CN115391317A (zh) 信息处理方法、装置、设备、***及存储介质
CN111898624A (zh) 定位信息的处理方法、装置、设备及存储介质
CN113706578B (zh) 一种基于轨迹的移动对象伴随关系的确定方法和装置
CN112995018B (zh) 消息处理方法、装置、设备及存储介质
CN112801837B (zh) 设备聚类方法、装置、存储介质及电子设备
CN113411217A (zh) 一种通话***监控告警的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant