CN109446186B - 一种基于移动轨迹的社会关系判断方法 - Google Patents

一种基于移动轨迹的社会关系判断方法 Download PDF

Info

Publication number
CN109446186B
CN109446186B CN201811133723.3A CN201811133723A CN109446186B CN 109446186 B CN109446186 B CN 109446186B CN 201811133723 A CN201811133723 A CN 201811133723A CN 109446186 B CN109446186 B CN 109446186B
Authority
CN
China
Prior art keywords
track
point
time
data
semantic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811133723.3A
Other languages
English (en)
Other versions
CN109446186A (zh
Inventor
鞠时光
唐祥宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Mengxiong Digital Technology Co.,Ltd.
Original Assignee
Jiangsu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu University filed Critical Jiangsu University
Priority to CN201811133723.3A priority Critical patent/CN109446186B/zh
Publication of CN109446186A publication Critical patent/CN109446186A/zh
Application granted granted Critical
Publication of CN109446186B publication Critical patent/CN109446186B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于移动轨迹的社会关系判断方法,该方法首先对采集得到的居民的定位数据进行数据清洗,得到移动对象的轨迹点信息;然后利用改进后的基于密度的聚类算法DBSCAN对轨迹中的停留点进行提取,并利用POI数据库对停留点进行的语义化,得到移动对象的语义轨迹;最后对不同移动对象的语义轨迹进行共现分析,得到不同移动对象间的共现特征,利用机器学习中的分类算法SVM完成不同移动对象的社会关系判断。本发明基于定位数据,从真实世界中移动用户的物理交互角度出发对移动用户间的社会关系进行判断,能够准确的完成群体的关系划分,为用户画像精准描述、公共安全领域群体监测追踪提供了有效的数据参考。

Description

一种基于移动轨迹的社会关系判断方法
技术领域
本发明涉及时空数据挖掘研究与应用领域,具体涉及一种基于移动轨迹的社会关系判断方法。
背景技术
近年来,随着GPS、卫星通信等技术的不断发展以及带有定位功能的移动智能设备被广泛使用,移动对象的追踪准确度及精度显著改善。而移动互联网、大数据、云计算、传感器网络、计算机存储等技术的快速发展,使得这些轨迹数据能够持久化保存,形成了时空轨迹数据。这些数据不仅记录了人在时间序列上的位置信息,数据的背后还暗含了个体自身的行为特征,以及人与人、人与城市、人与社会之间的关系等信息。在对人的运动轨迹的挖掘研究中,根据数据的利用方式,可以分为纵向利用方式和横向利用方式,即个体行为特征的研究以及群体性轨迹的研究。
现有轨迹数据分析主要集中在运动规律挖掘的层面上,没有提取出隐含在轨迹数据中用户相关的深层次知识,如社会关系,导致挖掘结果抽象程度较低、难以表示用户高级语义。而社会关系判断作为社会网络分析的研究热点之一,现有的移动社会网络仍然基于用户线上虚拟社会关系提供传统的在线社会网络服务,例如利用手机数据以及网络社交数据进行计算,尚未有研究从实际的地理轨迹角度进行计算。因此如何通过用户的轨迹数据对用户高级语义行为进行描述、对用户间的共现模式的描述以及如何通过轨迹数据对不同用户间共现信息特征的提取等各项工作均有待进一步研究。
发明内容
针对上述问题,本发明提供了一种基于移动轨迹的社会关系判断方法,从实际的地理轨迹数据出发,为移动对象的轨迹分析以及社会关系判断提供一个可行的方案。
为了实现上述目的,本发明具体技术方案如下:一种基于移动轨迹的社会关系判断方法,包括如下步骤:
1)采集出行者轨迹数据,构建轨迹点集合Traj,即通过出行者携带手机,借助手机软件和定位技术采集出行者轨迹数据离散点;
2)清洗轨迹点集合Traj,并对缺失数据进行标记;
3)从清洗后的轨迹点集合Traj中提取轨迹中的停留点序列Stop=<s1,s2,s3,…,sn>,其中,si表示用户某一停留点,记为si=(Lon,Lat,t1,t2),Lon表示停留点si的经度,Lat表示停留点si的纬度,t1为进入停留点si的时间,t2为离开停留点si的时间;
4)对停留点序列Stop进行语义化扩展,扩展后的停留点序列为S=<(C1,T1),(C2,T2),…,(Cn,Tn)>,其中Ci表示语义位置,包括停留点的名称、详细地址以及行业分类;Ti表示在对应停留区域Pi开始停留的时间和离开时间,是一个二元组(tstart,tend),其中tstart表示在停留区域Pi开始停留的时间,tend表示离开停留区域Pi的时间;停留点序列S中所有地理区域的集合用S.C来表示;
5)构建语义位置层次结构,记为
Figure GDA0002999948140000021
其中L表示层次结构总的层数,1≤l≤L,Cl={cl,1,cl,2,…,cl,k}表示在l层语义位置的集合,cl,k表示第l层中的第k个语义位置;
6)提取用户A和用户B间的共现信息,记为θ=(u,v,time,timeblock,place,category),其中u,v是用户编号,time为出现共现的时间,timeblock为在一起的时间长度,place为相遇的位置名称,若不存在名称则为相遇地点的经纬度,category为相遇地点的类别;
7)通过对两个用户间的地理共现信息的统计分析,获取用户间地理共现信息特征;
8)根据用户间地理共现信息特征,利用分类算法SVM划分移动对象间的社会关系,关系类别的集合用C:{c1,…cnum}表示,num表示关系类别的数目。
进一步的,上述步骤1)中,构建轨迹点集合Traj方法如下:
1.1)利用全球定位***GPS、Wi-Fi定位以及基站定位技术获取出行者的经纬度信息;
1.2)利用手机软件对经纬度信息以及信息对应的时间戳进行存储收集,得到同时具有空间属性和时间属性的轨迹数据Traj=<p1,p2,p3,…,pn>,其中,每个轨迹点pi记为pi=(Loni,Lati,ti),Lon表示轨迹点的经度,Lat表示轨迹点的纬度,t表示轨迹点的时间戳,且pi.t<pi+1.t。
进一步的,上述步骤2)中,清洗轨迹点集合Traj方法如下:
2.1)初始化变量i=1,设置时间阈值T1和速度阈值v1
2.2)计算轨迹点pi和pi+1之间的间隔时间Δt,Δt=pi+1-pi
2.3)比较Δt与时间阈值T1,若Δt>T1转步骤2.4),否则转步骤2.5);
2.4)轨迹点pi和pi+1之间存在数据缺失,标记轨迹点pi和pi+1
2.5)计算轨迹点pi和pi+1之间的速度v,v=D/Δt,其中D表示轨迹点pi和pi+1之间距离,具体的计算公式为:
Figure GDA0002999948140000031
其中
Figure GDA0002999948140000032
R为地球半径;
2.6)比较v与速度阈值v1,若v>v1转步骤2.7),否则转步骤2.8);
2.7)认为以非正常的速度高速运行,即出现数据漂移现象,将轨迹点pi+1从轨迹数据中移除;
2.8)i=i+1;
2.9)判断pi是否为轨迹数据Traj中最后一个数据点,即判断i是否等于n,若是转步骤3);否则转步骤2.2)。
进一步的,上述步骤3)中,提取轨迹中的停留点序列的方法如下:
3.1)设置参数∈和ΔT,初始化核心对象集合Ω为空;其中∈表示∈邻域的范围,∈邻域表示包含轨迹数据Traj中与该轨迹点的距离不大于∈的样本子集,轨迹点pi的∈邻域表示为N(pi);ΔT表示邻域时间间隔,即轨迹点∈邻域的时间跨度;
3.2)判断轨迹点是否为核心对象,即对轨迹数据Traj进行遍历,比较轨迹点的∈邻域中轨迹点的时间跨度是否大于邻域时间间隔ΔT,如果大于则该轨迹点即为核心对象,并将核心对象加入到核心对象集合Ω中;
3.3)将轨迹点分簇,构建聚类簇集合P;
3.4)由聚类簇集合P获取停留点序列Stop的信息,其中聚类簇Pk的信息对应停留点sk的信息;其中,聚类簇Pk中所有所有核心对象的经度的平均值,记为
Figure GDA0002999948140000041
所有核心对象的纬度的平均值,记为
Figure GDA0002999948140000042
聚类簇Pk中最小的时间戳记为
Figure GDA0002999948140000043
最大的时间戳为
Figure GDA0002999948140000044
Figure GDA0002999948140000045
进一步的,上述步骤3.3)中,构建聚类簇集合P的方法如下:
3.3.1)初始化聚类簇数k和未访问轨迹数据集合Γ,记k=0,Γ=Traj;
3.3.2)记录当前未访问的轨迹数据集合,记为Γold,Γold=Γ;
3.3.3)选取当前核心对象集合Ω中的第一个核心对象,记为o,初始化队列Q,令Q={o},Γ=Γ\{o};
3.3.4)取出队列Q中的第一个轨迹数据q;
3.3.5)判断q是否为核心对象,若q不是核心对象,转步骤3.3.7);否则转步骤3.3.6);
3.3.6)取N(pi)与Γ的交集,记为Δ,将Δ加入到队列Q中,同时令Γ=Γ\Δ;
3.3.7)判断队列Q是否为空,若不为空转入步骤3.3.4);否则聚类簇数k=k+1,生成聚类簇Pk=Гold\Г,Ω=Ω\Pk
3.3.8)判断核心对象集合Ω是否为空,如果不为空,转步骤3.3.2);否则完成簇类划分,P={P1,P2,…,Pk}。
进一步的,上述步骤6)中,提取用户A和用户B间的共现信息方法如下:
6.1)逐层获取用户A、B的语义历史位置,记为
Figure GDA0002999948140000046
其中
Figure GDA0002999948140000047
是语义位置层次
Figure GDA0002999948140000048
的l层的序列;对于停留点clk,Δtk=clk·tl-clk·ta表示在clk停留的时间;
6.2)判断用户A、B当前语义层的语义位置是否匹配,若当前不存在匹配转步骤6.3);若匹配用(a1,b1)→(a2,b2)→…→(ak,bk)表示轨迹匹配,转步骤6.4);
6.3)用户A、B的轨迹不相交即没有共同出现,转步骤7);
6.4)判断当前层不是最后一层,若当前层不是最后一层,则进入下一层,并转步骤6.2);否则进入步骤6.5);
6.5)对轨迹进行最大轨迹匹配,其中,最大轨迹匹配必须同时满足三个条件,即无左增量、无右增量和无内部增量;
6.6)得到用户A、B的共现信息,用多元组θ=(u,v,time,timeblock,place,category)来表示,其中u,v是用户编号,time为出现共现的时间,timeblock为在一起的时间长度,place为相遇的位置名称,若不存在名称则为相遇地点的经纬度,category为相遇地点的类别。
进一步的,上述步骤6.2)中,判断用户A、B当前语义层的语义位置是否匹配的方法是给定时间约束因子ρ∈[0,1]以及S1子序列S1[a1,a2,…,ak]和S2的子序列S2[b1,b2,…,bk],必须满足以下两个条件:
a)
Figure GDA0002999948140000051
b)
Figure GDA0002999948140000052
其中:
αi=Max(S1[ai].ta,S2[bi].ta),α′i=Min(S1[ai].tl,S2[bi].tl),即判断在同一停留点是否同时停留了足够的时间。(a1,b1)→(a2,b2)→…→(ak,bk)来表示轨迹匹配。
进一步的,上述步骤8)中,社会关系划分方法如下:
8.1)确定社会关系类别集合的具体类别;
8.2)对用户间地理共现信息特征数据添加相应的类别标签,生成分类的算法最终的数据集D;
8.3)将数据集D划分为k个大小相同的互斥子集,每个子集都尽可能保持数据分布的一致性,选取其中的k-1个子集的并集作为训练集,剩余的那个子集作为测试集;
8.4)通过交叉验证法完成对分类模型SVM的训练,即参数调整;
8.5)利用分类模型完成对新数据社会关系的推测。
本发明基于定位数据,从真实世界中移动用户的物理交互角度出发对移动用户间的社会关系进行判断,能够准确的完成群体的关系划分,为用户画像精准描述、公共安全领域群体监测追踪提供了有效的数据参考。
附图说明
图1是基于移动轨迹的社会关系判断方法流程图。
图2是语义位置示例以及语义位置树形结构图。
图3是多级空间尺度下移动对象共现模式提取流程图。
具体实施方式
下面结合附图对本发明作进一步描述。
基于移动轨迹的社会关系判断方法流程图如图1所示,包括如下步骤:
1)采集出行者轨迹数据Traj,通过出行者携带手机,借助手机软件和定位技术采集出行者轨迹数据离散点,具体方法如下:
1.1)利用全球定位***GPS、Wi-Fi定位以及基站定位技术获取出行者的经纬度信息;
1.2)利用手机软件对经纬度信息以及信息对应的时间戳进行存储收集,得到同时具有空间属性和时间属性的轨迹数据Traj=<p1,p2,p3,…,pn>,每个轨迹点pi包含经度(Lon),纬度(Lat),时间戳(t)3个元素,记为pi=(Loni,Lati,ti),其中pi.t<pi+1.t;
2)清洗轨迹数据Traj,并对缺失数据进行标记;具体方法如下:
2.1)初始化变量i=1,设置时间阈值T1和速度阈值v1
2.2)计算轨迹点pi和pi+1之间的间隔时间Δt,Δt=pi+1-pi
2.3)比较Δt与时间阈值T1,若Δt>T1转步骤2.4),否则转步骤2.5);
2.4)轨迹点pi和pi+1之间存在数据缺失,标记轨迹点pi和pi+1
2.5)计算轨迹点pi和pi+1之间的速度v,v=D/Δt,其中D表示轨迹点pi和pi+1之间距离,具体的计算公式为:
Figure GDA0002999948140000071
其中
Figure GDA0002999948140000072
R为地球半径;
2.6)比较v与速度阈值v1,若v>v1转步骤2.7),否则转步骤2.8);
2.7)认为以非正常的速度高速运行,即出现数据漂移现象,将轨迹点pi+1从轨迹数据中移除;
2.8)i=i+1;
2.9)判断pi是否为轨迹数据Traj中最后一个数据点,即判断i是否等于n,若是转步骤3);否则转步骤2.2);
3)从清洗后的轨迹数据Traj中提取轨迹中的停留点序列Stop=<s1,s2,s3,…,sn>,si表示用户某一停留点,记为si=(Lon,Lat,t1,t2),其中Lon表示停留点si的经度,Lat表示停留点si的纬度,t1为进入停留点si的时间,t2为离开停留点si的时间;提取方法如下:
3.1)设置参数∈和ΔT,初始化核心对象集合Ω为空;其中∈表示∈邻域的范围,∈邻域表示包含轨迹数据Traj中与该轨迹点的距离不大于∈的样本子集,轨迹点pi的∈邻域表示为N(pi);ΔT表示邻域时间间隔,即轨迹点∈邻域的时间跨度;
3.2)判断轨迹点是否为核心对象,即对轨迹数据Traj进行遍历,比较轨迹点的∈邻域中轨迹点的时间跨度是否大于邻域时间间隔ΔT,如果大于则该轨迹点即为核心对象,并将核心对象加入到核心对象集合Ω中;
3.3)将轨迹点分簇,构建聚类簇集合P,方法如下:
3.3.1)初始化聚类簇数k和未访问轨迹数据集合Γ,记k=0,Γ=Traj;
3.3.2)记录当前未访问的轨迹数据集合,记为Γold,Γold=Γ;
3.3.3)选取当前核心对象集合Ω中的第一个核心对象,记为o,初始化队列Q,令Q={o},Γ=Γ\{o};
3.3.4)取出队列Q中的第一个轨迹数据q;
3.3.5)判断q是否为核心对象,若q不是核心对象,转步骤3.3.7);否则转步骤3.3.6);
3.3.6)取N(pi)与Γ的交集,记为Δ,将Δ加入到队列Q中,同时令Γ=Γ\Δ;
3.3.7)判断队列Q是否为空,若不为空转入步骤3.3.4);否则聚类簇数k=k+1,生成聚类簇Pk=Γold\Γ,Ω=Ω\Pk
3.3.8)判断核心对象集合Ω是否为空,如果不为空,转步骤3.3.2);否则完成簇类划分,P={P1,P2,…,Pk};
3.4)由聚类簇集合P获取停留点序列Stop的信息,其中聚类簇Pk的信息对应停留点sk的信息;具体对应方式为,聚类簇Pk中所有所有核心对象的经度的平均值,记为
Figure GDA0002999948140000081
所有核心对象的纬度的平均值,记为
Figure GDA0002999948140000082
聚类簇Pk中最小的时间戳记为
Figure GDA0002999948140000083
最大的时间戳为
Figure GDA0002999948140000084
Figure GDA0002999948140000085
4)对停留点序列Stop进行语义化扩展,扩展后的停留点序列为S=<(C1,T1),(C2,T2),…,(Cn,Tn)>,其中Ci表示语义位置,包括停留点的名称、详细地址以及行业分类信息,这些信息均由POI数据库查询获得;Ti表示在对应停留区域Pi开始停留的时间和离开时间,是一个二元组(tstart,tend),其中tstart表示在停留区域Pi开始停留的时间,tend表示离开停留区域Pi的时间;停留点序列S中所有地理区域的集合用S.C来表示;
5)构建语义位置层次结构;基于位置信息本身的层次性的构建语义位置层次结构,语义位置层次
Figure GDA0002999948140000086
是特征向量空间中的一种树型结构,
Figure GDA0002999948140000087
其中L代表层次结构总的层数,1≤l≤L,Cl={cl,1,cl,2,…,cl,k}表示在l层语义位置的集合,cl,k表示第l层中的第k个语义位置,示例语义位置如图2所示;
6)提取用户A和用户B间的共现信息;在语义位置层次的基础上,对不同用户间的语义化轨迹进行共现分析,完成移动用户间的共现信息的提取,其中若用户A的轨迹停留点序列与用户B的轨迹停留点序列,满足
Figure GDA0002999948140000091
同时
Figure GDA0002999948140000092
称用户A与用户B之间存在时空共现;如图3所示,具体方法如下:
6.1)逐层获取用户A、B的语义历史位置,用户的语义位置历史是在不同语义位置层次
Figure GDA0002999948140000093
上的一系列语义位置,
Figure GDA0002999948140000094
其中
Figure GDA0002999948140000095
是语义位置层次
Figure GDA0002999948140000096
的l层的序列;对于停留点clk,Δtk=clk.tl-clk.ta表示在clk停留的时间;
6.2)判断用户A、B当前语义层的语义位置是否匹配,若当前不存在匹配转步骤6.3),否则转步骤6.4);其中,判断方法是:给定时间约束因子ρ∈[0,1]以及S1子序列S1[a1,a2,…,ak]和S2的子序列S2[b1,b2,…,bk],如果满足以下两个条件则认为是长度为k的轨迹匹配
1.
Figure GDA0002999948140000097
2.
Figure GDA0002999948140000098
其中αi=Max(S1[ai].ta,S2[bi].ta),α′i=Min(S1[ai].tl,S2[bi].tl),即判断在同一停留点是否同时停留了足够的时间,用(a1,b1)→(a2,b2)→…→(ak,bk)来表示轨迹匹配;
6.3)用户A、B的轨迹不相交即没有共同出现,转步骤7);
6.4)判断当前层不是最后一层,若当前层不是最后一层,则进入下一层,并转步骤6.2);否则进入步骤6.5);
6.5)对轨迹进行最大轨迹匹配,其中,最大轨迹匹配必须满足下面三个条件,具体为:
a)无左增量:
Figure GDA0002999948140000099
b0<b1,s.t.,(a0,b0)→(a1,b1)→(a2,b2)→…→(ak,bk)
b)无右增量:
Figure GDA00029999481400000910
bk+1>bk,s.t.,(a1,b1)→(a2,b2)→…→(ak,bk)→(ak+1,bk+1)
c)无内部增量:
Figure GDA00029999481400000911
以及
bi<bi′<bi+1
s.t.,(a1,b1)→(a2,b2)→…→(ai,bi)→(ai′,bi′)→(ai+1,bi+1)→…→(ak,bk);
6.5)得到用户A、B的共现信息,用多元组θ=(u,v,time,timeblock,place,category)来表示,其中u,v是用户编号,time为出现共现的时间,timeblock为在一起的时间长度,place为相遇的位置名称,若不存在名称则为相遇地点的经纬度,category为相遇地点的类别,例如住宅区,商业区,办公区,景区等;
7)通过对两个用户间的地理共现信息的统计分析,获取用户间地理共现信息特征;其中,用户间具体地理共现信息特征包括如下:
共同出现的总的次数,共同出现总的时间长度,在工作日白天出现的次数占总次数的比值,在工作日夜间出现的次数占总次数的比值,在周末白天出现的次数占总次数的比值,在周末夜间出现的次数占总次数的比值,在住宅区白天出现的次数占总次数的比值,在住宅区夜间出现的次数占总次数的比值,在工作区域白天出现的次数占总次数的比值,在工作区域夜间出现的次数占总次数的比值,在商业区出现的次数占总次数的比值,在景区出现的次数占总次数的比值,在住宅区共同出现的时间长度占共同出现总时间长度的比值,在工作区域共同出现的时间长度占共同出现总时间长度的比值,在商业区共同出现的时间长度占共同出现总时间长度的比值,在景区共同出现的时间长度占共同出现总时间长度的比值;其中,周末指周六周日,工作日指周一至周五,白天指9:00-23:00,晚上指23:00至次日上午9:00;
8)根据用户间地理共现信息特征,利用分类算法SVM实现移动对象间的社会关系划分,C:{c1,…cnum}表示关系类别的集合,num表示关系类别的数目,具体的关系集合由用户需求决定,例如关系类别可以表示为C:{家人,同事,同学,朋友},关系类别个数num为4;具体的关系划分方法如下:
8.1)确定社会关系类别集合的具体类别;
8.2)对用户间地理共现信息特征数据添加相应的类别标签,生成分类的算法最终的数据集D;
8.3)将数据集D划分为k个大小相同的互斥子集,每个子集都尽可能保持数据分布的一致性,选取其中的k-1个子集的并集作为训练集,剩余的那个子集作为测试集;
8.4)通过交叉验证法完成对分类模型SVM的训练,即参数调整;
8.5)利用分类模型完成对新数据社会关系的推测。

Claims (8)

1.一种基于移动轨迹的社会关系判断方法,其特征在于,包括如下步骤:
1)采集出行者轨迹数据,构建轨迹点集合Traj,即通过出行者携带手机,借助手机软件和定位技术采集出行者轨迹数据离散点;
2)清洗轨迹点集合Traj,并对缺失数据进行标记;
3)从清洗后的轨迹点集合Traj中提取轨迹中的停留点序列Stop=<s1,s2,s3,…,sn>,其中,si表示用户某一停留点,记为si=(Lon,Lat,t1,t2),Lon表示停留点si的经度,Lat表示停留点si的纬度,t1为进入停留点si的时间,t2为离开停留点si的时间;
4)对停留点序列Stop进行语义化扩展,扩展后的停留点序列为S=<(C1,T1),(C2,T2),…,(Cn,Tn)>,其中Ci表示语义位置,包括停留点的名称、详细地址以及行业分类;Ti表示在对应停留区域Pi开始停留的时间和离开时间,是一个二元组(tstart,tend),其中tstart表示在停留区域Pi开始停留的时间,tend表示离开停留区域Pi的时间;停留点序列S中所有地理区域的集合用S.C来表示;
5)构建语义位置层次结构,记为
Figure FDA0002999948130000011
其中L表示层次结构总的层数,1≤l≤L,Cl={cl,1,cl,2,…,cl,k}表示在l层语义位置的集合,cl,k表示第l层中的第k个语义位置;
6)提取用户A和用户B间的共现信息,记为θ=(u,v,time,timeblock,place,category),其中u,v是用户编号,time为出现共现的时间,timeblock为在一起的时间长度,place为相遇的位置名称,若不存在名称则为相遇地点的经纬度,category为相遇地点的类别;
7)通过对两个用户间的地理共现信息的统计分析,获取用户间地理共现信息特征;
8)根据用户间地理共现信息特征,利用分类算法SVM划分移动对象间的社会关系,关系类别的集合用C:{c1,…cnum}表示,num表示关系类别的数目。
2.根据权利要求1所述的基于移动轨迹的社会关系判断方法,其特征在于所述步骤1)中,构建轨迹点集合Traj方法如下:
1.1)利用全球定位***GPS、Wi-Fi定位以及基站定位技术获取出行者的经纬度信息;
1.2)利用手机软件对经纬度信息以及信息对应的时间戳进行存储收集,得到同时具有空间属性和时间属性的轨迹数据Traj=<p1,p2,p3,…,pn>,其中,每个轨迹点pi记为pi=(Loni,Lati,ti),Lon表示轨迹点的经度,Lat表示轨迹点的纬度,t表示轨迹点的时间戳,且pi.t<pi+1.t。
3.根据权利要求1所述的基于移动轨迹的社会关系判断方法,其特征在于所述步骤2)中,清洗轨迹点集合Traj方法如下:
2.1)初始化变量i=1,设置时间阈值T1和速度阈值v1
2.2)计算轨迹点pi和pi+1之间的间隔时间Δt,Δt=pi+1-pi
2.3)比较Δt与时间阈值T1,若Δt>T1转步骤2.4),否则转步骤2.5);
2.4)轨迹点pi和pi+1之间存在数据缺失,标记轨迹点pi和pi+1
2.5)计算轨迹点pi和pi+1之间的速度v,v=D/Δt,其中D表示轨迹点pi和pi+1之间距离,具体的计算公式为:
Figure FDA0002999948130000021
其中
Figure FDA0002999948130000022
R为地球半径;
2.6)比较v与速度阈值v1,若v>v1转步骤2.7),否则转步骤2.8);
2.7)认为以非正常的速度高速运行,即出现数据漂移现象,将轨迹点pi+1从轨迹数据中移除;
2.8)i=i+1;
2.9)判断pi是否为轨迹数据Traj中最后一个数据点,即判断i是否等于n,若是转步骤3);否则转步骤2.2)。
4.根据权利要求1所述的基于移动轨迹的社会关系判断方法,其特征在于所述步骤3)中,提取轨迹中的停留点序列的方法如下:
3.1)设置参数∈和ΔT,初始化核心对象集合Ω为空;其中∈表示∈邻域的范围,∈邻域表示包含轨迹数据Traj中与该轨迹点的距离不大于∈的样本子集,轨迹点pi的∈邻域表示为N(pi);ΔT表示邻域时间间隔,即轨迹点∈邻域的时间跨度;
3.2)判断轨迹点是否为核心对象,即对轨迹数据Traj进行遍历,比较轨迹点的∈邻域中轨迹点的时间跨度是否大于邻域时间间隔ΔT,如果大于则该轨迹点即为核心对象,并将核心对象加入到核心对象集合Ω中;
3.3)将轨迹点分簇,构建聚类簇集合P;
3.4)由聚类簇集合P获取停留点序列Stop的信息,其中聚类簇Pk的信息对应停留点sk的信息;其中,聚类簇Pk中所有所有核心对象的经度的平均值,记为
Figure FDA0002999948130000031
所有核心对象的纬度的平均值,记为
Figure FDA0002999948130000032
聚类簇Pk中最小的时间戳记为
Figure FDA0002999948130000033
最大的时间戳为
Figure FDA0002999948130000034
Figure FDA0002999948130000035
5.根据权利要求4所述的基于移动轨迹的社会关系判断方法,其特征在于所述步骤3.3)中,构建聚类簇集合P的方法如下:
3.3.1)初始化聚类簇数k和未访问轨迹数据集合Γ,记k=0,Γ=Traj;
3.3.2)记录当前未访问的轨迹数据集合,记为Γold,Γold=Γ;
3.3.3)选取当前核心对象集合Ω中的第一个核心对象,记为o,初始化队列Q,令Q={o},Γ=Γ\{o};
3.3.4)取出队列Q中的第一个轨迹数据q;
3.3.5)判断q是否为核心对象,若q不是核心对象,转步骤3.3.7);否则转步骤3.3.6):
3.3.6)取N(pi)与Γ的交集,记为Δ,将Δ加入到队列Q中,同时令Γ=Γ\Δ;
3.3.7)判断队列Q是否为空,若不为空转入步骤3.3.4);否则聚类簇数k=k+1,生成聚类簇Pk=Γold\Γ,Ω=Ω\Pk
3.3.8)判断核心对象集合Ω是否为空,如果不为空,转步骤3.3.2);否则完成簇类划分,P={P1,P2,…,Pk}。
6.根据权利要求1所述的基于移动轨迹的社会关系判断方法,其特征在于所述步骤6)中,提取用户A和用户B间的共现信息方法如下:
6.1)逐层获取用户A、B的语义历史位置,记为
Figure FDA0002999948130000041
其中
Figure FDA0002999948130000042
是语义位置层次
Figure FDA0002999948130000043
的l层的序列;对于停留点clk,Δtk=clk.tl-clk.ta表示在clk停留的时间;
6.2)判断用户A、B当前语义层的语义位置是否匹配,若当前不存在匹配转步骤6.3);若匹配用(a1,b1)→(a2,b2)→…→(ak,bk)表示轨迹匹配,转步骤6.4);
6.3)用户A、B的轨迹不相交即没有共同出现,转步骤7);
6.4)判断当前层不是最后一层,若当前层不是最后一层,则进入下一层,并转步骤6.2);否则进入步骤6.5);
6.5)对轨迹进行最大轨迹匹配,其中,最大轨迹匹配必须同时满足三个条件,即无左增量、无右增量和无内部增量;
6.6)得到用户A、B的共现信息,用多元组θ=(u,v,time,timeblock,place,category)来表示,其中u,v是用户编号,time为出现共现的时间,timeblock为在一起的时间长度,place为相遇的位置名称,若不存在名称则为相遇地点的经纬度,category为相遇地点的类别。
7.根据权利要求6所述的基于移动轨迹的社会关系判断方法,其特征在于所述步骤6.2)中,判断用户A、B当前语义层的语义位置是否匹配的方法是给定时间约束因子ρ∈[0,1]以及S1子序列S1[a1,a2,…,ak]和S2的子序列S2[b1,b2,…,bk],必须满足以下两个条件:
a)
Figure FDA0002999948130000044
ai=bi
b)
Figure FDA0002999948130000045
其中:
αi=Max(S1[ai].ta,S2[bi].ta),α′i=Min(S1[ai].tl,S2[bi].tl),即判断在同一停留点是否同时停留了足够的时间,(a1,b1)→(a2,b2)→…→(ak,bk)来表示轨迹匹配。
8.根据权利要求1所述的基于移动轨迹的社会关系判断方法,其特征在于所述步骤8)中,社会关系划分方法如下:
8.1)确定社会关系类别集合的具体类别;
8.2)对用户间地理共现信息特征数据添加相应的类别标签,生成分类的算法最终的数据集D;
8.3)将数据集D划分为k个大小相同的互斥子集,每个子集都尽可能保持数据分布的一致性,选取其中的k-1个子集的并集作为训练集,剩余的那个子集作为测试集;
8.4)通过交叉验证法完成对分类模型SVM的训练,即参数调整;
8.5)利用分类模型完成对新数据社会关系的判断。
CN201811133723.3A 2018-09-27 2018-09-27 一种基于移动轨迹的社会关系判断方法 Active CN109446186B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811133723.3A CN109446186B (zh) 2018-09-27 2018-09-27 一种基于移动轨迹的社会关系判断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811133723.3A CN109446186B (zh) 2018-09-27 2018-09-27 一种基于移动轨迹的社会关系判断方法

Publications (2)

Publication Number Publication Date
CN109446186A CN109446186A (zh) 2019-03-08
CN109446186B true CN109446186B (zh) 2021-07-20

Family

ID=65545567

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811133723.3A Active CN109446186B (zh) 2018-09-27 2018-09-27 一种基于移动轨迹的社会关系判断方法

Country Status (1)

Country Link
CN (1) CN109446186B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110322295B (zh) * 2019-07-09 2022-04-26 北京百度网讯科技有限公司 关系强度确定方法及***、服务器、计算机可读介质
CN111104468B (zh) * 2019-09-25 2023-03-28 西安交通大学 一种基于语义轨迹推断用户活动的方法
CN110675192A (zh) * 2019-09-27 2020-01-10 深圳市掌众信息技术有限公司 一种亲密关系挖掘方法、广告推送方法及***
CN111159582B (zh) * 2019-12-20 2023-10-31 北京邮电大学 一种移动对象轨迹数据的处理方法及装置
CN111027781A (zh) * 2019-12-24 2020-04-17 北京明略软件***有限公司 一种社会关系的预测方法、装置、存储介质和电子设备
CN111190891B (zh) * 2019-12-27 2023-07-25 武汉长江通信产业集团股份有限公司 一种多语义轨迹数据分段存储方法
CN111581320B (zh) * 2020-05-09 2022-06-28 海南中智信信息技术有限公司 一种基于行为轨迹的碰头地点及时长识别方法及***
CN113742605A (zh) * 2020-05-29 2021-12-03 京东城市(北京)数字科技有限公司 时空关联关系的确定方法、装置、设备和存储介质
CN113742606A (zh) * 2020-05-29 2021-12-03 京东城市(北京)数字科技有限公司 对象识别方法、装置、电子设备及可读存储介质
CN112907385A (zh) * 2021-02-23 2021-06-04 深圳市广信安科技股份有限公司 社会关系分析方法、终端设备及存储介质
CN115719546A (zh) * 2021-08-24 2023-02-28 中移***集成有限公司 轨迹异常检测方法和装置、电子设备及可读存储介质
CN116680346B (zh) * 2022-09-23 2024-04-16 荣耀终端有限公司 运动轨迹分析方法、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106022934A (zh) * 2016-05-05 2016-10-12 北京邮电大学 一种基于移动轨迹模式的潜在好友发现方法及***
CN106912015A (zh) * 2017-01-10 2017-06-30 上海云砥信息科技有限公司 一种基于移动网络数据的人员出行链识别方法
CN107145504A (zh) * 2017-03-21 2017-09-08 南京邮电大学 一种用户移动轨迹相似度比较的隐私保护方法
CN107273488A (zh) * 2017-06-13 2017-10-20 武汉大学 一种现实空间活动与网络空间行为时空联动作用评价方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106022934A (zh) * 2016-05-05 2016-10-12 北京邮电大学 一种基于移动轨迹模式的潜在好友发现方法及***
CN106912015A (zh) * 2017-01-10 2017-06-30 上海云砥信息科技有限公司 一种基于移动网络数据的人员出行链识别方法
CN107145504A (zh) * 2017-03-21 2017-09-08 南京邮电大学 一种用户移动轨迹相似度比较的隐私保护方法
CN107273488A (zh) * 2017-06-13 2017-10-20 武汉大学 一种现实空间活动与网络空间行为时空联动作用评价方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Testing access control policy through change rule and swap rule algorithm;Patricia Ghann,etc,;《Journal of Information Security and Applications》;20160629;第81页至93页 *

Also Published As

Publication number Publication date
CN109446186A (zh) 2019-03-08

Similar Documents

Publication Publication Date Title
CN109446186B (zh) 一种基于移动轨迹的社会关系判断方法
EP3241370B1 (en) Analyzing semantic places and related data from a plurality of location data reports
Zheng Trajectory data mining: an overview
CN110516708B (zh) 一种基于轨迹与路网匹配的路径预测方法
Xu et al. Topic based context-aware travel recommendation method exploiting geotagged photos
Zheng et al. Mining interesting locations and travel sequences from GPS trajectories
CN102203729B (zh) 用于基于位置历史确定用户相似性的方法和***
CN106931974B (zh) 基于移动终端gps定位数据记录计算个人通勤距离的方法
US20100153292A1 (en) Making Friend and Location Recommendations Based on Location Similarities
CN107092638A (zh) 基于位置从地图历史提供相关元素信息的方法和计算装置
CN109885643B (zh) 一种基于语义轨迹的位置预测方法及存储介质
CN111782741A (zh) 兴趣点挖掘方法、装置、电子设备及存储介质
CN111242352A (zh) 基于车辆轨迹的停等聚集效应预测方法
Yuan et al. Recognition of functional areas based on call detail records and point of interest data
CN115545758A (zh) 城市服务设施自适应增量选址的方法和***
Chen et al. An analysis of movement patterns between zones using taxi GPS data
Lee et al. Crowd-sourced carpool recommendation based on simple and efficient trajectory grouping
Hu et al. A comprehensive survey of recommendation system based on taxi GPS trajectory
Yuan et al. Discovering functional zones in a city using human movements and points of interest
CN114007186B (zh) 定位方法及相关产品
Thomason et al. Context trees: Augmenting geospatial trajectories with context
Neto et al. Prediction of Destinations and Routes in Urban Trips with Automated Identification of Place Types and Stay Points.
Straub et al. Learning from experts: Inferring road popularity from GPS trajectories
CN111444299A (zh) 基于地址树模型的中文地址提取方法
CN116842123B (zh) 搬迁位置预测方法、地图更新方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240219

Address after: 1003, Building A, Zhiyun Industrial Park, No. 13 Huaxing Road, Henglang Community, Dalang Street, Longhua District, Shenzhen City, Guangdong Province, 518000

Patentee after: Shenzhen Wanzhida Technology Transfer Center Co.,Ltd.

Country or region after: China

Address before: 212013 No. 301, Xuefu Road, Zhenjiang, Jiangsu

Patentee before: JIANGSU University

Country or region before: China

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240612

Address after: Room 1210, 12th Floor, Building 10, Courtyard 1, Tianxing Street, Fangshan District, Beijing, 102400

Patentee after: Beijing Mengxiong Digital Technology Co.,Ltd.

Country or region after: China

Address before: 1003, Building A, Zhiyun Industrial Park, No. 13 Huaxing Road, Henglang Community, Dalang Street, Longhua District, Shenzhen City, Guangdong Province, 518000

Patentee before: Shenzhen Wanzhida Technology Transfer Center Co.,Ltd.

Country or region before: China

TR01 Transfer of patent right