CN112738715A - 一种基于GloVe模型的移动信令轨迹相关性表示方法 - Google Patents
一种基于GloVe模型的移动信令轨迹相关性表示方法 Download PDFInfo
- Publication number
- CN112738715A CN112738715A CN202110054499.4A CN202110054499A CN112738715A CN 112738715 A CN112738715 A CN 112738715A CN 202110054499 A CN202110054499 A CN 202110054499A CN 112738715 A CN112738715 A CN 112738715A
- Authority
- CN
- China
- Prior art keywords
- grid
- mobile terminal
- signaling
- sequence
- base station
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000011664 signaling Effects 0.000 title claims abstract description 100
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000012546 transfer Methods 0.000 claims abstract description 41
- 239000013604 expression vector Substances 0.000 claims abstract description 22
- 238000013507 mapping Methods 0.000 claims abstract description 17
- 230000000694 effects Effects 0.000 claims abstract description 15
- 239000013598 vector Substances 0.000 claims abstract description 8
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 238000012512 characterization method Methods 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims abstract description 5
- 239000011159 matrix material Substances 0.000 claims description 13
- 230000007704 transition Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 8
- 238000009499 grossing Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000001413 cellular effect Effects 0.000 claims description 4
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 230000001788 irregular Effects 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 206010035664 Pneumonia Diseases 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/021—Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/025—Services making use of location information using location based information parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W8/00—Network data management
- H04W8/18—Processing of user or subscriber data, e.g. subscribed services, user preferences or user profiles; Transfer of user or subscriber data
- H04W8/183—Processing at user equipment or user record carrier
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
一种基于GloVe模型的移动终端信令轨迹相关性表示方法,属于基于位置的服务领域,方法包括以下步骤:采集移动终端信令数据,通过数据预处理消减重复、乒乓、漂移等噪声效应;构建位置网格映射表,将预处理后的位置点映射为网格编号,得到不同移动终端的网格转移序列;以网格转移序列集作为语料库训练GloVe模型,求出每个网格编号的嵌入表征向量,并基于时长加权平均计算任意网格序列的嵌入表达向量,用以表示不同移动终端的时空行为模式;计算目标网格序列与候选网格序列的嵌入表达向量的余弦相似度或明氏距离相似度,并根据相似度得分评估网格转移序列之间的相关性。结果表明本方法能够更好地捕捉到移动终端信令轨迹的相关性。
Description
技术领域
本发明属于基于位置的服务(Location Based Services,LBS)领域,具体涉及一种基于GloVe模型的移动终端信令轨迹相关性表示方法。
背景技术
移动终端信令数据是一种人类电子足迹数据,其中蕴含着丰富的时空信息,通过分析移动终端信令数据,可以发现移动对象的行为特性、活动规律、兴趣偏好等时空模式,进而为基于位置的服务提供支持。常见的基于移动终端信令的位置服务包括:重点人群监测、公共安全、靶向预警、商业选址、城市空间品质分析、交通规划与路网优化等。
移动终端信令数据的采集依托三大运营商建立的信令监测平台,记录了手机与基站之间的信令数据交换;触发信令数据交换有两种方式,一是通话、短信、上网、区间切换等主动行为,形成的主动信息记录;二是基站定期扫描其覆盖范围内移动终端的在线情况,形成的被动信息记录;信令数据具有全天候、全覆盖、海量性、持续性、低成本等特点。每条信令数据包含了移动终端编号、信令发生时间、基站信息(位置区码、蜂窝小区编号、经纬度坐标)和触发事件代码等字段;通过与基站位置的地理信息关联,就可以构成每一个移动终端的时空活动轨迹;因此,基于移动终端信令轨迹分析人群的时空分布特征和时空流动模式,一直是轨迹数据挖掘研究中的热点,得到了业界众多研究者的广泛关注。
实际的移动通信***处于复杂电磁环境下,由此造成移动终端的时空活动轨迹与基站位置之间普遍存在大量的误差和噪声数据;主要表现形式有:1)重复;根据用户的时空活动规律,会在诸如家庭、工作地及休闲场所等长时间停留,并随之产生大量的重复信令数据;2)乒乓;若用户处于相邻蜂窝小区的交界处,两基站信号强度相当,易导致移动终端信令在两基站间来回快速切换;3)漂移;在某些特殊情况下,移动终端信令会突然从临近的基站切换到相对较远的宏基站;4)固有偏差;由于基站的信号覆盖效应,导致基站位置与移动终端真实位置存在较大的固有偏差:城区内偏差100~500米,郊区偏差可能超过1km,对于配备拉远站的基站而言,偏差最远可达10km以上;如何有效消减移动终端信令中的误差和噪声,是进行轨迹相关性分析的必要前提条件。
轨迹相关性分析是挖掘人群时空流动模式的关键技术之一;已有的典型轨迹相关性分析技术主要包括:最长公共子序列(Longest Common Subsequence,LCS)、动态时间调整(Dynamic Time Warping,DTW)、最大共现时间(Maximum Co-occurrence Time,MCT)等;上述方法数据处理的时间复杂度较高,重点关注的是不同轨迹点序列在空间上的重合程度,但无法有效度量在人群时空流动模式中具有高度相关、且重合度较低的轨迹段之间的相关性。如何有效度量移动终端信令轨迹的相关性是一个悬而未决的问题。
发明内容
为解决移动终端信令轨迹相关性的有效度量问题,本发明提供了一种基于GloVe模型的移动终端信令轨迹相关性表示方法,该方法包括。
步骤1采集移动终端信令数据,通过数据预处理消减重复、乒乓、漂移等噪声效应。
步骤2构建位置网格映射表,将移动终端信令序列转换为网格转移序列,构建网格转移序列集。
步骤3基于网格转移序列集,训练GloVe模型,得到网格嵌入矩阵,并基于时长加权平均计算出任意网格转移序列的嵌入表达向量。
步骤4计算任意两段网格转移序列的嵌入表达向量的相似度,得到移动终端信令轨迹的相关性。
在上述技术方案中,所述步骤1包括。
步骤1.1采集在重点关注区域出现的移动终端的信令数据,持续时长不少于2个月,信令数据中包括六个基本字段信息:移动终端编号、信令发生时间、位置区码、蜂窝小区编号、基站经度坐标、基站纬度坐标。
步骤1.2整行删除信息不完整的信令数据。根据移动终端编号,对每个移动 终端的信令按照时间先后排序,得到每个移动终端的信令序列,移动终端j的信 令序列记为Sj:
Sj={(tj,0,lngj,0,latj,0),…,(tj,k,lngj,k,latj,k),…}
其中,tj,k,lngj,k,latj,k分别为信令发生时间,基站经度坐标、基站纬度坐标。
步骤1.3基于滑动时间窗口W1对移动终端信令序列进行平滑处理,窗口宽度 为TW,滑动偏移量为TS,即分别对时间窗内的信令序列的信令发生时间、基站 经度坐标、基站纬度坐标求均值,得到平滑处理后的移动终端信令序列。其目 的是消减由于复杂电磁环境引起的重复、乒乓、漂移等噪声效应,平滑处理后 的移动终端j的信令序列记为
在上述技术方案中,所述步骤2包括:
步骤2.1构建位置网格映射表。将移动终端信令序列中的轨迹点映射到具有 一定空间覆盖度的网格,其目的是在一定程度上减小基站的信号覆盖效应带来 的固有偏差,有效压缩位置变量的分布空间。分为两种情形:在城区内,基站 部署密度高,采用半径r米的正六边形蜂窝网格覆盖;在郊区,基站部署密度相 对较低,利用DBSCAN聚类算法将基站覆盖位置合并为较大尺度的不规则网格 覆盖。在构建的位置网格映射表中,网格总数为N,网格Gi记为:
Gi=(center_lngi,center_lati)
其中center_lngi,center_lati分别表示网格中心的经度坐标和纬度坐标。
步骤2.2将移动终端信令序列转换为网格转移序列,构建网格转移序列集。 根据位置网格映射表,将平滑处理后的移动终端信令序列中每个轨迹点,基于 最近邻原则映射为最近的网格Gi。计算公式为:
在上述技术方案中,所述步骤3包括:
步骤3.1基于预定义网格宽度窗口W2,遍历所有网格转移序列,构建网格共 现矩阵C,其中N为网格总数,元素ci,j表示在所有网格转移集中,网格j出现在以 网格i为中心的网格宽度窗口W2内的次数:
其中,vi,vj的长度为嵌入维度E,权重函数f(ci,j)的形式为:
步骤3.3对于任意长度网格转移序列的嵌入表达向量,计算出不同网格的权 重。不妨设网格转移序列的长度为K+1,则前K个网格的时长权重计算公式为:
从而,可以计算出任意网格转移序列的嵌入表达向量,其长度为嵌入维度E。
在上述技术方案中,所述步骤4包括:
计算任意两段网格转移序列的嵌入表达向量vS1,vS2的余弦相似度:
或者明氏距离相似度:
当p=1时是曼哈顿距离,p=2时是欧氏距离,p为无穷大时是切比雪夫距离;最终计算得到的相似度,即为移动终端信令轨迹的相关性。
本发明方法具有以下优点。
(1)通过数据预处理消减移动终端信令中的误差和噪声,通过位置网格映射表和不同网格的权重兼顾到不同区域的重要性差异。
(2)利用深度学习中的序列嵌入技术,建立了可稳定描述人群时空流动模式的网格嵌入表达向量,通过计算向量之间的相似度,从而有效度量在人群时空流动模式中具有高度相关、且重合度较低的轨迹段之间的相关性。
附图说明
图1为本发明的流程图。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,以下结合实施例及附图对本发明作具体阐述。
本实施例中,以陕西省为考察范围,以西安市为重点关注区域,其中北纬取值范围[108.721227°N, 109.140915°N],东经取值范围[34.150732°E, 34.481805°E],涉及到基站数量约为4.98万。
步骤1采集移动终端信令数据,通过数据预处理消减重复、乒乓、漂移等噪声效应。
步骤1.1在2020.04.28–2020.07.27期间,从重点关注区域内出现的所有移动终端中随机选取1000个移动终端,采集到原始信令数据共计24460511条,每条原始信令数据中包括六个基本字段信息:移动终端编号、信令发生时间、位置区码、蜂窝小区编号、基站经度坐标、基站纬度坐标。
步骤1.2 整行删除信息不完整的信令数据;对每个移动终端的信令按照时间先后排序,得到1000个移动终端的信令序列,其中包括18399807条信令数据。
步骤1.3基于滑动时间窗口W1对移动终端信令序列进行平滑处理,窗口宽度 为TW=5min,滑动偏移量为TS=5min,消减重复、乒乓、漂移等噪声效应,得到 平滑处理后的1000个移动终端信令序列,其中包括5028828条数据。
步骤2构建位置网格映射表,将移动终端信令序列转换为网格转移序列, 构建网格转移序列集。
步骤2.1构建位置网格映射表。对西安市重点关注区域采用半径为300米的 正六边形蜂窝网格覆盖,陕西省内其他区域采用DBSCAN算法对基站进行聚类, 合并构成不规则网格,并计算各网格中心点经纬度坐标,构建地理空间网格映 射表,共得到5943个网格。
步骤2.2将1000条移动终端信令序列转换为1000条网格转移序列,其中网格 索引号取值范围[1,5943]。
步骤3基于网格转移序列集,训练GloVe模型,得到网格嵌入矩阵,并基于 时长加权平均计算出任意网格转移序列的嵌入表达向量。
步骤3.1基于预定义网格宽度窗口W2=3,遍历所有网格转移序列,构建网 格共现矩阵C5943×5943,其中5943为网格总数:
步骤3.2采用随机梯度下降法训练GloVe模型,其中学习率取0.01,循环次 数取50,得到5943个网格的嵌入表征向量表征向量长度为嵌入维度E=60, 网格嵌入矩阵为GridE=(v1,v2,…,v5943)T。
移动终端26:截取时间段2020-06-05 07:00:00~2020-06-05 09:00:00,发生的移
动信令数据,经过上述步骤处理,得到的网格转移序列长度26(K=25),时间段、网格编号、网
格权重如表1所示。
时间段 | 网格编号 | 网格权重 |
2020-06-05 07:02:09 | 2118 | 0.028879 |
2020-06-05 07:05:38 | 4920 | 0.026392 |
2020-06-05 07:08:49 | 4920 | 0.03565 |
2020-06-05 07:13:07 | 4857 | 0.076137 |
2020-06-05 07:22:18 | 1990 | 0.038137 |
2020-06-05 07:26:54 | 2054 | 0.011469 |
2020-06-05 07:28:17 | 4975 | 0.075307 |
2020-06-05 07:37:22 | 4920 | 0.078762 |
2020-06-05 07:46:52 | 4920 | 0.020312 |
2020-06-05 07:49:19 | 2055 | 0.071991 |
2020-06-05 07:58:00 | 4920 | 0.027774 |
2020-06-05 08:01:21 | 4858 | 0.037032 |
2020-06-05 08:05:49 | 4857 | 0.044355 |
2020-06-05 08:11:10 | 4920 | 0.039381 |
2020-06-05 08:15:55 | 2054 | 0.013542 |
2020-06-05 08:17:33 | 4858 | 0.051541 |
2020-06-05 08:23:46 | 1992 | 0.027359 |
2020-06-05 08:27:04 | 2055 | 0.022938 |
2020-06-05 08:29:50 | 4917 | 0.019621 |
2020-06-05 08:32:12 | 4796 | 0.049883 |
2020-06-05 08:38:13 | 2055 | 0.031228 |
2020-06-05 08:41:59 | 4920 | 0.039243 |
2020-06-05 08:46:43 | 4920 | 0.021418 |
2020-06-05 08:49:18 | 4920 | 0.032887 |
2020-06-05 08:53:16 | 2054 | 0.031367 |
2020-06-05 08:57:03 | 2054 | 0.047395 |
表1。
移动终端783:截取时间段2020-06-05 07:00:00~2020-06-05 09:00:00,发生的
移动信令数据,经过上述步骤处理,得到的网格转移序列长度7(K=6),时间段、网格编号、网
格权重如表2所示。
时间段 | 网格编号 | 网格权重 |
2020-06-05 07:59:38 | 4236 | 0.038804 |
2020-06-05 08:02:06 | 4231 | 0.118773 |
2020-06-05 08:09:39 | 4224 | 0.380440 |
2020-06-05 08:33:50 | 4224 | 0.064499 |
2020-06-05 08:37:56 | 1348 | 0.252229 |
2020-06-05 08:53:58 | 4224 | 0.058731 |
2020-06-05 08:57:42 | 4221 | 0.086523 |
表2。
步骤3.4结合网格嵌入矩阵GridE=(v1,v2,…,v5943)T和网格的时长权重 基于时长加权平均计算出所有移动终端的网格转移序列的嵌入表达向 量,其长度为嵌入维度60。以移动终端26和移动终端783为例说明。
移动终端26的嵌入表达向量vS26:
[-0.00020927,0.0005792,0.00108622,-0.00021015,0.00035025,0.00206338,-0.00071861,0.00079705,0.00095549,-0.00046904,-0.00033171,0.00019991, -0.00267957,-0.00022226,0.00060844,-0.00099018,0.00079124,0.00047156,0.0005128,0.00117441,0.00150647,0.00094499,-0.00073751,0.00041739,0.00053622,0.00127249,-0.0000979,-0.0005511,-0.00181473,-0.00073599,0.0002963,0.00296922,0.0002236,0.00091548,0.00099559,0.00014784, -0.00149617,-0.00043373,0.00155126,0.00248556,-0.00134076,0.000708,0.00089196,-0.00258728,-0.00002522,0.00140396,0.00229813,-0.00048293, -0.00257826,-0.00169406,0.00114152,0.00079931,0.00029694,0.00242982,0.00029111,0.00207249,-0.00048036,0.00004665,-0.00096276,0.00080228]
移动终端783的嵌入表达向量vS783:
[-0.0189999,-0.01547875,0.01674357,-0.01750407,-0.01475298,-0.0166625, -0.01494532,-0.01893303,-0.01883285,-0.02159209,-0.01536785,0.02052424, -0.01685914,0.00248955,-0.01544047,0.01593026,-0.01451739,0.02144702, -0.02334099,0.02293941,-0.0157658,-0.0204249,-0.01050173,0.01945252, -0.00637136,0.019781,-0.01715144,-0.0187027,-0.0249627,-0.0205044, -0.00369801,0.01847215,0.00211256,0.01425333,0.00132631,-0.01805688, -0.01416264,-0.0133448,0.00601273,0.01707013,-0.02354686,0.02062726, -0.01795361,-0.02283511,0.01576922,0.02252061,0.01794986,0.01885057, -0.02360203,-0.02326177,0.01407123,-0.01934529,0.0203213,0.01772783, -0.00210585,0.02257319,0.01158342,0.01890588,-0.01973429,-0.02269858]
步骤4计算任意两段网格转移序列的嵌入表达向量的相似度,得到移动终 端信令轨迹的相关性。以移动终端26和移动终端783为例说明。
两个向量vS26、vS783的余弦相似度为:
两个向量vS26、vS783的明氏距离相似度为:
当p=1时是曼哈顿距离,p=2时是欧氏距离,p为无穷大时是切比雪夫距离。 最终通过对相似度大小的分析,就可以判断移动终端轨迹vS26、vS783的相关性弱。
综上所述,本发明的基于GloVe模型的移动终端信令轨迹相关性表示方法,通过数据预处理消减移动终端信令中的误差和噪声,通过位置网格映射表和不同网格的权重兼顾到不同区域的重要性差异,通过序列嵌入技术可稳定描述人群时空流动模式,通过相似度计算可有效度量移动终端信令轨迹的相关性,使得属性相似的移动终端信令轨迹尽可能地聚在一起,从而提高了匹配效率,保证基于移动终端信令的位置服务应用中的时间复杂性要求,包括重点人群监测、公共安全、靶向预警、商业选址、城市空间品质分析、交通规划与路网优化等。
风险提示:本发明为基于历史信令数据对移动终端信令轨迹相关性的研究,当社会重大事件发生,例如新冠肺炎疫情、国庆七天长假,需要对位置网格映射表和网格共现矩阵进行重构,否则可能会使得模型失效。
Claims (5)
1.一种基于GloVe模型的移动终端信令轨迹相关性表示方法,其特征在于,包括:
步骤1采集移动终端信令数据,通过数据预处理消减重复、乒乓、漂移等噪声效应;
步骤2构建位置网格映射表,将移动终端信令序列转换为网格转移序列,构建网格转移序列集;
步骤3基于网格转移序列集,训练GloVe模型,得到网格嵌入矩阵,并基于时长加权平均计算出任意网格转移序列的嵌入表达向量;
步骤4计算任意两段网格转移序列的嵌入表达向量的相似度,得到移动终端信令轨迹的相关性。
2.根据权利要求1所述基于GloVe模型的移动终端信令轨迹相关性表示方法,其特征在于,所述步骤1包括:
步骤1.1采集在重点关注区域出现的移动终端的信令数据,持续时长不少于2个月,信令数据中包括六个基本字段信息:移动终端编号、信令发生时间、位置区码、蜂窝小区编号、基站经度坐标、基站纬度坐标;
步骤1.2整行删除信息不完整的信令数据,根据移动终端编号,对每个移动终端的信令按照时间先后排序,得到每个移动终端的信令序列,移动终端j的信令序列记为Sj:
Sj={(tj,0,lngj,0,latj,0),…,(tj,k,lngj,k,latj,k),…}
其中,tj,k,lngj,k,latj,k分别为信令发生时间,基站经度坐标、基站纬度坐标;
步骤1.3基于滑动时间窗口W1对移动终端信令序列进行平滑处理,窗口宽度为TW,滑动偏移量为TS,即分别对时间窗内的信令序列的信令发生时间、基站经度坐标、基站纬度坐标求均值,得到平滑处理后的移动终端信令序列,其目的是消减由于复杂电磁环境引起的重复、乒乓、漂移等噪声效应,平滑处理后的移动终端j的信令序列记为
3.根据权利要求1所述基于GloVe模型的移动终端信令轨迹相关性表示方法,其特征在于,所述步骤2包括:
步骤2.1构建位置网格映射表,将移动终端信令序列中的轨迹点映射到具有一定空间覆盖度的网格,其目的是在一定程度上减小基站的信号覆盖效应带来的固有偏差,有效压缩位置变量的分布空间,分为两种情形:在城区内,基站部署密度高,采用半径r米的正六边形蜂窝网格覆盖;在郊区,基站部署密度相对较低,利用DBSCAN聚类算法将基站覆盖位置合并为较大尺度的不规则网格覆盖,在构建的位置网格映射表中,网格总数为N,网格Gi记为:
Gi=(center_lngi,center_lati)
其中center_lngi,center_lati分别表示网格中心的经度坐标和纬度坐标;
步骤2.2将移动终端信令序列转换为网格转移序列,构建网格转移序列集,根据位置网格映射表,将平滑处理后的移动终端信令序列中每个轨迹点,基于最近邻原则映射为最近的网格Gi,计算公式为:
4.根据权利要求1所述基于GloVe模型的移动终端信令轨迹相关性表示方法,其特征在于,所述步骤3包括:
步骤3.1基于预定义网格宽度窗口W2,遍历所有网格转移序列,构建网格共现矩阵C,其中N为网格总数,元素ci,j表示在所有网格转移集中,网格j出现在以网格i为中心的网格宽度窗口W2内的次数:
其中,vi,vj的长度为嵌入维度E,权重函数f(cij)的形式为:
步骤3.3对于任意长度网格转移序列的嵌入表达向量,计算出不同网格的权重。不妨设网格转移序列的长度为K+1,则前K个网格的时长权重计算公式为:
从而,可以计算出任意网格转移序列的嵌入表达向量,其长度为嵌入维度E。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110054499.4A CN112738715A (zh) | 2021-01-15 | 2021-01-15 | 一种基于GloVe模型的移动信令轨迹相关性表示方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110054499.4A CN112738715A (zh) | 2021-01-15 | 2021-01-15 | 一种基于GloVe模型的移动信令轨迹相关性表示方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112738715A true CN112738715A (zh) | 2021-04-30 |
Family
ID=75591639
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110054499.4A Pending CN112738715A (zh) | 2021-01-15 | 2021-01-15 | 一种基于GloVe模型的移动信令轨迹相关性表示方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112738715A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113378891A (zh) * | 2021-05-18 | 2021-09-10 | 东北师范大学 | 基于轨迹分布表示的城市区域关系可视分析方法 |
CN114245312A (zh) * | 2021-11-10 | 2022-03-25 | 陕西省信息化工程研究院 | 一种基于双分支lstm融合的移动终端轨迹预测方法 |
-
2021
- 2021-01-15 CN CN202110054499.4A patent/CN112738715A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113378891A (zh) * | 2021-05-18 | 2021-09-10 | 东北师范大学 | 基于轨迹分布表示的城市区域关系可视分析方法 |
CN114245312A (zh) * | 2021-11-10 | 2022-03-25 | 陕西省信息化工程研究院 | 一种基于双分支lstm融合的移动终端轨迹预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109743683B (zh) | 一种采用深度学习融合网络模型确定手机用户位置的方法 | |
CN106792465B (zh) | 一种基于众包指纹的室内指纹地图构建方法 | |
CN104239556A (zh) | 基于密度聚类的自适应轨迹预测方法 | |
CN107027148B (zh) | 一种基于UE速度的Radio Map分类定位方法 | |
CN105636201B (zh) | 基于稀疏信号指纹数据库的室内定位方法 | |
CN105243844A (zh) | 一种基于手机信令的道路状态识别方法 | |
CN112738715A (zh) | 一种基于GloVe模型的移动信令轨迹相关性表示方法 | |
CN103634902B (zh) | 基于指纹聚类的新型室内定位方法 | |
JP2000092556A (ja) | パタ―ン認識ベ―スの地理位置識別 | |
CN109511085B (zh) | 一种基于MeanShift和加权k近邻算法的UWB指纹定位方法 | |
CN106793085A (zh) | 基于正态假设检验的指纹定位方法 | |
CN115082250B (zh) | 个体移动与生态空间的网络关系分析方法、装置及终端 | |
CN110213710A (zh) | 一种基于随机森林的高性能室内定位方法、室内定位*** | |
CN106597370A (zh) | 一种基于rfid的室内无线定位方法 | |
Wainer et al. | Machine learning-based indoor localization and occupancy estimation using 5G ultra-dense networks | |
Ji et al. | A novel Wi-Fi AP localization method using Monte Carlo path-loss model fitting simulation | |
Talvitie et al. | Modeling received signal strength measurements for cellular network based positioning | |
CN109672986A (zh) | 一种时空大数据分析*** | |
CN103476113A (zh) | 基于mnl概率辨识室内定位***及方法、定位模型建立*** | |
CN108414905A (zh) | 基于流形距离近邻传播聚类的变压器局部放电识别方法 | |
Arya et al. | A hierarchical clustering technique for radio map compression in location fingerprinting systems | |
CN106922017A (zh) | 定位方法以及终端 | |
Assayag et al. | Indoor positioning system using synthetic training and data fusion | |
CN113947123B (zh) | 人员轨迹识别方法、***、存储介质和设备 | |
Tian et al. | A novel approach to estimate human space-time path based on mobile phone call records |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210430 |