CN112733112A - 一种用户出行方式的确定方法、装置、电子设备和存储介质 - Google Patents
一种用户出行方式的确定方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN112733112A CN112733112A CN202011636054.9A CN202011636054A CN112733112A CN 112733112 A CN112733112 A CN 112733112A CN 202011636054 A CN202011636054 A CN 202011636054A CN 112733112 A CN112733112 A CN 112733112A
- Authority
- CN
- China
- Prior art keywords
- user
- sequence
- roaming
- fingerprint
- travel mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000004891 communication Methods 0.000 claims abstract description 36
- 230000002776 aggregation Effects 0.000 claims description 21
- 238000004220 aggregation Methods 0.000 claims description 21
- 230000007781 signaling event Effects 0.000 claims description 19
- 238000000605 extraction Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 238000009792 diffusion process Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/02—Reservations, e.g. for tickets, services or events
- G06Q10/025—Coordination of plural reservations, e.g. plural trip segments, transportation combined with accommodation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
- G06Q10/063114—Status monitoring or status determination for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Computer Security & Cryptography (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种用户出行方式的确定方法、装置、电子设备和存储介质,包括:根据通信位置话单获取漫入用户进入指定区域后指定时间范围内的用户位置序列;获取位置特征区域数据集;根据位置特征区域数据集从漫入用户的用户位置序列中提取序列指纹;根据每个漫入用户的序列指纹创建指纹库;将待测用户的序列指纹与指纹库进行匹配,以确定待测用户的出行方式。通过通信位置话单就可以获取漫入用户的序列指纹,并根据每个漫入用户的序列指纹创建指纹库,将待测用户的序列指纹与所创建的指纹库进行匹配,从而准确高效的确定出用户的出行方式。
Description
技术领域
本发明实施例涉及数据处理处理技术领域,尤其涉及一种用户出行方式的确定方法、装置、电子设备和存储介质。
背景技术
随着经济全球化的发展,全球各国家和国内各省份、城市间的人员流动越来越频繁,特别是重大节日或者有重大活动举办期间,人员的快速涌入会对城市管理者造成一定困扰。因此城市管理者比较关心每天进入城市的人员的出行方式,例如,汽车、火车、飞机或轮船,以便有效地规划和分配城市的交通运力,快速将进入城市的人流从聚集地有效进行分散。传统的对人员出行方式的识别包括:第一种方式,在道路上安装大量的摄像头等传感器设备,采集交通路面的图像数据,通过图像分析识别用户乘坐的交通工具类型;以及第二种方式,依赖于各交通站点在乘客到达后的事后上报。
但是采用第一种方式,通常需要在前期进行大量的设备投入,在后期还需要大量的维护成本,并且受雨雪等天气因素的影响,图像识别的准确性、覆盖率和时效性都会受影响,从而降低出行方式确定的准确率;而采用第二种方式,通常实时性不够,效率较低,容易造成主要交通枢纽的拥堵和混乱。因此现有的用人员出行方式的识别方式并不能满足用户的实际需求。
发明内容
本发明实施例提供了一种用户出行方式的确定方法、装置、电子设备和存储介质。以实现准确高效的确定用户的出行方式。
第一方面,本发明实施例提供了一种用户出行方式的确定方法,包括:根据通信位置话单获取漫入用户进入指定区域后指定时间范围内的用户位置序列,其中,用户位置序列中包括用户标识、时间、经纬度、基站标识和事件类型;
获取位置特征区域数据集,其中,位置特征区域数据集中包括区域类型和区域经纬度的对应关系;
根据位置特征区域数据集从漫入用户的用户位置序列中提取序列指纹,其中,序列指纹包括:基站数量、移动速度、速度平稳度、各区域类型的特征点数量、特殊信令事件次数和时空聚集度;
根据每个漫入用户的序列指纹创建指纹库;
将待测用户的序列指纹与指纹库进行匹配,以确定待测用户的出行方式。
第二方面,本发明实施例提供了一种用户出行方式的确定装置,包括:用户位置序列获取模块,用于根据通信位置话单获取漫入用户进入指定区域后指定时间范围内的用户位置序列,其中,用户位置序列中包括用户标识、时间、经纬度、基站标识和事件类型;
位置特征区域数据集获取模块,用于获取位置特征区域数据集,其中,位置特征区域数据集中包括区域类型和区域经纬度的对应关系;
序列指纹提取模块,用于根据位置特征区域数据集从漫入用户的用户位置序列中提取序列指纹,其中,序列指纹包括:基站数量、移动速度、速度平稳度、各区域类型的特征点数量、特殊信令事件次数和时空聚集度;
指纹库创建模块,用于根据每个漫入用户的序列指纹创建指纹库;
出行方式确定模块,用于将待测用户的序列指纹与指纹库进行匹配,以确定待测用户的出行方式。
第三方面,本发明实施例还提供了一种电子设备,电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现本发明任意实施例的方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例的方法。
在本发明实施例中,通过通信位置话单就可以获取漫入用户的序列指纹,并根据每个漫入用户的序列指纹创建指纹库,将待测用户的序列指纹与所创建的指纹库进行匹配,从而准确高效的确定出用户的出行方式。
附图说明
图1是本发明实施例一提供的用户出行方式的确定方法的流程图;
图2是本发明实施例二提供的用户出行方式的确定方法的流程图;
图3是本发明实施例三提供的用户出行方式的确定装置结构示意图;
图4是本发明实施例四提供的一种电子设备的结构框图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例提供的用户出行方式的确定方法的流程图,本实施例可适用于对城市漫入用户出行方式进行确定的情况。该方法可以由本发明实施例中的数据入库装置来执行,该装置可以通过软件和/或硬件的方式实现,本发明实施例的方法具体包括如下步骤:
步骤S101,根据通信位置话单获取漫入用户进入指定区域后指定时间范围内的用户位置序列,其中,用户位置序列中包括用户标识、时间、经纬度、基站标识和事件类型。
可选的,根据通信位置话单获取漫入用户进入指定区域后指定时间范围内的用户位置序列之前,还包括:从通信位置话单中确定进入指定区域的漫入用户。
具体的说,本实施方式中会获取从运营商通信网络所采集的指定城市的通信位置话单,在通信位置话单中包括:用户标识、时间、用户所在位置、基站标识、经纬度、事件类型、漫游类型和漫游方向。其中,用户标识主要用于区分不同的用户,具体可以是手机号码、国际移动设备识别码(International Mobile Equipment Identity,IMEI)或国际移动用户识别码(International Mobile Subscriber Identity,IMSI)。事件类型包括:呼叫、短信发送、开机、关机、位置更新和切换等,事件类型通常与用户的出行方式有一定的关联,例如,在飞机起飞前用户的关机行为一般会产生关机信令。漫游类型包括:省内漫游、省际漫游、国际漫游和无漫游;漫游方向包括:漫入和漫出,漫入指的是在其它城市进行注册,但进入指定城市,而漫出指的是在指定城市注册,但离开指定城市。
可选的,从通信位置话单中确定进入指定区域的漫入用户,包括:根据漫游类型和漫游方向从通信位置话单中确定进入指定区域的漫入用户。
具体的说,由于本申请重点关注的是进入指定城市的用户,即漫入用户的出行方式,因此需要从通信位置话单中进行筛选,锁定在某个时间段进入指定城市的用户,例如,在确定早晨8点至9点时间段内进入指定城市的漫入用户时,将通信位置话单中漫游类型为无漫游的用户记录进行删除,同时将漫游方向为漫出的用户记录进行删除,并获取删除上述记录之后通信位置话单中所包含的用户标识和时间,并根据用户标识确定进入指定区域的漫入用户。
其中,在确定并锁定漫入用户之后,根据漫入用户标识和时间,从通信位置话单中获取漫入用户漫入后指定时间范围内的用户位置序列,并且每一个用户位置序列S=[用户标识,时间,经纬度、基站标识,事件类型]。如下表1所示为一个漫入用户的用户位置序列:
表1
其中,在表1中事件类型以代码的形式进行表示,1表示呼叫,2表示开机、3表示关机,当然,本实施方式中仅是举例说明,而并不对每个事件类型所对应的具体代码形式进行限定。并且由于篇幅限制,表1中仅是对用户标识为1300000000的用户位置序列所对应的数据进行部分展示,由于所确定的漫入用户为多个,而针对每个漫入用户都会对应一个用户位置序列,结构与用户标识1300000000所对应的用户位置序列大致相同,本实施方式中不再对其他漫入用户的用户位置序列进行赘述。
步骤S102,获取位置特征区域数据集,其中,位置特征区域数据集中包括区域类型和区域经纬度的对应关系。
其中,位置特征区域是标识漫入用户进入指定区域所必经的一些重要线路的位置区域,具体可以采用自动圈选工具,选择城市和关键字进行搜索,使用预定形状,例如矩形在地图上连续圈选一些区域,并通过导出圈选区域的经纬度坐标以获取位置特征区域数据集。而在位置特征区域数据集中包括区域类型和区域经纬度的对应关系,并且区域类型包括:机场、铁路、高速、国道和航道。如下表2所示为所获取的位置特征区域数据集的示意:
表2
其中,由于在采用自动圈选工具进行圈选时,所使用的预定形状为矩形,有四个顶点,因此在表2中每个区域类型所对应的区域经纬度中主要包含所圈选矩形区域的四个顶点的坐标位置,通过四个顶点的坐标位置确定每个区域类型的范围。表2中是以一个区域类型对应一个圈选的矩形区域为例进行的说明,当然在实际应用中一个区域类型还可以对应多个圈选的矩形区域。
步骤S103,根据位置特征区域数据集从漫入用户的用户位置序列中提取序列指纹。
具体的说,在获取每个漫入用户的用户位置序列S=[用户标识,时间,经纬度、基站标识,事件类型]之后,还会从位置序列中提取序列指纹,序列指纹包括:基站数量、移动速度、速度平稳度、各区域类型的特征点数量、特殊信令事件次数和时空聚集度。其中,基站数量是每个漫入用户进入指定区域后指定时间范围内统计所获取的基站数量。移动速度表示漫入用户在指定时间范围内所移动的平均速度,可以用于衡量漫入用户所采用的出行工具,通常飞机高于火车,火车高于汽车。速度平稳度用于衡量漫入用户出行工具的稳定性,一般火车稳定性高于汽车。在确定各区域类型的特征点数量时,利用到了上述所获取的位置特征区域数据集,主要是用于确定漫入用户在每个时刻的位置点在每个区域类型内的数量。某些事件类型在特定出行方式下出现的概率比较高,例如,飞机起飞前关机,降落后开机,因此将开机、关机、位置更新等事件类型作为特殊信令事件,并通过对用户位置序列进行统计确定每个用户的特殊信令事件次数。时空聚集度主要是确定用户漫入后在某个时间点漫入用户周围的其他用户数量,并将周围其他用户数量作为时空聚集度,时空聚集度用于衡量某个时间点某个位置用户聚集的程度,并且通常飞机中用户的聚集度要大于汽车中用户的聚集度,公共汽车中用户的聚集度要大于私家车中用户的聚集度。从而根据上述所提取的每个特征构成漫入用户的序列指纹f=[基站数量,移动速度,速度平稳度,各区域类型的特征点数量,特殊信令事件次数,时空聚集度]。例如,针对用户标识为1300000000的漫入用户,根据表2的位置特征区域数据集从表1的用户位置序列中进行提取,所获取的该漫入用户的序列指纹f=[基站数量:4,移动速度:100km/h,速度平稳度:20,各区域类型的特征点数量:高速-60国道-40,特殊信令事件次数:关机-2切换-20,时空聚集度:3]。
步骤S104,根据每个漫入用户的序列指纹创建指纹库。
可选的,根据每个漫入用户的序列指纹创建指纹库,可以包括:对每个漫入用户的序列指纹进行聚类获得多个聚类簇,以及每个聚类簇所对应的特征值;根据用户的标记指令对每个聚类簇的出行方式进行标记,以创建指纹库,其中,指纹库中包含每个聚类簇的特征值与出行方式的对应关系。
具体的说,在获取每个漫入用户的序列指纹后,可以对每个漫入用户的序列指纹进行归一化,并通过K-Means聚类算法对归一化后的序列指纹进行聚类,由于关于K-Means聚类算法的具体原理并不是本申请的重点,因此本实施方式中不再进行赘述。在经过聚类后可以获得多个聚类簇,每个聚类簇中包含多个漫入用户的序列指纹,并且位于同一聚类簇中的漫入用户通常具有相近的出行方式。在获得多个聚类簇之后,计算每个聚类簇中多个漫入用户的序列指纹的平均值,并将平均值作为聚类簇所对应的特征值。根据每个聚类簇的特征值,依据用户的标记指令对每个聚类簇的出行方式进行标记,以创建指纹库。从而在指纹库中包含每个聚类簇的特征值与出行方式的对应关系。
步骤S105,将待测用户的序列指纹与指纹库进行匹配,以确定待测用户的出行方式。
可选的,将待测用户的序列指纹与指纹库进行匹配,以获取待测用户的出行方式,可以包括:计算待测用户的序列指纹与指纹库中每个聚类簇的特征值的距离;确定最小距离所对应的匹配聚类簇;确定匹配聚类簇所对应的出行方式,并将所对应的出行方式作为待测用户的出行方式。
具体的说,本实施方式中待测用户的序列指纹与创建指纹库时获取指定时间范围内漫入用户的序列指纹方式大致相同,本实施方式中不再对其进行赘述。并且待测用户的序列指纹所获取的时间与指定时间不重叠。在确定待测用户的出行方式时,具体是计算待测用户的序列指纹与指纹库中每个聚类簇的特征值的距离,例如,确定待测用户的序列指纹为f、,数据库中包含六个聚类簇:聚类簇1的特征值为f1,所对应的出行方式为飞机;聚类簇2的特征值为f2,所对应的出行方式为高铁;聚类簇3的特征值为f3,所对应的出行方式为私家车;聚类簇4的特征值为f4,所对应的出行方式为普速火车;聚类簇5的特征值为f5,所对应的出行方式为轮船;聚类簇6的特征值为f6,所对应的出行方式为公共汽车。计算待测用户的序列指纹分别与数据库中六个聚类簇的特征值的欧式距离,并确定最小距离所对应的匹配聚类簇,在确定f、与f1的欧式距离最小时,则确定匹配聚类簇为聚类簇1,由于聚类簇1所对应的出行方式为飞机,则确定待测用户的出行方式为飞机。
在本发明实施例中,通过通信位置话单就可以获取漫入用户的序列指纹,并根据每个漫入用户的序列指纹创建指纹库,将待测用户的序列指纹与所创建的指纹库进行匹配,从而准确高效的确定出用户的出行方式。
实施例二
图2是本发明实施例提供的用户出行方式的确定方法的流程图,本实施例以上述实施例为基础,并对根据特征区域数据集从漫入用户的用户位置序列中提取序列指纹的方式进行具体说明。
如图2所示,本公开实施例的方法具体包括:
步骤S201,根据通信位置话单获取漫入用户进入指定区域后指定时间范围内的用户位置序列,其中,用户位置序列中包括用户标识、时间、经纬度、基站标识和事件类型。
步骤S202,获取位置特征区域数据集,其中,位置特征区域数据集中包括区域类型和区域经纬度的对应关系。
步骤S203,根据位置特征区域数据集从漫入用户的用户位置序列中提取基站数量、移动速度、速度平稳度、各区域类型的特征点数量、特殊信令事件次数和时空聚集度以构成序列指纹。
具体的说,以表1所示的用户位置序列为例,假设该用户位置序列对应的是用户标识为1300000000的漫入用户进入指定区域后半个小时内所获取的,并且以表1中包含100行,即包含100个时间点为例进行说明。对于第一个特征基站数量,获取方式为对表1中第五列基站标识进行统计,确定不同标识的基站数量为4。
对于第二个特征移动速度,具体是将表1中的用户位置序列按照时间进行升序排列,获取时间最小值所对应的起始位置经纬度(经度1,纬度1),以及时间最大值所对应的结束位置经纬度(经度2,纬度2),根据所确定的起始位置经纬度(经度1,纬度1)以及结束位置经纬度(经度2,纬度2)确定该漫入用户的移动距离d,由于关于根据经纬度计算两点距离的具体计算方式并不是本申请的重点,因此本实施方式中不再进行赘述。由于该用户位置序列对应的是该漫入用户进入指定区域后半个小时内所获取的,因此该漫入用户的移动时间t=30min,因此移动速度v=d/t,通过计算可以获取v=100km/h。
对于第三个特征速度平稳度,具体是将表1中的用户位置序列按照时间进行升序排列,获取最小时间和最大时间的差值Δt,设定一个时间间隔delta,通过计算Δt/delta并取整,确定分组数量,将表1中的用户位置序列按照所确定的分组数量进行顺序分段,假设分成了3段,则计算每一段内的移动速度,计算每一段内移动速度的方式与上述确定第二个特征的原理大致相同,本实施方式中不再进行赘述,假设每一段所获取的速度分别是v1、v2和v3,则计算上述三个速度的标准差,并将所计算的标准差作为速度平稳度,通过计算可以获得速度平稳度为20。
对于第四个特征各区域类型的特征点数量,需要结合步骤S202中所获取的位置特征区域数据集进行确定。针对表2中每个区域类型,例如对于高速,由于表2中第二列区域经纬度中已经限定了高速所圈选的位置区域范围,因此将表1中每个时间点下所对应的经纬度分别与高速的区域范围进行匹配,判断该时间点下所对应的经纬度是否在高速的区域范围内,若是则标记为1,否则标记为0,然后统计表1中标记为1的数量,经过统计获取高速的区域范围内的特征点数量为60。同理,可以获取国道的区域范围内的特征点数量为40。从而可以获取各区域类型的特征点数量:高速-60国道-40。
对于第五个特征特殊信令事件次数,确定将开机、关机、位置更新等事件类型作为特殊信令事件,则根据表1中的第六列进行统计,确定所有特殊信令事件次数,经过统计可以确定关机信令事件次数为2,切换信令事件次数为20,即:关机-2切换-20。
对于第六个特征时空聚集度,确定漫入用户漫入后的时间点t1,并且t1<t,例如,t=30min,t1=15min,即表1中的用户位置序列对应的是该漫入用户进入指定区域后半个小时内所获取的,则在该漫入用户漫入后的第15min开始计算该漫入用户的时空聚集度。在确定用户标识为1300000000的漫入用户的时空聚集度时,需要参照其它所有用户的用户位置序列,设置邻域半径为e,即确定以用户标识为1300000000的漫入用户为中心,半径为e的范围内所包含的用户的数量,将所包含的用户数量作为该漫入用户的时空聚集度,通过计算可以确定该漫入用户的时空聚集度为3。从而所获取的用户标识为1300000000的漫入用户的序列指纹f=[基站数量:4,移动速度:100km/h,速度平稳度:20,各区域类型的特征点数量:高速-60国道-40,特殊信令事件次数:关机-2切换-20,时空聚集度:3]。当然本实施方式中仅是以用户标识为1300000000的漫入用户提取序列指纹的方式为例进行的说明,对于其他用户提取序列指纹的方式与此大致相同,本实施方式中不再进行赘述。
步骤S204,根据每个漫入用户的序列指纹创建指纹库。
步骤S205,将待测用户的序列指纹与指纹库进行匹配,以确定待测用户的出行方式。
在本发明实施例中,通过通信位置话单就可以获取漫入用户的序列指纹,并根据每个漫入用户的序列指纹创建指纹库,将待测用户的序列指纹与所创建的指纹库进行匹配,从而准确高效的确定出用户的出行方式。通过对提取序列指纹的方式进行具体说明,从而使得所提取的序列指纹更加精准,进一步提高了用户的出行方式确定的准确性。
实施例三
图3是本发明实施例提供的一种用户出行方式的装置的结构示意图,具体包括:用户位置序列获取模块310、位置特征区域数据集获取模块320、序列指纹提取模块330、指纹库创建模块340和出行方式确定模块350。
其中,用户位置序列获取模块310,用于根据通信位置话单获取漫入用户进入指定区域后指定时间范围内的用户位置序列,其中,用户位置序列中包括用户标识、时间、经纬度、基站标识和事件类型;
位置特征区域数据集获取模块320,用于获取位置特征区域数据集,其中,位置特征区域数据集中包括区域类型和区域经纬度的对应关系;
序列指纹提取模块330,用于根据位置特征区域数据集从漫入用户的用户位置序列中提取序列指纹,其中,序列指纹包括:基站数量、移动速度、速度平稳度、各区域类型的特征点数量、特殊信令事件次数和时空聚集度;
指纹库创建模块340,用于根据每个漫入用户的序列指纹创建指纹库;
出行方式确定模块350,用于将待测用户的序列指纹与指纹库进行匹配,以确定待测用户的出行方式。
可选的,装置还包括漫入用户确定模块,用于从通信位置话单中确定进入指定区域的漫入用户。
可选的,通信位置话单中包括:用户标识、时间、用户所在位置、基站标识、经纬度、事件类型、漫游类型和漫游方向;
事件类型包括:呼叫、短信发送、开机、关机、位置更新和切换;
漫游类型包括:省内漫游、省际漫游、国际漫游和无漫游;
漫游方向包括:漫入和漫出。
可选的,漫入用户确定模块,用于根据漫游类型和漫游方向从通信位置话单中确定进入指定区域的漫入用户。
可选的,区域类型包括:机场、铁路、高速、国道和航道。
可选的,指纹库创建模块,用于对每个漫入用户的序列指纹进行聚类获得多个聚类簇,以及每个聚类簇所对应的特征值;
根据用户的标记指令对每个聚类簇的出行方式进行标记,以创建指纹库,其中,指纹库中包含每个聚类簇的特征值与出行方式的对应关系。
可选的,出行方式确定模块,用于计算待测用户的序列指纹与指纹库中每个聚类簇的特征值的距离;
确定最小距离所对应的匹配聚类簇;
确定匹配聚类簇所对应的出行方式,并将所对应的出行方式作为待测用户的出行方式。
上述装置可执行本发明任意实施例所提供的用户出行方式的确定方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的方法。
实施例四
图4是本发明实施例提供的一种电子设备的结构示意图。图4示出了适用于用来实现本发明实施方式的示例性电子设备412的框图。图4显示的电子设备412仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,电子设备412以通用计算设备的形式出现。电子设备412的组件可以包括但不限于:一个或者多个处理器412,存储器428,连接不同***组件(包括存储器428和处理器416)的总线418.
总线418表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及***组件互连(PCI)总线。
电子设备412典型地包括多种计算机***可读介质。这些介质可以是任何能够被电子设备412访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器428用于存储指令。存储器428可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(RAM)430和/或高速缓存存储器432。电子设备412可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***434可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线418相连。存储器428可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块442的程序/实用工具440,可以存储在例如存储器428中,这样的程序模块442包括但不限于操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块442通常执行本发明所描述的实施例中的功能和/或方法。
电子设备412也可以与一个或多个外部设备414(例如键盘、指向设备、显示器424等)通信,还可与一个或者多个使得用户能与该电子设备412交互的设备通信,和/或与使得该电子设备412能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口422进行。并且,电子设备412还可以通过网络适配器420与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器420通过总线418与电子设备412的其它模块通信。应当明白,尽管图4中未示出,可以结合电子设备412使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
处理器416通过运行存储在存储器428中的指令,从而执行用户出行方式的确定方法:根据通信位置话单获取漫入用户进入指定区域后指定时间范围内的用户位置序列,其中,用户位置序列中包括用户标识、时间、经纬度、基站标识和事件类型;获取位置特征区域数据集,其中,位置特征区域数据集中包括区域类型和区域经纬度的对应关系;根据位置特征区域数据集从漫入用户的用户位置序列中提取序列指纹,其中,序列指纹包括:基站数量、移动速度、速度平稳度、各区域类型的特征点数量、特殊信令事件次数和时空聚集度;根据每个漫入用户的序列指纹创建指纹库;将待测用户的序列指纹与指纹库进行匹配,以确定待测用户的出行方式。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,计算机可执行指令在由计算机处理器执行时用于执行用户出行方式的确定,该方法包括:
根据通信位置话单获取漫入用户进入指定区域后指定时间范围内的用户位置序列,其中,用户位置序列中包括用户标识、时间、经纬度、基站标识和事件类型;获取位置特征区域数据集,其中,位置特征区域数据集中包括区域类型和区域经纬度的对应关系;根据位置特征区域数据集从漫入用户的用户位置序列中提取序列指纹,其中,序列指纹包括:基站数量、移动速度、速度平稳度、各区域类型的特征点数量、特殊信令事件次数和时空聚集度;根据每个漫入用户的序列指纹创建指纹库;将待测用户的序列指纹与指纹库进行匹配,以确定待测用户的出行方式。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上的方法操作,还可以执行本发明任意实施例所提供的数据入库方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的跨平台的作业转换方法。
值得注意的是,上述实施例中所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种用户出行方式的确定方法,其特征在于,包括:
根据通信位置话单获取漫入用户进入指定区域后指定时间范围内的用户位置序列,其中,所述用户位置序列中包括用户标识、时间、经纬度、基站标识和事件类型;
获取位置特征区域数据集,其中,所述位置特征区域数据集中包括区域类型和区域经纬度的对应关系;
根据所述位置特征区域数据集从漫入用户的用户位置序列中提取序列指纹,其中,所述序列指纹包括:基站数量、移动速度、速度平稳度、各区域类型的特征点数量、特殊信令事件次数和时空聚集度;
根据每个漫入用户的序列指纹创建指纹库;
将待测用户的序列指纹与所述指纹库进行匹配,以确定所述待测用户的出行方式。
2.根据权利要求1所述的方法,其特征在于,所述根据通信位置话单获取漫入用户进入指定区域后指定时间范围内的用户位置序列之前,还包括:
从所述通信位置话单中确定进入指定区域的漫入用户。
3.根据权利要求2所述的方法,其特征在于,所述通信位置话单中包括:用户标识、时间、用户所在位置、基站标识、经纬度、事件类型、漫游类型和漫游方向;
所述事件类型包括:呼叫、短信发送、开机、关机、位置更新和切换;
所述漫游类型包括:省内漫游、省际漫游、国际漫游和无漫游;
所述漫游方向包括:漫入和漫出。
4.根据权利要求3所述的方法,其特征在于,所述从所述通信位置话单中确定进入指定区域的漫入用户,包括:
根据所述漫游类型和漫游方向从所述通信位置话单中确定进入指定区域的漫入用户。
5.根据权利要求1所述的方法,其特征在于,所述区域类型包括:机场、铁路、高速、国道和航道。
6.根据权利要求1所述的方法,其特征在于,所述根据每个漫入用户的序列指纹创建指纹库,包括:
对每个漫入用户的序列指纹进行聚类获得多个聚类簇,以及每个聚类簇所对应的特征值;
根据用户的标记指令对每个聚类簇的出行方式进行标记,以创建所述指纹库,其中,所述指纹库中包含每个聚类簇的特征值与出行方式的对应关系。
7.根据权利要求6所述的方法,其特征在于,所述将待测用户的序列指纹与所述指纹库进行匹配,以获取所述待测用户的出行方式,包括:
计算待测用户的序列指纹与所述指纹库中每个聚类簇的特征值的距离;
确定最小距离所对应的匹配聚类簇;
确定所述匹配聚类簇所对应的出行方式,并将所对应的出行方式作为所述待测用户的出行方式。
8.一种用户出行方式的确定装置,其特征在于,所述装置包括:
用户位置序列获取模块,用于根据通信位置话单获取漫入用户进入指定区域后指定时间范围内的用户位置序列,其中,所述用户位置序列中包括用户标识、时间、经纬度、基站标识和事件类型;
位置特征区域数据集获取模块,用于获取位置特征区域数据集,其中,所述位置特征区域数据集中包括区域类型和区域经纬度的对应关系;
序列指纹提取模块,用于根据所述位置特征区域数据集从漫入用户的用户位置序列中提取序列指纹,其中,所述序列指纹包括:基站数量、移动速度、速度平稳度、各区域类型的特征点数量、特殊信令事件次数和时空聚集度;
指纹库创建模块,用于根据每个漫入用户的序列指纹创建指纹库;
出行方式确定模块,用于将待测用户的序列指纹与所述指纹库进行匹配,以确定所述待测用户的出行方式。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011636054.9A CN112733112B (zh) | 2020-12-31 | 2020-12-31 | 一种用户出行方式的确定方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011636054.9A CN112733112B (zh) | 2020-12-31 | 2020-12-31 | 一种用户出行方式的确定方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112733112A true CN112733112A (zh) | 2021-04-30 |
CN112733112B CN112733112B (zh) | 2024-05-03 |
Family
ID=75608638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011636054.9A Active CN112733112B (zh) | 2020-12-31 | 2020-12-31 | 一种用户出行方式的确定方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112733112B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113329338A (zh) * | 2021-05-26 | 2021-08-31 | 恒安嘉新(北京)科技股份公司 | 一种用户流动行为处理方法、装置、电子设备及存储介质 |
CN113408920A (zh) * | 2021-06-29 | 2021-09-17 | 北京百度网讯科技有限公司 | 迁徙方式确定方法、装置、设备以及存储介质 |
CN115134748A (zh) * | 2022-02-17 | 2022-09-30 | 恒安嘉新(北京)科技股份公司 | 确定漫入漫出用户的方法、装置、电子设备及存储介质 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101184266A (zh) * | 2007-12-18 | 2008-05-21 | 北京西塔网络科技有限公司 | 一种信息发布装置及信息发布方法 |
CN101283617A (zh) * | 2005-08-10 | 2008-10-08 | 高通股份有限公司 | 用于为无线网络创建指纹的方法和设备 |
US20130018826A1 (en) * | 2011-07-15 | 2013-01-17 | Microsoft Corporation | Location determination using generalized fingerprinting |
CN105788244A (zh) * | 2016-05-12 | 2016-07-20 | 中国联合网络通信集团有限公司 | 一种拼车方法及*** |
CN106067154A (zh) * | 2016-05-30 | 2016-11-02 | 上海华企软件有限公司 | 一种基于手机大数据的城市间迁移客流分析方法 |
CN107333325A (zh) * | 2017-07-26 | 2017-11-07 | 维沃移动通信有限公司 | 一种网络搜索方法及移动终端 |
US20170332273A1 (en) * | 2016-05-12 | 2017-11-16 | M2MD Technologies, Inc. | Method and system for managing the providing of different classes of wireless communications services from different mobile networks |
EP3288216A1 (en) * | 2016-08-24 | 2018-02-28 | Telia Company AB | Provision to a user terminal of a combined data record on charging regarding at least one communication type |
CN107770744A (zh) * | 2017-09-18 | 2018-03-06 | 上海世脉信息科技有限公司 | 大数据环境下出行od节点识别和节点间路径提取方法 |
CN108391265A (zh) * | 2018-02-12 | 2018-08-10 | 中国联合网络通信集团有限公司 | 一种确定漫游过境用户的方法及装置 |
CN109874104A (zh) * | 2017-12-05 | 2019-06-11 | ***通信集团山西有限公司 | 用户位置定位方法、装置、设备及介质 |
CN110020980A (zh) * | 2019-04-08 | 2019-07-16 | 江苏号百信息服务有限公司 | 基于手机信令数据的机场到发旅客识别与客情分析方法 |
CN112738729A (zh) * | 2020-12-31 | 2021-04-30 | 桂林旅游学院 | 一种用手机信令数据判别探亲返乡游客的方法及*** |
CN113329338A (zh) * | 2021-05-26 | 2021-08-31 | 恒安嘉新(北京)科技股份公司 | 一种用户流动行为处理方法、装置、电子设备及存储介质 |
-
2020
- 2020-12-31 CN CN202011636054.9A patent/CN112733112B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101283617A (zh) * | 2005-08-10 | 2008-10-08 | 高通股份有限公司 | 用于为无线网络创建指纹的方法和设备 |
CN101184266A (zh) * | 2007-12-18 | 2008-05-21 | 北京西塔网络科技有限公司 | 一种信息发布装置及信息发布方法 |
US20130018826A1 (en) * | 2011-07-15 | 2013-01-17 | Microsoft Corporation | Location determination using generalized fingerprinting |
US20170332273A1 (en) * | 2016-05-12 | 2017-11-16 | M2MD Technologies, Inc. | Method and system for managing the providing of different classes of wireless communications services from different mobile networks |
CN105788244A (zh) * | 2016-05-12 | 2016-07-20 | 中国联合网络通信集团有限公司 | 一种拼车方法及*** |
CN106067154A (zh) * | 2016-05-30 | 2016-11-02 | 上海华企软件有限公司 | 一种基于手机大数据的城市间迁移客流分析方法 |
EP3288216A1 (en) * | 2016-08-24 | 2018-02-28 | Telia Company AB | Provision to a user terminal of a combined data record on charging regarding at least one communication type |
CN107333325A (zh) * | 2017-07-26 | 2017-11-07 | 维沃移动通信有限公司 | 一种网络搜索方法及移动终端 |
CN107770744A (zh) * | 2017-09-18 | 2018-03-06 | 上海世脉信息科技有限公司 | 大数据环境下出行od节点识别和节点间路径提取方法 |
CN109874104A (zh) * | 2017-12-05 | 2019-06-11 | ***通信集团山西有限公司 | 用户位置定位方法、装置、设备及介质 |
CN108391265A (zh) * | 2018-02-12 | 2018-08-10 | 中国联合网络通信集团有限公司 | 一种确定漫游过境用户的方法及装置 |
CN110020980A (zh) * | 2019-04-08 | 2019-07-16 | 江苏号百信息服务有限公司 | 基于手机信令数据的机场到发旅客识别与客情分析方法 |
CN112738729A (zh) * | 2020-12-31 | 2021-04-30 | 桂林旅游学院 | 一种用手机信令数据判别探亲返乡游客的方法及*** |
CN113329338A (zh) * | 2021-05-26 | 2021-08-31 | 恒安嘉新(北京)科技股份公司 | 一种用户流动行为处理方法、装置、电子设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
安瑞虹等: "基于移动网数据的城市交通分析研究", 邮电设计技术, no. 1, pages 50 - 54 * |
肖艳丽等: "移动数据的交通出行方式识别方法", 智能***学报, vol. 9, no. 5, pages 536 - 543 * |
高华等: "通讯信息诈骗综合防范***", 信息技术与标准化, no. 9, pages 35 - 38 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113329338A (zh) * | 2021-05-26 | 2021-08-31 | 恒安嘉新(北京)科技股份公司 | 一种用户流动行为处理方法、装置、电子设备及存储介质 |
CN113329338B (zh) * | 2021-05-26 | 2023-08-04 | 恒安嘉新(北京)科技股份公司 | 一种用户流动行为处理方法、装置、电子设备及存储介质 |
CN113408920A (zh) * | 2021-06-29 | 2021-09-17 | 北京百度网讯科技有限公司 | 迁徙方式确定方法、装置、设备以及存储介质 |
CN113408920B (zh) * | 2021-06-29 | 2024-01-12 | 北京百度网讯科技有限公司 | 迁徙方式确定方法、装置、设备以及存储介质 |
CN115134748A (zh) * | 2022-02-17 | 2022-09-30 | 恒安嘉新(北京)科技股份公司 | 确定漫入漫出用户的方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112733112B (zh) | 2024-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112733112B (zh) | 一种用户出行方式的确定方法、装置、电子设备和存储介质 | |
CN107040894B (zh) | 一种基于手机信令数据的居民出行od获取方法 | |
CN106503714B (zh) | 一种基于兴趣点数据识别城市功能区的方法 | |
US9355063B2 (en) | Parking lot detection using probe data | |
CN111653099B (zh) | 基于手机信令数据的公交客流od获取方法 | |
CN109254861B (zh) | 基于轨迹数据的od需求提取及其可靠性分析方法 | |
CN114416710B (zh) | 一种快速路车辆od位置提取方法及*** | |
CN105608505A (zh) | 一种基于手机信令数据的居民轨道交通出行方式识别方法 | |
CN114363842B (zh) | 基于手机信令数据的公交乘客下车站点预测方法及装置 | |
CN110472999B (zh) | 基于地铁和共享单车数据的客流模式分析方法及装置 | |
CN110990661B (zh) | 一种基于路网约束和密度聚类的兴趣区域出入口提取方法 | |
CN111586586B (zh) | 一种追踪方法和*** | |
CN112770278B (zh) | 手机信令分析方法、装置、计算机设备及存储介质 | |
CN114530038B (zh) | 一种基于时空数据聚类的出行兴趣区域提取方法及*** | |
CN113079463A (zh) | 一种基于手机信令数据的旅游景点游客出行活动识别方法 | |
Lu et al. | Taxi queue, passenger queue or no queue? | |
CN115795332A (zh) | 一种用户出行模式识别的方法 | |
CN115862331A (zh) | 考虑卡口网络拓扑结构的车辆出行轨迹重构方法 | |
CN116129643B (zh) | 一种公交车出行特征识别方法、装置、设备及介质 | |
CN113536906A (zh) | 一种基于乘客画像的人脸识别方法及装置 | |
CN112182132A (zh) | 一种地铁用户的识别方法、***、设备和存储介质 | |
CN112566025B (zh) | 公交客流来源去向识别方法、装置、电子设备和存储介质 | |
CN110647595A (zh) | 一种新增兴趣点的确定方法、装置、设备和介质 | |
Arifoğulları et al. | Public Transportation Data Analysis to Estimate Road Status in Metropolitan Areas: The Case of İstanbul | |
CN110880244A (zh) | 一种辨别出租车是否为克隆车的方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |