CN110955738B - 一种基于信令数据结合场景信息的人物画像刻画方法 - Google Patents
一种基于信令数据结合场景信息的人物画像刻画方法 Download PDFInfo
- Publication number
- CN110955738B CN110955738B CN201811126281.XA CN201811126281A CN110955738B CN 110955738 B CN110955738 B CN 110955738B CN 201811126281 A CN201811126281 A CN 201811126281A CN 110955738 B CN110955738 B CN 110955738B
- Authority
- CN
- China
- Prior art keywords
- users
- user
- base station
- data
- scene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000011664 signaling Effects 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 title claims abstract description 13
- 230000000694 effects Effects 0.000 claims description 16
- 230000002354 daily effect Effects 0.000 claims description 6
- 230000006399 behavior Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000003203 everyday effect Effects 0.000 claims description 3
- 230000002457 bidirectional effect Effects 0.000 claims 1
- 238000012512 characterization method Methods 0.000 claims 1
- 238000004458 analytical method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 238000011840 criminal investigation Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/025—Services making use of location information using location based information parameters
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于信令数据结合场景信息的人物画像刻画方法,通过移动运营商信令数据,采集用户的移动轨迹数据,获取每个用户在一天内驻留过的基站;根据每个基站的经纬度,结合POI数据和GIS数据,将每个基站与该基站所在地的物理场景相对应,用场景信息对基站位置进行标注;将用户的移动轨迹中的每个基站与该基站的场景信息进行对应,可直观显示出每个用户的移动轨迹特征,从移动空间和时间角度对用户进行画像;进一步,将两个用户的场景信息按一定算法进行计算,可以判断一个用户与其他用户间的亲疏关系,从而对用户画像进行更加细致的描述。
Description
技术领域
本发明涉及移动大数据统计分析应用技术领域,具体涉及一种基于信令数据结合场景信息的人物画像刻画方法。
背景技术
随着智能手机的普及,促进了移动大数据技术的发展。移动大数据中蕴含了丰富的信息,包括移动用户的出行活动信息。用户的出行活动信息具有重要的利用价值,如,通过发现并掌握移动用户的活动共性,可以服务于城市规划、旅游开发、交通建设等领域;通过用户的个性化活动信息,可用于商业领域的个性化服务、精准营销,以及安保、刑侦、反恐等领域。目前通过移动运营商的信令数据,可以较容易发现并掌握群体用户的活动共性。而对每个用户的活动特性,因其具有多样性、分散性,目前还没有有效的方法进行规模化挖掘。
发明内容
本发明的目的在于对移动大数据中蕴含的用户活动信息进一步挖掘,提供一种基于信令数据结合场景信息的人物画像刻画方法,从移动大数据中将用户的个性化活动信息挖掘并直观展现出来。
本发明的技术方案如下:
一种基于信令数据结合场景信息的人物画像刻画方法,其特征在于:
(1)通过移动运营商信令数据,采集用户的移动轨迹数据,获取每个用户在一天内驻留过的基站,及在每个基站驻留的时长,并对用户移动轨迹数据进行差补;
(2)根据每个基站的经纬度,结合POI数据和GIS数据,将每个基站与该基站所在地的物理场景相对应,用场景信息对基站位置进行标注;
(3)将用户的移动轨迹中的每个基站与该基站的场景信息进行对应,由此将一个用户每日所访问基站的记录转化为用户访问的场景记录,并记录该用户在每个场景的驻留时长,由此直观显示出每个用户的移动轨迹特征,从移动空间和时间角度对用户进行画像;
(4)对任意两个用户i和j,以每个用户在不同场景下的停留时间作为特征,将两个用户的移动特征通过以下公式进行余弦值计算:
其中,是指用户i在n个情景下停留时间所组成的向量,即/>xik是指用户i在第k个场景下停留的时间,由于所有的xik都是大于等于0的,所以计算所得的余弦值范围在0到1之间;
计算所得的值代表两个用户之间的社会关系紧密程度,值越大说明两个用户之间的关系越密切,完全无关的两两用户之间的相关系数为0,两个始终停留在完全相同的场景下的用户计算出的相关系数为1,从而描绘出每个用户的社会关系特征,从社会关系角度对用户进行画像。
本发明可通过用户的移动信息,从用户的活动场景和社会关系两方面刻画用户画像。通过活动场景可以对用户的活动特征进行直观展示,获得形象化的形象标签;进一步,还可利用场景分析的方法计算出用户间的亲疏关系,即可用来描述用户的交往圈,基于此能够对用户进行更加细致的描述,甚至对一些缺乏全局用户身份标识的用户来进行推测描述。
附图说明
图1是本发明用场景信息对用户画像的一个实施例示意图;
图2是本发明对用户亲疏关系进行识别的一个实施例示意图。
具体实施方式
本发明所采用的数据为移动运营商提供的信令数据(或称为轨迹数据),包括:加密的用户手机号码-IMSI;位置区识别码lac,用于标识不同的位置区、基站编号;ci,与位置区识别码(lac)结合,用于识别网络中覆盖的小区;time_in,表示进入基站的时间;time_out,表示离开基站的时间;
以下以一个城市的移动用户为例,采用本发明的方法对该城市的移动用户进行画像,具体实现方式如下:
(1)通过移动运营商信令数据,采集用户的移动轨迹数据,轨迹数据记录了一条IMSI进入某个基站和离开某个基站的时间,从而可获取每个用户在一天内驻留过的基站,及在每个基站驻留的时长;针对轨迹数据中会出现的信令缺失问题,要对用户移动轨迹数据进行差补;差补具体方法如下:
划出城市地域周边基站,设定为边缘基站缓冲区,根据用户移动行为,将当天移动行为出现在边界缓冲区内的用户标记为进/出城用户,其余未出现在边界缓冲区内的用户统计为未出城用户;对当日未出城用户进行驻留时长的双向差补,此类人群可视为当日在城驻留时长满24小时,对未出城用户每日的第一条信令和最后一条信令时间造成的驻留时长变短的情况,则将第一条信令的开始时间设置为每日开始时间(00:00:00),将最后一条信令的终止时间设置为每日的结束时间(23:59:59);对进/出城用户仍以实际驻留时长为准。
(2)根据每个基站的经纬度,结合POI数据和GIS数据,将每个基站与该基站所在地的物理场景相对应,用场景信息对基站位置进行标注。
所述的POI数据,主要是指城市中的信息点(Points of Information,POI)或兴趣点(Points of Interest),包括一些与人们日常生活密切相关的活动场所或地点,主要划分为商务办公、公寓住宅、综合娱乐、商业零售、酒店餐饮、医疗服务、公共设施、旅游景点8个大类,每个大类下面再划分为若干个小类,并用多个字段对每个小类进行描述,字段包括名称,地址,邮编,经纬度,电话,所属区县,所属分类,所属细分类别等信息。
以下为本实施例中对POI数据的分类表。
所述的GIS,即地理信息***,是指建立的地理数据库所需的各种数据的来源,主要包括地图、遥感数据、文本资料、统计资料、实测数据、多媒体数据、已有***的数据等。其中地图数据、遥感数据、统计数据、实测数据等是GIS最主要的数据源。GIS对地理空间实体通常从空间、属性、时间等方面进行描述。本发明采用GIS数据对在地图上对基站位置进行标注,从而直观显示基站的位置。
(3)将用户的移动轨迹中的每个基站与该基站的场景信息进行对应,由此将一个用户每日所访问基站的记录转化为用户访问的场景记录,并记录该用户在每个场景的驻留时长,由此直观显示出每个用户的移动轨迹特征,从移动空间和时间角度对用户进行画像。
如图1所示,任意抽取两个用户A和B。通过对两个用户的移动轨迹分别进行场景化描述,结果如下:
用户A活动区域主要在城区,居住区为高层住宅区,工作区在写字楼,经常去会展中心、机场、休闲娱乐场所;
用户B活动区域主要在城区,居住区为底层住宅区,工作区在写字楼,经常去星级酒店、企事业单位、党政军机关。
通过对比A和B两个用户,可以基本判断出:用户A极大可能性为商务人士,用户B可能企事业单位的财务部门人员或者其他较常与政府部门沟通的岗位。用户移动特征的标签化是对人口更加细致的刻画,用户标签管理***搭建好后,意味着用户画像已经形成。配合用户信息,把具有同类标签的用户分为一组,可以对他们进行更灵活、更有针对性的活动分析。
(4)进一步,本发明还可从用户的社会关系角度对用户进行画像。
对任意两个用户i和j,以每个用户在不同场景下的停留时间作为特征,将两个用户的移动特征通过以下公式进行余弦值计算:
其中,是指用户i在n个情景下停留时间所组成的向量,即/>例如,i在商业区停留50分钟,在学校停留0分钟,在住宅区停留300分钟,则i可以表示为向量(50,0,300);xik是指用户i在第k个场景下停留的时间,由于所有的xik都是大于等于0的,所以计算所得的余弦值范围在0到1之间;
计算所得的值代表两个用户之间的社会关系紧密程度,值越大说明两个用户之间的关系越密切,完全无关的两两用户之间的相关系数为0,两个始终停留在完全相同的场景下的用户计算出的相关系数为1,从而描绘出每个用户的社会关系特征,从社会关系角度对用户进行画像。
图2是本实施例中选择已知用户信息的部分自愿者数据计算其两两之间的相关系数,得到的相关矩阵:
由图2可见,非0数据高度稀疏,符合实际情况;属于同一家庭的用户被准确识别(样本1与样本2);白天同事、晚上邻居,且节假日经常结伴活动的得分高(4与7);白天同事,非工作日一起在单位加班,得分较高(4与5)。
一般人口的描述是无法分析人与人之间的关联性,而如果利用上述方法计算出用户间的亲疏关系,即可用来描述用户的交往圈,基于此能够对用户进行更加细致的描述,甚至对一些缺乏全局用户身份标识的用户来进行推测描述。
Claims (3)
1.一种基于信令数据结合场景信息的人物画像刻画方法,其特征在于:
(1)通过移动运营商信令数据,采集用户的移动轨迹数据,获取每个用户在一天内驻留过的基站,及在每个基站驻留的时长,并对用户移动轨迹数据进行差补;
(2)根据每个基站的经纬度,结合POI数据和GIS数据,将每个基站与该基站所在地的物理场景相对应,用场景信息对基站位置进行标注;
(3)将用户的移动轨迹中的每个基站与该基站的场景信息进行对应,由此将一个用户每日所访问基站的记录转化为用户访问的场景记录,并记录该用户在每个场景的驻留时长,由此直观显示出每个用户的移动轨迹特征,从移动空间和时间角度对用户进行画像;
(4)对任意两个用户i和j,以每个用户在不同场景下的停留时间作为特征,将两个用户的移动特征通过以下公式进行余弦值计算:
其中,是指用户i在n个情景下停留时间所组成的向量,即/>xik是指用户i在第k个场景下停留的时间,由于所有的xik都是大于等于0的,所以计算所得的余弦值范围在0到1之间;
计算所得的值代表两个用户之间的社会关系紧密程度,值越大说明两个用户之间的关系越密切,完全无关的两两用户之间的相关系数为0,两个始终停留在完全相同的场景下的用户计算出的相关系数为1,从而描绘出每个用户的社会关系特征,从社会关系角度对用户进行画像。
2.根据权利要求1所述的基于信令数据结合场景信息的人物画像刻画方法,其特征在于,步骤(1)中所述的差补,具体方法如下:
划出城市地域周边基站,设定为边缘基站缓冲区,根据用户移动行为,将当天移动行为出现在边界缓冲区内的用户标记为进/出城用户,其余未出现在边界缓冲区内的用户统计为未出城用户;对当日未出城用户进行驻留时长的双向差补,此类人群视为当日在城驻留时长满24小时,对未出城用户每日的第一条信令和最后一条信令时间造成的驻留时长变短的情况,则将第一条信令的开始时间设置为每日开始时间,即每日00:00:00,将最后一条信令的终止时间设置为每日的结束时间,即每日23:59:59;对进/出城用户仍以实际驻留时长为准。
3.根据权利要求1所述的基于信令数据结合场景信息的人物画像刻画方法,其特征在于:步骤(2)中所述的POI数据,是指城市中的信息点或兴趣点,包括一些与人们日常生活相关的活动场所或地点,划分为商务办公、公寓住宅、综合娱乐、商业零售、酒店餐饮、医疗服务、公共设施、旅游景点8个大类,每个大类下面再划分为若干个小类,并用多个字段对每个小类进行描述,字段包括名称,地址,邮编,经纬度,电话,所属区县,所属分类,所属细分类别信息;步骤(2)中所述的GIS,即地理信息***,用于对基站位置从空间、属性、时间方面进行描述。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811126281.XA CN110955738B (zh) | 2018-09-26 | 2018-09-26 | 一种基于信令数据结合场景信息的人物画像刻画方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811126281.XA CN110955738B (zh) | 2018-09-26 | 2018-09-26 | 一种基于信令数据结合场景信息的人物画像刻画方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110955738A CN110955738A (zh) | 2020-04-03 |
CN110955738B true CN110955738B (zh) | 2023-10-20 |
Family
ID=69966117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811126281.XA Active CN110955738B (zh) | 2018-09-26 | 2018-09-26 | 一种基于信令数据结合场景信息的人物画像刻画方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110955738B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112256747B (zh) * | 2020-09-18 | 2024-06-14 | 珠海市新德汇信息技术有限公司 | 一种面向电子数据的人物刻画方法 |
CN114071366B (zh) * | 2022-01-17 | 2022-05-24 | 北京融信数联科技有限公司 | 结合知识图谱的人物画像刻画方法、***和可读存储介质 |
CN114741612B (zh) * | 2022-06-13 | 2022-09-02 | 北京融信数联科技有限公司 | 一种基于大数据的消费习惯分类方法、***和存储介质 |
CN116128128A (zh) * | 2023-01-17 | 2023-05-16 | 北京融信数联科技有限公司 | 基于智能体图谱的城市职住平衡预测方法、***和介质 |
CN117858132B (zh) * | 2024-03-07 | 2024-05-24 | 济南光路科技有限公司 | 一种基于云计算设备管理***及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105634854A (zh) * | 2014-11-07 | 2016-06-01 | 中兴通讯股份有限公司 | 用户属性分析方法及装置 |
CN105682025A (zh) * | 2016-01-05 | 2016-06-15 | 重庆邮电大学 | 基于移动信令数据的用户驻留地识别方法 |
CN106778876A (zh) * | 2016-12-21 | 2017-05-31 | 广州杰赛科技股份有限公司 | 基于移动用户轨迹相似性的用户分类方法和*** |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5523274B2 (ja) * | 2010-10-12 | 2014-06-18 | Kddi株式会社 | 携帯端末を所持したユーザの有意圏を推定する装置、プログラム及び方法 |
-
2018
- 2018-09-26 CN CN201811126281.XA patent/CN110955738B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105634854A (zh) * | 2014-11-07 | 2016-06-01 | 中兴通讯股份有限公司 | 用户属性分析方法及装置 |
CN105682025A (zh) * | 2016-01-05 | 2016-06-15 | 重庆邮电大学 | 基于移动信令数据的用户驻留地识别方法 |
CN106778876A (zh) * | 2016-12-21 | 2017-05-31 | 广州杰赛科技股份有限公司 | 基于移动用户轨迹相似性的用户分类方法和*** |
Also Published As
Publication number | Publication date |
---|---|
CN110955738A (zh) | 2020-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110955738B (zh) | 一种基于信令数据结合场景信息的人物画像刻画方法 | |
Barros et al. | Using geotagged photographs and GPS tracks from social networks to analyse visitor behaviour in national parks | |
Hardy et al. | Tracking tourists’ travel with smartphone-based GPS technology: a methodological discussion | |
CN109362041B (zh) | 一种基于大数据的人口时空分布分析方法 | |
Haklay | How good is volunteered geographical information? A comparative study of OpenStreetMap and Ordnance Survey datasets | |
Chung et al. | A trip reconstruction tool for GPS-based personal travel surveys | |
CN109583640A (zh) | 一种基于多源定位数据的城市出行客流属性识别方法 | |
CN106096631A (zh) | 一种基于手机大数据的流动人口分类识别分析方法 | |
Ahas et al. | Mobile positioning in space–time behaviour studies: social positioning method experiments in Estonia | |
Zhou et al. | A data-driven method for trip ends identification using large-scale smartphone-based GPS tracking data | |
Cui et al. | Social media and mobility landscape: Uncovering spatial patterns of urban human mobility with multi source data | |
Yuan et al. | Recognition of functional areas based on call detail records and point of interest data | |
KR20230124952A (ko) | 개별 미세 위치 식별자를 표시하고 사용하기 위한 시스템및 방법 | |
CN107133689B (zh) | 一种位置标记方法 | |
US20220100796A1 (en) | Method, apparatus, and system for mapping conversation and audio data to locations | |
Ellersiek et al. | Using Bluetooth to track mobility patterns: depicting its potential based on various case studies | |
Chen et al. | Harnessing social media to understand tourist travel patterns in muti-destinations | |
CN114071366B (zh) | 结合知识图谱的人物画像刻画方法、***和可读存储介质 | |
Pospíšilová et al. | Mobile phone location data: New challenges for geodemographic research | |
CN110019237A (zh) | 一种基于地图分析罪犯行踪的***及方法 | |
Tao | Hurricane evacuation analysis based on smartphone location data: A case study of Hurricane Florence | |
Sparks et al. | Modeling Building Use and Population Distribution Opportunity Using Open Geosocial Data in Urban Areas | |
Baučić et al. | Telecom big data for urban transport analysis–a case study of Split-Dalmatia county in Croatia | |
CN117493981B (zh) | 游客分类方法、装置及电子设备 | |
Cheng | Hurricane Evacuation Behavior Analysis Based on Mobile Location Data: A Case Study of Hurricane Florence |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |