CN108573265B - 人流量统计方法及统计*** - Google Patents

人流量统计方法及统计*** Download PDF

Info

Publication number
CN108573265B
CN108573265B CN201710141863.4A CN201710141863A CN108573265B CN 108573265 B CN108573265 B CN 108573265B CN 201710141863 A CN201710141863 A CN 201710141863A CN 108573265 B CN108573265 B CN 108573265B
Authority
CN
China
Prior art keywords
serving cell
historical
reported
area
reported information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710141863.4A
Other languages
English (en)
Other versions
CN108573265A (zh
Inventor
陈霖
游龙涛
韩桂鲁
李志阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201710141863.4A priority Critical patent/CN108573265B/zh
Publication of CN108573265A publication Critical patent/CN108573265A/zh
Application granted granted Critical
Publication of CN108573265B publication Critical patent/CN108573265B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/10Scheduling measurement reports ; Arrangements for measurement reports
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/021Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/025Services making use of location information using location based information parameters
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种人流量统计方法,包括以下步骤:获取指定区域的边界,对具有准确位置的历史UE上报数据进行区域内外分类;根据分类结果,对区域内外的所述历史UE上报数据分别进行标签处理;获取历史UE上报信息,从所述历史UE上报信息中抽取出特征,并结合落在区域内外的标签构建特征分类模型;根据所述特征分类模型,对采集的不含准确位置的UE上报信息样本进行是否落在指定区域的分类处理;将分类得到的落在所述指定区域内的样本点进行人流量统计。本发明还公开了一种统计***。本发明可以解决基于GPS数据源的数据样本不足以及基于UE上报信息存在误差的技术问题,以提高针对特定区域进行人流量统计的准确性。

Description

人流量统计方法及统计***
技术领域
本发明涉及无线通信技术领域,尤其涉及一种人流量统计方法及统计***。
背景技术
随着移动互联网的兴起,基于移动终端如手机的各种应用层出不穷,特别是和定位服务相关的手机定位技术。由于目前手机的人均拥有率很高,因此,基于手机的人流量统计具有很高的准确性和实用价值,比如在商业上通过分析人流量来分析商店布局,在交通上分析人流动的特点来改善交通,在安全领域根据人流量变化来及时了解突发事件等。
基于手机的定位技术通常具有两种获取渠道,一种是基于GPS(Global PositionSystem,全球定位***)获取的位置信息,另外一种是基于UE(User Equipment,用户设备)与上报给无线基站的各类无线通信测量信息进行位置估算。通过GPS定位信息的优势在于:定位精度非常高,一般定位误差小于10米,但GPS定位信息的局限性也非常大,包括以下几个方面:第一,虽然现在智能手机基本都配备GPS模块,但是处于节电的考虑,很多用户只有在开启定位、导航应用的时候才会打开GPS模块,而在一般状态下,不会打开该模块;第二,GPS只能在室外无遮挡环境下使用,在室内环境中因为无法接收到GPS卫星信号,所以无法提供定位信息。因此,仅仅使用GPS位置信息进行区域人流量统计将面临样本量严重不足的问题,统计结果难以达到满意的水平。
与之相反,基于UE上报信息进行位置估计的定位方法的优缺点跟GPS位置信息恰恰相反,这类定位方法不受环境和用户设置的限制,在室内、室外均可以使用,而且相对于GPS定位信息样本不足的缺点来说,基于UE上报信息得到的位置信息在样本充裕度方面具有明显的优势。但是另外一个方面,基于UE上报信息的估计得到的位置信息,定位误差远远大于GPS的位置信息。因此,仅仅使用该位置信息进行热点区域的人流量统计,精度难以达到要求。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种人流量统计方法及统计***,旨在解决基于GPS数据源的数据样本不足以及基于UE上报信息存在误差的技术问题,以提高针对特定区域进行人流量统计的准确性。
为实现上述目的,本发明提供的一种人流量统计方法,所述人流量统计方法包括以下步骤:
获取指定区域的边界,对具有准确位置的历史UE上报数据进行区域内外分类;
根据分类结果,对区域内外的所述历史UE上报数据分别进行标签处理;
获取历史UE上报信息,从所述历史UE上报信息中抽取出特征,并结合落在区域内外的标签构建特征分类模型;
根据所述特征分类模型,对采集的不含准确位置的UE上报信息样本进行是否落在指定区域的分类处理;
将分类得到的落在所述指定区域内的样本点进行人流量统计。
优选地,所述获取历史UE上报信息,从所述历史UE上报信息中抽取出特征,并结合落在区域内外的标签构建特征分类模型的步骤包括:
获取历史UE上报信息,统计主服务小区以及邻服务小区ID的分布特征;
抽取覆盖所述指定区域的主服务小区ID列表以及邻服务小区ID列表,并结合落在所述指定区域内外的标签构建主邻区序列集合。
优选地,所述根据所述特征分类模型,对采集的不含准确位置的UE上报信息样本进行是否落在指定区域的分类处理的步骤包括:
根据构建的所述主邻区序列集合,对采集的不含准确位置的所述UE上报信息样本进行分类;
若所述UE上报信息样本的主服务小区ID不在所述主服务小区ID列表内,则判定该UE上报信息样本落在所述指定区域外;
若所述上报信息的主服务小区ID在所述主服务小区ID列表内,则获取邻服务小区ID在所述邻服务小区ID列表内的数量,在所述数量大于预定阈值时,判定该UE上报信息样本落在所述指定区域内。
优选地,所述获取历史UE上报信息,从所述历史UE上报信息中抽取出特征,并结合落在区域内外的标签构建特征分类模型的步骤包括:
获取历史UE上报信息,从所述历史UE上报信息中抽取主服务小区以及邻服务小区的信号强度;
对获取的主服务小区以及邻服务小区的信号强度进行预处理;
根据经标签处理后的历史数据以及预处理后的样本,采用数据挖掘中的分类算法训练并构建分类模型。
优选地,所述根据所述特征分类模型,对采集的不含准确位置的UE上报信息样本进行是否落在指定区域的分类处理的步骤包括:
获取所述UE上报信息样本的主服务小区以及邻服务小区的信号强度;
根据所述分类模型以及所述主服务小区以及邻服务小区的信号强度,确定该样本是否落在所述指定区域内。
为实现上述目的,本发明还提供一种统计***,所述统计***包括:
区域分类模块,用于获取指定区域的边界,对具有准确位置的历史UE上报数据进行区域内外分类;
标签处理模块,用于根据分类结果,对区域内外的所述历史UE上报数据分别进行标签处理;
构建模块,用于获取历史UE上报信息,从所述历史UE上报信息中抽取出特征,并结合落在区域内外的标签构建特征分类模型;
分类处理模块,用于根据所述特征分类模型,对采集的不含准确位置的UE上报信息样本进行是否落在指定区域的分类处理;
统计模块,用于将分类得到的落在所述指定区域内的样本点进行人流量统计。
优选地,所述构建模块包括:
统计单元,用于获取历史UE上报信息,统计主服务小区以及邻服务小区ID的分布特征;
构建单元,用于抽取覆盖所述指定区域的主服务小区ID列表以及邻服务小区ID列表,并结合落在所述指定区域内外的标签构建主邻区序列集合。
优选地,所述分类处理模块包括:
分类单元,用于根据构建的所述主邻区序列集合,对采集的不含准确位置的所述UE上报信息样本进行分类;
判断单元,用于若所述UE上报信息样本的主服务小区ID不在所述主服务小区ID列表内,则判定该UE上报信息样本落在所述指定区域外;
所述判断单元,还用于若所述上报信息的主服务小区ID在所述主服务小区ID列表内,则获取邻服务小区ID在所述邻服务小区ID列表内的数量,在所述数量大于预定阈值时,判定该UE上报信息样本落在所述指定区域内。
优选地,所述构建模块包括:
抽取单元,用于获取历史UE上报信息,从所述历史UE上报信息中抽取主服务小区以及邻服务小区的信号强度;
预处理单元,用于对获取的主服务小区以及邻服务小区的信号强度进行预处理;
构建单元,用于根据经标签处理后的历史数据以及预处理后的样本,采用数据挖掘中的分类算法训练并构建分类模型。
优选地,所述分类处理模块包括:
获取单元,用于获取所述UE上报信息样本的主服务小区以及邻服务小区的信号强度;
确定单元,用于根据所述分类模型以及所述主服务小区以及邻服务小区的信号强度,确定该样本是否落在所述指定区域内。
本发明提供的人流量统计方法以及统计***,通过获取指定区域的边界,对具有准确位置的历史UE上报数据进行区域内外分类;根据分类结果,对区域内外的所述历史UE上报数据分别进行标签处理;获取历史UE上报信息,从所述历史UE上报信息中抽取出特征,并结合落在区域内外的标签构建特征分类模型;根据所述特征分类模型,对采集的不含准确位置的UE上报信息样本进行是否落在指定区域的分类处理;将分类得到的落在所述指定区域内的样本点进行人流量统计。这样,基于准确位置学习UE上报信息的模式,建立特征分类模型,不仅具有鲁棒性好,适应性强的特点,还可以解决基于GPS数据源的数据样本不足以及基于UE上报信息存在误差的技术问题,从而提高了针对特定区域进行人流量统计的准确性。
附图说明
图1为本发明人流量统计方法第一实施例的流程示意图;
图2为历史数据落在指定区域内外的示意图;
图3为图1中S3步骤第一实施例的细化流程示意图;
图4为主服务小区的分布统计结果示意图;
图5为邻服务小区的分布统计结果示意图;
图6为图1中S4步骤第一实施例的细化流程示意图;
图7为图1中S3步骤第二实施例的细化流程示意图;
图8为图1中S4步骤第二实施例的细化流程示意图;
图9为本发明人流量统计方法第一实施例的流程示意图;
图10为本发明统计***第一实施例的功能模块示意图;
图11为图10中构建模块第一实施例的细化功能模块示意图;
图12为图10中分类处理模块第一实施例的细化功能模块示意图;
图13为图10中构建模块第二实施例的细化功能模块示意图;
图14为图10中分类处理模块第二实施例的细化功能模块示意图;
图15为本发明统计***第二实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种人流量统计方法,参照图1,在一实施例中,所述人流量统计方法包括:
步骤S1、获取指定区域的边界,对具有准确位置的历史UE上报数据进行区域内外分类;
本实施例中,根据指定区域的角点的坐标,使用多边形算法,对具有准确位置的历史UE上报数据进行指定区域内外的分类,其中,准确位置是通过UE(User Equipment,用户设备)内的AGPS(Assisted Global Positioning System,辅助全球定位***)来获取的;历史UE上报数据是从UE上报的信息中获取。
步骤S2、根据分类结果,对区域内外的所述历史UE上报数据分别进行标签处理;
本实施例中,如图2所示,在完成对具有准确位置的历史UE上报数据进行区域内外分类后,将落在该指定区域内的历史UE上报数据标记为1,将落在该指定区域外的历史UE上报数据标记为0;其中,历史UE上报信息包括但不限于MR(Measurement Report,测量报告)信息。
步骤S3、获取历史UE上报信息,从所述历史UE上报信息中抽取出特征,并结合落在区域内外的标签构建特征分类模型;
本实施例中,从历史UE上报信息中抽取出特征集,包括但不限于:主服务小区ID列表,邻服务小区ID列表,主服务小区信号强度,邻服务小区信号强度,以及各个小区(包括主服务小区、邻服务小区)到指定区域中心点的距离等信息。
本实施例中,根据从历史UE上报信息中抽取的特征,以及结合落在区域内外的标签构建的特征分类模型,可以是根据特征集,人为规定的分类规则;也可以是根据历史数据,学习UE上报信息模式,并经过一系列算法建立的分类模型。
步骤S4、根据所述特征分类模型,对采集的不含准确位置的UE上报信息样本进行是否落在指定区域的分类处理;
本实施例中,根据抽取出的特征集,结合上述对指定区域内外的历史数据进行标记的标签,通过数据挖掘和/或统计分析的方法,建立区域内/区域外的特征分类模型。其中,可选用数据挖掘方法包括但不限于决策树,逻辑回归,随机森林等方法。
根据特征分类模型,对采集到的不含准确位置的UE上报信息进行分类处理,区分出来每一条数据信息是落在指定区域内还是指定区域外。
步骤S5、将分类得到的落在所述指定区域内的样本点进行人流量统计。
本实施例中,可以将分类得到的落在所述指定区域内的样本点进行人流量统计。进一步地,还可以获取指定时间段内的UE上报信息,在根据特征分类模型,得到分类结果后,可以按照所需要的时间段,统计该指定区域在指定时间段内的人流量大小。
本发明提供的人流量统计方法,通过获取指定区域的边界,对具有准确位置的历史UE上报数据进行区域内外分类,然后根据分类结果,对区域内外的所述历史上报数据分别进行标签处理,再从历史UE上报信息中抽取出特征,并结合落在区域内外的标签构建特征分类模型,最后根据所述特征分类模型,对采集的不含准确位置的UE上报信息样本进行是否落在指定区域的分类处理,并将分类得到的落在所述指定区域内的样本点进行人流量统计。这样,基于准确位置学习UE上报信息的模式,建立特征分类模型,不仅具有鲁棒性好,适应性强的特点,还可以解决基于GPS数据源的数据样本不足以及基于UE上报信息存在误差的技术问题,从而提高了针对特定区域进行人流量统计的准确性。
在第一实施例中,如图3所示,在上述图1所示的实施例基础上,所述步骤S3包括:
步骤S31、获取历史UE上报信息,统计主服务小区以及邻服务小区ID的分布特征;
步骤S32、抽取覆盖所述指定区域的主服务小区ID列表以及邻服务小区ID列表,并结合落在所述指定区域内外的标签构建主邻区序列集合。
本实施例中,特征集合选取的是历史UE上报信息中的主服务小区以及邻服务小区ID特征序列,抽取主服务小区ID,邻服务小区ID列表作为特征集,以建立是否落在指定区域内的特征分类模型。
具体地,统计主服务小区ID,邻服务小区ID出现的分布特征,统计结果见附图4、附图5。从附图4、5中可以看出,历史数据样本中各个主服务小区ID出现次数的占比,以及按照频次从高到低降序排列后的累积占比。由此可见,对于指定区域的覆盖,无论主服务小区还是邻服务小区,都是少数几个小区进行覆盖的;抽取该特定区域最主要的主服务小区/邻服务小区ID,构建该特定区域主邻区ID特征序列集合。其中,累计覆盖百分比阈值可根据实际需要合理配置,通过所述阈值,可以筛选出重点覆盖该特定区域的主服务小区/邻服务小区,这些主服务小区、邻服务小区即共同构成了主邻区序列特征集合。
在一实施例中,如图6所示,在上述图1所示的实施例基础上,所述步骤S4包括:
步骤S41、根据构建的所述主邻区序列集合,对采集的不含准确位置的所述UE上报信息样本进行分类;
本实施例中,根据构建的所述主邻区序列集合,对采集的不含准确位置的所述UE上报信息样本进行分类,识别出落在该指定区域内的记录。以下列举出其中一种判定规则,当然,在其他实施例中还可以定义其它的判定规则。
步骤S42、若所述UE上报信息样本的主服务小区ID不在所述主服务小区ID列表内,则判定该UE上报信息样本落在所述指定区域外;
本实施例中,针对采集的一条UE上报的信息样本,若其主服务小区ID不在前述得到的主服务小区ID列表内,则直接将该样本的分类归为落在指定区域外;
步骤S43、若所述UE上报信息的主服务小区ID在所述主服务小区ID列表内,则获取邻服务小区ID在所述邻服务小区ID列表内的数量,在所述数量大于预定阈值时,判定该UE上报信息样本落在所述指定区域内。
本实施例中,若所述上报信息的主服务小区ID在所述主服务小区ID列表内,则需进一步获取该样本的所有邻服务小区ID出现在邻服务小区ID列表内的数量,如果获取的数量大于预定阈值,则将其分类归为落在指定区域内,反之,则分类归为落在指定区域外。这样,通过对落在指定区域内的样本记录进行统计,即可得到指定区域的人流变化情况。当然,若按照指定时间获取UE上报信息,则可以按照所需要的时间段,统计该指定区域在指定时间段内的人流量大小。
在第二实施例中,如图7所示,在上述图1所示的实施例基础上,所述步骤S3包括:
步骤S33、获取历史UE上报信息,从所述历史UE上报信息中抽取主服务小区以及邻服务小区的信号强度;
本实施例中,抽取历史UE上报信息中的主服务小区以及邻服务小区的信号强度作为特征集,用于建立是否落在指定区域内的特征分类模型。其中,信号强度优选为RSRP(Reference Signal Receiving Power,参考信号接收强度)。
步骤S34、对获取的主服务小区以及邻服务小区的信号强度进行预处理;
本实施例中,UE上报信息具体可以包含1个主服务小区的RSRP,3条邻服务小区的RSRP,若采集不到RSRP而出现缺失值,则可以进行预处理,预处理包括但不限于剔除无效值和显著的偏离值,并对缺失值进行处理等。
步骤S35、根据经标签处理后的历史数据以及预处理后的样本,采用数据挖掘中的分类算法训练并构建分类模型。
本实施例中,将标签处理后的历史数据以及预处理后的样本,采用逻辑回归等算法进行模型训练,得到一个二元分类模型。
这样,无需对UE进行精确的点定位,而是基于历史数据学习到指定区域的某些特征,即可直接对UE样本是否归属于指定区域进行识别判断,进而得到指定区域内人流量的大小。
在一实施例中,如图8所示,在上述图7所示的实施例基础上,所述步骤S4包括:
步骤S44、获取所述UE上报信息样本的主服务小区以及邻服务小区的信号强度;
步骤S45、根据所述分类模型以及所述主服务小区以及邻服务小区的信号强度,确定该样本是否落在所述指定区域内。
本实施例中,根据上述得到的分类模型,对上报的主服务小区以及邻服务小区的RSRP进行分析,确定该样本是否落在指定区域内。本实施例中,通过逻辑回归分类模型的学习训练,即可根据上报的主服务小区以及邻服务小区的RSRP确定样本是否落在指定区域内。这样,通过对落在指定区域内的样本记录进行统计,即可得到按小时粒度的人流变化情况。当然,若按照指定时间获取UE上报信息,则可以按照所需要的时间段,统计该指定区域在指定时间段内的人流量大小。
在一实施例中,如图9所示,在上述图1所示的实施例基础上,所述步骤S3之前还包括:
步骤S6、对所述历史UE上报信息进行定位,并将所述指定区域进行扩展得到扩展区域;
步骤S7、筛选出落在所述扩展区域内的历史UE上报信息。
本实施例中,采用指纹定位算法或者三角定位等算法,对历史UE上报信息进行定位,并将指定区域扩展一定范围得到一个扩展区域,如沿指定区域边缘向外部扩展300米,然后筛选出落在所述扩展区域内的历史UE上报信息样本点。
经过如上粗筛后,落在指定区域内的样本点集合将相对原来针对全城的样本集合大大减少,然后针对这些通过粗筛后的样本点,构建特征分类模型,对判定落在指定区域内的样本点并进行人流量统计。这样,可以在不降低统计准确度的情况下,有效降低计算复杂度,从而提高了实用性。
本发明提供的一种统计***100,参照图10,在一实施例中,所述统计***100包括:
区域分类模块10,用于获取指定区域的边界,对具有准确位置的历史UE上报数据进行区域内外分类;
本实施例中,根据指定区域的角点的坐标,使用多边形算法,对具有准确位置的历史UE上报数据进行指定区域内外的分类,其中,准确位置是通过UE(User Equipment,用户设备)内的AGPS(Assisted Global Positioning System,辅助全球定位***)来获取的;历史UE上报数据是从UE上报的信息中获取。
标签处理模块20,用于根据分类结果,对区域内外的所述历史UE上报数据分别进行标签处理;
本实施例中,如图2所示,在完成对具有准确位置的历史UE上报数据进行区域内外分类后,将落在该指定区域内的历史UE上报数据标记为1,将落在该指定区域外的历史UE上报数据标记为0;其中,历史UE上报信息包括但不限于MR(Measurement Report,测量报告)信息。
构建模块30,用于获取历史UE上报信息,从所述历史UE上报信息中抽取出特征,并结合落在区域内外的标签构建特征分类模型;
本实施例中,从历史UE上报信息中抽取出特征集,包括但不限于:主服务小区ID列表,邻服务小区ID列表,主服务小区信号强度,邻服务小区信号强度,以及各个小区(包括主服务小区、邻服务小区)到指定区域中心点的距离等信息。
本实施例中,根据从历史UE上报信息中抽取的特征,以及结合落在区域内外的标签构建的特征分类模型,可以是根据特征集,人为规定的分类规则;也可以是根据历史数据,学习UE上报信息模式,并经过一系列算法建立的分类模型。
分类处理模块40,用于根据所述特征分类模型,对采集的不含准确位置的UE上报信息样本进行是否落在指定区域的分类处理;
本实施例中,根据抽取出的特征集,结合上述对指定区域内外的历史数据进行标记的标签,通过数据挖掘和/或统计分析的方法,建立区域内/区域外的特征分类模型。其中,可选用数据挖掘方法包括但不限于决策树,逻辑回归,随机森林等方法。
根据特征分类模型,对采集到的不含准确位置的UE上报信息进行分类处理,区分出来每一条数据信息是落在指定区域内还是指定区域外。
统计模块50,用于将分类得到的落在所述指定区域内的样本点进行人流量统计。
本实施例中,可以将分类得到的落在所述指定区域内的样本点进行人流量统计。进一步地,还可以获取指定时间段内的UE上报信息,在根据特征分类模型,得到分类结果后,可以按照所需要的时间段,统计该指定区域在指定时间段内的人流量大小。
本发明提供的统计***,通过获取指定区域的边界,对具有准确位置的历史UE上报数据进行区域内外分类,然后根据分类结果,对区域内外的所述历史上报数据分别进行标签处理,再从历史UE上报信息中抽取出特征,并结合落在区域内外的标签构建特征分类模型,最后根据所述特征分类模型,对采集的不含准确位置的UE上报信息样本进行是否落在指定区域的分类处理,并将分类得到的落在所述指定区域内的样本点进行人流量统计。这样,基于准确位置学习UE上报信息的模式,建立特征分类模型,不仅具有鲁棒性好,适应性强的特点,还可以解决基于GPS数据源的数据样本不足以及基于UE上报信息存在误差的技术问题,从而提高了针对特定区域进行人流量统计的准确性。
在第一实施例中,如图11所示,在上述图10所示的实施例基础上,所述构建模块30包括:
统计单元301,用于获取历史UE上报信息,统计主服务小区以及邻服务小区ID的分布特征;
构建单元302,用于抽取覆盖所述指定区域的主服务小区ID列表以及邻服务小区ID列表,并结合落在所述指定区域内外的标签构建主邻区序列集合。
本实施例中,特征集合选取的是历史UE上报信息中的主服务小区以及邻服务小区ID特征序列,抽取主服务小区ID,邻服务小区ID列表作为特征集,以建立是否落在指定区域内的特征分类模型。
具体地,统计主服务小区ID,邻服务小区ID出现的分布特征,统计结果见附图4、附图5。从附图4、5中可以看出,历史数据样本中各个主服务小区ID出现次数的占比,以及按照频次从高到低降序排列后的累积占比。由此可见,对于指定区域的覆盖,无论主服务小区还是邻服务小区,都是少数几个小区进行覆盖的;抽取该特定区域最主要的主服务小区/邻服务小区ID,构建该特定区域主邻区ID特征序列集合。其中,累计覆盖百分比阈值可根据实际需要合理配置,通过所述阈值,可以筛选出重点覆盖该特定区域的主服务小区/邻服务小区,这些主服务小区、邻服务小区即共同构成了主邻区序列特征集合。
在一实施例中,如图12所示,在上述图10所示的实施例基础上,所述分类处理模块40包括:
分类单元401,用于根据构建的所述主邻区序列集合,对采集的不含准确位置的所述UE上报信息的样本进行分类;
本实施例中,根据构建的所述主邻区序列集合,对采集的不含准确位置的所述UE上报信息样本进行分类,识别出落在该指定区域内的记录。以下列举出其中一种判定规则,当然,在其他实施例中还可以定义其它的判定规则。
判断单元402,用于若所述UE上报信息样本的主服务小区ID不在所述主服务小区ID列表内,则判定该UE上报信息样本落在所述指定区域外;
本实施例中,针对采集的一条UE上报的信息样本,若其主服务小区ID不在前述得到的主服务小区ID列表内,则直接将该样本的分类归为落在指定区域外;
所述判断单元402,还用于若所述上报信息的主服务小区ID在所述主服务小区ID列表内,则获取邻服务小区ID在所述邻服务小区ID列表内的数量,在所述数量大于预定阈值时,判定该UE上报信息样本落在所述指定区域内。
本实施例中,若所述上报信息的主服务小区ID在所述主服务小区ID列表内,则需进一步获取该样本的所有邻服务小区ID出现在邻服务小区ID列表内的数量,如果获取的数量大于预定阈值,则将其分类归为落在指定区域内,反之,则分类归为落在指定区域外。这样,通过对落在指定区域内的样本记录进行统计,即可得到指定区域的人流变化情况。当然,若按照指定时间获取UE上报信息,则可以按照所需要的时间段,统计该指定区域在指定时间段内的人流量大小。
在第二实施例中,如图13所示,在上述图10所示的实施例基础上,所述构建模块30包括:
抽取单元303,用于获取历史UE上报信息,从所述历史UE上报信息中抽取主服务小区以及邻服务小区的信号强度;
本实施例中,抽取历史UE上报信息中的主服务小区以及邻服务小区的信号强度作为特征集,用于建立是否落在指定区域内的特征分类模型。其中,信号强度优选为RSRP(Reference Signal Receiving Power,参考信号接收强度)。
预处理单元304,用于对获取的主服务小区以及邻服务小区的信号强度进行预处理;
本实施例中,UE上报信息具体可以包含1个主服务小区的RSRP,3条邻服务小区的RSRP,若采集不到RSRP而出现缺失值,则可以进行预处理,预处理包括但不限于剔除无效值和显著的偏离值,并对缺失值进行处理等。
构建单元302,用于根据经标签处理后的历史数据以及预处理后的样本,采用数据挖掘中的分类算法训练并构建分类模型。
本实施例中,将标签处理后的历史数据以及预处理后的样本,采用逻辑回归等算法进行模型训练,得到一个二元分类模型。
这样,无需对UE进行精确的点定位,而是基于历史数据学习到指定区域的某些特征,即可直接对UE样本是否归属于指定区域进行识别判断,进而得到指定区域内人流量的大小。
在一实施例中,如图14所示,在上述图10所示的实施例基础上,所述分类处理模块40包括:
获取单元403,用于获取所述UE上报信息样本的主服务小区以及邻服务小区的信号强度;
确定单元404,用于根据所述分类模型以及所述主服务小区以及邻服务小区的信号强度,确定该样本是否落在所述指定区域内。
本实施例中,根据上述得到的分类模型,对上报的主服务小区以及邻服务小区的RSRP进行分析,确定该样本是否落在指定区域内。本实施例中,通过逻辑回归分类模型的学习训练,即可根据上报的主服务小区以及邻服务小区的RSRP确定样本是否落在指定区域内。这样,通过对落在指定区域内的样本记录进行统计,即可得到按小时粒度的人流变化情况。当然,若按照指定时间获取UE上报信息,则可以按照所需要的时间段,统计该指定区域在指定时间段内的人流量大小。
在一实施例中,如图15所示,在上述图10所示的实施例基础上,所述统计***100还包括:
扩展模块60,用于对所述历史UE上报信息进行定位,并将所述指定区域进行扩展得到扩展区域;
筛选模块70,用于筛选出落在所述扩展区域内的历史UE上报信息。
本实施例中,采用指纹定位算法或者三角定位等算法,对历史UE上报信息进行定位,并将指定区域扩展一定范围得到一个扩展区域,如沿指定区域边缘向外部扩展300米,然后筛选出落在所述扩展区域内的历史UE上报信息样本点。
经过如上粗筛后,落在指定区域内的样本点集合将相对原来针对全城的样本集合大大减少,然后针对这些通过粗筛后的样本点,构建特征分类模型,对判定落在指定区域内的样本点并进行人流量统计。这样,可以在不降低统计准确度的情况下,有效降低计算复杂度,从而提高了实用性。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种人流量统计方法,其特征在于,所述人流量统计方法包括以下步骤:
获取指定区域的边界,对具有准确位置的历史UE上报数据进行区域内外分类;
根据分类结果,对区域内外的所述历史UE上报数据分别进行标签处理;
获取历史UE上报信息,从所述历史UE上报信息中抽取出特征,并结合落在区域内外的标签构建特征分类模型;
根据所述特征分类模型,对采集的不含准确位置的UE上报信息样本进行是否落在指定区域的分类处理;
将分类得到的落在所述指定区域内的样本点进行人流量统计。
2.如权利要求1所述的人流量统计方法,其特征在于,所述获取历史UE上报信息,从所述历史UE上报信息中抽取出特征,并结合落在区域内外的标签构建特征分类模型的步骤包括:
获取历史UE上报信息,统计主服务小区以及邻服务小区ID的分布特征;
抽取覆盖所述指定区域的主服务小区ID列表以及邻服务小区ID列表,并结合落在所述指定区域内外的标签构建主邻区序列集合。
3.如权利要求2所述的人流量统计方法,其特征在于,所述根据所述特征分类模型,对采集的不含准确位置的UE上报信息样本进行是否落在指定区域的分类处理的步骤包括:
根据构建的所述主邻区序列集合,对采集的不含准确位置的所述UE上报信息样本进行分类;
若所述UE上报信息样本的主服务小区ID不在所述主服务小区ID列表内,则判定该UE上报信息样本落在所述指定区域外;
若所述上报信息的主服务小区ID在所述主服务小区ID列表内,则获取邻服务小区ID在所述邻服务小区ID列表内的数量,在所述数量大于预定阈值时,判定该UE上报信息样本落在所述指定区域内。
4.如权利要求1所述的人流量统计方法,其特征在于,所述获取历史UE上报信息,从所述历史UE上报信息中抽取出特征,并结合落在区域内外的标签构建特征分类模型的步骤包括:
获取历史UE上报信息,从所述历史UE上报信息中抽取主服务小区以及邻服务小区的信号强度;
对获取的主服务小区以及邻服务小区的信号强度进行预处理;
根据经标签处理后的历史数据以及预处理后的样本,采用数据挖掘中的分类算法训练并构建分类模型。
5.如权利要求4所述的人流量统计方法,其特征在于,所述根据所述特征分类模型,对采集的不含准确位置的UE上报信息样本进行是否落在指定区域的分类处理的步骤包括:
获取所述UE上报信息样本的主服务小区以及邻服务小区的信号强度;
根据所述分类模型以及所述主服务小区以及邻服务小区的信号强度,确定该样本是否落在所述指定区域内。
6.一种统计***,其特征在于,所述统计***包括:
区域分类模块,用于获取指定区域的边界,对具有准确位置的历史UE上报数据进行区域内外分类;
标签处理模块,用于根据分类结果,对区域内外的所述历史UE上报数据分别进行标签处理;
构建模块,用于获取历史UE上报信息,从所述历史UE上报信息中抽取出特征,并结合落在区域内外的标签构建特征分类模型;
分类处理模块,用于根据所述特征分类模型,对采集的不含准确位置的UE上报信息样本进行是否落在指定区域的分类处理;
统计模块,用于将分类得到的落在所述指定区域内的样本点进行人流量统计。
7.如权利要求6所述的统计***,其特征在于,所述构建模块包括:
统计单元,用于获取历史UE上报信息,统计主服务小区以及邻服务小区ID的分布特征;
构建单元,用于抽取覆盖所述指定区域的主服务小区ID列表以及邻服务小区ID列表,并结合落在所述指定区域内外的标签构建主邻区序列集合。
8.如权利要求7所述的统计***,其特征在于,所述分类处理模块包括:
分类单元,用于根据构建的所述主邻区序列集合,对采集的不含准确位置的所述UE上报信息样本进行分类;
判断单元,用于若所述UE上报信息样本的主服务小区ID不在所述主服务小区ID列表内,则判定该UE上报信息样本落在所述指定区域外;
所述判断单元,还用于若所述上报信息的主服务小区ID在所述主服务小区ID列表内,则获取邻服务小区ID在所述邻服务小区ID列表内的数量,在所述数量大于预定阈值时,判定该UE上报信息样本落在所述指定区域内。
9.如权利要求6所述的统计***,其特征在于,所述构建模块包括:
抽取单元,用于获取历史UE上报信息,从所述历史UE上报信息中抽取主服务小区以及邻服务小区的信号强度;
预处理单元,用于对获取的主服务小区以及邻服务小区的信号强度进行预处理;
构建单元,用于根据经标签处理后的历史数据以及预处理后的样本,采用数据挖掘中的分类算法训练并构建分类模型。
10.如权利要求9所述的统计***,其特征在于,所述分类处理模块包括:
获取单元,用于获取所述UE上报信息样本的主服务小区以及邻服务小区的信号强度;
确定单元,用于根据所述分类模型以及所述主服务小区以及邻服务小区的信号强度,确定该样本是否落在所述指定区域内。
CN201710141863.4A 2017-03-10 2017-03-10 人流量统计方法及统计*** Active CN108573265B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710141863.4A CN108573265B (zh) 2017-03-10 2017-03-10 人流量统计方法及统计***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710141863.4A CN108573265B (zh) 2017-03-10 2017-03-10 人流量统计方法及统计***

Publications (2)

Publication Number Publication Date
CN108573265A CN108573265A (zh) 2018-09-25
CN108573265B true CN108573265B (zh) 2023-04-07

Family

ID=63577395

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710141863.4A Active CN108573265B (zh) 2017-03-10 2017-03-10 人流量统计方法及统计***

Country Status (1)

Country Link
CN (1) CN108573265B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109600758B (zh) * 2018-11-15 2022-03-29 南昌航空大学 一种基于rss的人流量监测方法
CN111898322B (zh) * 2020-08-11 2024-03-01 腾讯科技(深圳)有限公司 一种数据处理方法及相关设备
CN113409018B (zh) * 2021-06-25 2024-03-05 北京红山信息科技研究院有限公司 人流密度确定方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201518687D0 (en) * 2015-10-21 2015-12-02 Fujitsu Ltd EMF impact triggered reporting and cell selection
CN105516928A (zh) * 2016-01-15 2016-04-20 中国联合网络通信有限公司广东省分公司 一种基于位置人群特征的位置推荐方法和***
CN106251578A (zh) * 2016-08-19 2016-12-21 深圳奇迹智慧网络有限公司 基于探针的人流预警分析方法和***
CN106303953A (zh) * 2016-07-29 2017-01-04 上海斐讯数据通信技术有限公司 一种人流量统计***及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE505044T1 (de) * 2007-11-29 2011-04-15 Nokia Siemens Networks Oy Funkzellenleistungsüberwachung und/oder - steuerung basierend auf den endgerätpositionierungsdaten und funkqualitätsparametern

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201518687D0 (en) * 2015-10-21 2015-12-02 Fujitsu Ltd EMF impact triggered reporting and cell selection
CN105516928A (zh) * 2016-01-15 2016-04-20 中国联合网络通信有限公司广东省分公司 一种基于位置人群特征的位置推荐方法和***
CN106303953A (zh) * 2016-07-29 2017-01-04 上海斐讯数据通信技术有限公司 一种人流量统计***及方法
CN106251578A (zh) * 2016-08-19 2016-12-21 深圳奇迹智慧网络有限公司 基于探针的人流预警分析方法和***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于Cell_ID的区域定位方法的研究与实现;王雪靖等;《软件》;20161115(第11期);全文 *

Also Published As

Publication number Publication date
CN108573265A (zh) 2018-09-25

Similar Documents

Publication Publication Date Title
Bachir et al. Inferring dynamic origin-destination flows by transport mode using mobile phone data
Lesani et al. Development and testing of a real-time WiFi-bluetooth system for pedestrian network monitoring, classification, and data extrapolation
CN109982366B (zh) 基于大数据的目标价值区域分析方法、装置、设备及介质
Janecek et al. The cellular network as a sensor: From mobile phone data to real-time road traffic monitoring
Fekih et al. A data-driven approach for origin–destination matrix construction from cellular network signalling data: a case study of Lyon region (France)
Sohn et al. Dynamic origin–destination flow estimation using cellular communication system
CN109996186A (zh) 一种网络覆盖问题识别方法及装置、可读取存储介质
CN108109423B (zh) 基于WiFi室内定位的地下停车场智能导航方法及***
CN109996278B (zh) 道路网络质量评估方法、装置、设备及介质
CN109688532B (zh) 一种划分城市功能区域的方法及装置
CN107767669A (zh) 基于WiFi和蓝牙识别的公交线路客流OD估计方法
CN108616900B (zh) 一种室内外测量报告的区分方法及网络设备
CN105472621B (zh) 一种基于rssi的伪ap检测方法
CN103648096A (zh) 一种非法基站入侵的快速检测与定位方法
CN108133001B (zh) Mr室内外分离方法、装置及介质
CN108573265B (zh) 人流量统计方法及统计***
CN109803274B (zh) 一种天线方位角优化方法和***
CN104636611A (zh) 城市道路/路段的车辆速度评估方法
CN107027148A (zh) 一种基于UE速度的Radio Map分类定位方法
CN103167605B (zh) 一种卫星辅助信号覆盖图建立/更新的WiFi室外定位方法
CN110460962A (zh) 轨道交通用户识别方法和装置
Leca et al. Significant location detection & prediction in cellular networks using artificial neural networks
Kanjo et al. CrowdTracing: overcrowding clustering and detection system for social distancing
Duan et al. MobilePulse: Dynamic profiling of land use pattern and OD matrix estimation from 10 million individual cell phone records in Shanghai
Meneses et al. Using GSM CellID positioning for place discovering

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant