CN105227369A - 基于众包模式的移动Apps对无线网路资源利用的分析方法 - Google Patents

基于众包模式的移动Apps对无线网路资源利用的分析方法 Download PDF

Info

Publication number
CN105227369A
CN105227369A CN201510674309.3A CN201510674309A CN105227369A CN 105227369 A CN105227369 A CN 105227369A CN 201510674309 A CN201510674309 A CN 201510674309A CN 105227369 A CN105227369 A CN 105227369A
Authority
CN
China
Prior art keywords
mobile
window
mobile solution
app
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510674309.3A
Other languages
English (en)
Other versions
CN105227369B (zh
Inventor
吴冬华
欧阳晔
王计斌
胡岳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Hua Su Science and Technology Ltd.
Original Assignee
Nanjing Hua Su Science And Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Hua Su Science And Technology Co Ltd filed Critical Nanjing Hua Su Science And Technology Co Ltd
Priority to CN201510674309.3A priority Critical patent/CN105227369B/zh
Publication of CN105227369A publication Critical patent/CN105227369A/zh
Priority to PCT/CN2016/078830 priority patent/WO2017067141A1/zh
Priority to US15/127,400 priority patent/US20170264749A1/en
Application granted granted Critical
Publication of CN105227369B publication Critical patent/CN105227369B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M15/00Arrangements for metering, time-control or time indication ; Metering, charging or billing arrangements for voice wireline or wireless communications, e.g. VoIP
    • H04M15/58Arrangements for metering, time-control or time indication ; Metering, charging or billing arrangements for voice wireline or wireless communications, e.g. VoIP based on statistics of usage or network monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/60Subscription-based services using application servers or record carriers, e.g. SIM application toolkits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于众包模式的移动Apps对无线网路资源利用的分析方法,通过一个基于众包技术的安装在移动客户端的数据采集工具和位于云服务器上的分析算法,采集每种移动应用App的行为特征数据,并针对性的利用机器学***。

Description

基于众包模式的移动Apps对无线网路资源利用的分析方法
技术领域
本发明涉及移动Apps对无线网路资源利用的分析方法,具体涉及一种基于众包模式的移动Apps对无线网路资源利用的分析方法。
背景技术
智能终端拉近了人们彼此之间的距离,而自从拥有了面向移动网络的各种移动应用业务,简称移动Apps,智能终端更使人们能够通过Apps所提供的丰富服务内容加强了彼此之间的联系,如视频直播,推送电子邮件,及在线聊天等。然而,Apps的快速增长和网络话务的急剧增加给移动网络带来了巨大的开销。在2013中,全球移动数据流量增长了81%,超过了2012年,每月达到了15GB。除了数据流量,在线聊天程序,如微信和推特,需要周期性地发送约2400个/小时的心跳信号到用于接收推送消息的服务器上,而这些Apps在2015年将达到480亿次的下载量。这些数据和信号风暴极大地消耗了终端资源,如电源,CPU及带宽等,而且有时也会造成一些移动服务的中断,这大大降低了移动网络服务质量的水平。基于以上事实,这也引起了移动通信运营商们对智能终端Apps如何使用基站小区的无线网络资源状况的重视,特别关键的是对资源的控制,服务质量的改善,资源使用的定价等。
虽然网络资源使用状况分析的问题已引起了所有移动运营商们的普遍关注,但一个普遍的现状是现有的研究主要是对智能终端自身的性能以及优化的研究,如对终端上运行的各种移动应用Apps使用智能终端资源状况的分析,而对终端应用如何最优化的利用和消耗小区无线网络资源的状况却缺乏一种有效的方法。目前与终端资源管理相关的研究工作可以分为两类:(1)移动应用Apps对智能终端资源使用状况的分析,该项工作注重于终端端,并针对终端Apps分析智能终端资源的使用状况;(2)网络资源的管理和优化,该项工作是分析用户活动和移动模式是如何影响移动网络资源分配的问题。现有的方案并不能直接用于解决上述问题,因为他们要么只关注于终端端的资源使用情况分析,要么只关注于分析网络资源使用状况时并不考虑终端Apps的影响。因此,对于移动通信运营商而言,他们急需一种有效的方法将移动应用Apps的特征行为与网络话务和网络资源映射与关联起来,特别是以注重于网络端为基础,分析以无线网络为载体的移动应用Apps对无线网络资源的具体使用情况。由此实现网络端无线资源的合理配置,优化使用。
然而,不像智能手机的内部物理资源(其直接只被终端Apps的函数调用),无线网络资源不仅直接受移动终端上运行的Apps的影响,而且受多种纷繁复杂的无线网络条件的影响,如流量大小和信号强度等。此外,由于在移动网络中众多移动应用App的共存及其对网络的巨大影响,我们即使只专注于移动应用Apps,也很难清楚地将一个App所使用的资源与其他Apps所用的资源相分开。最后,对于每一个特定的移动应用Apps,它们自然适用于不同时间和不同网络条件的区域。因此,移动应用Apps的行为、网络特征及资源使用状况最终频繁地变化着。针对移动应用Apps,诸如这种模糊性、复杂性及动态性等特征对网络资源的分析提出了挑战,而且这也使得移动运营商对移动应用Apps使用资源状况的量化或相对排名等方面变得异常困难。
发明内容
本发明针对上述现有技术存在的问题作出改进,即本发明要解决的技术问题是提供一种基于众包模式的移动Apps对无线网路资源利用的分析方法,着眼于针对每个移动应用App使用网络资源的情况进行分析,并利用这些知识为移动运营商提供决策建议,如预测,控制及对App所使用的资源进行定量化定价,以提高无线网络资源利用与效率和服务质量水平。
为了解决上述技术问题,本发明提供了如下的技术方案:
一种基于众包模式的移动Apps对无线网路资源利用的分析方法,通过一个众包工具和位于服务器上的分析算法,采集移动应用APP行为指标,并对所述行为指标进行数据挖掘;在移动应用APP行为特征指标、无线网络资源及网络话务间建立映射模型,对移动应用App网络资源利用情况进行分析。
所述映射模型为两层因果关系映射模型,通过选取相关的指标作为特征项及其回归依据,在移动应用App和网络话务之间建立一种可量化的映射。
所述两层因果关系映射模型具体为,设计基于随机森林决策树的相似矩阵辅助选择算法,选择与网络话务指标高度相关的移动应用APP性能特征指标,并且开发基于滑动窗口的局部权重散点图平滑算法,以回归所选取的指标建立移动应用App与网络话务之间、网络话务与网络资源利用之间的两层映射,即移动应用App的行为变化可被用来对在较低层的网络话务变化进行建模,并进一步利用网络话务对网络资源进行建模。
设所述相似矩阵为P,P是一个n*n的全零值矩阵,对一个树的节点,设有两个指标,分别记为fi和fj,然后修改矩阵中的项Pij为加1后的取值,Pij=Pij+1,该过程一直重复至所有的决策树都已生成完毕;对矩阵中的每一项取值进行规范化或量化,而每一项代表了其对应指标对的相似度。
所述滑动窗口的局部权重散点图平滑算法具体为,把所选的指标作为特征项,并把这些特征项的取值落入相对应的窗口区间,根据各窗口的分布和局部设置情况,动态地调整窗口大小。
在窗口被配置之后,给定一个拥有n个点、K个窗口和每个具有相同的长度(即L=n/k)的特征项,设置一个初始窗口大小为并对所有按升序排列的测量值绘制散点图;设f(x),(x=1,...,n)表示散点图的功能;首先,针对每一个窗口,通过整合散点图的范围内函数取值,计算其分布密度,具体如下:
然后,将F={F0,...,Fk-1}按升序进行排序,设BFmin表示F中取值最小的窗口,BFmed表示F中取平均值的窗口,及BFmax表示F中取值最大的窗口,并根据已排序完成的结果动态地计算出窗口的大小,具体如下:
然后,对两层中已选特征项使用动态的LOESS回归算法,在回归之后,成功地获得到两层映射,使用移动应用App的行为特征指标信息对网络话务话务建模,并进一步利用网络话务对网络资源进行建模,即实现针对基于小区层面的移动业务App对小区网络资源利用情况进行建模。
本发明的有益效果是针对每个移动应用App使用网络资源的情况进行分析,并利用这些知识为移动运营商提供决策建议,如预测,控制及对App所使用的资源进行定价,以提高资源分配率和服务质量水平。
附图说明
图1是本发明原理图。
图2是实施例的模型。
具体实施方式
如图1所示,本发明公开一种基于众包模式的移动Apps对无线网路资源利用的分析方法,通过一个众包工具和位于服务器上的分析算法,采集APP行为指标,并对所述行为指标进行数据挖掘;在APP行为指标、无线网络资源及网络话务间建立一个两层因果关系映射模型(如图2),对移动应用App网络资源利用情况进行分析。
两层因果关系映射模型具体为,设计基于随机森林决策树的相似矩阵辅助选择算法,选择与网络话务高度相关的APP可测量指标,并且开发基于滑动窗口的局部权重散点图平滑算法,以回归所选取的指标建立移动应用App和网络话务之间的映射;移动应用App的行为变化可被用来对在较低层的网络话务变化进行建模。
为建立两层映射模型而选择相关特征指标,设计了相似矩阵辅助选择(PMFS)算法,即通过利用随机森林决策树,根据指标的相似距,对各个指标的重要性进行计分。
在数据采集之后,根据3GPP相关技术标准(例如,3GPPTS36.104)和指标的测量值,对每条记录中的每个指标进行标记,并为这些数据建立决策树而采用监督学习的思想和应用随机森林决策树分类器,以分成不同的类。而在构建的树时,设计了一个二维相似矩阵,其中每一项记录的各个指标之间存在的相似距。我们使用所设计的相似矩阵来测量团簇之间的相似度,并将这些知识运用在数据被分成不同的类时,对每个指标的重要性进行计分。我们只选择得高分的指标作为特征指标,因为这些特征指标被认为与数据的变化有关。
更具体地说,在随机森林决策树的生成过程中,对相似矩阵不断地进行完善。假如给定一个含n个指标的训练数据集,初始时,相似矩阵P是一个n*n的全零值矩阵。当生成树时,我们对树中每个节点的研究如下:
对一个树的节点,设有两个指标,分别记为fi和fj,然后修改矩阵中的项Pij为加1后的取值(即Pij=Pij+1)。该过程一直重复至所有的决策树都已生成完毕。之后,对矩阵中的每一项取值进行规范化(或量化),而每一项代表了其对应指标对的相似度。
由于使用近邻相似矩阵,所以现在需要对每个指标的重要性进行计分。假设训练集含有n个指标,并已被分为c类。我们开始计算类内部相似度Pintra和类间相似度Pinter,如下:
R=Pintra/Pinter;(1)
其中,对该指标的重要性起着决定性的作用。用随机噪声替换了它自身的取值,得到了一个新的数据集,然后将这个新的数据集用于随机森林分类器上,获得一个新的相似矩阵Pi,并与Ri相对应。为找出新相似度与原相似度的区别,即R′i=R-Ri,对所有的指标进行了相同的过程。最后,对相似度间的差异进行规范化,即ISi=R′i/S。其中,S为所有指标{R′1,...R′n}的标准差。
如果一个指标的重要度得分越高,那么该指标对于分类器越高度相关。因此,可以选取一些可被用于显示数据变化(例如,无线网络资源的变化等)且得分较高的指标。事实上,值得一提的是,在无线网络中含有数千个指标,假如对所有这些指标的相关度进行量化计分,这可能需要花费比较长的时间。为了加快搜索进度,通过使用领域知识来预先选择了一系列的候选指标,而不是针对所有的指标进行搜索。
其中,PMFS算法的主要实现步骤,具体如下(已训练完成且拥有T个节点的决策树)。
输入:预选指标的训练数据
输出:每一个指标fi的重要度得分ISi
//更新P
规范化P
通过使用公式(1)计算基于P的相似度比率R
根据从所收集数据中抽取的相关指标信息,分析用于获得两层映射关系的回归技术。开发了基于自适应SW-LOESS的滑动窗口,而这提高了LOESS的执行效率,即通过在回归的过程中自动计算最佳窗口大小,而不是在原LOESS算法中对该窗口设定固定的大小。具体而言,该算法把所选的指标作为特征项,并把这些特征项的取值打包入不同的窗口,同时,根据各窗口的分布和局部设置情况,动态地调整窗口大小。实际上,这些窗口可由领域专家根据自身的经验进行设定。在窗口被配置之后,假如给定一个拥有n个点、K个窗口和每个具有相同的长度(即L=n/k)的特征项,我们设置一个初始窗口大小为并对所有按升序排列的测量值绘制散点图。设f(x),(x=1,...,n)表示散点图的功能。首先,针对每一个窗口,通过整合散点图的范围内函数取值,我们计算其分布密度,具体如下:
然后,我们将F={F0,...,Fk-1}按升序进行排序,设BFmin表示F中取值最小的窗口,BFmed表示F中取平均值的窗口,及BFmax表示F中取值最大的窗口,并根据已排序完成的结果动态地计算出窗口的大小,具体如下:
然后,我们可对两层中已选特征项使用动态的LOESS回归算法。在回归之后,我们成功地获得到两层映射,而这可使我们使用移动应用App的行为指标信息对网络话务进行建模,并进一步利用网络话务对小区网络资源进行建模,即我们现在可以针对基于移动应用App的指标信息对小区网络资源利用情况进行建模。
此外,我们开发了一个可成功将移动应用App级别的行为特征指标信息映射到底层网络资源使用中的模型。在这一部分中,为预测未来的移动应用App行为(用于预测未来网络资源利用状况),我们利用已建立完成的模型来设计一个临时的挖掘算法。在AppToR中,我们从众多的移动用户和几乎每个小区中收集了App的特征指标信息。例如,针对每个小区中的一个行为指标X,如App的吞吐量或在线用户数,其时间序列(属于时间T1和T2之间)可以表示为X(T1),X(T1+1),...,X(T2)。然而,在这些直接被测量的时间系列中,其包括了各种特征项信息,如趋势性、季节性、突发性、波动性及信噪等。为清晰地理解每个指标是如何随着时间的推移而变化的过程,我们设计了一个算法,以根据四个特征项对所测量的时间序列进行分解:(1)趋势性T(t),它表示了移动应用App行为的长期变化,如用户行为,收费政策,或用户数等,并反映出在大粒度时的变化(例如,每星期);(2)季节性S(T),它表示了周期性变化,如App流量的日变化(忙时/非忙时);(3)突发性B(t),其表明了因外部的已知或未知的因素对正常的趋势所造成的显著变化;(4)随机信噪R(t),其包含了不可预测的波动和可测量的噪音。这种分解是专门针对运营活动进行的分析,而这些活动通常具有很强的季节性特点。除了常用的分解方法,如霍尔特-温特斯,我们引入了一个额外的特征项,即突发性,其特别适合于大流量突变的情况,例如美国的超级杯赛(美式橄榄球)。分量提取算法的详细分析如下:
1)趋势特征的提取:为将趋势特征从一个时间序列中提取出来,我们首先对时间系列进行切片,并把线性回归算法应用到每一分片中,最后将所有符合要求的分片进行拟合,即表示了所输入的时间序列的趋势。
当对时间系列进行分片时,每片的长度取决于所要预测的时间长度,即需要预测的时间越遥远,分片的长度也越长。分片后,异常需要被删除,以确保平滑的趋势。为此,我们首先采用Shapiro-Wilk试验来测试时间序列的正态性。如果它服从正态分布,那么我们只需简单的将那些在95%的置信水平外的剩下两侧取值点进行删除,以排除异常值。如果时间序列不呈正态分布,我们采用四分位数间距(IQR)来排除异常值。在消噪后,我们对这些分片应用线性回归算法进行拟合。
2)季节性特征的提取:众所周知,无线流量或资源消耗通常具有很强的每周或每月的周期性,而这进一步加强了数据在不同时期的高度相关性,如季节性等。我们使用这些固定的长度来对时间序列进行季节性特征信息的提取,而它可以利用有的各种方法来获得,如移动平均法。
3)突发性特征的提取:它表明了因外部的已知或未知的因素对正常的趋势所造成的显著变化。已知的原因是可预见的,如节假日等,而不可预测的未知原因是由小概率的随机事件所造成的。例如,在很短的时间内许多用户同时打电话,以致产生了非常大的数据流量。
我们使用一个阈值来确定其是否为突发性变化。在该模型中,突发性被定义为一个可疑App超过预定流量数据阈值时所测得。例如,在正态分布中,低于置信水平的两侧数据点便可认为是突发点。一个确定突发情况的更为有效办法是比较其取值与正常趋势特征项的取值。如果某点超过了阈值的预定比例,例如120%,我们即可确定该点取值为一个突发点。通过使用这种突发识别机制,对于任何给定不同区域的小区,我们首先便可对可能产生突发流量的事件确定相似距,如假期或体育赛事。然后针对每个已识别的事件,我们给它配上相应的突发值和持续时间。在确定已知的突发点之后,下一步便是观察这些突发点是否会随时间的推移而按照预期频繁的出现。如果是,我们便可确认这些突发点是会经常发生的;否则,我们把它作为一个特例(即下面将要介绍的随机信噪)。
4)随机信噪的提取:随机分量R(t)可以进一步分解为平稳时间序列RS(T)和白噪声RN(T)。App特征指标项的测量值减去前三个指标项测量值之和便是该随机误差的估计值。处于忙时的随机误差分量取值是由其处于忙时的平均值给定。
下面结合实验结果证明本发明的可行性:
第一步持续了两个月,即从2014年1月到2014年2月。收集来自50部智能终端的下载数据量,而这些终端使用了与所有主要的Apps(如facebook,YouTube,在线聊天,What’sapp及GoogleMap等)相兼容的安卓4.2+***。本发明以日志的形式记录了所有需要的App行为指标信息,生成并定期上传测试日志至本实验数据中心。为确保所收集的App行为与网络使用数据的一致性,我们部署了四个彼此相邻的测试小区。其中,一个IMEI列表的配置是,只有指定的这些智能终端才可以访问测试小区,而任何其他设备访问或切换到该测试小区都将被阻止。通过这些配置之后,我们便可确保通过50部智能终端产生的App数据与在这些测试小区中产生的流量统计数据日志完全在线同步。第二步历时了七个月,即从2014年2月到2014年7月,为获得数据的临时趋势和季节性信息,比第一步的时间更长。在这一步中,为在实际小区中测试本研究小组建立的模型,我们并不使用测试小区。相反,我们使DPI每周30分钟在实际小区中收集数据。所测得的DPI数据由各种Apps的行为指标信息构成,并与流量统计日志的粒度相符合。
我们选择下行小区的链路交换功率(TCP功率)作为有趣的网络资源指标,因为它是支持网络主要功能的最关键性资源。然后本试验分析了移动应用App是如何消耗TCP功率的过程。
在实验的过程中,我们收集了两种数据集。第一种数据集是由本发明收集的Apps日志和来自测试小区的网络资源利用统计数据。第二种数据集是DPI日志。总之,我们仔细地观察了207个忙时的网络使用状况,并收集了这些数据。由于不完整的日志或解析失败等情况,我们排除了最后10小时的数据,并获得197份有效忙时测量数据,而这些数据可用于测试所设计的模型和验证预测算法。
我们首先通过使用PMFS来选择与TCP功率高相关性的可判别性流量指标,然后再应用PMFS来选择与之前选择的流量指标高度相关的App行为指标。根据3GPPTR36.942,我们首先将TCP功率分为4类,即[0dBm,10dBm],(10dBm,20dBm],(20dBm,30dBm的],和(30dBm,43dBm],并对每一类进行标记。我们通过应用随机森林分类器来训练1500棵树,以推导出针对TCP功率的相似矩阵及为其重要性进行评分。在量化后,表1中的数据表示了与TCP功率高度相关的排名前11个的流量指标。
根据表1中所示,我们可以看到的是,已选取的流量指标大致可以分为以下三类:用户面指标:DL.Cell.Simultaneous.Users.Average,DL.Cell.PRB.Used.Average,DL.Cell.PDCP.Throughput,Cell.RRC.Connected.Users.Average。
信令面指标:Cell.RRC.Connection.Req,Cell.PDCCH.OFDM.Symbol.Number,Cell.Paging.UUInterface.Number,Cell.PDCCH.OFDM.CCE.Number。
移动性指标:Cell.Intra+IntereNB.Handover.In,
Cell.Intra+IntereNB.Handover.Out,
表1.选取的流量指标
流量指标 重要度评分
DL.Cell.PRB.Used.Average 0.8735
DL.Cell.Simultaneous.Users.Average 0.8454
DL.Cell.PDCP.Throughput 0.8253
Cell.RRC.Connected.Users.Average 0.8192
Cell.RRC.Connection.Req 0.7960
Cell.eRAB.Setup.Req 0.7807
Cell.Paging.UUInterface.Number 0.7402
Cell.PDCCH.OFDM.Symbol.Number 0.7396
Cell.PDCCH.OFDM.CCE.Number 0.7308
Cell.Intra+IntereNB.Handover.Out 0.6377
Cell.Intra+IntereNB.Handover.In 0.6169
这两个分别是内/间eNodeB切换的入向和出向。已选取的指标及其对应的类别在我们期望之中是因为这三类在实际网络中为造成大量消耗无线网络资源的主要因素。同样地,根据所选择的流量指标,我们通过使用PMFS来选取App的行为指标。表2中的数据则列出了对流量指标影响比较大且排名靠前的13个App指标。
表2.选取的App行为指标
App行为指标 重要度评分
DL.TrafficVolumn.Bytes.PerApp 0.8690
DL.MeanHoldingTime.PerSession.PerApp 0.8529
Sessions.PerUser.PerApp 0.8181
ActiveSessions.PerApp 0.8116
Registered.Users.PerApp 0.8012
DL.ActiveUsers.PerApp 0.7921
Throughput.PerSession.PerApp 0.7408
DL.PacketCall.Frequency.PerApp 0.7134
UL.ActiveUsers.PerApp 0.7103
DL.Bytes.PerPacketCall.PerApp 0.6945
DL.Packets.PerPacketCall.PerApp 0.6733
PacketFreq.PerPacketCall.PerApp 0.6402
DL.PacketCalls.PerSession.PerApp 0.6307
为评估两层映射模型的准确性,我们使用整个数据集的80%作为训练集,且整个数据集剩余的20%作为测试集,并应用已设计好的SW-LOESS回归算法。我们比较了由本发明模型计算得出的指标数据与真实区域的测量值,并使用平均绝对误差率(MAPE)对本次建立的模型计算误差,具体如下:
e = 1 n Σ i = 1 n | S i m e a s u r e - S i e s t S i m e a s u r e | ,
其中,是分别与第ith个App的可测量和评估指标相对应,11个已选取流量指标的MAPE值已在图2中列出。根据图2中的数据显示,除了有关的移动性指标之外,我们可以观察到的是所有流量指标的MAPE测量值小于0.25,而其MAPE的训练值则更小。移动性指标取值较高的原因是本研究中建立的模型所使用的数据为四个测试小区中的数据,而在许多广泛分布的小区中,使用的数据是DPI数据。测试小区之间因彼此相邻而不能获得足够的移动行为指标数据,因此移动性相关指标的MAPE值会比其他的高。然而,因流动性指标的重要性评分较低(见表1,小于0.65),其MAPE的取值对模型的准确性影响并不是很大。我们配置了数百个移动应用App,并且数据表示了主要Apps对网络资源(TCP功率)利用的百分比。
HTTP/HTTPS对资源消耗最严重,如浏览器,因为Web浏览器始终是智能终端上Apps中被使用最频繁的。流媒体应用,如P2P,Netflix及相关的视频文件等Apps,对资源的消耗也比较严重。除了这两类Apps之外,发送命令比较频繁的App,如facebook,What’sapp等,因用户众多,消耗了非常可观的网络资源。这些分析使移动运营商可以了解每个移动应用App所使用的无线网络资源是如何消耗的,并非常有助于他们对资源的管理和定价。
我们将设计的基于时间序列的预测算法用于预测App的行为指标。预测两种典型应用指标的结果:线下和线上的活跃用户数。预测结果:两个指标的MAPE训练值分别是7.47%和8.93%,而其MAPE的预测(测试)值则小幅上升,分别达到了12.54%和13.39%。训练和预测集间的MAPE差值约为较低的5%,该数据验证了本预测模型是可靠的和健壮的。同时,我们也将该预测算法应用到其他指标中,这些指标训练时的MAPE取值范围是在7.47%和18.34%之间,而其预测时的MAPE取值范围是在12.54%到25.78%之间。总之,大多数指标所预测的MAPE值低于15%。其预测时MAPE值最高为DL.PacketCalls.PerSession.PerApp,这是由在采样时间中,被小区中不稳定的App组合所引起。例如,在一个小区中的一段时间后,大部分的数据流量是由YouTube产生,而就在此之后,所有的流量切换到即时消息。这种急剧变化的App组合引起了某个指标的巨大变化,这使得它很难反映出它的长期趋势、中期和短期的季节性特征。另一方面,该研究也解释了为什么某个指标会在表2的本发明映射模型中重要度评分最低。
综上,本发明首先通过在移动应用app行为特征指标、无线网络资源及网络话务间建立一个两层的映射模型,对移动应用App的网络资源利用情况进行分析。同时,我们开发了一个名为AppToR的基于众包的无线网络分析***,而该***可以收集来自移动用户的各种类型App行为数据。另外,我们也提供一组可从收集的数据中提取相关特征信息的算法,并对这些特征指标进行回归,以建立关系映射模型。最后,我们将本发明部署在一个以LTE为主的无线网络中,并进行实验观察,以评估其性能。实验表明,本发明在评估和预测移动应用App对小区无线网络资源利用方面的情况具有很高的准确性。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于众包模式的移动Apps对无线网路资源利用的分析方法,其特征在于,通过一个众包工具和位于服务器上的分析算法,采集移动应用APP行为指标,并对所述行为指标进行数据挖掘;在移动应用APP行为特征指标、无线网络资源及网络话务间建立映射模型,对移动应用App网络资源利用情况进行分析。
2.根据权利要求1所述的基于众包模式的移动Apps对无线网路资源利用的分析方法,其特征在于:所述映射模型为两层因果关系映射模型,通过选取相关的指标作为特征项及其回归依据,在移动应用App和网络话务之间建立一种可量化的映射。
3.根据权利要求2所述的基于众包模式的移动Apps对无线网路资源利用的分析方法,其特征在于,所述两层因果关系映射模型具体为,设计基于随机森林决策树的相似矩阵辅助选择算法,选择与网络话务指标高度相关的移动应用APP性能特征指标,并且开发基于滑动窗口的局部权重散点图平滑算法,以回归所选取的指标建立移动应用App与网络话务之间、网络话务与网络资源利用之间的两层映射,即移动应用App的行为变化可被用来对在较低层的网络话务变化进行建模,并进一步利用网络话务对网络资源进行建模。
4.根据权利要求2或3所述的基于众包模式的移动Apps对无线网路资源利用的分析方法,其特征在于,设所述相似矩阵为P,P是一个n*n的全零值矩阵,对一个树的节点,设有两个指标,分别记为fi和fj,然后修改矩阵中的项Pij为加1后的取值,Pij=Pij+1,该过程一直重复至所有的决策树都已生成完毕;对矩阵中的每一项取值进行规范化或量化,而每一项代表了其对应指标对的相似度。
5.根据权利要求3所述的基于众包模式的移动Apps对无线网路资源利用的分析方法,其特征在于,所述滑动窗口的局部权重散点图平滑算法具体为,把所选的指标作为特征项,并把这些特征项的取值落入相对应的窗口区间,根据各窗口的分布和局部设置情况,动态地调整窗口大小。
6.根据权利要求5所述的基于众包模式的移动Apps对无线网路资源利用的分析方法,其特征在于,在窗口被配置之后,给定一个拥有n个点、K个窗口和每个具有相同的长度(即L=n/k)的特征项,设置一个初始窗口大小为并对所有按升序排列的测量值绘制散点图;设f(x),(x=1,...,n)表示散点图的功能;首先,针对每一个窗口,通过整合散点图的范围内函数取值,计算其分布密度,具体如下:
F j = ∫ f - 1 ( L * j ) f - 1 ( L * j + L ) f ( x ) d x , ( j = 0 , ... , k - 1 )
然后,将F={F0,...,Fk-1}按升序进行排序,设BFmin表示F中取值最小的窗口,BFmed表示F中取平均值的窗口,及BFmax表示F中取值最大的窗口,并根据已排序完成的结果动态地计算出窗口的大小,具体如下:
w i n _ s i z e = 0.5 ( 1 + 1 / i ) * B 100 * N , ( B = 0 , ... , i ) 1 + ( B - i ) 100 * N , ( B = i + 1 , i + 2 , ... , k )
然后,对两层中已选特征项使用动态的LOESS回归算法,在回归之后,成功地获得到两层映射,使用移动应用App的行为特征指标信息对网络话务话务建模,并进一步利用网络话务对网络资源进行建模,即实现针对基于小区层面的移动业务App对小区网络资源利用情况进行建模。
CN201510674309.3A 2015-10-19 2015-10-19 基于众包模式的移动Apps对无线网路资源利用的分析方法 Active CN105227369B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201510674309.3A CN105227369B (zh) 2015-10-19 2015-10-19 基于众包模式的移动Apps对无线网路资源利用的分析方法
PCT/CN2016/078830 WO2017067141A1 (zh) 2015-10-19 2016-04-08 基于众包模式的移动Apps对无线网路资源利用的分析方法
US15/127,400 US20170264749A1 (en) 2015-10-19 2016-04-08 CROWDSOURCING-MODE-BASED ANALYSIS METHOD FOR UTILIZATION OF WIRELESS NETWORK RESOURCES BY MOBILE Apps

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510674309.3A CN105227369B (zh) 2015-10-19 2015-10-19 基于众包模式的移动Apps对无线网路资源利用的分析方法

Publications (2)

Publication Number Publication Date
CN105227369A true CN105227369A (zh) 2016-01-06
CN105227369B CN105227369B (zh) 2016-06-22

Family

ID=54996080

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510674309.3A Active CN105227369B (zh) 2015-10-19 2015-10-19 基于众包模式的移动Apps对无线网路资源利用的分析方法

Country Status (3)

Country Link
US (1) US20170264749A1 (zh)
CN (1) CN105227369B (zh)
WO (1) WO2017067141A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017067141A1 (zh) * 2015-10-19 2017-04-27 南京华苏科技有限公司 基于众包模式的移动Apps对无线网路资源利用的分析方法
CN109143159A (zh) * 2018-07-16 2019-01-04 南京理工大学 基于联合定价和任务分配的指纹众包室内定位激励方法
CN109976916A (zh) * 2019-04-04 2019-07-05 中国联合网络通信集团有限公司 一种云资源需求判定方法及***
US20210064432A1 (en) * 2018-02-05 2021-03-04 Telefonaktiebolaget Lm Ericsson (Publ) Resource needs prediction in virtualized systems: generic proactive and self-adaptive solution
CN113766523A (zh) * 2020-06-02 2021-12-07 ***通信集团河南有限公司 服务小区的网络资源利用率预测方法、装置及电子设备

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10977005B2 (en) * 2017-06-14 2021-04-13 International Business Machines Corporation Congnitive development of DevOps pipeline
KR102408348B1 (ko) * 2017-12-21 2022-06-14 삼성전자주식회사 단말 장치 및 단말 장치의 제어 방법
US11770311B2 (en) * 2019-04-05 2023-09-26 Palo Alto Networks, Inc. Automatic and dynamic performance benchmarking and scoring of applications based on crowdsourced traffic data
CN110324190B (zh) * 2019-07-08 2022-02-15 中国联合网络通信集团有限公司 一种网络规划方法及装置
CN110348122B (zh) * 2019-07-11 2023-01-17 东北大学 基于特征选择的季节型非平稳并发量能耗分析方法
CN113806028A (zh) * 2020-06-16 2021-12-17 阿里巴巴集团控股有限公司 一种空间众包任务分配方法及***、计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102227148A (zh) * 2011-06-07 2011-10-26 西安方诚通讯技术服务有限公司 一种基于gis话务模型的无线网络优化分析方法
CN104579854A (zh) * 2015-02-12 2015-04-29 北京航空航天大学 众包测试方法
US20150133152A1 (en) * 2013-11-08 2015-05-14 Qualcomm Incorporated Techniques and methods for controlling crowdsourcing from a mobile device
CN104640158A (zh) * 2013-11-13 2015-05-20 ***通信集团广东有限公司 终端占用网络资源计算方法、装置和网络资源计算服务器

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100563168C (zh) * 2005-09-30 2009-11-25 杭州华三通信技术有限公司 应用流量统计方法及装置
CN102916854B (zh) * 2012-10-22 2018-02-09 北京瓦力网络科技有限公司 流量统计方法、装置及代理服务器
CN103036729A (zh) * 2012-12-31 2013-04-10 华为技术有限公司 一种开放网络能力的***、方法和相关网元
CN104144083A (zh) * 2013-05-10 2014-11-12 中国电信股份有限公司 一种基于应用的流量统计方法、bras设备及网络
CN104348682A (zh) * 2014-10-11 2015-02-11 北京中创腾锐技术有限公司 一种移动应用流量特征自动分析的方法和***
CN105227369B (zh) * 2015-10-19 2016-06-22 南京华苏科技股份有限公司 基于众包模式的移动Apps对无线网路资源利用的分析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102227148A (zh) * 2011-06-07 2011-10-26 西安方诚通讯技术服务有限公司 一种基于gis话务模型的无线网络优化分析方法
US20150133152A1 (en) * 2013-11-08 2015-05-14 Qualcomm Incorporated Techniques and methods for controlling crowdsourcing from a mobile device
CN104640158A (zh) * 2013-11-13 2015-05-20 ***通信集团广东有限公司 终端占用网络资源计算方法、装置和网络资源计算服务器
CN104579854A (zh) * 2015-02-12 2015-04-29 北京航空航天大学 众包测试方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017067141A1 (zh) * 2015-10-19 2017-04-27 南京华苏科技有限公司 基于众包模式的移动Apps对无线网路资源利用的分析方法
US20210064432A1 (en) * 2018-02-05 2021-03-04 Telefonaktiebolaget Lm Ericsson (Publ) Resource needs prediction in virtualized systems: generic proactive and self-adaptive solution
CN109143159A (zh) * 2018-07-16 2019-01-04 南京理工大学 基于联合定价和任务分配的指纹众包室内定位激励方法
CN109976916A (zh) * 2019-04-04 2019-07-05 中国联合网络通信集团有限公司 一种云资源需求判定方法及***
CN113766523A (zh) * 2020-06-02 2021-12-07 ***通信集团河南有限公司 服务小区的网络资源利用率预测方法、装置及电子设备
CN113766523B (zh) * 2020-06-02 2023-08-01 ***通信集团河南有限公司 服务小区的网络资源利用率预测方法、装置及电子设备

Also Published As

Publication number Publication date
WO2017067141A1 (zh) 2017-04-27
US20170264749A1 (en) 2017-09-14
CN105227369B (zh) 2016-06-22

Similar Documents

Publication Publication Date Title
CN105227369A (zh) 基于众包模式的移动Apps对无线网路资源利用的分析方法
CN109921941B (zh) 网络业务质量评估和优化方法、装置、介质及电子设备
Shafiq et al. A first look at cellular machine-to-machine traffic: large scale measurement and characterization
EP2832040B1 (en) System and method for root cause analysis of mobile network performance problems
US9204319B2 (en) Estimating long term evolution network capacity and performance
CN104160659B (zh) 用于通信网络的管理和操作的方法和装置
EP2750432A1 (en) Method and system for predicting the channel usage
Jeong et al. Development of a patent roadmap through the Generative Topographic Mapping and Bass diffusion model
CN112101692B (zh) 移动互联网质差用户的识别方法及装置
CN110363427A (zh) 模型质量评估方法和装置
WO2020135510A1 (zh) 突发负荷的预测方法及装置、存储介质、电子装置
Mahimkar et al. Robust assessment of changes in cellular networks
US10085157B2 (en) Reconfiguring a mobile network based on cellular network state information
CN113157922B (zh) 基于图的网络实体行为评估、可视化方法
Vasilakos et al. Integrated methodology to cognitive network slice management in virtualized 5G networks
Raca et al. Back to the future: Throughput prediction for cellular networks using radio KPIs
Horton et al. Examining the operational use of avalanche problems with decision trees and model-generated weather and snowpack variables
Clemente et al. Traffic forecast in mobile networks: Classification system using machine learning
De Masi et al. Towards accurate models for predicting smartphone applications’ QoE with data from a living lab study
Rao et al. Prediction and exposure of delays from a base station perspective in 5G and beyond networks
Allahdadi et al. Predicting short 802.11 sessions from radius usage data
Ouyang et al. Profiling wireless resource usage for mobile apps via crowdsourcing-based network analytics
Ahmed et al. Monitoring quality-of-experience for operational cellular networks using machine-to-machine traffic
CN111222897B (zh) 基于客户上网满意度预测方法及装置
Hairuman et al. Evaluation of machine learning techniques for anomaly detection on hourly basis kpi

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: Longjing road Chunxi town Gaochun County Nanjing city Jiangsu province 211399 No. 6

Patentee after: Nanjing Hua Su Science and Technology Ltd.

Address before: Longjing road Chunxi town Gaochun County Nanjing city Jiangsu province 211399 No. 6

Patentee before: Nanjing Hua Su Science and Technology Co., Ltd.