CN108777870B - 基于皮尔森系数的lte高负荷小区甄别方法及*** - Google Patents

基于皮尔森系数的lte高负荷小区甄别方法及*** Download PDF

Info

Publication number
CN108777870B
CN108777870B CN201810573488.5A CN201810573488A CN108777870B CN 108777870 B CN108777870 B CN 108777870B CN 201810573488 A CN201810573488 A CN 201810573488A CN 108777870 B CN108777870 B CN 108777870B
Authority
CN
China
Prior art keywords
index
screening
samples
inflection point
load
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810573488.5A
Other languages
English (en)
Other versions
CN108777870A (zh
Inventor
吴宇庆
徐俊凯
刘飞浪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HUBEI POST TELECOMMUNICATION PLANNING DESIGN CO Ltd
Original Assignee
HUBEI POST TELECOMMUNICATION PLANNING DESIGN CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HUBEI POST TELECOMMUNICATION PLANNING DESIGN CO Ltd filed Critical HUBEI POST TELECOMMUNICATION PLANNING DESIGN CO Ltd
Priority to CN201810573488.5A priority Critical patent/CN108777870B/zh
Priority to CN202110490568.6A priority patent/CN113133035B/zh
Publication of CN108777870A publication Critical patent/CN108777870A/zh
Application granted granted Critical
Publication of CN108777870B publication Critical patent/CN108777870B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明涉及一种高负荷小区甄别方法及***,属于通信技术领域,具体是涉及一种基于皮尔森系数的LTE高负荷小区甄别方法及***。本发明能只依据LTE网管提取的无线性能统计数据,即可甄别出高负荷待扩容小区。与现有方法相比有两点积极效果:本发明涉及的方法较传统的算法,误差至少小一个数量级。本发明涉及的方法是非参数算法,无需人为指定门限,直接根据无线性能统计数据导出结果,较客观。

Description

基于皮尔森系数的LTE高负荷小区甄别方法及***
技术领域
本发明涉及一种高负荷小区甄别方法及***,属于通信技术领域,具体是涉及一种基于皮尔森系数的LTE高负荷小区甄别方法及***。
背景技术
随着国内LTE网络的快速建设和发展,网络容量分析和优化的需求越来越强,核心工作为LTE高负荷待扩容小区的甄别。例如某运营商以信道利用率为基础,参***承载能力、有效RRC连接用户数、小区吞吐量情况进行扩容,分析网管提取的性能统计数据,当小区满足以下条件时,则符合“高负荷待扩容”条件:
门限一(大流量):自忙时小区下行PRB平均利用率大于50%且小区忙时吞吐量大于6GB;门限二(多用户):自忙时小区下行PRB平均利用率大于50%且当有效RRC连接最大数大于200;
统计条件:大数据平台按月提取全月数据,连续7天至少4天自忙时统计达到扩容门限一或门限二,输出扩容列表。
传统的使用指定扩容门限来甄别高负荷待扩容小区的算法,是一种参数算法。但是,由于扩容门限这个参数仅在中国就直接影响每年数百亿元投资,所以运营商通常在集团层面全国统一核算这个重要参数,下发到省、市执行。实际项目中,由于不同地方的用户行为差异较大,用户模型在地域上差异较大,另一方面,诸如“不限流量套餐”等各种营销举措导致用户模型剧烈波动。因此“一刀切”的参数很难按用户群或具体区域细化,导致误差较大。
因此,对现有技术中的智能监控***进行改进,以满足不同应用场景的需求,是当前迫切需要解决的技术问题。
发明内容
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。
本发明主要的目的是解决现有技术中所存在的扩容指标单一,无法适应用户群或具体区域细化的要求,提供了一种基于皮尔森系数的LTE高负荷小区甄别方法及***。该方法及***无需人为指定门限,直接根据无线性能统计数据导出结果,扩容判断结果更加准确。
为解决上述问题,本发明的方案是:
一种基于皮尔森系数的LTE高负荷小区甄别方法,包括:
步骤1,提取待评估区域小区性能指标统计数据,剔除无效数;
步骤2,从性能指标统计数据中选择第一指标及至少一个第二指标,计算第二指标与第一指标的皮尔森相关系数;
步骤3,以第一指标为横坐标,第二指标为纵坐标,对第一指标和第二指标进行拟合;基于第二指标靠前的若干个样本均值以及其对应的皮尔森相关系数得到筛选拐点K;
步骤4,剔除纵坐标小于拐点K对应纵坐标,且横坐标小于拐点K对应横坐标的样本,重复步骤3-4直至筛选拐点在拟合线的最左端或最右端;
步骤5,基于最终的样本,按照预设条件筛选出高负荷小区。
在本发明的至少一个实施例中,所述步骤1中,剔除平均PRC连接用户数小于预定值的样本。
在本发明的至少一个实施例中,所述第一指标是平均RRC连接用户数;所述第二指标是下行PRB平均占用率和/或PDCP层下行用户面流量。
在本发明的至少一个实施例中,将第二指标排序靠前的若干个样本均值与皮尔森相关系数的平方r^2相乘得到拐点的纵坐标,将拐点在拟合曲线上对应的横坐标作为拐点的横坐标。
在本发明的至少一个实施例中,所述步骤4中,筛选高负荷小区的条件是:
连续7天至少有4个高负荷样本;
连续15天至少有7个高负荷样本;
连续30天至少有14个高负荷样本。
一种基于皮尔森系数的LTE高负荷小区甄别***,包括:
网络数据提取模块,提取待评估区域小区性能指标统计数据,剔除无效数;
相关系数确定模块,从性能指标统计数据中选择第一指标及至少一个第二指标,计算第二指标与第一指标的皮尔森相关系数;
筛选拐点确定模块,以第一指标为横坐标,第二指标为纵坐标,对第一指标和第二指标进行拟合;基于第二指标靠前的若干个样本均值以及其对应的皮尔森相关系数得到筛选拐点K;
相关数据剔除模块,剔除纵坐标小于拐点K对应纵坐标,且横坐标小于拐点K对应横坐标的样本,重复调用筛选拐点确定模块和相关数据剔除模块直至筛选拐点在拟合线的最左端或最右端;
高负荷小区筛选模块,基于最终的样本,按照预设条件筛选出待扩容小区。
在本发明的至少一个实施例中,所述网络数据提取模块中,剔除平均PRC连接用户数小于预定值的样本。
在本发明的至少一个实施例中,所述第一指标是平均RRC连接用户数;所述第二指标是下行PRB平均占用率和/或PDCP层下行用户面流量。
在本发明的至少一个实施例中,将第二指标排序靠前的若干个样本均值与皮尔森相关系数的平方r^2相乘得到拐点的纵坐标,将拐点在拟合曲线上对应的横坐标作为拐点的横坐标。
在本发明的至少一个实施例中,所述高负荷小区筛选模块中,筛选高负荷小区的条件是:
连续7天至少有4个高负荷样本;
连续15天至少有7个高负荷样本;
连续30天至少有14个高负荷样本。
通过以上描述可知:本发明涉及的方法较传统的方法相比,误差至少小一个数量级;本发明涉及的方法是非参数算法,无需人为指定门限,直接根据无线性能统计数据导出结果,较客观。
附图说明
并入本文并形成说明书的一部分的附图例示了本发明的实施例,并且附图与说明书一起进一步用于解释本发明的原理以及使得所属领域技术人员能够制作和使用本公开。
图1为“下行PRB平均占用率”与“平均RRC连接用户数”的散点图(门限法获取的1472个高负荷样本)。
图2例示了“PDCP层下行用户面流量”与“平均RRC连接用户数”的散点图(门限法获取的1472个高负荷样本);
图3例示了“下行PRB平均占用率”与“平均RRC连接用户数”的散点图(全部数据);
图4例示了“PDCP层下行用户面流量”与“平均RRC连接用户数”的散点图(全部数据);
图5例示了“下行PRB平均占用率的散点图”与“平均RRC连接用户数”(高负荷样本清单V1);
图6例示了“PDCP层下行用户面流量”与“平均RRC连接用户数”的散点图(高负荷样本清单V1);
图7示例了“下行PRB平均占用率的散点图”与“平均RRC连接用户数”(高负荷样本最终清单);
图8示例了“PDCP层下行用户面流量”与“平均RRC连接用户数”的散点图(高负荷样本最终清单);
将参照附图描述本发明的实施例。
具体实施方式
实施例
本实施例的目的是通过如下原理来达到的:受调度算法影响,LTE网络的容量和性能指标间相互影响和制约,在低负荷时,负荷和吞吐量指标与有效用户数间是准线性、正相关的关系;在高负荷时,一旦资源紧张,负荷和吞吐量指标与有效用户数间转为负相关的关系,即为“饱和”状态。本实施例利用该特点,分析无线性能统计数据,识别指标从正相关变成负相关的拐点,辨识处于“饱和”状态的样本,以此甄别出高负荷待扩容小区。
本实施例具体步骤如下:
步骤1,从网管提取某区域m个小区N天的24小时性能统计数据。
数据应包括:负荷指标(上行PRB平均占用率、下行PRB平均占用率)、小区忙时吞吐量指标(PDCP层上行用户面流量、PDCP层下行用户面流量)、平均RRC连接用户数。
涉及指标说明:
N:提取统计数据的天数,一般为7、15、30。
上行PRB平均利用率:上行PRB占用平均数/小区PRB数*100%,反映上行物理资源的使用情况。
下行PRB平均利用率:下行PRB占用平均数/小区PRB数*100%,反映下行物理资源的使用情况。
平均RRC连接用户数:统计同时存在的RRC连接平均数量,此测量参数通过预先设定测量时间间隔采样,得到给定小区同时存在的RRC连接数量,然后取平均值。
小区忙时吞吐量:此处采用空口业务流量,分为上行和下行业务字节数,该指标反映了空口的上行和下行流量。
步骤2,进行预处理。
剔除平均RRC连接用户数为0的样本。本文以下全部数据专指剔除平均RRC连接用户数为0的样本后的某区域m个小区Nx24小时的性能统计数据。
步骤3,计算全部数据的皮尔森相关系数。
皮尔森相关系数是一种线性相关系数,相关系数用r表示,r描述的是两个变量间线性相关强弱的程度。r的取值在-1与+1之间,若r>0,表明两个变量是正相关,即一个变量的值越大,另一个变量的值也会越大;若r<0,表明两个变量是负相关,即一个变量的值越大另一个变量的值反而会越小。
r2指的是在拟合线(线性关系)中可以解释的比例。例如:若y和x的r2=0.7,也就是70%的y的变化可以由x和y的最佳拟合线来解释,剩余30%受其他因素影响。r的绝对值越大表明相关性越强。
步骤4,基于全部数据进行负荷指标分析
将全部数据中的样本生成“下行PRB平均占用率”与“平均RRC连接用户数”散点图,及线性拟合线。
计算“下行PRB平均占用率”最大5个统计值的均值,与第3步得到的皮尔森相关系数的平方r2相乘,积作为点K0的纵坐标。通过拟合线,计算得到K0的横坐标。参见图3。
点K0的意义在于给出了一种理想情况:点K0左下方样本(“下行PRB平均占用率<K0纵坐标”且“平均RRC连接用户数<K0横坐标”)全部满足拟合线(线性关系),即全部是低负荷样本;点K0上方或右方(“下行PRB平均占用率>K0纵坐标”或“平均RRC连接用户数>K0横坐标”)的样本全部不满足拟合线(线性关系),而受其他因素影响,即全部是高负荷样本。
步骤5,基于得到的全部数据进行吞吐量分析
将全部数据中的样本生成“PDCP层下行用户面流量”与“平均RRC连接用户数”散点图,及拟合线(线性关系)。
计算“PDCP层下行用户面流量”最大5个统计值的均值,与第3步得到的皮尔森相关系数的平方r2相乘,积作为点K1的纵坐标。通过线性拟合线,计算得到K1的横坐标。参见图4。
点K1的意义在于给出了一种理想情况:点K1左下方样本(“PDCP层下行用户面流量<K1纵坐标”且“平均RRC连接用户数<K1横坐标”)全部满足拟合线(线性关系),即全部是低负荷样本;点K1上方或右方(“PDCP层下行用户面流量>K1纵坐标”或“平均RRC连接用户数>K1横坐标”)的样本全部不满足拟合线(线性关系),而受其他因素影响,即全部是高负荷样本。
步骤6,获得高负荷样本清单
从“某区域统计数据”中筛除“下行PRB平均占用率<K0纵坐标”且“PDCP层下行用户面流量<K1纵坐标”且“平均RRC连接用户数<Min(K0横坐标,K1横坐标)”的低负荷样本,获取高负荷样本清单。
步骤7,基于高负荷样本清单进行负荷分析
将高负荷样本清单生成“下行PRB平均占用率”与“平均RRC连接用户数”散点图(图5),及LOESS拟合线(a=0.5,非线性关系)。
LOESS特指是局部权重多项式拟合。利用低次多项式来拟合在数据集上的每个点,距离要拟合的点越近,权重就越高,相反距离越远,权重就越低
若生成的拟合线的最高点(点K0^')不在区间的左端或右端,拟合线会有一段“下行PRB平均占用率”与“平均RRC连接用户数”线性相关,这是因为高负荷样本清单v1存在一部分低负荷样本(位于图5点K0^'的左下方,即“下行PRB平均占用率<K0^'纵坐标”且“平均RRC连接用户数”<K0^'横坐标)。
步骤8,基于高负荷样本清单进行吞吐量分析
将高负荷样本清单中的样本生成“PDCP层下行用户面流量”与“平均RRC连接用户数”散点图(图6),及LOESS拟合线(a=0.5,即非线性关系)。
若拟合线的最高点(点K′1)不在区间的左端或右端,拟合线有一段“PDCP层下行用户面流量”与“平均RRC连接用户数”正线性相关,则表示因为存在一部分低负荷样本(位于图6点K1^'的左下方,即“PDCP层下行用户面流量<K1^'纵坐标”且“平均RRC连接用户数”<K1^'横坐标)。
步骤9,修正获得第二高负荷样本清单
从全部数据中筛除低负荷样本“下行PRB平均占用率<K0^'纵坐标”且“PDCP层下行用户面流量<K1^'纵坐标”且“平均RRC连接用户数”<Min(K′0横坐标,K′1横坐标)。修正获得第二高负荷样本清单。
步骤10,重复步骤7-9,修正高负荷样本清单,直至“下行PRB平均占用率”与“平均RRC连接用户数”拟合线,“PDCP层下行用户面流量”与“平均RRC连接用户数”拟合线,两条拟合线的最高点全部在区间的左端或右端。
获得第三高负荷样本清单。将其样本生成“下行PRB平均占用率”与“平均RRC连接用户数”的散点图(如图7)、“PDCP层下行用户面流量”与“平均RRC连接用户数”的散点图(如图8),拟合线的最高点均在区间的左端,即“下行PRB平均占用率”及“PDCP层下行用户面流量”与“平均RRC连接用户数”为负相关关系,这是典型的高负荷状态下无线性能特征。
步骤11,甄别“高负荷待扩容小区”
统计条件:当某小区在第三高负荷样本最终清单中的样本数量,连续7天至少有4个(或连续15天至少有7个、或连续30天至少有14个),该小区即为高负荷待扩容小区。
综上所述,传统的使用指定的扩容门限来甄别高负荷待扩容小区的算法,是一种参数算法。但是,由于扩容门限这个参数仅在中国就直接影响每年数百亿元投资,所以运营商通常在集团层面全国统一核算这个重要参数,下发到省、市执行。实际项目中,由于不同地方的用户行为差异较大,用户模型在地域上差异较大,另一方面,诸如“不限流量套餐”等各种营销举措导致用户模型剧烈波动。因此“一刀切”的参数很难按用户群或具体区域细化,导致误差较大。
下面结合具体的应用实例来对本实施例进行详细说明。
首先,对传统的扩容法进行描述。
例如,某运营商在一个大学扩容项目时,提取了该大学各小区7x24小时无线性能统计数据(10447个样本),使用上述算法,筛选出1472个样本达到扩容门限一或门限二。但是,在对门限法获取的1472个高负荷样本分析,却发现其中有300个低负荷样本:
《“下行PRB平均占用率”与“平均RRC连接用户数”的散点图》(如图1),拟合线的最高点(点K0)不在区间的左端或右端,拟合线有一段“下行PRB平均占用率”与“平均RRC连接用户数”正相关(近似线性),这是因为存在一部分低负荷样本(位于点K0的左下方,即“下行PRB平均占用率<K0纵坐标”且“平均RRC连接用户数”<K0横坐标)。《“PDCP层下行用户面流量”与“平均RRC连接用户数”的散点图》(如图2),拟合线的最高点(点K1)不在区间的左端或右端,拟合线有一段“PDCP层下行用户面流量”与“平均RRC连接用户数”正相关(近似线性),这是因为存在一部分低负荷样本(位于点K1的左下方,即“PDCP层下行用户面流量<K1纵坐标”且“平均RRC连接用户数”<K1横坐标)。
而“最终的高负荷样本清单”共有1596个样本,《“下行PRB平均占用率”与“平均RRC连接用户数”的散点图》(如图7)、《“PDCP层下行用户面流量”与“平均RRC连接用户数”的散点图》(如图8)中,拟合线的最高点均在区间的左端,“下行PRB平均占用率”及“PDCP层下行用户面流量”与“平均RRC连接用户数”为负相关关系,这是典型的高负荷状态下无线性能特征。所以,门限法漏掉了1596-(1472-300)=424个高负荷样本。
因此,门限法获得的高负荷样本的误差为(300+424)/1596=45.4%。
按照统计条件:“连续7天至少4天自忙时统计达到扩容门限一或门限二,输出扩容列表”,门限法(基于1472个高负荷样本)的扩容列表中共有30个待扩容高负荷小区。但是与基于“最终的高负荷样本清单”1596个高负荷样本的扩容列表相比,门限法(基于1472个高负荷样本)的扩容列表有3个误判和3个漏判待扩容高负荷小区,扩容方案的误差为20%。
接下来对采用本实施例的方法进行描述:
1、从网管提取某区域m个小区Nx24小时的性能统计数据。
数据应包括;负荷指标(上行PRB平均占用率、下行PRB平均占用率)、小区忙时吞吐量指标(PDCP层上行用户面流量、PDCP层下行用户面流量)、平均RRC连接用户数。
2、进行预处理。
剔除平均RRC连接用户数为0的样本,“统计数据”中样本有9412个。
3、计算“统计数据”的皮尔森相关系数。
Figure GDA0002959685610000121
Figure GDA0002959685610000131
**.在.01水平(双侧)上显著相关。
4、“统计数据”的负荷指标分析
将“统计数据”生成“下行PRB平均占用率”与“平均RRC连接用户数”散点图,及拟合线(线性关系)。
计算“下行PRB平均占用率”最大5个统计值的均值,与第3步得到的皮尔森相关系数的平方r2相乘,积作为点K0的纵坐标。通过拟合线,计算得到K0的横坐标。参见图3。
5、“统计数据”的吞吐量分析
将“统计数据”生成“PDCP层下行用户面流量”与“平均RRC连接用户数”散点图,及拟合线(线性关系)。
计算“PDCP层下行用户面流量”最大5个统计值的均值,与第3步得到的皮尔森相关系数的平方r2相乘,积作为点K1的纵坐标。通过拟合线,计算得到K1的横坐标。参见图4。
6、获得“高负荷样本清单V1”
Figure GDA0002959685610000132
Figure GDA0002959685610000141
从“某区域统计数据”中筛除“下行PRB平均占用率<K0纵坐标”且“PDCP层下行用户面流量<K1纵坐标”且“平均RRC连接用户数<Min(K0横坐标,K1横坐标)”的低负荷样本,获取“高负荷样本清单V1”,其中有1680个样本。
7、“高负荷样本清单V1”的负荷分析
将“高负荷样本清单V1”生成“下行PRB平均占用率”与“平均RRC连接用户数”散点图(图5),及LOESS拟合线(a=0.5,非线性关系)。
生成的拟合线的最高点(点K′0)不在区间的左端或右端,拟合线有一段“下行PRB平均占用率”与“平均RRC连接用户数”线性相关,这是因为“高负荷样本清单v1”存在一部分低负荷样本(位于图5点K′0的左下方,即“下行PRB平均占用率<K′0纵坐标”且“平均RRC连接用户数”<K′0横坐标)。
8、“高负荷样本清单V1”的吞吐量分析
将“高负荷样本清单V1”生成“PDCP层下行用户面流量”与“平均RRC连接用户数”散点图(图6),及LOESS拟合线(a=0.5,即非线性关系)。
拟合线的最高点(点K′1)不在区间的左端或右端,拟合线有一段“PDCP层下行用户面流量”与“平均RRC连接用户数”正线性相关,则表示存在一部分低负荷样本(位于图6点K′1的左下方,即“PDCP层下行用户面流量<K′1纵坐标”且“平均RRC连接用户数”<K′1横坐标)。
9、修正获得“高负荷样本清单V2”
Figure GDA0002959685610000151
从“统计数据”中筛除低负荷样本“下行PRB平均占用率<K′0纵坐标”且“PDCP层下行用户面流量<K′1纵坐标”且“平均RRC连接用户数”<Min(K′0横坐标,K′1横坐标)。修正获得“高负荷样本清单V2”。
10、重复步骤7—9,修正高负荷样本清单,直至“下行PRB平均占用率”与“平均RRC连接用户数”拟合线,“PDCP层下行用户面流量”与“平均RRC连接用户数”拟合线,两条拟合线的最高点全部在区间的左端或右端。
获得“高负荷样本最终清单”,其中有1596个样本。《“下行PRB平均占用率”与“平均RRC连接用户数”的散点图》(如图7)、《“PDCP层下行用户面流量”与“平均RRC连接用户数”的散点图》(如图8)中,拟合线的最高点均在区间的左端,“下行PRB平均占用率”及“PDCP层下行用户面流量”与“平均RRC连接用户数”为负相关关系,这是典型的高负荷状态下无线性能特征。
“高负荷样本最终清单”的样本误差e是可以定量估算的,具体如下:
首先计算“高负荷样本清单v1”样本误差。
“高负荷样本清单v1”中,低负荷样本“下行PRB平均占用率<K′0纵坐标”且“PDCP层下行用户面流量<K′1纵坐标”且“平均RRC连接用户数”<Min(K′0横坐标,K′1横坐标),误判数量为303个;高负荷样本则有1680-303=1377个,漏判数量是1596-303=219个。
“高负荷样本清单v1”样本误差:
Figure GDA0002959685610000161
“高负荷样本最终清单”样本误差:
Figure GDA0002959685610000162
因为“高负荷样本清单v1”是从“下行PRB平均占用率”和“PDCP层下行用户面流量”的最大5个统计值计算所得,因此上面公式中“高负荷样本最终清单的样本总数”除以5。
11、甄别“高负荷待扩容小区”
按照统计条件:当某小区在“高负荷样本最终清单”中的样本数量,连续7天至少有4个(或连续15天至少有7个、或连续30天至少有14个),该小区即为高负荷待扩容小区。
基于“最终的高负荷样本清单”1596个高负荷样本的扩容列表,具体参见表1。
该扩容列表误差为
Figure GDA0002959685610000163
综上所述,传统的使用指定的扩容门限来甄别高负荷待扩容小区的算法,是一种参数算法。本例采用门限法时,高负荷样本的误差45.4%;按照统计条件:“连续7天至少4天自忙时统计达到扩容门限一或门限二”,所输出扩容列表的误差为20%。
而采用本发明具体涉及的非参数算法,高负荷样本的误差1.8%;按照相同的统计条件:“当某小区在《高负荷样本最终清单》中的样本数量,连续7天至少有4个”,所输出扩容列表的误差为0.9%。
本发明涉及的方法较传统的算法,误差至少小一个数量级。
综上所述可知:本发明具体涉及的一种非参数算法,能只依据LTE网管提取的无线性能统计数据,即可甄别出高负荷待扩容小区。与现有方法相比有两点积极效果:
本发明涉及的方法较传统的算法,误差至少小一个数量级
本发明涉及的方法是非参数算法,无需人为指定门限,直接根据无线性能统计数据导出结果,较客观。
本实施例中,尽管为使解释简单化将上述方法图示并描述为一系列动作,但是应理解并领会,这些方法不受动作的次序所限,因为根据一个或多个实施例,一些动作可按不同次序发生和/或与来自本文中图示和描述或本文中未图示和描述但本领域技术人员可以理解的其他动作并发地发生。
本领域技术人员将进一步领会,结合本文中所公开的实施例来描述的各种解说性逻辑板块、模块、电路、和算法步骤可实现为电子硬件、计算机软件、或这两者的组合。为清楚地解说硬件与软件的这一可互换性,各种解说性组件、框、模块、电路、和步骤在上面是以其功能性的形式作一般化描述的。此类功能性是被实现为硬件还是软件取决于具体应用和施加于整体***的设计约束。技术人员对于每种特定应用可用不同的方式来实现所描述的功能性,但这样的实现决策不应被解读成导致脱离了本发明的范围。
结合本文中公开的实施例描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中体现。软件模块可驻留在RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域中所知的任何其他形式的存储介质中。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读取和写入信息。在替换方案中,存储介质可以被整合到处理器。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替换方案中,处理器和存储介质可作为分立组件驻留在用户终端中。
在一个或多个示例性实施例中,所描述的功能可在硬件、软件、固件或其任何组合中实现。如果在软件中实现为计算机程序产品,则各功能可以作为一条或更多条指令或代码存储在计算机可读介质上或藉其进行传送。计算机可读介质包括计算机存储介质和通信介质两者,其包括促成计算机程序从一地向另一地转移的任何介质。存储介质可以是能被计算机访问的任何可用介质。作为示例而非限定,这样的计算机可读介质可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁存储设备、或能被用来携带或存储指令或数据结构形式的合意程序代码且能被计算机访问的任何其它介质。任何连接也被正当地称为计算机可读介质。例如,如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)、或诸如红外、无线电、以及微波之类的无线技术从web网站、服务器、或其它远程源传送而来,则该同轴电缆、光纤电缆、双绞线、DSL、或诸如红外、无线电、以及微波之类的无线技术就被包括在介质的定义之中。如本文中所使用的盘(disk)和碟(disc)包括压缩碟(CD)、激光碟、光碟、数字多用碟(DVD)、软盘和蓝光碟,其中盘(disk)往往以磁的方式再现数据,而碟(disc)用激光以光学方式再现数据。上述的组合也应被包括在计算机可读介质的范围内。
注意到,说明书中对“一个实施例”、“实施例”、“示例实施例”、“一些实施例”等的引用指示所描述的实施例可以包括特定特征、结构或特性,但是每个实施例可以不必包括所述特定特征、结构或特性。而且,这样的短语不必指代同一实施例。此外,当结合实施例描述特定特征、结构或特性时,无论是否明确描述,结合其他实施例来实现这样的特征、结构或特性将在所属领域的技术人员的知识范围内。
提供对本公开的先前描述是为使得本领域任何技术人员皆能够制作或使用本公开。对本公开的各种修改对本领域技术人员来说都将是显而易见的,且本文中所定义的普适原理可被应用到其他变体而不会脱离本公开的精神或范围。由此,本公开并非旨在被限定于本文中所描述的示例和设计,而是应被授予与本文中所公开的原理和新颖性特征相一致的最广范围。

Claims (8)

1.一种基于皮尔森系数的LTE高负荷小区甄别方法,其特征在于,包括:
步骤1,提取待评估区域小区性能指标统计数据,剔除无效数;
步骤2,从性能指标统计数据中选择第一指标及至少一个第二指标,计算第二指标与第一指标的皮尔森相关系数;
步骤3,以第一指标为横坐标,第二指标为纵坐标,对第一指标和第二指标进行拟合;基于第二指标靠前的若干个样本均值以及其对应的皮尔森相关系数得到筛选拐点K;
步骤4,剔除纵坐标小于拐点K对应纵坐标,且横坐标小于拐点K对应横坐标的样本,重复步骤3-4直至筛选拐点在拟合线的最左端或最右端;
步骤5,基于最终的样本,按照预设条件筛选出高负荷小区;
其中,所述第一指标是吞吐量指标,所述第二指标为有效用户数指标。
2.根据权利要求1所述的一种基于皮尔森系数的LTE高负荷小区甄别方法,其特征在于,所述第一指标是平均RRC连接用户数;所述第二指标是下行PRB平均占用率和/或PDCP层下行用户面流量。
3.根据权利要求1所述的一种基于皮尔森系数的LTE高负荷小区甄别方法,其特征在于,将第二指标排序靠前的若干个样本均值与皮尔森相关系数的平方r2相乘得到拐点的纵坐标,将拐点在拟合曲线上对应的横坐标作为拐点的横坐标。
4.根据权利要求1所述的一种基于皮尔森系数的LTE高负荷小区甄别方法,其特征在于,所述步骤4中,筛选高负荷小区的条件是:
连续7天至少有4个高负荷样本;
连续15天至少有7个高负荷样本;
连续30天至少有14个高负荷样本。
5.一种基于皮尔森系数的LTE高负荷小区甄别***,其特征在于,包括:
网络数据提取模块,提取待评估区域小区性能指标统计数据,剔除无效数;
相关系数确定模块,从性能指标统计数据中选择第一指标及至少一个第二指标,计算第二指标与第一指标的皮尔森相关系数;
筛选拐点确定模块,以第一指标为横坐标,第二指标为纵坐标,对第一指标和第二指标进行拟合;基于第二指标靠前的若干个样本均值以及其对应的皮尔森相关系数得到筛选拐点K;
相关数据剔除模块,剔除纵坐标小于拐点K对应纵坐标,且横坐标小于拐点K对应横坐标的样本,重复调用筛选拐点确定模块和相关数据剔除模块直至筛选拐点在拟合线的最左端或最右端;
高负荷小区筛选模块,基于最终的样本,按照预设条件筛选出待扩容小区;
其中,所述第一指标是吞吐量指标,所述第二指标为有效用户数指标。
6.根据权利要求5所述的一种基于皮尔森系数的LTE高负荷小区甄别***,其特征在于,所述第一指标是平均RRC连接用户数;所述第二指标是下行PRB平均占用率和/或PDCP层下行用户面流量。
7.根据权利要求5所述的一种基于皮尔森系数的LTE高负荷小区甄别***,其特征在于,将第二指标排序靠前的若干个样本均值与皮尔森相关系数的平方r2相乘得到拐点的纵坐标,将拐点在拟合曲线上对应的横坐标作为拐点的横坐标。
8.根据权利要求5所述的一种基于皮尔森系数的LTE高负荷小区甄别***,其特征在于,所述高负荷小区筛选模块中,筛选高负荷小区的条件是:
连续7天至少有4个高负荷样本;
连续15天至少有7个高负荷样本;
连续30天至少有14个高负荷样本。
CN201810573488.5A 2018-06-06 2018-06-06 基于皮尔森系数的lte高负荷小区甄别方法及*** Active CN108777870B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810573488.5A CN108777870B (zh) 2018-06-06 2018-06-06 基于皮尔森系数的lte高负荷小区甄别方法及***
CN202110490568.6A CN113133035B (zh) 2018-06-06 2018-06-06 一种lte高负荷小区甄别方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810573488.5A CN108777870B (zh) 2018-06-06 2018-06-06 基于皮尔森系数的lte高负荷小区甄别方法及***

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202110490568.6A Division CN113133035B (zh) 2018-06-06 2018-06-06 一种lte高负荷小区甄别方法及***

Publications (2)

Publication Number Publication Date
CN108777870A CN108777870A (zh) 2018-11-09
CN108777870B true CN108777870B (zh) 2021-06-08

Family

ID=64025767

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201810573488.5A Active CN108777870B (zh) 2018-06-06 2018-06-06 基于皮尔森系数的lte高负荷小区甄别方法及***
CN202110490568.6A Active CN113133035B (zh) 2018-06-06 2018-06-06 一种lte高负荷小区甄别方法及***

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202110490568.6A Active CN113133035B (zh) 2018-06-06 2018-06-06 一种lte高负荷小区甄别方法及***

Country Status (1)

Country Link
CN (2) CN108777870B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111010665B (zh) * 2019-12-18 2021-03-16 广东海格怡创科技有限公司 热点范围定位方法、装置、计算机设备及存储介质
CN111132215B (zh) * 2019-12-18 2023-06-20 广东海格怡创科技有限公司 热点区域定位方法、装置、计算机设备及存储介质
CN113259954B (zh) * 2020-02-13 2023-02-28 ***通信集团广东有限公司 一种质差处理策略的确定方法、装置及电子设备
CN113469576A (zh) * 2021-07-26 2021-10-01 中国电信股份有限公司 高负荷小区识别方法、装置、存储介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104469817A (zh) * 2013-09-18 2015-03-25 上海无线通信研究中心 基于负载和干扰水平控制小基站休眠的方法
CN106612516A (zh) * 2015-10-26 2017-05-03 中兴通讯股份有限公司 参数优化的方法及装置
CN106851736A (zh) * 2016-12-15 2017-06-13 北京拓明科技有限公司 基于负荷的lte邻区参数自动优化方法
CN107277844A (zh) * 2017-07-25 2017-10-20 山东浪潮商用***有限公司 一种基于时间序列的电信网络高负荷小区预警方法
CN107371178A (zh) * 2017-08-28 2017-11-21 北京天元创新科技有限公司 高负荷小区优化方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6055433A (en) * 1996-09-20 2000-04-25 Northern Telecom Limited Data processing system and method for balancing a load in a communications network
US8682310B2 (en) * 2010-05-28 2014-03-25 Telefonaktiebolaget L M Ericsson (Publ) Network-based area positioning for capacity and coverage improvement
US8515427B2 (en) * 2010-06-28 2013-08-20 Qualcomm Incorporated Resource utilization measurements for heterogeneous networks
CN106714239B (zh) * 2016-12-14 2022-02-22 北京拓明科技有限公司 一种lte网络负载自动均衡的方法和***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104469817A (zh) * 2013-09-18 2015-03-25 上海无线通信研究中心 基于负载和干扰水平控制小基站休眠的方法
CN106612516A (zh) * 2015-10-26 2017-05-03 中兴通讯股份有限公司 参数优化的方法及装置
CN106851736A (zh) * 2016-12-15 2017-06-13 北京拓明科技有限公司 基于负荷的lte邻区参数自动优化方法
CN107277844A (zh) * 2017-07-25 2017-10-20 山东浪潮商用***有限公司 一种基于时间序列的电信网络高负荷小区预警方法
CN107371178A (zh) * 2017-08-28 2017-11-21 北京天元创新科技有限公司 高负荷小区优化方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
移动通信网流量数据分析及预测研究;张雁钦;《中国优秀硕士学位论文全文数据库 信息科技辑》;20170115;全文 *

Also Published As

Publication number Publication date
CN113133035A (zh) 2021-07-16
CN108777870A (zh) 2018-11-09
CN113133035B (zh) 2022-07-22

Similar Documents

Publication Publication Date Title
CN108777870B (zh) 基于皮尔森系数的lte高负荷小区甄别方法及***
CN103491556B (zh) 一种网络调整的方法及装置
CN110505650B (zh) 随机异构分层网容量智能评估方法及装置
CN109905882B (zh) 一种网络扩容方法及装置
CN109391950B (zh) 终端分布的预测方法、装置、设备及介质
CN108770017B (zh) 一种无线资源动态均衡方法及***
CN114143326A (zh) 负载调节方法、管理节点以及存储介质
CN109327844A (zh) 一种小区扩容方法及装置
CN105429792B (zh) 用户行为流量获取方法及装置、用户行为分析方法及***
CN106982441A (zh) 一种小区扩容的确定方法及装置
US8682293B1 (en) Telecom fraud detection using social pattern
CN105139227A (zh) 一种数据计算方法及装置
CN104883705A (zh) 一种数据业务投诉的问题定位方法及装置
CN102158868A (zh) 基于扫频的干扰矩阵的获取方法及***
CN103607731A (zh) 一种测量报告的处理方法及装置
CN104105206A (zh) 一种td-scdma网络载波调整方法、装置及***
CN110740450B (zh) 一种网络小区扩容方法和装置
CN106991101B (zh) 一种数据表分析处理的方法和装置
CN109525995B (zh) 一种小区识别方法、装置及计算机可读存储介质
CN103955192B (zh) 一种用于污水处理厂的曲线报表数据采样方法
CN107086923B (zh) 通信网络性能指标分析方法及装置
CN101980209B (zh) 自适应多领域搜索引擎调用方法及***
CN108235337B (zh) 利用率基线值估计方法及装置
CN103746753A (zh) 一种基于认知无线网络的数据预测方法
CN103841601B (zh) 一种精准评估td‑scdma小区间频率扰码干扰严重等级的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant