CN104735710A - 一种基于趋势外推聚类的移动网络性能预警预判方法 - Google Patents

一种基于趋势外推聚类的移动网络性能预警预判方法 Download PDF

Info

Publication number
CN104735710A
CN104735710A CN201510119179.7A CN201510119179A CN104735710A CN 104735710 A CN104735710 A CN 104735710A CN 201510119179 A CN201510119179 A CN 201510119179A CN 104735710 A CN104735710 A CN 104735710A
Authority
CN
China
Prior art keywords
data
early warning
anticipation
trend
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510119179.7A
Other languages
English (en)
Other versions
CN104735710B (zh
Inventor
解永平
李凯涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN201510119179.7A priority Critical patent/CN104735710B/zh
Publication of CN104735710A publication Critical patent/CN104735710A/zh
Application granted granted Critical
Publication of CN104735710B publication Critical patent/CN104735710B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种移动网络性能预警预判方法,一种基于趋势外推聚类的移动网络性能预警预判方法,包括以下步骤:(1)利用趋势外推及K中心点聚类算法计算各个性能指标的预警门限;(2)实时计算本时间粒度的预警及预判,得出预判变化。本发明能够有效克服由于历史数据异常点导致的预警门限不准确问题,能够反映趋势变化,使预警门限更准确,能够根据网络拓扑将多条预警信息汇总为一条预判,并能够反映预判变化,从而能够从整体上反映网络的性能变化情况。

Description

一种基于趋势外推聚类的移动网络性能预警预判方法
技术领域
本发明涉及一种移动网络性能预警预判方法,更具体地说,涉及一种基于趋势外推聚类的移动网络性能预警预判方法。
背景技术
移动运营商对网络运行设备进行了实时监控,各个设备会定时产生一段时间的监测数据,以供查询分析。当前移动网络异常分析一般包括两种方法:一是:发现网络故障之后,查询历史监测数据,分析故障原因。这种方法一般都有一定滞后性,即故障发生后才能分析出原因,然后进行维护。二是:设置各个性能指标的预警门限,并实时监测当前各个性能指标,如发现指标超出门限,则产生预警,进行故障分析。门限配置一般包括两种方法,即静态门限和动态门限。静态门限需要人工配置,工作量大,要有足够的经验,而且随着网络变化需要经常更新。动态门限一种方法是根据历史数据进行统计,采用均值作为中心线,3倍标准差作为阈值计算门限。这种方法没有考虑到网络数据的变化趋势,直接把历史数据均值作为未来的中心线,而且历史数据中的异常数据也会对结果产生影响。另一种方法是采用传统时间序列预测方法进行预测作为中心线,3倍标准差作为阈值计算门限。这种预测方法对预测之后某几个点比较准确,如果预测点数多则误差较大,而且如果预测最近的序列出现异常,对预测结果影响较大,容易产生误差。当网络中告警比较多时,人工查看非常不方便,需要采用一种方法将网络中告警汇总为几个主告警,以便更好的分析查看,本方法将这种汇总预警的方法称为预判。
发明内容
为了克服现有技术中存在的不足,本发明目的是提供一种基于趋势外推聚类的移动网络性能预警预判方法。该方法能够通过趋势外推法更加准确的反映未来的变化趋势,通过K中心点聚类算法能够消除历史数据中异常点对结果的影响,通过预警汇总为预判给网络优化人员提供了更好的呈现方式,提高了预警的准确率,减少了预警的误判,减少了网络优化人员的工作量。
为了实现上述发明目的,解决现有技术中所存在的问题,本发明采取的技术方案是:一种基于趋势外推聚类的移动网络性能预警预判方法,其特征在于包括以下步骤:
步骤1、利用趋势外推及K中心点聚类算法计算各个性能指标的预警门限:将动态获取的移动网络性能指标历史数据,利用趋势外推及K中心点聚类算法计算各个性能指标预警门限,本方法每天计算一次预警门限,具体包括以下子步骤:
(1)、获取移动网络性能指标的历史数据:从移动网络数据库中动态获取各个指标的历史数据,本方法要求历史性能指标数据至少为3周,最多不超过8周,而且必须为整周;
(2)、将历史数据分解为趋势分量和周期分量:针对某一个网元的某一指标的历史数据,看做是一个周期时间序列,周期为一天,共多个周期,将历史数据分解为趋势分量和周期分量,具体包括以下子步骤:
(2a)、历史数据利用周期模型,计算移动平均值,得到趋势分量,历史数据可看做周期分量和趋势分量共同作用的结果,利用时间序列的乘法模型表示为:
Y=F*T    (1)
式中,F是周期分量,T是趋势分量,Y是历史数据,对时间序列计算周期整数倍的移动平均即可消除趋势分量的影响,得到周期分量,设历史数据时间序列为yt,t=1,2,…,k-1,其中k为当前时刻,因为周也构成了一个周期,因此本方法对周进行移动平均,表示为:
y ^ t = ( y t + y t - 1 + . . . + y t - N + 1 ) / N - - - ( 2 )
式中,是移动平均之后结果,yt是t时刻的实际值,N是移动平均的数据点数,本方法采用N为一周点数,从历史数据的第二周开始计算,一直计算到当前时间粒度的前一个时间粒度,其值即为各个时间粒度的趋势分量;
(2b)、将历史数据原始值除以趋势分量即得周期分量,从而将趋势分量和周期分量分离;
根据公式(1)可得F=Y/T,将历史数据中第二周开始的数据除以对应时间粒度的趋势分量,即得对应时间粒度的周期分量,从而将历史数据中趋势分量和周期分量分离;
(3)、趋势分量利用曲线拟合得到下一周期的趋势分量:根据历史数据的趋势分量,可以估算下一周期的趋势分量,具体包括以下子步骤:
(3a)、将历史数据的趋势分量利用多项式曲线拟合:根据经验,移动网络性能指标的趋势一般满足多项式函数,因此进行多项式曲线拟合,多项式拟合的结果形式为y=a0+a1x+…+akxk,式中x的最高次幂k代表此多项式是k次多项式,本发明采用最小二乘法进行曲线拟合,误差平方和是指拟合数据和实际数据对应点误差的平方和,其计算公式为:
SSE = Σ i = 1 n ( y i - y ^ i ) 2 - - - ( 3 )
式中,yi是实际数据,是拟合数据,n代表数据点个数,最小二乘法就是要使误差平方和最小,进而确定各项系数,假设历史趋势分量共有n个点,则其误差平方和为
SSE = Σ i = 1 n [ y i - ( a 0 + a 1 x i + . . . + a k x i k ) ] 2 - - - ( 4 )
式中,yi是趋势分量实际数据,xi是趋势分量序号,n代表趋势分量数据点个数,a0到ak为要拟合的多项式系数,对公式(4)中a0到ak分别求偏导,并令其为0,可得:
- 2 Σ i = 1 n [ y i - ( a 0 + a 1 x i + . . . a k x i k ) ] = 0 . . . - 2 Σ i = 1 n [ y i - ( a 0 + a 1 x i + . . . a k x i k ) ] x i k = 0 - - - ( 5 )
式中,yi是趋势分量实际数据,xi是趋势分量序号,n代表趋势分量数据点个数,a0到ak为要拟合的多项式系数,根据k+1个方程的方程组,可以解得a0到ak的值,进而得到趋势方程;
(3b)、利用拟合的趋势方程计算出下个周期的趋势值:根据拟合的趋势方程和下个周期各点的序号,将序号带入趋势方程中,即可求得下个周期各点的趋势值;
(4)、周期分量利用K中心点聚类算法聚类出一个聚类中心:针对历史数据中n天的周期分量,利用K中心点聚类算法找出其中一天来代替n天的数据,具体包括以下子步骤:
(4a)、任意选择一天数据作为初始中心点:假设周期分量共有n天数据,每天有k个点,本发明将每天k个点作为一个数据点,它是一个k维向量,则周期分量即可看做n个k维向量,任意选择n个k维向量中其中一个作为初始中心点;
(4b)、计算此中心点的目标函数值:为了计算哪个中心点更加能够更好的代替整个数据集,需要一个目标函数,目标函数越小,说明聚类效果越优,本发明采用其余数据点离中心点距离之和作为目标函数,其中两点之间距离采用如下公式计算:
d = ( a 1 - b 1 ) 2 + ( a 2 - b 2 ) 2 + . . . + ( a k - b k ) 2 - - - ( 6 )
式中,a、b是两天数据,a1到ak分别为当天第一个数据点到第k个数据点,每天一共k个点,本方法采用的目标函数计算公式为:
S = Σ i = 1 n - 1 d i - - - ( 7 )
式中,di为其余数据点到中心点距离,计算其余数据点离当前中心点的距离,其和作为当前中心点的目标函数值;
(4c)、依次选择其余数据点作为中心点,比较目标函数值,确定最终中心点:依次选择其余数据点作为中心点,计算目标函数值,与之前目标函数值比较,如果小于之前目标函数值,则替换为当前中心点,直至所有数据点都比较过之后,得到最终聚类中心点;
(5)、将聚类中心和下一周期的趋势分量相乘得到下一周期的预警门限基准值:由子步骤(3)得到的下一周期的趋势分量和由子步骤(4)得到周期分量的聚类中心,将两者对应项相乘得到下一周期的预警门限基准值;
(6)、利用正态分布的3σ原则,计算下一周期的正常活动区间,得到预警门限:根据统计计算,历史每天同一时间粒度数据基本满足正态分布,而正态分布满足3σ原则,即数据基本都在均值-3σ到均值+3σ之间,而偏离这个区间的概率只有0.3%,因此可以采用这个原则确定数据正常的活动范围,具体包括以下子步骤:
(6a)、计算历史性能指标数据每天同一个时间粒度的标准差:将历史性能指标数据与每天同一时间粒度数据作为一组,计算每组的标准差,其中标准差公式为:
σ = 1 N - 1 Σ i = 1 N ( x i - μ ) 2 - - - ( 8 )
式中,xi是每天同一时间粒度的数据值,一共N个,μ是每天同一时间粒度的均值,σ是标准差;
(6b)、计算下一周期的正常活动区间,结合下一周期的预警门限基准值得到预警门限:本方法将预警门限基准值上下浮动2σ作为正常活动区间,超出则产生预警,将预警级别定为2级,即高级别预警和低级别预警,将基准值加减3σ作为高级别预警门限,基准值加减2σ作为低级别预警门限;
步骤2、实时计算本时间粒度的预警及预判,得出预判变化:实时获得各个性能指标值,跟步骤1得到的预警门限进行比较,判断是否预警,然后将各个指标预警汇总为预判,并与上个时间粒度预判进行比较,得到预判变化,具体包括以下子步骤:
(A)、计算本时间粒度的预警:将各个网元的各个性能指标实际值和步骤1计算出来的预警门限进行比较,判断是否预警;
(B)、将各个指标的预警根据各自的网络拓扑汇总为本时间粒度的预判信息:将各个指标预警汇总为一个或多个主预警,定义为预判,具体包括以下子步骤:
(Ba)、将本时间粒度预警根据指标进行分组:将本时间粒度预警根据性能指标进行分组,每个指标分为一组;
(Bb)、将同一指标维度最高的预警提取出作为本时间粒度预判:根据不同的性能指标,移动网络性能网元分为不同的维度,如位置更新成功率网元维度从上到下依次为Pool、MSC、BSC,即每个Pool由多个MSC组成,每个MSC管理多个BSC,将不同性能指标预警按照各自网络拓扑从下到上进行汇总,得到维度最高的一个或多个预警作为预判;
(C)、将本时间粒度预判与上一时间粒度预判进行比较,得出预判变化:将上个时间粒度的预判与本时间粒度预判进行比较,得出预判的变化情况,预判变化为预判发生、预判消除、预判维度变化及预判级别变化。
本发明有益效果是:一种基于趋势外推聚类的移动网络性能预警预判方法,包括以下步骤:步骤1、利用趋势外推及K中心点聚类算法计算各个性能指标的预警门限,具体包括以下子步骤:(1)、获取移动网络性能指标的历史数据,(2)、将历史数据分解为趋势分量和周期分量,(3)、趋势分量利用曲线拟合得到下一周期的趋势分量,(4)、周期分量利用K中心点聚类算法聚类出一个聚类中心,(5)、将聚类中心和下一周期的趋势分量相乘得到下一周期的预警门限基准值,(6)、利用正态分布的3σ原则,计算下一周期的正常活动区间,得到预警门限;步骤2、实时计算本时间粒度的预警及预判,得出预判变化,具体包括以下子步骤:(A)、计算本时间粒度的预警,(B)、将各个指标的预警根据各自的网络拓扑汇总为本时间粒度的预判信息,(C)、将本时间粒度预判与上一时间粒度预判进行比较,得出预判变化。与现有技术相比,本发明能够有效克服由于历史数据异常点导致的预警门限不准确问题,能够反映趋势变化,使预警门限更准确,能够根据网络拓扑将多条预警信息汇总为一条预判,并能够反映预判变化,从而能够从整体上反映网络的性能变化情况。
附图说明
图1是本发明移动网络性能预警预判方法的流程图。
图2是2013.8.1-2013.8.28某MSC位置更新成功率原始数据图。
图3是2013.8.1-2013.8.28某MSC位置更新成功率原始数据按天统计图。
图4是2013.8.1-2013.8.28某MSC位置更新成功率应用7*96移动平均结果图。
图5是2013.8.1-2013.8.28某MSC位置更新成功率应用移动平均后分解出的周期分量图。
图6是2013.8.1-2013.8.28某MSC位置更新成功率分解出的周期分量按天统计图。
图7是2013.8.1-2013.8.28某MSC位置更新成功率分解出的趋势分量使用1次、3次多项式曲线拟合结果图。
图8是2013.8.1-2013.8.28某MSC位置更新成功率分解出的趋势分量使用5次、7次多项式曲线拟合结果图。
图9是2013.8.1-2013.8.28某MSC位置更新成功率分解出的趋势分量使用8次、9次多项式曲线拟合结果图。
图10是2013.8.1-2013.8.28某MSC位置更新成功率分解出的趋势分量最终趋势外推结果图。
图11是2013.8.1-2013.8.28某MSC位置更新成功率分解出的周期分量应用K中心点聚类算法结果图。
图12是2013.8.1-2013.8.28某MSC位置更新成功率计算出的动态门限结果图。
具体实施方式
下面结合附图对本发明作进一步说明。
如图1所示,一种基于趋势外推聚类的移动网络性能预警预判方法,包括以下步骤:
步骤1、利用趋势外推及K中心点聚类算法计算各个性能指标的预警门限。
将动态获取的移动网络性能指标历史数据,利用趋势外推及K中心点聚类算法计算各个性能指标预警门限,本方法每天计算一次预警门限,具体包括以下子步骤:
(1)、获取移动网络性能指标的历史数据;动态获取移动网络性能指标的历史数据,移动网络性能指标可以有多个,如寻呼成功率、位置更新成功率、CP负荷等,各个性能指标又可以分为不同的网元维度(Pool、MSC、BSC等),高维度指标需要通过低维度来统计计算,移动网络性能指标可以按照不同的时间粒度来统计,如1小时、15分钟等,本方法要求历史性能指标数据至少3周,最多不超过8周,并且必须为整周。接下来会结合具体数据进行分析,从某市移动网络管理数据库中获取某MSC位置更新成功率指标数据,时间是从2013年8月1日开始的28天,时间采集粒度为15分钟,原始数据如图2所示。每天96个点,可以看做是一个96维的向量,28天可以看做28个96维向量,如图3所示。
(2)、将历史数据分解为趋势分量和周期分量;时间序列一般是由多因素共同作用的结果,一般将其分解为不同分量来分析:趋势分量(T)、循环分量(C)、季节分量(S)、不规则分量(I)。时间序列有两种分析模型,加法模型(y=T+S+C+I)和乘法模型(y=T*S*C*I),由于加法模型可以通过求对数转为乘法模型,因此一般使用乘法模型来分析。对于有明显季节因素影响的时间序列,可以通过季节移动平均来消除季节变动和随机变动部分SI,剩下TC,采用移动季节平均公式为:yt=(yt+yt-1+…+yt-N+1)/N,得到的就是趋势分量和循环分量TC,其中N一般取为季节周期的正整数倍。针对某一个网元的历史数据,可以看做是一个周期时间序列,周期为一天,一共多个周期。将历史数据分解为趋势分量和周期分量,具体包括以下子步骤:
(2a)、历史数据利用周期模型,计算移动平均值,得到趋势分量;对于历史指标数据,因为是周期时间序列,所以有周期因素的影响,但是每个周期又伴有一定的趋势性,所以又有趋势的影响,所以可以把历史指标数据Y看做周期分量F和趋势分量T共同作用的结果。利用时间序列的乘法模型,即为
Y=F*T    (1)
式中,F是指周期分量,T是指趋势分量,Y是整个指标数据。对时间序列计算周期整数倍的移动平均即可消除趋势分量的影响,得到周期分量。设历史数据时间序列为yt,t=1,2,…,k-1,其中k为当前时刻,因为周也构成了一个周期,因此本方法对周进行移动平均,即
y ^ t = ( y t + y t - 1 + . . . + y t - N + 1 ) / N - - - ( 2 )
式中,是移动平均之后结果,yt是t时刻的实际值,N是移动平均的数据点数,本方法采用N为一周点数,如每小时采集一个点,N即为24*7=168。从历史数据的第二周开始计算,一直计算到当前时间粒度的前一个时间粒度,其值即为各个时间粒度的趋势分量。针对提供的某MSC位置更新成功率指标数据,每天采集96个点,因此N=96*7,计算其移动平均,结果如图4所示,其即为趋势分量T。
(2b)、将历史数据原始值除以趋势分量即得周期分量,从而将趋势分量和周期分量分离;根据公式1可得F=Y/T,将历史数据中第二周开始的数据除以对应时间粒度的趋势分量,即得对应时间粒度的周期分量,从而将历史数据中趋势分量和周期分量分离。针对提供的某MSC位置更新成功率指标数据,计算结果如图5、图6所示。
(3)、趋势分量利用曲线拟合得到下一周期的趋势分量;根据历史数据的趋势分量,可以估算下一周期的趋势分量,具体包括以下子步骤:
(3a)、将历史数据的趋势分量利用多项式曲线拟合;根据经验,移动网络性能指标的趋势一般满足多项式函数,因此进行多项式曲线拟合。多项式拟合的结果形式为y=a0+a1x+…+akxk,其中x的最高次幂k代表此多项式是k次多项式。本发明采用最小二乘法进行曲线拟合,误差平方和是指拟合数据和实际数据对应点误差的平方和,其计算公式为:
SSE = Σ i = 1 n ( y i - y ^ i ) 2 - - - ( 3 )
式中,yi是指实际数据,是指拟合数据,n代表数据点个数,最小二乘法就是要使误差平方和最小,进而确定各项系数。假设历史趋势分量共有n个点,则其误差平方和为
SSE = Σ i = 1 n [ y i - ( a 0 + a 1 x i + . . . + a k x i k ) ] 2 - - - ( 4 )
式中,yi是指趋势分量实际数据,xi是指趋势分量序号,n代表趋势分量数据点个数,a0到ak为要拟合的多项式系数。对公式4中a0到ak分别求偏导,并令其为0,可得:
- 2 Σ i = 1 n [ y i - ( a 0 + a 1 x i + . . . a k x i k ) ] = 0 . . . - 2 Σ i = 1 n [ y i - ( a 0 + a 1 x + . . . a k x i k ) ] x i k = 0 - - - ( 5 )
式中,yi是指趋势分量实际数据,xi是指趋势分量序号,n代表趋势分量数据点个数,a0到ak为要拟合的多项式系数。根据k+1个方程组,可以解得a0到ak的值,进而得到趋势方程。针对提供的某MSC位置更新成功率指标数据,分别进行1次、3次、5次、7次、8次、9次多项式拟合,得到结果分别为:
1次多项式拟合:f(x)=p1*x+p2
p1=0.0004168  p2=94.22
SSE:1.297
3次多项式拟合:f(x)=p1*x^3+p2*x^2+p3*x+p4
p1=-1.043e-10  p2=3.399e-07  p3=0.000113  p4=94.28
SSE:0.6613
5次多项式拟合:f(x)=p1*x^5+p2*x^4+p3*x^3+p4*x^2+p5*x+p6
p1=-1.827e-16  p2=1.075e-12  p3=-2.374e-09  p4=2.392e-06
p5=-0.000607  p6=94.34
SSE:0.2616
7次多项式拟合:f(x)=p1*x^7+p2*x^6+p3*x^5+p4*x^4+p5*x^3+p6*x^2+p7*x+p8
p1=2.522e-22  p2=-2.105e-18  p3=6.752e-15  p4=-1.039e-11
p5=7.576e-09  p6=-1.907e-06  p7=0.0001642  p8=94.31
SSE:0.1623
8次多项式拟合:f(x)=p1*x^8+p2*x^7+p3*x^6+p4*x^5+p5*x^4+p6*x^3+p7*x^2+p8*x+p9
p1=4.203e-25  p2=-3.138e-21  p3=9.067e-18  p4=-1.257e-14
p5=8.349e-12  p6=-2.509e-09  p7=8.7e-07  p8=-0.0001568
p9=94.32
SSE:0.1529
9次多项式拟合:f(x)=p1*x^9+p2*x^8+p3*x^7+p4*x^6+p5*x^5+p6*x^4+p7*x^3+p8*x^2+p9*x+p10
p1=-1.572e-27  p2=1.469e-23  p3=-5.73e-20  p4=1.206e-16
p5=-1.476e-13  p6=1.057e-10  p7=-4.281e-08  p8=9.593e-06
p9=-0.0009593  p10=94.33
SSE:0.1193
拟合曲线如图7、图8、图9所示,其中图7(a)为1次多项式拟合结果,图7(b)为3次多项式拟合结果,图8(a)为5次多项式拟合结果,图8(b)为7次多项式拟合结果,图9(a)为8次多项式拟合结果,图9(b)为9次多项式拟合结果。可以看到次幂越高,误差项平方和越小,但是阶数太高,数据点中异常项对结果影响越大,所以本例选择7次多项式拟合。
(3b)、利用拟合的趋势方程计算出下个周期的趋势值;根据拟合的趋势方程和下个周期各点的序号,将序号带入趋势方程中,即可求得下个周期各点的趋势值。针对提供的某MSC位置更新成功率指标数据,根据拟合函数计算下一周期趋势分量,即取x从2017到2112,计算y的值,得到结果如图10所示。
(4)、周期分量利用K中心点聚类算法聚类出一个聚类中心;K中心点聚类算法是K均值聚类算法的改进算法,K均值聚类算法是把n个样本分成K类,并且计算每个类中点的均值作为其类的中心点,其对离群点是敏感的,离群点容易导致分类结果不正确和中心点不正确,K中心点聚类算法改善了K均值聚类算法对离群点敏感的特性,在有异常值的情况下,依然可以较好的聚类出中心点。这个中心点能够代替整个数据集,此步针对历史数据中n天的周期分量,利用K中心点聚类算法找出其中一天来代替n天的数据,并且受数据中异常点的影响较小,具体包括以下子步骤:
(4a)、任意选择一天数据作为初始中心点;假设周期分量共有n天数据,每天有k个点,本发明将每天k个点作为一个数据点,它是一个k维向量,则周期分量即可看做n个k维向量。任意选择n个k维向量中其中一个作为初始中心点。
(4b)、计算此中心点的目标函数值;为了计算哪个中心点更加能够更好的代替整个数据集,需要一个目标函数,目标函数越小,说明聚类效果越优。本发明采用其余数据点离中心点距离之和作为目标函数,其中两点之间距离采用如下公式计算:
d = ( a 1 - b 1 ) 2 + ( a 2 - b 2 ) 2 + . . . + ( a k - b k ) 2 - - - ( 6 )
式中,a、b是两天数据,a1到ak分别为当天第一个数据点到第k个数据点,每天一共k个点。因此本方法采用的目标函数计算公式为:
S = Σ i = 1 n - 1 d i - - - ( 7 )
式中,di为其余数据点到中心点距离,计算其余数据点离当前中心点的距离,其和作为当前中心点的目标函数值。
(4c)、依次选择其余数据点作为中心点,比较目标函数值,确定最终中心点;依次选择其余数据点作为中心点,计算目标函数值,与之前目标函数值比较,如果小于之前目标函数值,则替换为当前中心点,直至所有数据点都比较过之后,得到最终聚类中心点。针对提供的某MSC位置更新成功率指标数据,聚类结果如图11所示。
(5)、将聚类中心和下一周期的趋势分量相乘得到下一周期的预警门限基准值;由子步骤(3)得到的下一周期的趋势分量和由子步骤(4)得到周期分量的聚类中心,将两者对应项相乘得到下一周期的预警门限基准值。
(6)、利用正态分布的3σ原则,计算下一周期的正常活动区间,得到预警门限;根据统计计算,历史每天同一时间粒度数据基本满足正态分布,而正态分布满足3σ原则,即数据基本都在“均值-3σ”到“均值+3σ”之间,而偏离这个区间的概率只有0.3%,因此可以采用这个原则确定数据正常的活动范围,具体包括以下子步骤:
(6a)、计算历史性能指标数据每天同一个时间粒度的标准差σ;历史性能指标数据,每天同一时间粒度数据作为一组,计算每组的标准差σ,其中标准差公式为:
σ = 1 N - 1 Σ i = 1 N ( x i - μ ) 2 - - - ( 8 )
式中,xi是每天同一时间粒度的数据值,一共N个,μ是每天同一时间粒度的均值。
(6b)、计算下一周期的正常活动区间,结合下一周期的预警门限基准值得到预警门限;本方法将预警门限基准值上下浮动2σ作为正常活动区间,超出则产生预警,将预警级别定为2级,高级别预警和低级别预警,将基准值加减3σ作为高级别预警门限,基准值加减2σ作为低级别预警门限。针对提供的某MSC位置更新成功率指标数据,最终计算结果如图12所示。
步骤2、实时计算本时间粒度的预警及预判,得出预判变化;实时获得各个性能指标值,跟步骤1得到的预警门限进行比较,判断是否预警,然后将各个指标预警汇总为预判,并与上个时间粒度预判进行比较,得到预判变化,具体包括以下子步骤:
(A)、计算本时间粒度的预警;将各个网元的各个性能指标实际值和上一步骤计算出来的预警门限比较,判断是否预警。
(B)、将各个指标的预警根据各自的网络拓扑汇总为本时间粒度的预判信息;将各个指标预警汇总为一个或多个主预警,定义为预判,具体包括以下子步骤:
(Ba)、将本粒度预警根据指标进行分组;将本粒度预警根据性能指标进行分组,每个指标分为一组。
(Bb)、将同一指标维度最高的预警提取出作为本粒度预判;根据不同的性能指标,移动网络性能网元可能分为不同的维度,如位置更新成功率网元维度从上到下依次为Pool、MSC、BSC,即每个Pool由多个MSC组成,每个MSC管理多个BSC。将不同性能指标预警按照各自网络拓扑从下到上进行汇总,得到维度最高的一个或多个预警作为预判。2013.8.1010:15位置更新成功率的预警情况如下:Pool1.MSC1.BSC2高级别预警,Pool1.MSC1.BSC5低级别预警,Pool1.MSC1低级别预警。根据网络拓扑结构,汇总出预判为Pool1.MSC1低级别预判。
(C)、将本时间粒度预判与上一时间粒度预判进行比较,得出预判变化;
获得上个时间粒度的所有预判,与本粒度预判进行比较,得出预判的变化情况。预判变化可能为:预判发生、预判消除、预判维度变化、预判级别变化,判别标准为:预判发生:当前时间粒度此维度有预判,上个时间粒度原来没有此维度预判,且没有此维度高低维度预判。预判消除:上个时间粒度有此维度预判,当前时间粒度没有此维度预判,且没有此维度高低维度预判。预判维度变化:当前时间粒度有此维度预判,上个时间粒度有此维度高低维度预判。预判级别变化:上个时间粒度有此维度预判,当前时间粒度有此维度预判,但是级别不同。2013.8.1010:00时间粒度位置更新成功率预判情况为:Pool1低级别预判,而2013.8.1010:15时间粒度位置更新成功率预判为:Pool1.MSC1低级别预判,所以可以得出位置更新成功率指标预判由Pool1的低级别预判降低为Pool1.MSC1的低级别预判,维度降低。
本发明优点在于:一种基于趋势外推聚类的移动网络性能预警预判方法,能够有效克服由于历史数据异常点导致的预警门限不准确问题,能够反映趋势变化,使预警门限更准确,能够根据网络拓扑将多条预警信息汇总为一条预判,并能够反映预判变化,从而能够从整体上反映网络的性能变化情况。

Claims (1)

1.一种基于趋势外推聚类的移动网络性能预警预判方法,其特征在于包括以下步骤:
步骤1、利用趋势外推及K中心点聚类算法计算各个性能指标的预警门限:将动态获取的移动网络性能指标历史数据,利用趋势外推及K中心点聚类算法计算各个性能指标预警门限,本方法每天计算一次预警门限,具体包括以下子步骤:
(1)、获取移动网络性能指标的历史数据:从移动网络数据库中动态获取各个指标的历史数据,本方法要求历史性能指标数据至少为3周,最多不超过8周,而且必须为整周;
(2)、将历史数据分解为趋势分量和周期分量:针对某一个网元的某一指标的历史数据,看做是一个周期时间序列,周期为一天,共多个周期,将历史数据分解为趋势分量和周期分量,具体包括以下子步骤:
(2a)、历史数据利用周期模型,计算移动平均值,得到趋势分量,历史数据可看做周期分量和趋势分量共同作用的结果,利用时间序列的乘法模型表示为:
Y=F*T   (1)
式中,F是周期分量,T是趋势分量,Y是历史数据,对时间序列计算周期整数倍的移动平均即可消除趋势分量的影响,得到周期分量,设历史数据时间序列为yt,t=1,2,…,k-1,其中k为当前时刻,因为周也构成了一个周期,因此本方法对周进行移动平均,表示为:
y ^ t = ( y t + y t - 1 + . . . + y t - N + 1 ) / N - - - ( 2 )
式中,是移动平均之后结果,yt是t时刻的实际值,N是移动平均的数据点数,本方法采用N为一周点数,从历史数据的第二周开始计算,一直计算到当前时间粒度的前一个时间粒度,其值即为各个时间粒度的趋势分量;
(2b)、将历史数据原始值除以趋势分量即得周期分量,从而将趋势分量和周期分量分离;
根据公式(1)可得F=Y/T,将历史数据中第二周开始的数据除以对应时间粒度的趋势分量,即得对应时间粒度的周期分量,从而将历史数据中趋势分量和周期分量分离;
(3)、趋势分量利用曲线拟合得到下一周期的趋势分量:根据历史数据的趋势分量,可以估算下一周期的趋势分量,具体包括以下子步骤:
(3a)、将历史数据的趋势分量利用多项式曲线拟合:根据经验,移动网络性能指标的趋势一般满足多项式函数,因此进行多项式曲线拟合,多项式拟合的结果形式为y=a0+a1x+…+akxk,式中x的最高次幂k代表此多项式是k次多项式,本发明采用最小二乘法进行曲线拟合,误差平方和是指拟合数据和实际数据对应点误差的平方和,其计算公式为:
SSE = Σ i = 1 n ( y i - y ^ i ) 2 - - - ( 3 )
式中,yi是实际数据,是拟合数据,n代表数据点个数,最小二乘法就是要使误差平方和最小,进而确定各项系数,假设历史趋势分量共有n个点,则其误差平方和为
SSE = Σ i = 1 n [ y i - ( a 0 + a 1 x i + . . . + a k x i k ) ] 2 - - - ( 4 )
式中,yi是趋势分量实际数据,xi是趋势分量序号,n代表趋势分量数据点个数,a0到ak为要拟合的多项式系数,对公式(4)中a0到ak分别求偏导,并令其为0,可得:
- 2 Σ i = 1 n [ y i - ( a 0 + a 1 x i + . . . a k x i k ) ] = 0 . . . - 2 Σ i = 1 n [ y i - ( a 0 + a 1 x i + . . . a k x i k ) ] x i k = 0 - - - ( 5 )
式中,yi是趋势分量实际数据,xi是趋势分量序号,n代表趋势分量数据点个数,a0到ak为要拟合的多项式系数,根据k+1个方程的方程组,可以解得a0到ak的值,进而得到趋势方程;
(3b)、利用拟合的趋势方程计算出下个周期的趋势值:根据拟合的趋势方程和下个周期各点的序号,将序号带入趋势方程中,即可求得下个周期各点的趋势值;
(4)、周期分量利用K中心点聚类算法聚类出一个聚类中心:针对历史数据中n天的周期分量,利用K中心点聚类算法找出其中一天来代替n天的数据,具体包括以下子步骤:
(4a)、任意选择一天数据作为初始中心点:假设周期分量共有n天数据,每天有k个点,本发明将每天k个点作为一个数据点,它是一个k维向量,则周期分量即可看做n个k维向量,任意选择n个k维向量中其中一个作为初始中心点;
(4b)、计算此中心点的目标函数值:为了计算哪个中心点更加能够更好的代替整个数据集,需要一个目标函数,目标函数越小,说明聚类效果越优,本发明采用其余数据点离中心点距离之和作为目标函数,其中两点之间距离采用如下公式计算:
d = ( a 1 - b 1 ) 2 + ( a 2 - b 2 ) 2 + . . . + ( a k - b k ) 2 - - - ( 6 )
式中,a、b是两天数据,a1到ak分别为当天第一个数据点到第k个数据点,每天一共k个点,本方法采用的目标函数计算公式为:
S = Σ i = 1 n - 1 d i - - - ( 7 )
式中,di为其余数据点到中心点距离,计算其余数据点离当前中心点的距离,其和作为当前中心点的目标函数值;
(4c)、依次选择其余数据点作为中心点,比较目标函数值,确定最终中心点:依次选择其余数据点作为中心点,计算目标函数值,与之前目标函数值比较,如果小于之前目标函数值,则替换为当前中心点,直至所有数据点都比较过之后,得到最终聚类中心点;
(5)、将聚类中心和下一周期的趋势分量相乘得到下一周期的预警门限基准值:由子步骤(3)得到的下一周期的趋势分量和由子步骤(4)得到周期分量的聚类中心,将两者对应项相乘得到下一周期的预警门限基准值;
(6)、利用正态分布的3σ原则,计算下一周期的正常活动区间,得到预警门限:根据统计计算,历史每天同一时间粒度数据基本满足正态分布,而正态分布满足3σ原则,即数据基本都在均值-3σ到均值+3σ之间,而偏离这个区间的概率只有0.3%,因此可以采用这个原则确定数据正常的活动范围,具体包括以下子步骤:
(6a)、计算历史性能指标数据每天同一个时间粒度的标准差:将历史性能指标数据与每天同一时间粒度数据作为一组,计算每组的标准差,其中标准差公式为:
σ = 1 N - 1 Σ i = 1 N ( x i - μ ) 2 - - - ( 8 )
式中,xi是每天同一时间粒度的数据值,一共N个,μ是每天同一时间粒度的均值,σ是标准差;
(6b)、计算下一周期的正常活动区间,结合下一周期的预警门限基准值得到预警门限:本方法将预警门限基准值上下浮动2σ作为正常活动区间,超出则产生预警,将预警级别定为2级,即高级别预警和低级别预警,将基准值加减3σ作为高级别预警门限,基准值加减2σ作为低级别预警门限;
步骤2、实时计算本时间粒度的预警及预判,得出预判变化:实时获得各个性能指标值,跟步骤1得到的预警门限进行比较,判断是否预警,然后将各个指标预警汇总为预判,并与上个时间粒度预判进行比较,得到预判变化,具体包括以下子步骤:
(A)、计算本时间粒度的预警:将各个网元的各个性能指标实际值和步骤1计算出来的预警门限进行比较,判断是否预警;
(B)、将各个指标的预警根据各自的网络拓扑汇总为本时间粒度的预判信息:将各个指标预警汇总为一个或多个主预警,定义为预判,具体包括以下子步骤:
(Ba)、将本时间粒度预警根据指标进行分组:将本时间粒度预警根据性能指标进行分组,每个指标分为一组;
(Bb)、将同一指标维度最高的预警提取出作为本时间粒度预判:根据不同的性能指标,移动网络性能网元分为不同的维度,如位置更新成功率网元维度从上到下依次为Pool、MSC、BSC,即每个Pool由多个MSC组成,每个MSC管理多个BSC,将不同性能指标预警按照各自网络拓扑从下到上进行汇总,得到维度最高的一个或多个预警作为预判;
(C)、将本时间粒度预判与上一时间粒度预判进行比较,得出预判变化:将上个时间粒度的预判与本时间粒度预判进行比较,得出预判的变化情况,预判变化为预判发生、预判消除、预判维度变化及预判级别变化。
CN201510119179.7A 2015-03-18 2015-03-18 一种基于趋势外推聚类的移动网络性能预警预判方法 Expired - Fee Related CN104735710B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510119179.7A CN104735710B (zh) 2015-03-18 2015-03-18 一种基于趋势外推聚类的移动网络性能预警预判方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510119179.7A CN104735710B (zh) 2015-03-18 2015-03-18 一种基于趋势外推聚类的移动网络性能预警预判方法

Publications (2)

Publication Number Publication Date
CN104735710A true CN104735710A (zh) 2015-06-24
CN104735710B CN104735710B (zh) 2018-09-04

Family

ID=53459048

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510119179.7A Expired - Fee Related CN104735710B (zh) 2015-03-18 2015-03-18 一种基于趋势外推聚类的移动网络性能预警预判方法

Country Status (1)

Country Link
CN (1) CN104735710B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279257A (zh) * 2015-10-15 2016-01-27 珠海世纪鼎利科技股份有限公司 一种基于正态分布的互联网大数据挖掘方法和***
CN105873105A (zh) * 2016-04-22 2016-08-17 中国科学技术大学 一种基于网络体验质量的移动通信网异常检测和定位方法
CN106059661A (zh) * 2015-12-25 2016-10-26 国家电网公司 一种基于时序分析的光传输网络趋势预测方法
CN106100896A (zh) * 2016-07-13 2016-11-09 焦点科技股份有限公司 一种基于网站用户访问路径的流量预警方法
CN107204894A (zh) * 2017-05-18 2017-09-26 华为技术有限公司 网络业务质量的监控方法及装置
WO2018228049A1 (zh) * 2017-06-15 2018-12-20 平安科技(深圳)有限公司 数据库性能指标的监测方法、装置、设备及存储介质
CN110890998A (zh) * 2019-11-06 2020-03-17 厦门网宿有限公司 一种确定阈值的方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101404805A (zh) * 2008-11-05 2009-04-08 ***通信集团江苏有限公司 一种通过话单深度挖掘发现网络边漫问题的方法
CN101984702A (zh) * 2010-11-19 2011-03-09 中兴通讯股份有限公司 移动数据业务质量的监控预警方法及装置
CN102572883A (zh) * 2010-12-16 2012-07-11 ***通信集团湖南有限公司 一种网络通信保障方法及装置
WO2013017851A1 (en) * 2011-07-29 2013-02-07 Intellectual Ventures Holding 81 Llc Mobile communications network, infrastructure equipment and method for managing reduced mobility of and sending downlink data to machine type communciations (mtc) devices

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101404805A (zh) * 2008-11-05 2009-04-08 ***通信集团江苏有限公司 一种通过话单深度挖掘发现网络边漫问题的方法
CN101984702A (zh) * 2010-11-19 2011-03-09 中兴通讯股份有限公司 移动数据业务质量的监控预警方法及装置
CN102572883A (zh) * 2010-12-16 2012-07-11 ***通信集团湖南有限公司 一种网络通信保障方法及装置
WO2013017851A1 (en) * 2011-07-29 2013-02-07 Intellectual Ventures Holding 81 Llc Mobile communications network, infrastructure equipment and method for managing reduced mobility of and sending downlink data to machine type communciations (mtc) devices

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279257A (zh) * 2015-10-15 2016-01-27 珠海世纪鼎利科技股份有限公司 一种基于正态分布的互联网大数据挖掘方法和***
CN106059661A (zh) * 2015-12-25 2016-10-26 国家电网公司 一种基于时序分析的光传输网络趋势预测方法
CN106059661B (zh) * 2015-12-25 2019-05-24 国家电网公司 一种基于时序分析的光传输网络趋势预测方法
CN105873105A (zh) * 2016-04-22 2016-08-17 中国科学技术大学 一种基于网络体验质量的移动通信网异常检测和定位方法
CN105873105B (zh) * 2016-04-22 2018-07-03 中国科学技术大学 一种基于网络体验质量的移动通信网异常检测和定位方法
CN106100896A (zh) * 2016-07-13 2016-11-09 焦点科技股份有限公司 一种基于网站用户访问路径的流量预警方法
CN106100896B (zh) * 2016-07-13 2018-11-23 焦点科技股份有限公司 一种基于网站用户访问路径的流量预警方法
CN107204894A (zh) * 2017-05-18 2017-09-26 华为技术有限公司 网络业务质量的监控方法及装置
CN107204894B (zh) * 2017-05-18 2020-07-07 华为技术有限公司 网络业务质量的监控方法及装置
WO2018228049A1 (zh) * 2017-06-15 2018-12-20 平安科技(深圳)有限公司 数据库性能指标的监测方法、装置、设备及存储介质
CN110890998A (zh) * 2019-11-06 2020-03-17 厦门网宿有限公司 一种确定阈值的方法及装置

Also Published As

Publication number Publication date
CN104735710B (zh) 2018-09-04

Similar Documents

Publication Publication Date Title
CN104735710A (zh) 一种基于趋势外推聚类的移动网络性能预警预判方法
WO2022135265A1 (zh) 气候变化影响下水库调度规则的失效预警分析方法
ElNozahy et al. A probabilistic load modelling approach using clustering algorithms
CN105825298B (zh) 一种基于负荷特性预估的电网计量预警***及方法
CN110210681B (zh) 一种基于距离的监测站点pm2.5值的预测方法
CN106059661A (zh) 一种基于时序分析的光传输网络趋势预测方法
CN110222991B (zh) 基于rf-gbdt的计量装置故障诊断方法
CN111382897A (zh) 台区低压跳闸预测方法、装置、计算机设备及存储介质
CN104239968A (zh) 一种快速模糊粗糙集短期负荷预测方法
CN116976707B (zh) 基于用电信息采集的用户用电数据异常分析方法及***
CN113554361B (zh) 一种综合能源***数据处理计算方法及处理***
CN116204779B (zh) 一种判断储能盐穴运行状态的方法、***及可读存储介质
CN112418476A (zh) 一种超短期电力负荷预测方法
CN103440410A (zh) 主变个体缺陷概率预测方法
CN112417627A (zh) 一种基于四维指标体系配电网运行可靠性分析方法
CN111881961A (zh) 基于数据挖掘的配电网故障风险等级预测方法
CN113569462A (zh) 一种计及天气因素的配电网故障等级预测方法及***
CN117783745B (zh) 用于换电柜的数据在线监测方法及***
WO2018101878A1 (en) Forcasting time series data
CN117851908B (zh) 一种改进的在线低压台区电能表失准监测方法及装置
CN104408525A (zh) 作业车间调度风险的量化评估与控制方法
CN116862209B (zh) 一种新能源汽车充电设施管理方法及***
CN107834563A (zh) 电压暂降的处理方法和***
CN111382946B (zh) 设备健康状态的自主评估方法、***及工业互联网设备
CN112488418A (zh) 一种全拓扑负荷预测方法、装置及计算机设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180904