CN109995599A - 一种网络性能异常的智能告警方法 - Google Patents

一种网络性能异常的智能告警方法 Download PDF

Info

Publication number
CN109995599A
CN109995599A CN201910351169.4A CN201910351169A CN109995599A CN 109995599 A CN109995599 A CN 109995599A CN 201910351169 A CN201910351169 A CN 201910351169A CN 109995599 A CN109995599 A CN 109995599A
Authority
CN
China
Prior art keywords
network
network performance
exception
time
intelligent alarm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910351169.4A
Other languages
English (en)
Inventor
胡记伟
谭敏
黄飞
魏明
刘华汉
胡志勇
张磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Fiberhome Technical Services Co Ltd
Original Assignee
Wuhan Fiberhome Technical Services Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Fiberhome Technical Services Co Ltd filed Critical Wuhan Fiberhome Technical Services Co Ltd
Priority to CN201910351169.4A priority Critical patent/CN109995599A/zh
Publication of CN109995599A publication Critical patent/CN109995599A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0681Configuration of triggering conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种网络性能异常的智能告警方法,涉及网络智能告警领域,包括:收集网络运行近三天的工作指标;利用熵值法确定每个工作指标的权重,并生成基准线;依据基准线对网络性能情况进行实时监测,偏离度较大的判定为网络异常,进行报警。本发明的网络性能异常的智能告警方法根据被监控对象的历史走势数据,判断被监控对象的性能数据平稳性,以及在不同的业务形态以及不同的时间范围内的表现,自动生成随着业务不同、时间点不同的动态阈值,并通过动态阈值提供了高度健壮的性能检测机制,将告警检测从简单的固定值变成随着业务和时间能够自适应的动态值,能够大幅降低无效告警的发生频率,辅助用户更加准确的感知性能异常。

Description

一种网络性能异常的智能告警方法
技术领域
本发明涉及网络智能告警领域,具体涉及一种网络性能异常的智能告警方法。
背景技术
随着Internet业务和多媒体应用的快速发展,网络的业务量正在以指数级的速度迅速膨胀,这对网络高比特率数据传输能力和大吞吐量的交叉能力提出了更高的要求。光纤通信技术出现以后,其近30THz的巨大潜在带宽容量给通信领域带来了蓬勃发展的机遇,特别是在提出信息高速公路以来,光技术开始渗透于整个通信网,光纤通信有向全光网推进的趋势。同时,网络结构日趋复杂,网络设备数量、种类随着时代发展增加,维护需要相关数据以便准确地处理问题,因此对网络性能异常问题的处理就显得尤为重要。
目前对网络性能异常的管理主要采用人工监测和手动干预的方式进行管理,其主要流程如下:
1、管理员根据网络运行技术标准或者经验,对网络的负载阈值进行设定。
2、网络运行时,当某个网段的负载达到阈值,发出告警信息。
3、管理员对网络资源的占用情况进行评估,形成网络诊断结果报告。
4、管理员依据网络诊断结果报告,合理的调配网络中的资源,同时,根据网络整体的资源利用率利用网络管理工具进行网络优化。
上述技术方案在具体工作中存在以下缺点:一方面由于网络负载阈值固定,无法充分考虑实时变化的网络负载占用情况,网络性能异常的报送和收集不符合实际工作需求客观情况;另一方面,网络负载阈值依赖于管理员对网络优化工作的经验,由于没有具体标准所以容易发生误报,从而影响正常业务。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种网络性能异常的智能告警方法,可根据被监控对象的客观需求自动生成不同业务或时间点的动态阈值,能够大幅降低无效告警的发生频率,辅助用户更加准确的感知性能异常。
为达到以上目的,本发明采取的技术方案是:
一种网络性能异常的智能告警方法,包括:
收集网络运行近三天的工作指标;利用熵值法确定每个工作指标的权重,并生成基准线;依据基准线对网络性能的关键指标进行实时监测,将监测值相对基准线偏离度超过设定偏离度阈值的判定为网络异常,进行报警,所述关键指标为权重超过权重阈值的工作指标。
在上述技术方案的基础上,收集的所述工作指标包括负载程度、带宽、时延和带宽时延积。
在上述技术方案的基础上,利用熵值法确定每个工作指标的权重,并生成基准线的具体方法包括:对网络运行信息按照规定时间步长进行采样;对每个采样区间进行分析,识别工作指标,利用熵值法确定每个工作指标的权值大小;计算每个采样区间内各时刻的工作指标值与对应权值的积,形成各时刻的网络性能综合数值,将各网络性能综合数值依次相连获得该时间步长内的基准线。
在上述技术方案的基础上,重复采集多个相同时间步长的基准线,计算各时刻网络性能综合数值的平均值,将各网络性能综合数值平均值依次相连获得该时间步长内的最终基线。
在上述技术方案的基础上,依据基准线对网络性能情况进行实时监测包括:实时对网络性能的关键指标进行监测,按照与所述网络运行信息相同的规定时间步长进行采样;将实时采样点中的关键指标乘以熵值法所确定权值,得到该实时采样点的网络性能综合数值;将该实时采样点的网络性能综合数值与最终基线中对应综合数值进行比较,当偏离程度达到95%以上时,***发出异常检测告警并通知管理员。
在上述技术方案的基础上,所述偏离度采用以下算法进行计算:
设置函数PAD=percentile(|Xi-percentile(X)|);
设置当Xi>percentile(X)+n*PAD时,返回告警;
其中,预设窗口长度|X|=1天,Percentile=95分位值。
在上述技术方案的基础上,设置数值高于所述偏离度阈值的分类告警阈值;将偏离程度大于等于所述分类告警阈值的网络异常的归类为严重异常,将偏离程度大于等于所述偏离度阈值且低于所述分类告警阈值的网络异常的归类为一般异常;对一般异常进行记录和监测,对严重异常转入网络管理工具进行干预。
在上述技术方案的基础上,在获取基准线后,按照预设的时间步长对采样点进行定期巡检。
在上述技术方案的基础上,生成基准线过程中,将基准线分为工作日和休息日两种类型,分别通过近三个工作日或三个休息日进行基准线的建立。
与现有技术相比,本发明的优点在于:
(1)本发明的网络性能异常的智能告警方法根据被监控对象的历史走势数据,判断被监控对象的性能数据平稳性,以及在不同的业务形态以及不同的时间范围内的表现,自动生成随着业务不同、时间点不同的动态阈值,并通过动态阈值提供了高度健壮的性能检测机制,将告警检测从简单的固定值变成随着业务和时间能够自适应的动态值,能够大幅降低无效告警的发生频率,辅助用户更加准确的感知性能异常。
(2)本发明的网络性能异常的智能告警方法通过对特定时间步长的性能采样确定分析基线,随后根据确定的分析基线进行数据的监测分析,通过异常检测算法发现产生较大偏移的异常情况时进行报警,规避人为判断的偶然性使得网络运行更加安全稳定。
(3)本发明的网络性能异常的智能告警方法采用改进的异常检测算法,在算法中引入分位值的概念,以提高异常检测的敏感度,更加符合实际应用中网络性能告警发生率是比较低的客观事实,本方案能提高性能告警的准确度较现有方案对网络性能异常的判断更加准确。
附图说明
图1为本发明实施例中的网络业务架构图。
具体实施方式
以下结合附图及实施例对本发明作进一步详细说明。
参见图1所示,本发明实施例中的网络业务架构由下至上依次为包括数据采集层、数据处理层、产品服务层和可视化展示层。本发明的网络性能异常的智能告警方法即在此架构下实现,通过数据采集层采集网络业务的性能指标和状态指标,由数据处理层算法模型进行处理,实现网络业务的统一监控和智能告警功能,并在可视化展示层进行展示。
本发明实施例提供一种网络性能异常的智能告警方法,包括:
收集网络运行近3天的工作指标;利用熵值法确定每个工作指标的权重,并生成基准线;依据基准线对网络性能的关键指标进行实时监测,将监测值相对基准线偏离度超过设定偏离度阈值的判定为网络异常,进行报警,所述关键指标为权重超过权重阈值的工作指标。
权重阈值限制了指标异变是否触发或影响告警的工作指标,本发明中的所述的权重阈值为工作人员针对***告警敏感度需求、告警影响因素数量以及以往工作经验设置,针对告警敏感度高,告警影响因素多的***,相关权重阈值设置较高。偏离度阈值为直接限制告警敏感度的阈值,其数值越高***对指标偏差越不敏感,触发告警时的工作异常越明显和严重。
在上述过程中,收集的所述工作指标包括负载程度、带宽、时延和带宽时延积。
具体的,在一个实施例中,利用熵值法确定每个工作指标的权重,并生成基准线的方法包括:
对网络运行信息按照规定时间步长进行采样;对每个采样区间进行分析,识别工作指标,利用熵值法确定每个工作指标的权值大小;计算每个采样区间内各时刻的工作指标值与对应权值的积,形成各时刻的网络性能综合数值,将各网络性能综合数值依次相连获得该时间步长内的基准线。
依据基准线对网络性能情况进行实时监测包括:
对实时网络性能的关键指标进行监测,按照与所述网络运行信息相同的规定时间步长进行采样;将实时采样点中的关键指标乘以熵值法所确定权值,得到该实时采样点的网络性能综合数值;将该实时采样点的综合数值与最终基线中对应综合数值进行比较,当偏离程度达到95%以上时,***发出异常检测告警并通知管理员。此处的95%即为该实施例中预设的偏离度阈值,该数值是可调节的预设值,具体工程人员可依据实际告警发生频率和准确率对该比例进行调整。
本实施例中,所述偏离度采用以下算法进行计算:
设置函数PAD=percentile(|Xi-percentile(X)|);
设置当Xi>percentile(X)+n*PAD时,返回告警;
其中,预设窗口长度|X|=1天,Percentile=95分位值。
上述过程中使用PAD函数Percentile of Absolute Deviation aroundpercentile,该方法使用指标的历史数据确定指标的基准值和偏离程度基准值,然后利用这两个值判断观测值是否异常。
本过程中,可设置数值高于所述偏离度阈值的分类告警阈值;将偏离程度大于等于所述分类告警阈值的网络异常的归类为严重异常,将偏离程度大于等于所述偏离度阈值且低于所述分类告警阈值的网络异常的归类为一般异常;对一般异常进行记录和监测,对严重异常转入网络管理工具进行干预。
在获取基准线后,按照预设的时间步长对采样点进行定期巡检。
生成基准线过程中,将基准线分为工作日和休息日两种类型,分别通过近三个工作日或三个休息日进行基准线的建立。
下面提供一个可行的实施例的具体过程:
1.首先分工作日和休息日两种类型,分别取最近三天的网络运行信息。
2.对网络运行信息按照T的时间步长进行采样,本实施例中时间步长T设置为一天。
3.对每个采样区间(一天之内)进行分析,***会根据预设权重阈值识别关键指标,本实施例中包括负载程度、带宽、时延、带宽时延积等十余个指标,利用熵值法确定每个工作指标的权值大小。
4.代入每个采样点具体的指标值计算后会形成采样区间内各个时刻的网络性能综合数值,将这些网络性能综合数值按选取时刻相连就能得到这一段时间内的动态基线。
5.将这三个工作日或者三个休息日的采样区间内获得的动态基线取平均值得到两种类型的最终动态基线。
6.对实施网络性能进行监测,也按照T的时间步长进行采样。
7.把实时采样点中的关键指标,如负载程度、带宽、时延、带宽时延积等乘以熵值法所确定权值,得到该实时采样点的网络性能综合数值。
8.把该实时采样点的综合数值与最终基线中对应综合数值进行比较。
9.当偏离程度达到预设偏离度阈值以上时(本实施例中预设偏离度阈值为95%),***会发出异常检测告警并及时通知管理员。
可选的,可将告警分为一般异常和严重异常两个级别,设置数值高于所述偏离度阈值的分类告警阈值;将偏离程度大于等于所述分类告警阈值的网络异常的归类为严重异常,将偏离程度大于等于所述偏离度阈值且低于所述分类告警阈值的网络异常的归类为一般异常;对一般异常仅重点监测即可,而严重异常则需要通过网络管理工具进行管理。
本发明不局限于上述实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围之内。本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims (9)

1.一种网络性能异常的智能告警方法,其特征在于,包括:
收集网络运行近三天的工作指标;
利用熵值法确定每个工作指标的权重,并生成基准线;
依据基准线对网络性能的关键指标进行实时监测,将监测值相对基准线偏离度超过设定偏离度阈值的判定为网络异常,进行报警,所述关键指标为权重超过权重阈值的工作指标。
2.如权利要求1所述的网络性能异常的智能告警方法,其特征在于:收集的所述工作指标包括负载程度、带宽、时延和带宽时延积。
3.如权利要求1所述的网络性能异常的智能告警方法,其特征在于,利用熵值法确定每个工作指标的权重,并生成基准线的具体方法包括:
对网络运行信息按照规定时间步长进行采样;
对每个采样区间进行分析,识别工作指标,利用熵值法确定每个工作指标的权值大小;
计算每个采样区间内各时刻的工作指标值与对应权值的积,形成各时刻的网络性能综合数值,将各网络性能综合数值依次相连获得该时间步长内的基准线。
4.如权利要求3所述的网络性能异常的智能告警方法,其特征在于:重复采集多个相同时间步长的基准线,计算各时刻网络性能综合数值的平均值,将各网络性能综合数值平均值依次相连获得该时间步长内的最终基线。
5.如权利要求4所述的网络性能异常的智能告警方法,其特征在于,依据基准线对网络性能情况进行实时监测包括:
实时对网络性能的关键指标进行监测,按照与所述网络运行信息相同的规定时间步长进行采样;
将实时采样点中的关键指标乘以熵值法所确定权值,得到该实时采样点的网络性能综合数值;
将该实时采样点的网络性能综合数值与最终基线中对应综合数值进行比较,当偏离程度达到95%以上时,***发出异常检测告警并通知管理员。
6.如权利要求1所述的网络性能异常的智能告警方法,其特征在于,所述偏离度采用以下算法进行计算:
设置函数PAD=percentile(|Xi-percentile(X)|);
设置当Xi>percentile(X)+n*PAD时,返回告警;
其中,预设窗口长度|X|=1天,Percentile=95分位值。
7.如权利要求1所述的网络性能异常的智能告警方法,其特征在于:设置数值高于所述偏离度阈值的分类告警阈值;将偏离程度大于等于所述分类告警阈值的网络异常的归类为严重异常,将偏离程度大于等于所述偏离度阈值且低于所述分类告警阈值的网络异常的归类为一般异常;对一般异常进行记录和监测,对严重异常转入网络管理工具进行干预。
8.如权利要求1所述的网络性能异常的智能告警方法,其特征在于,还包括:在获取基准线后,按照预设的时间步长对采样点进行定期巡检。
9.如权利要求1所述的网络性能异常的智能告警方法,其特征在于:生成基准线过程中,将基准线分为工作日和休息日两种类型,分别通过近三个工作日或三个休息日进行基准线的建立。
CN201910351169.4A 2019-04-28 2019-04-28 一种网络性能异常的智能告警方法 Pending CN109995599A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910351169.4A CN109995599A (zh) 2019-04-28 2019-04-28 一种网络性能异常的智能告警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910351169.4A CN109995599A (zh) 2019-04-28 2019-04-28 一种网络性能异常的智能告警方法

Publications (1)

Publication Number Publication Date
CN109995599A true CN109995599A (zh) 2019-07-09

Family

ID=67135477

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910351169.4A Pending CN109995599A (zh) 2019-04-28 2019-04-28 一种网络性能异常的智能告警方法

Country Status (1)

Country Link
CN (1) CN109995599A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110365546A (zh) * 2019-08-22 2019-10-22 广州大学 节点数据流的监控方法、存储介质和计算设备
CN110708303A (zh) * 2019-09-25 2020-01-17 南京源堡科技研究院有限公司 一种网络安全风险评估方法
WO2021203810A1 (zh) * 2020-04-10 2021-10-14 中兴通讯股份有限公司 识别问题小区的方法、电子设备、计算机可读介质
CN113572654A (zh) * 2020-04-29 2021-10-29 华为技术有限公司 网络性能监控方法、网络设备及存储介质
CN115529218A (zh) * 2022-09-16 2022-12-27 中国建设银行股份有限公司 一种网络监控方法、装置、存储介质及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106909487A (zh) * 2017-01-18 2017-06-30 北京盛世全景科技股份有限公司 应用于信息***的预警方法及装置
CN107506843A (zh) * 2017-07-03 2017-12-22 国网上海市电力公司 一种短期负荷预测方法及装置
US20180367445A1 (en) * 2017-06-20 2018-12-20 Cisco Technology, Inc. Network path selection

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106909487A (zh) * 2017-01-18 2017-06-30 北京盛世全景科技股份有限公司 应用于信息***的预警方法及装置
US20180367445A1 (en) * 2017-06-20 2018-12-20 Cisco Technology, Inc. Network path selection
CN107506843A (zh) * 2017-07-03 2017-12-22 国网上海市电力公司 一种短期负荷预测方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
运小贝: ""百度网络监控实战:NetRadar横空出世(下)"", 《HTTPS://WWW.SOHU.COM/A/168589234_354963,百度网络监控实战:NETRADAR横空出世(下)》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110365546A (zh) * 2019-08-22 2019-10-22 广州大学 节点数据流的监控方法、存储介质和计算设备
CN110365546B (zh) * 2019-08-22 2022-03-22 广州大学 节点数据流的监控方法、存储介质和计算设备
CN110708303A (zh) * 2019-09-25 2020-01-17 南京源堡科技研究院有限公司 一种网络安全风险评估方法
WO2021203810A1 (zh) * 2020-04-10 2021-10-14 中兴通讯股份有限公司 识别问题小区的方法、电子设备、计算机可读介质
JP7474864B2 (ja) 2020-04-10 2024-04-25 中興通訊股▲ふん▼有限公司 故障セルの識別方法、電子機器、及びコンピュータ読み取り可能な媒体
CN113572654A (zh) * 2020-04-29 2021-10-29 华为技术有限公司 网络性能监控方法、网络设备及存储介质
CN113572654B (zh) * 2020-04-29 2023-11-14 华为技术有限公司 网络性能监控方法、网络设备及存储介质
CN115529218A (zh) * 2022-09-16 2022-12-27 中国建设银行股份有限公司 一种网络监控方法、装置、存储介质及设备

Similar Documents

Publication Publication Date Title
CN109995599A (zh) 一种网络性能异常的智能告警方法
CN112817280A (zh) 一种用于火电厂智慧监盘报警***实现方法
CN104992298A (zh) 能源管理***
CN105574593B (zh) 基于云计算和大数据的轨道状态静态检控***及方法
CN101854652A (zh) 一种电信网络业务性能监控***
CN115864658B (zh) 一种基于数据分析的电力远动智能监控***
CN116073372A (zh) 一种基于智慧用电的安全监控管理***及方法
CN106952032A (zh) 一种装备制造业大数据管理***
CN108964269A (zh) 配电网运维与综合管理***
CN110162445A (zh) 基于主机日志及性能指标的主机健康评价方法及装置
CN113762604B (zh) 一种工业互联网大数据服务***
CN107395382A (zh) 一种网络质量性能展示方法及装置、***
CN105608842A (zh) 一种核反应堆燃料破损在线监测报警装置
CN109271465A (zh) 一种基于云计算的水文数据分析及展示方法
CN117371952B (zh) 一种多项目协同管理***
CN208521175U (zh) 一种生产数据监控分析***
CN116986246A (zh) 一种用于对输煤皮带进行智能巡检***及巡检方法
CN103914482B (zh) 基于cmdb的集中监控事件影响性确定方法
CN116823220A (zh) 一种电缆运行状态监测平台及设备
CN115798155A (zh) 一种天然气计量分析***
CN113159503B (zh) 一种远程遥控智能安全评估***和方法
CN103412862A (zh) 一种动态母线功率不平衡率获取方法
CN116054416A (zh) 一种基于物联网的智能监控运维管理***
CN110347715A (zh) 一种针对电网运行数据汇总比对方法及***
CN202798762U (zh) 用于电力通信故障信息分析告警装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190709

RJ01 Rejection of invention patent application after publication