CN115484188A - Tap设备监控方法和***、电子设备及可读存储介质 - Google Patents

Tap设备监控方法和***、电子设备及可读存储介质 Download PDF

Info

Publication number
CN115484188A
CN115484188A CN202110666402.5A CN202110666402A CN115484188A CN 115484188 A CN115484188 A CN 115484188A CN 202110666402 A CN202110666402 A CN 202110666402A CN 115484188 A CN115484188 A CN 115484188A
Authority
CN
China
Prior art keywords
data
state information
tap
link
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110666402.5A
Other languages
English (en)
Inventor
任姣姣
孙剑骏
戴传智
蒋立翀
苏娟
李天�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Guangdong Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Guangdong Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Guangdong Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202110666402.5A priority Critical patent/CN115484188A/zh
Publication of CN115484188A publication Critical patent/CN115484188A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种TAP设备监控方法和***、电子设备及可读存储介质,其中方法包括:对TAP设备的状态信息数据以及链路状态数据进行实时采集;将所述TAP设备的状态信息数据以及链路状态数据存入网管监控平台数据库中;对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,确定出设备异常状态信息和/或链路异常状态信息。本发明通过对TAP设备的状态信息数据以及链路状态数据进行采集和存储,采用自动化智能分析方法对TAP设备状态信息以及链路状态数据进行分析,能够确定出设备异常状态信息和/或链路异常状态信息,可以实现对TAP设备的自动监控,并实现对TAP设备以及链路状态进行统一监控管理。

Description

TAP设备监控方法和***、电子设备及可读存储介质
技术领域
本发明涉及网管监控平台技术领域,尤其涉及一种TAP设备监控方法和***、电子设备及可读存储介质。
背景技术
现有技术中,TAP设备已经使用得非常广泛,TAP设备可呈现全部网络数据,在任何双工状态下,实现全线速100%数据捕获(包含错误包在内),方便故障排查。
现有的TAP设备方案,通常是串接在运营商信令网中的CS域或PS域网络中实现信令码流数据复制和汇聚。对于TAP设备的监管,需要运维人员到设备现场检查分析,人力消耗较大且效率低下,同时,对于TAP设备数量多的情况下,人工监控TAP设备还存在周期性问题,TAP设备运行状态、链路中断、链路接收数据错误、链路使用率过高、链路溢出等监控历史记录无法控制。
发明内容
本发明提供一种TAP设备监控方法和***、电子设备及可读存储介质,用以解决现有技术中存在的技术缺陷。
本发明提供一种TAP设备监控方法,包括:
对TAP设备的状态信息数据以及链路状态数据进行实时采集;
将所述TAP设备的状态信息数据以及链路状态数据存入网管监控平台数据库中;
对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,确定出设备异常状态信息和/或链路异常状态信息。
根据本发明所述的TAP设备监控方法,所述对TAP设备的状态信息数据以及链路状态数据进行实时采集,包括:
对所述TAP设备配置监控项,所述监控项包括所述TAP设备的状态以及链路状态;
与TAP设备进行通信,实现对所述TAP设备的监控项数据采集以及网络状态的监视;所述监控项数据包括状态信息数据以及链路状态数据。
根据本发明所述的TAP设备监控方法,所述将所述TAP设备的状态信息数据以及链路状态数据存入网管监控平台数据库中包括:
将所述TAP设备的状态信息数据以及链路状态数据以轮循方式存入网管监控平台数据库中,所述网管监控平台数据库中设置有预设时间长度的存储数据空间。
根据本发明所述的TAP设备监控方法,所述对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,包括:
对所述TAP设备的状态信息数据以及链路状态数据的数据合规性进行校验;
对于校验出的数据中的缺失值,采用均值、线性函数或预测算法进行预测的方式进行缺失值插补,得到在时序上具有连续性的数据;
对所述在时序上具有连续性的数据进行分析预测。
根据本发明所述的TAP设备监控方法,所述对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,确定出设备异常状态信息和/或链路异常状态信息,包括:
基于所述在时序上具有连续性的数据中的业务流量数据,构造时间和业务流量大小数值和/或流量包个数的连续型数据集合;
采用Prophet算法,使用Prophet.fit方法对所述连续型数据集合进行模型拟合,通过使用辅助的方法Prophet.make future dataframe将未来的日期扩展指定的数据个数,使用Prophet.predict方法进行预测,获得forecast对象,其中,包含一列预测值,以及成分的分析和置信区间;
计算流量大小和/或流量包个数偏离置信区间的数据点,对偏离程度进行分析严重程度,确定出链路异常状态信息。
根据本发明所述的TAP设备监控方法,所述对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,确定出设备异常状态信息和/或链路异常状态信息之后,包括:
基于所述链路异常状态信息,进行告警并展示;
当链路恢复正常后,解除告警。
根据本发明所述的TAP设备监控方法,所述对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,确定出设备异常状态信息和/或链路异常状态信息,包括:
对所述TAP设备的状态配置告警触发条件、关联到所述TAP设备的监控项;
采用指数加权移动算法配置触发告警动态阀值,指数加权移动算法的模型公式如下:
vt=βvt-1+(1-β)θt
其中,β取值在0到1之间,β值是根据时间序列的变化特性来选取的;历史数据做为指数加权移动算法的训练集,进行多次训练获得预测误差最小的β,保存指数加权移动算法模型;vt-1表示t-1时刻的指数移动平均值,θt表示t时刻的实际温度,vt表示作为告警动态阀值的t时刻的指数移动平均值。
本发明还提供一种TAP设备监控***,包括:
实时采集模块,用于对TAP设备的状态信息数据以及链路状态数据进行实时采集;
数据存储模块,用于将所述TAP设备的状态信息数据以及链路状态数据存入网管监控平台数据库中;
统计分析模块,用于对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,确定出设备异常状态信息和/或链路异常状态信息。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述TAP设备监控方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述TAP设备监控方法的步骤。
本发明通过对TAP设备的状态信息数据以及链路状态数据进行采集和存储,采用自动化智能分析方法对TAP设备状态信息以及链路状态数据进行分析,能够确定出设备异常状态信息和/或链路异常状态信息,可以实现对TAP设备的自动监控,并实现对TAP设备以及链路状态进行统一监控管理。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的TAP设备监控方法的流程示意图;
图2是本发明提供的TAP设备监控***的结构示意图;
图3是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1描述本发明的一种TAP设备监控方法,该方法等执行主体是网管监控平台,该方法包括:
S1、对TAP设备的状态信息数据以及链路状态数据进行实时采集;
网管监控平台接入交换机网络,用于实现TAP设备的接入访问,其状态信息用于判断是否出现以下异常:接收数据错误、端口使用率过高、电源,内存使用,CPU使用率等,链路状态数据用于判断是否出现以下异常:监控链路中断、链路溢出等。
S2、将所述TAP设备的状态信息数据以及链路状态数据存入网管监控平台数据库中;
以轮循方式进行存储,固定一个大小的存储数据空间,当存满后,新数据将最旧的数据覆盖掉,一直循环,这样就可以只保存固定时间长度的采集数据。
S3、对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,确定出设备异常状态信息和/或链路异常状态信息。
配置网管监控平台TAP设备告警触发条件、关联到TAP设备监控项,配置触发告警阀值,如果状态信息数据达到触发告警阀值,则说明设备状态异常,链路异常状态可以针对流量大小,流量包个数等数据进行统计分析,确定出链路异常状态信息。
本发明通过对TAP设备的状态信息数据以及链路状态数据进行采集和存储,采用自动化智能分析方法对TAP设备状态信息以及链路状态数据进行分析,能够确定出设备异常状态信息和/或链路异常状态信息,可以实现对TAP设备的自动监控,并实现对TAP设备以及链路状态进行统一监控管理。
根据本发明所述的TAP设备监控方法,所述对TAP设备的状态信息数据以及链路状态数据进行实时采集,包括:
对所述TAP设备配置监控项,所述监控项包括所述TAP设备的状态以及链路状态;监控项主要是监控链路中断、接收数据错误、端口使用率过高、链路溢出、电源,内存使用,CPU使用率等。
与TAP设备进行通信,实现对所述TAP设备的监控项数据采集以及网络状态的监视;所述监控项数据包括状态信息数据以及链路状态数据。
网管监控平台通过SNMP,代理,ping端口等方法与TAP设备进行通信,实现对TAP设备监控项数据采集以及网络状态的监视。
根据本发明所述的TAP设备监控方法,所述将所述TAP设备的状态信息数据以及链路状态数据存入网管监控平台数据库中包括:
将所述TAP设备的状态信息数据以及链路状态数据以轮循方式存入网管监控平台数据库中,所述网管监控平台数据库中设置有预设时间长度的存储数据空间。网管监控平台对于TAP设备关键指标数据采集,以轮循方式进行存储,固定一个大小的存储数据空间,当存满后,新数据将最旧的数据覆盖掉,一直循环,这样就可以只保存固定时间长度的采集数据。
根据本发明所述的TAP设备监控方法,所述对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,包括:
对所述TAP设备的状态信息数据以及链路状态数据的数据合规性进行校验;
对于校验出的数据中的缺失值,采用均值、线性函数或预测算法进行预测的方式进行缺失值插补,得到在时序上具有连续性的数据;
对所述在时序上具有连续性的数据进行分析预测。
首先校验数据合规性,确保数据完整性,对于数据中的缺失值,采用均值、线性函数或预测算法进行的预测值等方式进行缺失值插补。确保经过预处理后数据在时序上具有连续性。
根据本发明所述的TAP设备监控方法,所述对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,确定出设备异常状态信息和/或链路异常状态信息,包括:
基于所述在时序上具有连续性的数据中的业务流量数据,构造时间和业务流量大小数值和/或流量包个数的连续型数据集合;
网管监控平台采集到业务流量数据,针对流量大小,流量包个数等数据进行统计分析。
对流量大小进行分析预测,统计计和每五分钟流量大小,构造时间和流量大小数值的连续型数据集合。采用Prophet算法,使用Prophet.fit方法对所述连续型数据集合进行模型拟合,通过使用辅助的方法Prophet.make future dataframe将未来的日期扩展指定的数据个数,使用Prophet.predict方法进行预测,获得forecast对象,其中,包含一列预测值,以及成分的分析和置信区间;
计算流量大小和/或流量包个数偏离置信区间的数据点,对偏离程度进行分析严重程度,确定出链路异常状态信息。计算流量大小偏离置信区间的数据点,对偏离程度进行分析严重程度,对于偏离度非常严重和严重的数据点进行告警,从而监控到大小异常的流量。采用相同方法对流量包个数进行分析预测,从而监控到异常流量包。并针对异常流量进行告警。
根据本发明所述的TAP设备监控方法,所述对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,确定出设备异常状态信息和/或链路异常状态信息之后,包括:
基于所述链路异常状态信息,进行告警并展示;
通过网管监控平台TAP设备模型,增加TAP设备网络拓扑,可在当前视图和其它视图中,查找指定的TAP设备,TAP设备及其交换机之间的连接关系,包括连接的数量,TAP设备监控指示等信息,也可以查看TAP设备相关的故障、性能信息以及相关的告警详情和告警历史信息,对于TAP设备模型设计查询统计的入口,提供历史记录查询;
增加自动发现(可以根据配置文件),包括按照网段自动发现TAP设备,单点TAP设备的发现及多种自动发现手段;
网管监控平台配置TAP设备展示,主要以以点、线、面的形式呈现,为突出显示存在问题的TAP设备或连接关系,拓扑连线在正常情况下淡化(如淡绿色),发生设备告警或达到性能预警值时,对相关网元进行着色渲染,告警清除或低于性能预警值时,着色恢复正常,页面自动刷新时间小于60秒。
当链路恢复正常后,解除告警。
告警类型:包含所有的告警类型,可按照告警类型、告警级别、告警状态做过滤;网管监控平台监控TAP设备告警展示页面。当触发报警器链路连接断开,发生警报,当链路恢复后,报警会自动解除。
配置网管监控平台TAP设备告警触发条件、关联到TAP设备监控项,配置触发告警阀值,阀值的不同所产生告警级别也不同;阈值的设定不再是依赖经验设置恒定阈值,而是采用机器学习算法动态计算设定。因此,根据本发明所述的TAP设备监控方法,所述对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,确定出设备异常状态信息和/或链路异常状态信息,包括:
对所述TAP设备的状态配置告警触发条件、关联到所述TAP设备的监控项;
采用指数加权移动算法配置触发告警动态阀值,指数加权移动算法的模型公式如下:
vt=βvt-1+(1β)θt
其中,β取值在0到1之间,β值是根据时间序列的变化特性来选取的;历史数据做为指数加权移动算法的训练集,进行多次训练获得预测误差最小的β,保存指数加权移动算法模型;vt-1表示t-1时刻的指数移动平均值,θt表示t时刻的实际温度,vt表示作为告警动态阀值的t时刻的指数移动平均值,也就是EWMA的值,即告警动态阀值,也叫EXPMA指标,它也是一种趋向类指标,指数移动平均值是以指数式递减加权的移动平均。β值是根据时间序列的变化特性来选取的。系数β表示加权下降的快慢,值越小权重下降的越快;若时间序列的波动不大,比较平稳,则β应取小一些,如0.1~0.3;若时间序列具有迅速且明显的变动倾向,则β应取大一些,如0.7~0.9。β通过多个值进行试算比较而定,哪个β值引起的预测误差小,就采用哪个。
复杂动态阈值采用算法有加权移动平均法(EWMA)学习而定,EWMA算法的特点是近期观察值对阈值设置有较大影响,更能反映数据的近期变化趋势。历史数据做为EWMA算法的训练集,进行多次训练获得预测误差最小的β,保存EWMA模型,然后对未来数据进行预测,将预测值做为告警阈值。
参见图2,下面对本发明提供的TAP设备监控***进行描述,下文描述的TAP设备监控***与上文描述的TAP设备监控方法可相互对应参照。
实时采集模块10,用于对TAP设备的状态信息数据以及链路状态数据进行实时采集;
网管监控平台接入交换机网络,用于实现TAP设备的接入访问,其状态信息用于判断是否出现以下异常:接收数据错误、端口使用率过高、电源,内存使用,CPU使用率等,链路状态数据用于判断是否出现以下异常:监控链路中断、链路溢出等。
数据存储模块20,用于将所述TAP设备的状态信息数据以及链路状态数据存入网管监控平台数据库中;
以轮循方式进行存储,固定一个大小的存储数据空间,当存满后,新数据将最旧的数据覆盖掉,一直循环,这样就可以只保存固定时间长度的采集数据。
统计分析模块30,用于对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,确定出设备异常状态信息和/或链路异常状态信息。
配置网管监控平台TAP设备告警触发条件、关联到TAP设备监控项,配置触发告警阀值,如果状态信息数据达到触发告警阀值,则说明设备状态异常,链路异常状态可以针对流量大小,流量包个数等数据进行统计分析,确定出链路异常状态信息。
根据本发明所述的TAP设备监控***,所述实时采集模块10用于:
对所述TAP设备配置监控项,所述监控项包括所述TAP设备的状态以及链路状态;监控项主要是监控链路中断、接收数据错误、端口使用率过高、链路溢出、电源,内存使用,CPU使用率等。
与TAP设备进行通信,实现对所述TAP设备的监控项数据采集以及网络状态的监视;所述监控项数据包括状态信息数据以及链路状态数据。
网管监控平台通过SNMP,代理,ping端口等方法与TAP设备进行通信,实现对TAP设备监控项数据采集以及网络状态的监视。
根据本发明所述的TAP设备监控***,所述数据存储模块20用于:
将所述TAP设备的状态信息数据以及链路状态数据以轮循方式存入网管监控平台数据库中,所述网管监控平台数据库中设置有预设时间长度的存储数据空间。网管监控平台对于TAP设备关键指标数据采集,以轮循方式进行存储,固定一个大小的存储数据空间,当存满后,新数据将最旧的数据覆盖掉,一直循环,这样就可以只保存固定时间长度的采集数据。
根据本发明所述的TAP设备监控***,所述统计分析模块30用于:
对所述TAP设备的状态信息数据以及链路状态数据的数据合规性进行校验;
对于校验出的数据中的缺失值,采用均值、线性函数或预测算法进行预测的方式进行缺失值插补,得到在时序上具有连续性的数据;
对所述在时序上具有连续性的数据进行分析预测。
首先校验数据合规性,确保数据完整性,对于数据中的缺失值,采用均值、线性函数或预测算法进行的预测值等方式进行缺失值插补。确保经过预处理后数据在时序上具有连续性。
根据本发明所述的TAP设备监控***,所述统计分析模块30用于:
基于所述在时序上具有连续性的数据中的业务流量数据,构造时间和业务流量大小数值和/或流量包个数的连续型数据集合;
网管监控平台采集到业务流量数据,针对流量大小,流量包个数等数据进行统计分析。
对流量大小进行分析预测,统计计和每五分钟流量大小,构造时间和流量大小数值的连续型数据集合。采用Prophet算法,使用Prophet.fit方法对所述连续型数据集合进行模型拟合,通过使用辅助的方法Prophet.make future dataframe将未来的日期扩展指定的数据个数,使用Prophet.predict方法进行预测,获得forecast对象,其中,包含一列预测值,以及成分的分析和置信区间;
计算流量大小和/或流量包个数偏离置信区间的数据点,对偏离程度进行分析严重程度,确定出链路异常状态信息。计算流量大小偏离置信区间的数据点,对偏离程度进行分析严重程度,对于偏离度非常严重和严重的数据点进行告警,从而监控到大小异常的流量。采用相同方法对流量包个数进行分析预测,从而监控到异常流量包。并针对异常流量进行告警。
根据本发明所述的TAP设备监控***,所述***还包括告警模块,所述告警模块用于:
基于所述链路异常状态信息,进行告警并展示;
通过网管监控平台TAP设备模型,增加TAP设备网络拓扑,可在当前视图和其它视图中,查找指定的TAP设备,TAP设备及其交换机之间的连接关系,包括连接的数量,TAP设备监控指示等信息,也可以查看TAP设备相关的故障、性能信息以及相关的告警详情和告警历史信息,对于TAP设备模型设计查询统计的入口,提供历史记录查询;
增加自动发现(可以根据配置文件),包括按照网段自动发现TAP设备,单点TAP设备的发现及多种自动发现手段;
网管监控平台配置TAP设备展示,主要以以点、线、面的形式呈现,为突出显示存在问题的TAP设备或连接关系,拓扑连线在正常情况下淡化(如淡绿色),发生设备告警或达到性能预警值时,对相关网元进行着色渲染,告警清除或低于性能预警值时,着色恢复正常,页面自动刷新时间小于60秒。
当链路恢复正常后,解除告警。
告警类型:包含所有的告警类型,可按照告警类型、告警级别、告警状态做过滤;网管监控平台监控TAP设备告警展示页面。当触发报警器链路连接断开,发生警报,当链路恢复后,报警会自动解除。
配置网管监控平台TAP设备告警触发条件、关联到TAP设备监控项,配置触发告警阀值,阀值的不同所产生告警级别也不同;阈值的设定不再是依赖经验设置恒定阈值,而是采用机器学习算法动态计算设定。因此,根据本发明所述的TAP设备监控***,所述统计分析模块30用于:
对所述TAP设备的状态配置告警触发条件、关联到所述TAP设备的监控项;
采用指数加权移动算法配置触发告警动态阀值,指数加权移动算法的模型公式如下:
vt=βvt-1+(1-β)θt
其中,β取值在0到1之间,β值是根据时间序列的变化特性来选取的;历史数据做为指数加权移动算法的训练集,进行多次训练获得预测误差最小的β,保存指数加权移动算法模型;vt-1表示t-1时刻的指数移动平均值,θt表示t时刻的实际温度,vt表示作为告警动态阀值的t时刻的指数移动平均值,也就是EWMA的值,即告警动态阀值,也叫EXPMA指标,它也是一种趋向类指标,指数移动平均值是以指数式递减加权的移动平均。β值是根据时间序列的变化特性来选取的。系数β表示加权下降的快慢,值越小权重下降的越快;若时间序列的波动不大,比较平稳,则β应取小一些,如0.1~0.3;若时间序列具有迅速且明显的变动倾向,则β应取大一些,如0.7~0.9。β通过多个值进行试算比较而定,哪个β值引起的预测误差小,就采用哪个。
复杂动态阈值采用算法有加权移动平均法(EWMA)学习而定,EWMA算法的特点是近期观察值对阈值设置有较大影响,更能反映数据的近期变化趋势。历史数据做为EWMA算法的训练集,进行多次训练获得预测误差最小的β,保存EWMA模型,然后对未来数据进行预测,将预测值做为告警阈值。
图3示例了一种电子设备的实体结构示意图,该电子设备可以包括:处理器(processor)310、通信接口(Communications Interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行TAP设备监控方法,该方法包括:
S1、对TAP设备的状态信息数据以及链路状态数据进行实时采集;
S2、将所述TAP设备的状态信息数据以及链路状态数据存入网管监控平台数据库中;
S3、对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,确定出设备异常状态信息和/或链路异常状态信息。
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的TAP设备监控方法,该方法包括:
S1、对TAP设备的状态信息数据以及链路状态数据进行实时采集;
S2、将所述TAP设备的状态信息数据以及链路状态数据存入网管监控平台数据库中;
S3、对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,确定出设备异常状态信息和/或链路异常状态信息。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的TAP设备监控方法,该方法包括:
S1、对TAP设备的状态信息数据以及链路状态数据进行实时采集;
S2、将所述TAP设备的状态信息数据以及链路状态数据存入网管监控平台数据库中;
S3、对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,确定出设备异常状态信息和/或链路异常状态信息。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种TAP设备监控方法,其特征在于,包括:
对TAP设备的状态信息数据以及链路状态数据进行实时采集;
将所述TAP设备的状态信息数据以及链路状态数据存入网管监控平台数据库中;
对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,确定出设备异常状态信息和/或链路异常状态信息。
2.根据权利要求1所述的TAP设备监控方法,其特征在于,所述对TAP设备的状态信息数据以及链路状态数据进行实时采集,包括:
对所述TAP设备配置监控项,所述监控项包括所述TAP设备的状态以及链路状态;
与TAP设备进行通信,实现对所述TAP设备的监控项数据采集以及网络状态的监视;所述监控项数据包括状态信息数据以及链路状态数据。
3.根据权利要求1所述的TAP设备监控方法,其特征在于,所述将所述TAP设备的状态信息数据以及链路状态数据存入网管监控平台数据库中包括:
将所述TAP设备的状态信息数据以及链路状态数据以轮循方式存入网管监控平台数据库中,所述网管监控平台数据库中设置有预设时间长度的存储数据空间。
4.根据权利要求1-3任一所述的TAP设备监控方法,其特征在于,所述对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,包括:
对所述TAP设备的状态信息数据以及链路状态数据的数据合规性进行校验;
对于校验出的数据中的缺失值,采用均值、线性函数或预测算法进行预测的方式进行缺失值插补,得到在时序上具有连续性的数据;
对所述在时序上具有连续性的数据进行分析预测。
5.根据权利要求4所述的TAP设备监控方法,其特征在于,所述对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,确定出设备异常状态信息和/或链路异常状态信息,包括:
基于所述在时序上具有连续性的数据中的业务流量数据,构造时间和业务流量大小数值和/或流量包个数的连续型数据集合;
采用Prophet算法,使用Prophet.fit方法对所述连续型数据集合进行模型拟合,通过使用辅助的方法Prophet.make future dataframe将未来的日期扩展指定的数据个数,使用Prophet.predict方法进行预测,获得forecast对象,其中,包含一列预测值,以及成分的分析和置信区间;
计算流量大小和/或流量包个数偏离置信区间的数据点,对偏离程度进行分析严重程度,确定出链路异常状态信息。
6.根据权利要求2所述的TAP设备监控方法,其特征在于,所述对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,确定出设备异常状态信息和/或链路异常状态信息之后,包括:
基于所述链路异常状态信息,进行告警并展示;
当链路恢复正常后,解除告警。
7.根据权利要求4所述的TAP设备监控方法,其特征在于,所述对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,确定出设备异常状态信息和/或链路异常状态信息,包括:
对所述TAP设备的状态配置告警触发条件、关联到所述TAP设备的监控项;
采用指数加权移动算法配置触发告警动态阀值,指数加权移动算法的模型公式如下:
νt=βνt-1+(1-β)θt
其中,β取值在0到1之间,β值是根据时间序列的变化特性来选取的;历史数据做为指数加权移动算法的训练集,进行多次训练获得预测误差最小的β,保存指数加权移动算法模型;νt-1表示t-1时刻的指数移动平均值,θt表示t时刻的实际温度,νt表示作为告警动态阀值的t时刻的指数移动平均值。
8.一种TAP设备监控***,其特征在于,包括:
实时采集模块,用于对TAP设备的状态信息数据以及链路状态数据进行实时采集;
数据存储模块,用于将所述TAP设备的状态信息数据以及链路状态数据存入网管监控平台数据库中;
统计分析模块,用于对所述TAP设备的状态信息数据以及链路状态数据进行统计分析,确定出设备异常状态信息和/或链路异常状态信息。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述的TAP设备监控方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述的TAP设备监控方法的步骤。
CN202110666402.5A 2021-06-16 2021-06-16 Tap设备监控方法和***、电子设备及可读存储介质 Pending CN115484188A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110666402.5A CN115484188A (zh) 2021-06-16 2021-06-16 Tap设备监控方法和***、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110666402.5A CN115484188A (zh) 2021-06-16 2021-06-16 Tap设备监控方法和***、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN115484188A true CN115484188A (zh) 2022-12-16

Family

ID=84420434

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110666402.5A Pending CN115484188A (zh) 2021-06-16 2021-06-16 Tap设备监控方法和***、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN115484188A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070271014A1 (en) * 1995-06-07 2007-11-22 Automotive Technologies International, Inc. Vehicle Diagnostic and Prognostic Methods and Systems
WO2019056499A1 (zh) * 2017-09-20 2019-03-28 平安科技(深圳)有限公司 预测模型训练方法、数据监控方法、装置、设备及介质
CN109672583A (zh) * 2018-09-25 2019-04-23 平安科技(深圳)有限公司 网络监控方法、设备、存储介质及装置
CN110278102A (zh) * 2018-03-15 2019-09-24 勤智数码科技股份有限公司 一种it自动化运维***和方法
CN111563776A (zh) * 2020-05-08 2020-08-21 国网江苏省电力有限公司扬州供电分公司 一种基于K近邻异常检测和Prophet模型的电量分解和预测方法
CN112187514A (zh) * 2020-09-02 2021-01-05 上海御威通信科技有限公司 一种数据中心网络设备智能运维***、方法及终端

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070271014A1 (en) * 1995-06-07 2007-11-22 Automotive Technologies International, Inc. Vehicle Diagnostic and Prognostic Methods and Systems
WO2019056499A1 (zh) * 2017-09-20 2019-03-28 平安科技(深圳)有限公司 预测模型训练方法、数据监控方法、装置、设备及介质
CN110278102A (zh) * 2018-03-15 2019-09-24 勤智数码科技股份有限公司 一种it自动化运维***和方法
CN109672583A (zh) * 2018-09-25 2019-04-23 平安科技(深圳)有限公司 网络监控方法、设备、存储介质及装置
CN111563776A (zh) * 2020-05-08 2020-08-21 国网江苏省电力有限公司扬州供电分公司 一种基于K近邻异常检测和Prophet模型的电量分解和预测方法
CN112187514A (zh) * 2020-09-02 2021-01-05 上海御威通信科技有限公司 一种数据中心网络设备智能运维***、方法及终端

Similar Documents

Publication Publication Date Title
CN108073497B (zh) 一种基于数据中心数据采集平台的多指标异动分析方法
CA2731916C (en) Systems and methods for asset condition monitoring in electric power substation equipment
CN111290913A (zh) 一种基于运维数据预测的故障定位可视化***和方法
CN111309565B (zh) 告警处理方法、装置、电子设备以及计算机可读存储介质
JP6085550B2 (ja) ログ分析装置及び方法
CN106209432A (zh) 基于动态阈值的网络设备亚健康预警方法及装置
KR20180108446A (ko) Ict 인프라 관리 시스템 및 이를 이용한 ict 인프라 관리 방법
CN104796273A (zh) 一种网络故障根源诊断的方法和装置
CN115454778B (zh) 大规模云网络环境下的时序指标异常智能监控***
CN106100884A (zh) 变电站监控设备运行异常的告警方法
CN106940678B (zh) 一种***实时健康度评估分析方法及装置
CN112380089A (zh) 一种数据中心监控预警方法及***
CN114095965A (zh) 指标检测模型获取及故障定位方法、装置、设备及存储介质
CN113763667A (zh) 一种基于5g边缘计算的火灾预警及状态监测装置及方法
CN110969375A (zh) 一种智能变电站告警处理方法、装置、终端及存储介质
CN105187239A (zh) 基于数据挖掘的通信告警分析***及其处理方法
CN113468022B (zh) 一种对产品集中监控的自动化运维方法
CN108981785A (zh) 一种碎煤机设备安全的智能化检测***
CN101345656B (zh) 全局故障率测量方法
CN117391675B (zh) 一种数据中心基础设施运维管理方法
CN117930718A (zh) 基于大数据的设备运行状态监测预警方法及***
CN116204386B (zh) 应用服务关系自动识别及监控方法、***、介质和设备
CN112711507A (zh) 设备告警方法、电子设备和介质
CN115484188A (zh) Tap设备监控方法和***、电子设备及可读存储介质
CN116611953A (zh) 基于物联网的电能表生产制造实时数据管理方法和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20221216

RJ01 Rejection of invention patent application after publication