CN116455724A - 一种网络告警相关性大数据智能学习及执行*** - Google Patents

一种网络告警相关性大数据智能学习及执行*** Download PDF

Info

Publication number
CN116455724A
CN116455724A CN202310274502.2A CN202310274502A CN116455724A CN 116455724 A CN116455724 A CN 116455724A CN 202310274502 A CN202310274502 A CN 202310274502A CN 116455724 A CN116455724 A CN 116455724A
Authority
CN
China
Prior art keywords
alarm
rule
data
module
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310274502.2A
Other languages
English (en)
Inventor
朱东升
汪书涵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI GLORYSCIENCE INFORMAT
Original Assignee
SHANGHAI GLORYSCIENCE INFORMAT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI GLORYSCIENCE INFORMAT filed Critical SHANGHAI GLORYSCIENCE INFORMAT
Priority to CN202310274502.2A priority Critical patent/CN116455724A/zh
Publication of CN116455724A publication Critical patent/CN116455724A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提出了一种网络告警相关性大数据智能学习及执行***,应用于运营商网络管理***,涉及网络通信领域,所述***包括学习引擎和执行引擎;所述学习引擎包括数据采集模块、数据分析模块和结果处理模块,用于对告警数据进行关联分析和预测,生成告警规则;所述执行引擎包括网管融合模块、实时处理模块、告警拼接模块、规则启停模块和性能监控模块,用于执行学习引擎生成的告警规则,以及对性能进行自我控制。通过学习引擎由网络管理***提供的告警、路由数据生成各种规则文件,执行引擎接收实时告警,根据学习引擎生成的各种规则对告警进行匹配和标记根衍生,实时即时返回根告警和衍生告警组合的匹配结果。

Description

一种网络告警相关性大数据智能学习及执行***
技术领域
本发明涉及网络通信领域,尤其涉及一种网络告警相关性大数据智能学习及执行***。
背景技术
随着5G通信技术的日益成熟,传输网络规模越来越大,网络中每天都会产生海量告警,而这其中大部分是由于故障产生的衍生告警无效的告警,真正的和故障有直接关系的根告警有用的告警则淹没在其中。运营商综合网络管理***收到后会产生大量无效运维工单,从而大大影响一线生产效率。在此大背景下各运营商提出告警压降的目标,希望通过告警的智能分析在减少工单数量的同时能精准定位根本问题,提升处理效率。减少工单数量,提升处理速度。
中国专利CN112491593B《网元告警处理方法和装置》公开了一种网元告警处理方法和装置,涉及通信领域,根据多条原始告警信息对应的原始告警OID和原始告警设备IP地址,依据第一规则确定至少一条目标告警信息,用于处理网元告警,该专利可以处理网元告警支持大规模网络的告警处理,然而缺少对告警数据的根衍关系判断,以及性能监控和告警拼接的功能,在告警过多而突发大数据量情况下无法自我调节,可能会出现宕机现象。
发明内容
有鉴于此,本发明提出了一种网络告警相关性大数据智能学习及执行***,实现告警数据的关联衍生,区分无效告警和有效告警,对性能进行自我调控。
本发明的技术方案是这样实现的:本发明提供了一种网络告警相关性大数据智能学习及执行***,应用于运营商网络管理***,其特征在于,所述***包括学习引擎和执行引擎;
所述学习引擎用于对告警数据进行关联分析和预测,生成告警规则;
所述执行引擎用于执行所述学习引擎生成的告警规则;
所述***通过关联关系算法判断每个告警数据之间的根衍关系,并根据所述根衍关系确定所述告警数据为有效告警或无效告警;
其中,所述学习引擎用于对告警数据进行关联分析和预测,生成告警规则的步骤包括:
S1,获取预处理模块提供的告警历史数据;
S2,读取配置文件中所配置的关联关系的算法;
S3,提取关联关系算法所需的属性,提取的属性包括告警特征值和告警发生时间,根据告警特征值对告警对象进行分组,根据告警发生时间统计出相应时间粒度发生告警次数;
S4,进行关联关系算法的流程处理,两两告警之间通过对应时间告警发生次数来进行correlation公式计算,得出对应的关联关系系数,
其中,X表示当前时间粒度告警A发生的次数,Y表示当前时间粒度告警B发生的次数,N表示告警总粒度个数,ρX,Y表示告警A和告警B的关联系数;
S5,对算法计算结果整合处理,将关联关系系数和发生次数不满足阈值的进行过滤,配置系数和次数的阈值;
S6,根据所述关联关系系数和所述配置系数确定所述告警数据和所述告警特征值的关联关系列表,并生成告警规则。
优选的,所述学习引擎用于对告警数据进行关联分析和预测,生成告警规则的步骤还包括:
创建黑名单、白名单和特殊名单;
由两个告警对象结合关联关系列表进行告警规则输出,所述告警规则输出步骤包括:
S100、根据黑名单、白名单、特殊名单对最初规则进行过滤和置换,将同时是黑名单对象或者白名单对象的对象组删除,将判断得出根衍关系的单一白名单对象、单一黑名单对象、或者一个特殊名单的根告警和一个特殊名单衍生告警数据输出到规则表一,将无法判断根衍关系的数据输出到待处理表;
S200、通过告警层级的高低和电路层级的高低,调整关系中根与衍生的位置并输出规则表二和三,无法区分的规则输出到无法区分表并;
S300、将规则表一、二和三合并成新规则;
S400、将新规则与最初规则求并集,并更新规则训练出的时间,将训练时间在距今半年以上的规则进行删除,剩余规则输出至指定目录下的规则文件,所得规则文件即告警规则。
优选的,所述学习引擎包括数据采集模块;
所述数据采集模块用于:离线定期读取网络管理***的历史告警数据,提取关键字段组成告警对象,按时间切片,统计每个告警对象在相应切片时间段内的发生次数频率。
优选的,所述学习引擎还包括数据分析模块;
所述数据分析模块用于:运用关联关系算法计算每个告警对象在统计时间内的发生趋势,判断根衍关系。
优选的,所述学习引擎还包括结果处理模块;
所述结果处理模块用于:提取高关联性的分析结果,运用相关网络的业务模型,从网络的高低、源宿指向关系去判断告警对象间的根和衍生关系,生成告警规则。
优选的,所述执行引擎包括网管融合模块;
所述网管融合模块用于:以插件形式融合进网络管理***中,网管融合模块单独启停或者与网络管理***同启同停。
优选的,所述执行引擎还包括实时处理模块;
所述实时处理模块用于:学习引擎读取历史告警数据生成告警规则,执行引擎读取学习引擎生成的告警规则,实时分析网络管理***发送过来的告警,并即时将分析结果返回给网络管理***。
优选的,所述执行引擎还包括告警拼接模块;
所述告警拼接模块用于:当告警之间有多重根衍关系时,将相关告警结果进行拼接,输出一个最终根告警,以及衍生出来的其它衍生告警。
优选的,所述执行引擎还包括规则启停模块;
所述规则启停模块用于:实时启用和停用告警规则,具有根据现场情况实时修改并生效的能力。
优选的,所述执行引擎还包括性能监控模块;
所述性能监控模块用于:实时监控网络管理***运行状况,所述运行状况包括进程本身占用内存、CPU占用和硬盘容量。
本发明的一种网络告警相关性大数据智能学习及执行***相对于现有技术具有以下有益效果:
(1)通过学习引擎由网络管理***提供的告警、路由数据生成各种规则文件,执行引擎接收实时告警,根据学习引擎生成的各种规则对告警进行匹配和标记根衍生,实时返回根告警和衍生告警组合的匹配结果,对网管数据进行接收、采集、学习、分析和处理,深入挖掘传输网数据的潜在价值,实现准确的告警故障根衍分析功能,帮助运维人员快速定位故障原因;
(2)通过学习引擎的数据采集模块、数据分析模块和结果处理模块定期分析网络管理***的告警数据,实现关联衍生;
(3)通过执行引擎的网管融合模块、实时处理模块、告警拼接模块、规则启停模块和性能监控模块。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的一种网络告警相关性大数据智能学习及执行***结构图;
图2为本发明的一种网络告警相关性大数据智能学习及执行***的关联分析算法计算流程图;
图3为本发明的实施例一的烽火路由配置文件示例图;
图4为本发明的实施例一的电路树配置示例图;
图5为本发明的实施例二的学习引擎规则展示示意图;
图6为本发明的实施例三的告警组判断流程的处理逻辑示意图;
图7为本发明的实施例三的执行引擎当前告警展示示意图;
图8为本发明的实施例三的执行引擎历史告警展示示意图;
图9为本发明的实施例三的执行引擎过滤告警过程的示意图;
图10为本发明的实施例三的执行引擎查询已有告警相关性规则以及进行模糊性查询过程的示意图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
提供网络层级分明,通信较为频繁的骨干网络的告警大数据分析及压缩的一种网络告警相关性大数据智能学习及执行***,应用于运营商网络管理***,如图1所示,所述网管即网络管理***,所述***包括学习引擎和执行引擎;
所述学习引擎包括数据采集模块、数据分析模块和结果处理模块,用于对告警数据进行关联分析和预测,生成告警规则;
所述执行引擎包括网管融合模块、实时处理模块、告警拼接模块、规则启停模块和性能监控模块,用于执行学习引擎生成的告警规则,以及对性能进行自我控制;
所述***通过关联关系算法判断每个告警数据之间的根衍关系,并根据所述根衍关系确定所述告警数据为有效告警或无效告警。
实施例一
对于学习引擎;
数据采集模块:离线定期读取网络管理***的告警数据,提取关键字段组成告警对象,并按时间切片,统计每个告警对象在相应时间段内的发生次数。
数据分析模块:运用关联关系算法计算每个告警对象在统计时间内的发生趋势,相似度越高的,则关联关系越高,两个告警对象则越有可能存在根衍关系。
结果处理模块:提取高关联性的分析结果,运用相关网络的业务模型,从网络层级的高低、源宿指向关系去判断告警对象间的根和衍生关系,最终生成纯告警规则。
告警相关性分析是依赖于告警发生的线路号(端口)和告警代码,结合告警相关性规则,以及业务路径和端口模型,依据业务相关的规则和业务无关的规则分析出告警之间的根源-衍生关系。在对告警故障定位时,直接找到根源的故障点。
学习引擎能够定期根据历史告警数据和路由配置数据以及基本传输网层级模型进行关联关系计算,生成多种关联规则供诊断引擎使用。计算的数据量和规则的生成周期动态可配(历史告警数据量比如每次100万条,生成的周期比如每周一次)。下面以烽火的告警历史数据、烽火U2000定期输出告警历史文件csv格式、LE(learning engine,学习引擎)以读文件的方式输入文件;
烽火U2000定期输出路由配置日志文件,日志文件包含U2000管理的所有电路及相关路由信息,其中每个电路都存在的属性有:电路id(电路的唯一标志)、电路类型(电路所处OTN(光传送网)网络中的层级)、电路名称(包含电路的详细位置)、服务层电路ID(该条电路所服务的相关电路ID)、客户层电路ID(为该条电路提供服务的电路ID)、工作路径1(无用字段)、正反向路由(路由两个方向经过的位置)。文件中每个属性只能独占一行,不能存在一行中存在多个属性的情况(否则影响文件解析)。
功能举例:
(1)对烽火告警历史数据进行数据量控制并进行筛选和过滤,数据量控制指的是定时一个月,时间参数可配置,筛选的需求字段包括流水号、电路号、发生时间、机盘号、端口号、告警类型等),过滤去除需求字段为空的告警数据(字段包括流水号、发生时间、机盘号、告警类型等)。
(2)将烽火路由配置文件转成LE能够识别的电路树,原始路由配置文件中每条电路都生成一行记录。
所述烽火路由配置文件如图2所示,转化成的电路树如图3所示。
每一行定义为一颗树,第一列为电路id,第二列为该电路所处的层级,第三列为该电路从本层至OTN_CLIENT层的所有的子层级电路,以逗号分割,例如如果该电路是OTS(光传输段层)层的电路,则第三列为该电路的从OMS(光复用段层)层直至OTN_CLIENT层的所有电路,如果该电路为OCH(光信道层)层,则子电路为从OTUk层至OTN_CLIENT层的所有电路,以此类推。
OTN的网络结构分层模型如下,由上到下对应的层级为由低到高,层级由高到低分为如下几层:OTS,OMS,OCH,OTUK,ODUK,OTN_client。路由表和告警消息中的每个电路号都会归属到某一个层级。
(3)将第(1)步筛选和过滤后的告警数据,根据每条告警信息中携带的电路号,通过分析找出最高层级电路号,分析方法如下:
由告警携带的电路信息,根据上面第(2)步生成路由树提取最高层级电路(若找不到则默认取第一个电路号作为最高层电路)。
此处与模型不同的是当电路中存在OMS层电路时取OMS电路,不存在OMS电路时按照模型的高低取对应电路。(因为虽然按层级来分OTS是最高层,但实际数据中发现一般多个OTS电路归属于同一个OMS电路,而一条OMS电路发生故障会影响多个OTS电路。所以在告警电路取值中默认OMS为最高层电路)。
实施例二
如图4所示,告警关联性分析步骤如下,以correlation(相关)算法为例:
S1,获取预处理模块提供的告警历史数据;
S2,读取配置文件中所配置的关联关系的算法;
S3,提取关联关系算法所需的属性(以correlation算法为例,提取的属性包括:告警特征值和告警发生时间;根据告警特征值对告警对象进行分组,根据告警发生时间统计出相应时间粒度发生告警次数);
S4,进行关联关系算法的流程处理(以correlation算法为例,两两告警之间通过对应时间告警发生次数来进行correlation公式计算,并得出对应的关联关系系数),
X表示当前时间粒度告警A发生的次数,Y表示当前时间粒度告警B发生的次数,N表示告警总粒度个数,ρ表示告警A和告警B的关联系数;
S5,对算法计算结果整合处理(以correlation算法为例,将3-3、3-2的关联关系系数和发生次数不满足阈值的进行过滤,系数和次数的阈值均可配置);
S6,将关联关系结果按统一格式输出,得到关联关系列表。
创建黑名单、白名单和特殊名单,并结合关联关系列表进一步进行数据输出:
1、先根据黑名单、白名单、特殊名单(均可配置)对规则进行过滤和置换,将无效的规则(黑-黑、白-白)进行删除,将能够判断出来根与衍生的关系(单一白、单一黑、特殊根-特殊衍)输出到规则表一,无法判断的规则输出到待处理表。
2、依据告警定位层级表和电路树处理待处理表,通过告警层级的高低和电路层级的高低,调整关系中根与衍生的位置并输出规则表二和三,无法区分的规则输出到无法区分表,无法区分表把AB和BA格式的关系进行合并。
3、将规则表一、二和三合并成新规则。
4、将新规则与上一版的规则求并集,并更新规则训练出的时间,将训练时间在距今半年(可配置)以上的规则进行删除,剩余规则输出至指定目录下的规则文件,所得规则文件即告警规则。
所述学习引擎的规则展示如图5所示。
所述根告警即OTN网络中,会引发一系列告警的某个或某些个真正的根源告警,通常这些告警携带故障发生的重要信息;所述衍生告警即由于根告警的产生而产生的告警,根与衍生是相对概念;所述黑名单即绝对为衍生告警的告警名单;所述白名单即绝对为根告警的告警名单,所述特殊告警名单即由专家知识确定的告警匹配规则,可直接应用的规则。
实施例三
对于执行引擎;
网管融合:可以以插件形式融合进网络管理***中,与网络管理***同启同停,无需另外占用过多硬件资源。
实时处理:读取学习引擎生成的告警相关规则和现场网络结构,实时分析网络管理***发送过来的告警,并将分析结果返回给网络管理***。
告警拼接:如果告警之间有多重根衍关系,执行引擎会将相关告警结果进行拼接,最后输出结果为一个最终根告警,以及由此衍生出来的其它衍生告警。
规则启停:执行引擎可根据现场用户需要实时启用和停用规则,无需重启***。
性能监控:执行引擎能够实时监控***运行状况,包括内存、CPU占用,硬盘容量等,并能对性能进行自我控制,突发大数据量情况下也不会过多占用资源。
执行引擎能够实时处理从接口收取到的告警信息,利用学习引擎的告警规则标记出告警的根衍生告警,并组合成告警组返回给U2000。
告警组判断流程包括:
新增一个告警组拼接模块,把告警对以告警组(a,b,c,d...)(其中a是这一组告警中其它所有告警的根告警,b,c,d...是对应的衍生告警)的形式上报给U2000,具体逻辑如下:设在缓存中已经存在几组告警组(a1,b1,c1,d1...),(a2,b2,c2,d2...),(a3,b3,c3,d3...)其中每组告警组都会等待自己告警组的根告警与自己的告警对(a1,a1)、(a2,a2)、(a3,a3)...出现,然后从缓存中移除。
告警组拼接模块若收到一对新的告警(a,b),处理逻辑如图6所示。
执行引擎支持每秒10000告警风暴数据的处理,并能持续15分钟;
学习引擎支持每天计算完成1000万条数据的计算,并输出结果;
执行和学习引擎内存使用上限为8G。
所述执行引擎展示当前告警时如图7所示,所述执行引擎展示历史告警时如图8所示,所述执行引擎过滤告警的过程如图9所示,所述执行引擎查询已有告警相关性规则以及进行模糊性查询过程如图10所示。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种网络告警相关性大数据智能学习及执行***,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种网络告警相关性大数据智能学习及执行***,应用于运营商网络管理***,其特征在于,所述***包括学习引擎和执行引擎;
所述学习引擎用于对告警数据进行关联分析和预测,生成告警规则;
所述执行引擎用于执行所述学习引擎生成的告警规则;
所述***通过关联关系算法判断每个告警数据之间的根衍关系,并根据所述根衍关系确定所述告警数据为有效告警或无效告警;
其中,所述学习引擎用于对告警数据进行关联分析和预测,生成告警规则的步骤包括:
S1,获取预处理模块提供的告警历史数据;
S2,读取配置文件中所配置的关联关系的算法;
S3,提取关联关系算法所需的属性,提取的属性包括告警特征值和告警发生时间,根据告警特征值对告警对象进行分组,根据告警发生时间统计出相应时间粒度发生告警次数;
S4,进行关联关系算法的流程处理,两两告警之间通过对应时间告警发生次数来进行correlation公式计算,得出对应的关联关系系数,
其中,X表示当前时间粒度告警A发生的次数,Y表示当前时间粒度告警B发生的次数,N表示告警总粒度个数,ρX,Y表示告警A和告警B的关联系数;
S5,对算法计算结果整合处理,将关联关系系数和发生次数不满足阈值的进行过滤,配置系数和次数的阈值;
S6,根据所述关联关系系数和所述配置系数确定所述告警数据和所述告警特征值的关联关系列表,并生成告警规则。
2.如权利要求1所述的一种网络告警相关性大数据智能学习及执行***,其特征在于,所述学习引擎用于对告警数据进行关联分析和预测,生成告警规则的步骤还包括:
创建黑名单、白名单和特殊名单;
由两个告警对象结合关联关系列表进行告警规则输出,所述告警规则输出步骤包括:
S100、根据黑名单、白名单、特殊名单对最初规则进行过滤和置换,将同时是黑名单对象或者白名单对象的对象组删除,将判断得出根衍关系的单一白名单对象、单一黑名单对象、或者一个特殊名单的根告警和一个特殊名单衍生告警数据输出到规则表一,将无法判断根衍关系的数据输出到待处理表;
S200、通过告警层级的高低和电路层级的高低,调整关系中根与衍生的位置并输出规则表二和三,无法区分的规则输出到无法区分表并;
S300、将规则表一、二和三合并成新规则;
S400、将新规则与最初规则求并集,并更新规则训练出的时间,将训练时间在距今半年以上的规则进行删除,剩余规则输出至指定目录下的规则文件,所得规则文件即告警规则。
3.如权利要求2所述的一种网络告警相关性大数据智能学习及执行***,其特征在于,所述学习引擎包括数据采集模块;
所述数据采集模块用于:离线定期读取网络管理***的历史告警数据,提取关键字段组成告警对象,按时间切片,统计每个告警对象在相应切片时间段内的发生次数频率。
4.如权利要求2所述的一种网络告警相关性大数据智能学习及执行***,其特征在于,所述学习引擎还包括数据分析模块;
所述数据分析模块用于:运用关联关系算法计算每个告警对象在统计时间内的发生趋势,判断根衍关系。
5.如权利要求2所述的一种网络告警相关性大数据智能学习及执行***,其特征在于,所述学习引擎还包括结果处理模块;
所述结果处理模块用于:提取高关联性的分析结果,运用相关网络的业务模型,从网络的高低、源宿指向关系去判断告警对象间的根和衍生关系,生成告警规则。
6.如权利要求2所述的一种网络告警相关性大数据智能学习及执行***,其特征在于,所述执行引擎还包括网管融合模块;
所述网管融合模块用于:以插件形式融合进网络管理***中,网管融合模块单独启停或者与网络管理***同启同停。
7.如权利要求2所述的一种网络告警相关性大数据智能学习及执行***,其特征在于,所述执行引擎还包括实时处理模块;
所述实时处理模块用于:学习引擎读取历史告警数据生成告警规则,执行引擎读取学习引擎生成的告警规则,实时分析网络管理***发送过来的告警,并即时将分析结果返回给网络管理***。
8.如权利要求7所述的一种网络告警相关性大数据智能学习及执行***,其特征在于,所述执行引擎还包括告警拼接模块;
所述告警拼接模块用于:当告警之间有多重根衍关系时,将相关告警结果进行拼接,输出一个最终根告警,以及衍生出来的其它衍生告警。
9.如权利要求8所述的一种网络告警相关性大数据智能学习及执行***,其特征在于,所述执行引擎还包括规则启停模块;
所述规则启停模块用于:实时启用和停用告警规则,具有根据现场情况实时修改并生效的能力。
10.如权利要求9所述的一种网络告警相关性大数据智能学习及执行***,其特征在于,所述执行引擎还包括性能监控模块;
所述性能监控模块用于:实时监控网络管理***运行状况,所述运行状况包括进程本身占用内存、CPU占用和硬盘容量。
CN202310274502.2A 2023-03-21 2023-03-21 一种网络告警相关性大数据智能学习及执行*** Pending CN116455724A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310274502.2A CN116455724A (zh) 2023-03-21 2023-03-21 一种网络告警相关性大数据智能学习及执行***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310274502.2A CN116455724A (zh) 2023-03-21 2023-03-21 一种网络告警相关性大数据智能学习及执行***

Publications (1)

Publication Number Publication Date
CN116455724A true CN116455724A (zh) 2023-07-18

Family

ID=87121129

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310274502.2A Pending CN116455724A (zh) 2023-03-21 2023-03-21 一种网络告警相关性大数据智能学习及执行***

Country Status (1)

Country Link
CN (1) CN116455724A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118093329A (zh) * 2024-04-28 2024-05-28 成都乐超人科技有限公司 基于事件驱动的微服务监控告警方法及***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118093329A (zh) * 2024-04-28 2024-05-28 成都乐超人科技有限公司 基于事件驱动的微服务监控告警方法及***
CN118093329B (zh) * 2024-04-28 2024-07-12 成都乐超人科技有限公司 基于事件驱动的微服务监控告警方法及***

Similar Documents

Publication Publication Date Title
CN108833184B (zh) 服务故障定位方法、装置、计算机设备及存储介质
CN111158977B (zh) 一种异常事件根因定位方法及装置
CN112152830B (zh) 一种智能的故障根因分析方法及***
JP7174832B2 (ja) Odn論理トポロジ情報を取得するための方法および装置、デバイス、ならびに記憶媒体
CN111176953B (zh) 一种异常检测及其模型训练方法、计算机设备和存储介质
CN113553210A (zh) 告警数据的处理方法、装置、设备及存储介质
WO2023071761A1 (zh) 一种异常定位方法及装置
CN104158682B (zh) 一种基于贡献度的同步数字体系sdh故障定位方法
US11644812B2 (en) Machine tool management method, machine tool management system and medium
CN116455724A (zh) 一种网络告警相关性大数据智能学习及执行***
CN107548087A (zh) 一种告警关联分析的方法及装置
CN109063885A (zh) 一种变电站异常量测数据预测方法
CN112769605A (zh) 一种异构多云的运维管理方法及混合云平台
CN114595210A (zh) 一种多维数据的异常检测方法、装置及电子设备
CN108170702A (zh) 一种基于统计分析的电力通信告警关联模型
CN113409555A (zh) 一种基于物联网的实时报警联动方法及***
CN113765698B (zh) 一种面向工业互联网的网络故障定位和根因检测方法及***
CN108521346B (zh) 一种基于终端数据的电信承载网异常节点定位方法
CN112068979B (zh) 一种业务故障确定方法及装置
CN108055152B (zh) 基于分布式服务日志的通信网络信息***异常检测方法
CN115865611A (zh) 一种网络设备的故障处理方法、装置及电子设备
CN112039907A (zh) 一种基于物联网终端评测平台的自动测试方法及***
CN116628609A (zh) 一种多源数据分析的智能监控方法及***
CN116668264A (zh) 一种告警聚类的根因分析方法、装置、设备及存储介质
CN112363893B (zh) 时序指标异常检测方法、设备及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination