CN109993390B - 告警关联及派单优化方法、装置、设备及介质 - Google Patents

告警关联及派单优化方法、装置、设备及介质 Download PDF

Info

Publication number
CN109993390B
CN109993390B CN201711494844.6A CN201711494844A CN109993390B CN 109993390 B CN109993390 B CN 109993390B CN 201711494844 A CN201711494844 A CN 201711494844A CN 109993390 B CN109993390 B CN 109993390B
Authority
CN
China
Prior art keywords
alarm
probability
tree
frequency
path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711494844.6A
Other languages
English (en)
Other versions
CN109993390A (zh
Inventor
廖振松
王冼
熊胜
汤卫东
杨晶蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Hubei Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Hubei Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Hubei Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201711494844.6A priority Critical patent/CN109993390B/zh
Publication of CN109993390A publication Critical patent/CN109993390A/zh
Application granted granted Critical
Publication of CN109993390B publication Critical patent/CN109993390B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Primary Health Care (AREA)
  • Alarm Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供了一种告警关联及派单优化方法、装置、设备及介质,其中基于依赖树的告警关联及派单优化方法,包括对告警描述生成分词集合Seg,依据其出现的概率形成路径,形成概率层次树;基于滑动窗口t形成告警同时发生记录集;构建频率生长树,即告警依赖树,确定频繁模式及其各路径上各节点的频率依赖模式;构建节点概率列表、路径概率列表;最终对对待派单告警事件进行派单,本发明能够挖掘告警记录各关联关系的所有属性特征,并能够给出量化的评判关联关系可靠性的依据,最终实现提升工单派发效率的目的。

Description

告警关联及派单优化方法、装置、设备及介质
技术领域
本发明涉及网络性能告警和大数据关联挖掘领域,具体涉及到一种基于依赖树的告警关联及派单优化方法,尤其涉及一种基于依赖树的告警关联及派单优化方法、装置、设备及介质。
背景技术
***从实现网管集中建设以来,每日设备和***产生海量的告警信息,将上述告警信息进行集中汇总。这些告警信息涵盖到设备故障、网络隐患、用户感知和投诉预警等方方面面。同时随着通信网络的飞速发展,通信网络的互联、各种标准的融合、业务的整合以及设备***的多样化等因素使得移动网络的结构越来越复杂,产生的告警信息也就来源众多,从而给网络维护消除故障的工作带来巨大的工作量。同时这些海量的告警信息也因为这种复杂性多数未能完全实现告警编码和描述的统一,这给告警分析也带来了一些阻碍。
针对移动通信网络的特点,可以预见的是网络故障多具有连带效应,产生的告警信息也存在隐性的关联性,目前的挖掘手段并不能充分提取到这些关联性,如果能够提高挖掘的准确性和效率则可以降低网络维护的工作量,避免告警重复派单的浪费。因此,现有的技术方案存在派单效率较低的技术问题。
发明内容
本发明实施例提供了一种告警关联及派单优化方法、装置、设备及介质,一方面给出一种涵盖挖掘关联关系的所有属性特征,另一方面给出量化的评判关联关系可靠性的依据,最终实现提升工单派发效率的目的。
第一方面,本发明实施例提供了一种基于依赖树的告警关联及派单优化方法,包括:
对告警描述进行格式化和分词,生成最终的分词集合Seg;
依据所述最终的分词集合中的分词在告警描述中出现的概率形成路径,对所述路径进行合并形成概率层次树;
设置滑动窗口t;
基于滑动窗口t,对告警记录中的告警事件进行合并,形成告警同时发生记录集;
计算所述告警同时发生记录集中的分词词频,基于所述概率层次树,构建频率生长树,即告警依赖树,确定最终的频繁模式;
基于所述最终的频繁模式及所述频率生长树,确定所述频繁模式中各路径上各节点的频率依赖模式;
对所述频繁模式中各路径上各节点的频率依赖模式,构建节点概率列表,并构建路径概率列表;
对待派单告警事件,获取滑动窗口区间内所有待派单告警,结合所述节点概率列表和路径概率列表,遍历所述告警依赖树形成告警链路,基于所形成的各告警链路的相交层级进行派单。
第二方面,本发明实施例提供了一种基于依赖树的告警关联及派单优化装置,包括:
分词集合生成模块,用于对告警描述进行格式化和分词,生成最终的分词集合Seg;
概率层次树生成模块,用于依据所述最终的分词集合中的分词在告警描述中出现的概率形成路径,对所述路径进行合并形成概率层次树;
滑动窗口设置模块,用于设置滑动窗口t;
告警同时发生记录集生成模块,用于基于滑动窗口t,对告警记录中的告警事件进行合并,形成告警同时发生记录集;
频率生长树及频繁模式生成模块,用于计算所述告警同时发生记录集中的分词词频,基于所述概率层次树,构建频率生长树,确定最终的频繁模式;
频率依赖模式生成模块,用于基于所述最终的频繁模式及所述频率生长树,确定所述频繁模式中各路径上各节点的频率依赖模式;
概率列表生成模块,用于对所述频繁模式中各路径上各节点的频率依赖模式,构建节点概率列表,并构建路径概率列表;
派单模块,用于对待派单告警事件,获取滑动窗口区间内所有待派单告警,遍历告警依赖树形成告警链路,基于所形成的各告警链路的相交层级进行派单。
本发明实施例提供了一种基于依赖树的告警关联及派单优化设备,包括:至少一个处理器、至少一个存储器以及存储在存储器中的计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。
本发明实施例提供的基于依赖树的告警关联及派单优化方法、装置、设备及介质,能够挖掘告警记录各关联关系的所有属性特征,并能够给出量化的评判关联关系可靠性的依据,最终实现提升工单派发效率的目的。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明一实施例中一种基于依赖树的告警关联及派单优化方法的流程示意图。
图2示出了图1所示实施例中步骤1的流程示意图;
图3示出了图1所示实施例中步骤2的流程示意图;
图4示出了图1所示实施例中所述概率层次树的结构示意图;
图5示出了图1所示实施例中步骤4的流程示意图;
图6示出了图1所示实施例中步骤5的流程示意图;
图7给出了图6所示实施例中所述频繁项列表LSeg和所述频率生成树的示意图;
图8示出了图1所示实施例中步骤8的流程示意图;
图9示出了本发明一实施例中一种基于依赖树的告警关联及派单优化装置的结构示意图;
图10示出了图9所示实施例中分词集合生成模块1001的结构示意图;
图11示出了图9所示实施例中所述概率层次树生成模块1002的结构示意图;
图12示出了图9所示实施例中告警同时发生记录集生成模块1004的结构示意图;
图13示出了图9所示实施例中所述频率生长树及频繁模式生成模块1005的结构示意图;
图14示出了图9所示实施例中派单模块1008的结构示意图;
图15示出了本发明实施例提供的基于依赖树的告警关联及派单优化设备的硬件结构示意图;
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本发明实施例提供了一种基于依赖树的告警关联及派单优化方法,图1为本发明基于依赖树的告警关联及派单优化方法实施例的流程示意图,如图1所示,包括如下步骤,
步骤1:对告警描述进行格式化和分词,生成最终的分词集合Seg。
鉴于告警***格式众多,告警编码、告警描述及涉及的设备和***编码和名称,缺乏统一规范。鉴于此,对告警描述进行格式化和分词,生成最终的分词集合Seg。
可选地,如图2所示,步骤1可以包括:
步骤1.1:对第i条告警描述DESi,基于分割符集进行正则匹配,构成第i个分割分词集合SEGi;
通常,分隔符集合可以是,但不局限于:{\s|,|:|;|#|_。。。。。}。
步骤1.2:统计所有告警描述相邻字同时出现的次数,构建隐马尔科夫模型及所述隐马尔科夫模型转移概率,基于所述转移概率确定第一分词集合Seg’I;
步骤1.3:判断Seg’I集合中分词是否为SEGi中分词的子集或全集,若Seg’I集合中分词为SEGi中分词的子集或全集,则将Seg’I作为所述最终的分词集合Seg。通常,分词涉及到,但不限于告警相关的区域、网络、地址、设备及组件等。
步骤2:依据所述最终的分词集合中的分词在告警描述中出现的概率形成路径,对所述路径进行合并形成概率层次树;
可选地,如图3所示,步骤2可以包括:
步骤2.1:统计所述最终的分词集合中第i个分词Segi的频率Pi;
步骤2.2:遍历告警描述DESi,对所述告警描述所含分词的概率进行排序,将所述告警描述所含分词的排序索引k作为所述告警描述所含分词所属层次,并形成路径Lk;
步骤2.3:若相同Segi在不同路径上所属层次不同,则统计所述相同Segi所处层次的概率,以概率最高的层次作为所述相同Segi的层次;
步骤2.4:对所述相同Segi所属路径索引与所述相同Segi的层次不一致,依次调整所述相同Segi所属路径索引上节点的层次;
步骤2.5:对调整后所述相同Segi所属路径索引的路径进行合并,形成概率层次树,其中所述概率层次树结构如图4所示。
步骤3:设置滑动窗口t;
步骤4:基于滑动窗口t,对告警记录中的告警事件进行合并,形成告警同时发生记录集;
可选地,如图5所示,步骤4可以包括:
步骤4.1:基于告警记录对所述告警事件进行排序,并取所述告警事件的唯一值作为时刻序列tj;
步骤4.2:以时间序列tj及滑动窗口t确定时间区间[tj-t,tj+t];
步骤4.3:对时间区间内的告警事件进行归并,构建告警同时发生记录集DESj。通常,告警同时发生记录集DESj可以包括,但不限于如下具体示例:{xxx网元连接中断,xxx射频单元业务不可用告警}。
步骤5:计算所述告警同时发生记录集中的分词词频,基于所述概率层次树,构建频率生长树,即告警依赖树,确定频繁模式;
可选地,如图6所述,步骤5可以包括:
步骤5.1:提取DESj中所有告警事件的告警分词形成分词集合SEGj;
步骤5.2:基于所有告警描述计算SEGj中的分词词频,并对所述SEGj中的分词词频进行排序,形成频繁项列表LSeg;
步骤5.3:基于所述概率层次树和所述频繁项列表LSeg,构建频率生长树;图7给出了所述频繁项列表LSeg和所述频率生成树的示意图,当然,频繁项列表LSeg和所述频率生成树的结构、其所包含的内容及内容发生频率由告警事件确定,本图仅给出示意。
步骤5.4:遍历频率生长树,获得各频繁模式的频度,若频繁模式的频度大于最小支持度门限e,则将该频繁模式作为最终的频繁模式。其中,频繁模式即同时出现的告警,例如:{动环掉电,链路丢失,误码率过高},这三者同时发生概率即为该频繁模式的频度。
步骤6:基于所述频繁模式及频率生长树,确定所述频繁模式中各路径上各节点的频率依赖模式;其中,路径Li的频率依赖如式1所示。
Figure BDA0001536210050000071
若路径Li由若干Segi,j构成,若节点Segi,j发生的概率为Pi,j,路径Li的概率矩阵如表1所示,表1四路径节点概率分布。
表1
Seg0 Seg1 Seg2 Seg3 …… Segm
L0 P00 P01 0 P03 …… P0m
L1 0 P11 0 P13 …… P1m
L2 0 0 P22 P23 …… P2m
L3 0 0 P32 P23 …… 0
…… …… …… …… …… …… ……
Ln Pn0 0 0 0 …… Pnm
步骤7:对所述频繁模式中各路径上各节点的频率依赖模式,构建节点概率列表,并构建路径概率列表;其中,
节点概率列表为{Segi,P(Segi)};
路径概率列表为
Figure BDA0001536210050000072
步骤8:对待派单告警事件,获取滑动窗口区间内所有告警,遍历告警依赖树形成告警链路,基于所形成的各告警链路的相交层级进行派单。
可选地,如图8所示,步骤8可以包括:
步骤8.1:对于待派单告警事件,提取所述待派单告警事件的发生事件t0,构建滑动窗口区间[t0-t,t0+t];
步骤8.2:对于发生时间处于[t0-t,t0+t]内的所有待派单告警事件,遍历告警依赖树;
步骤8.3:若遍历告警依赖树成功,确定遍历成功的告警集合W=(L’i,Pi),其中L’i为路径,Pi为路径概率,比较集合W中的各告警所属路径L’i相交层次的数量N,若N大于设定阈值,则对相交最底层的待派单告警事件进行派单;
步骤8.4:若遍历告警依赖树失败,对于遍历不成功的待派单告警事件,增加新的路径L’k,并根据已遍历成功的路径的概率Pi及同层节点的最大概率,计算路径L’k的概率P’k,依据P’k对待派单告警事件进行排序,依次派单。
本实施例采用基于依赖树的方法,借助移动网络设备告警之间的依存关系,生成告警依赖树,抽取相互关联的告警路径,并基于告警路径上的海量告警信息,挖掘告警之间的时间相关性、频率相关性、路径相关性,以此作为告警关联分析的基础,对告警进行溯源,制定合理的告警工单派发依据。
本发明另实施例还提供了一种基于依赖树的告警关联及派单优化装置,图9为本发明基于依赖树的告警关联及派单优化装置实施例的结构示意图,如图9所示,包括如下模块,
分词集合生成模块1001,用于对告警描述进行格式化和分词,生成最终的分词集合Seg;
可选地,如图10所示,所述分词集合生成模块1001可以包括:
正则匹配子模块10011,用于对第i条告警描述DESi,基于分割符集进行正则匹配,构成分割分词集合SEGi;
隐马尔科夫模型构建子模块10012,用于统计所有告警描述相邻字同时出现的次数,构建隐马尔科夫模型及所述隐马尔科夫模型转移概率,基于转移概率确定第一分词集合Seg’I;
分词集合判断子模块10013,用于判断Seg’I集合中分词是否为SEGi中分词的子集或全集,若Seg’I集合中分词为SEGi中分词的子集或全集,则将Seg’I作为最终的分词集合Seg。
概率层次树生成模块1002,用于依据所述最终的分词集合中的分词在告警描述中出现的概率形成路径,对所述路径进行合并形成概率层次树;
可选地,如图11所示,所述概率层次树生成模块1002可以包括:
分词频率统计子模块10021,用于统计所述最终的分词集合中第i个分词Segi的频率Pi;
路径生成子模块10022,用于遍历告警描述DESi,对所述告警描述所含分词的概率进行排序,将所述告警描述所含分词的排序索引k作为所述告警描述所含分词所属层次,并形成路径Lk;
分词层次生成子模块10023,用于判断相同Segi在不同路径上所属层次是否相同,若相同,则得到所述相同Segi所属层次,若不同,则统计所述相同Segi所处层次的概率,以概率最高的层次作为所述相同Segi的层次;
节点层次生成子模块10024,用于对所述相同Segi所属路径索引与分词层次生成子模块10023最终确定层次不一致的,依次调整所述相同Segi所属路径索引上剩余节点的层次;
概率层次树生成子模块10025,用于对节点层次生成子模块10024确定的路径进行合并,形成概率层次树,其中所述概率层次树结构如图4所示。
滑动窗口设置模块1003,用于设置滑动窗口t;
告警同时发生记录集生成模块1004,用于基于滑动窗口t,对告警记录中的告警事件进行合并,形成告警同时发生记录集;
可选地,如图12所示,所述告警同时发生记录集生成模块1004可以包括:
时刻提取子模块10041,用于基于告警记录对所述告警事件进行排序,并取所述告警事件的唯一值作为时刻序列tj;
时间区间生成子模块10042:以时刻提取子模块10041提取到的时间序列tj及滑动窗口设置模块1003设置的滑动窗口t,确定时间区间[tj-t,tj+t];
告警同时发生记录集生成子模块10043,用于对时间区间内的告警事件进行归并,构建告警同时发生记录集DESj。
频率生长树及频繁模式生成模块1005,用于计算所述告警同时发生记录集中的分词词频,基于所述概率层次树,构建频率生长树,将所述频率生长树作为告警依赖树,确定最终的频繁模式;
可选地,如图13所述,所述频率生长树及频繁模式生成模块1005可以包括:
告警分词集合生成子模块10051,用于提取DESj中所有告警事件的告警分词形成分词集合SEGj;可选地,该告警分词集合生成子模块10051可以与利用分词集合生成模块1001完成分词集合SEGj的生成。
频繁项列表生成子模块10052,用于基于所有告警描述计算所述告警分词集合生成子模块10051生成的SEGj中的分词词频,并对所述SEGj中的分词词频进行排序,形成频繁项列表LSeg;
频率生长树生成子模块10053,用于基于所述概率层次树生成子模块10025构建的概率层次树和所述频繁项列表生成子模块10052形成的频繁项列表LSeg,构建频率生长树;图7给出了所述频繁项列表LSeg和所述频率生成树的示意图,当然,频繁项列表LSeg和所述频率生成树的结构、其所包含的内容及内容发生频率由告警事件确定,本图仅给出示意。
频繁模式生成子模块10054,用于遍历所述频率生长树生成子模块10053构建频率生长树,获得各频繁模式的频度,若频繁模式的频度大于最小支持度门限e,则将该频繁模式作为最终的频繁模式。其中,频繁模式即同时出现的告警,例如:{动环掉电,链路丢失,误码率过高},这三者同时发生概率即为该频繁模式的频度。
频率依赖模式生成模块1006,用于基于所述最终的频繁模式及所述频率生长树,确定所述频繁模式中各路径上各节点的频率依赖模式;其中,路径Li的频率依赖如式1所示,路径Li的概率矩阵如表1所示。
概率列表生成模块1007,用于对所述频繁模式中各路径上各节点的频率依赖模式,构建节点概率列表,并构建路径概率列表;其中,
节点概率列表为{Segi,P(Segi)};
路径概率列表为
Figure BDA0001536210050000101
派单模块1008,用于对待派单告警事件,获取滑动窗口区间内所有待派单告警,结合所述节点概率列表和路径概率列表,遍历告警依赖树形成告警链路,基于所形成的各告警链路的相交层级进行派单。
可选地,如图14所示,派单模块1008可以包括:
滑动窗口构建子模块10081,用于对于待派单告警事件,提取所述待派单告警事件的发生事件t0,构建滑动窗口区间[t0-t,t0+t];可选地,滑动窗口构建子模块10081可以利用时间区间生成子模块10042构建滑动窗口区间。
告警依赖树遍历子模块10082,用于对于发生时间处于滑动窗口构建子模块10081生成的滑动窗口区间[t0-t,t0+t]内的所有待派单告警事件,遍历告警依赖树,若遍历告警依赖树成功则启动第一派单子模块10083,若遍历告警依赖树不成功则启动第二派单子模块10084;
第一派单子模块10083,用于确定遍历成功的告警集合W=(L’i,Pi),其中L’i为路径,Pi为路径概率,比较集合W中的各告警所属路径L’i相交层次的数量N,若N大于设定阈值,则对相交最底层的告警事件进行派单;
第二派单子模块10084,用于对于遍历不成功的待派单告警事件,增加新的路径L’k,并根据已遍历成功的路径的概率Pi及同层节点的最大概率,计算路径L’k的概率P’k,依据P’k对待派单告警事件进行排序,依次派单。
本实施例采用基于路径树的方法生成告警路径树,不仅总结分析了所有告警记录而且涵盖了记录之间的层级关系,包括区域关系、网元层级关系和告警编码层级关系,同时采用开销较小的数据结构表征了挖掘告警关联关系需要的属性特征,使得算法本身易于应用到相应的挖掘场景。此外,采用基于挖掘的关联关系追溯告警源的方法能够合理利用关联关系在滑动时间范围内合并同源告警,更深层次解决重复派单的问题,进一步提高了告警工单的出单效率。
另外,结合图1-8描述的本发明实施例的基于依赖树的告警关联及派单优化方法中的任意一种方法可以分别由基于依赖树的告警关联及派单优化设备来实现。图15示出了本发明实施例提供的基于依赖树的告警关联及派单优化设备的硬件结构示意图。
基于依赖树的告警关联及派单优化设备可以包括处理器1501以及存储有计算机程序指令的存储器1502。
具体地,上述处理器1501可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器1502可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器1502可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器1502可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器1502可在数据处理装置的内部或外部。在特定实施例中,存储器1502是非易失性固态存储器。在特定实施例中,存储器1502包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器1501通过读取并执行存储器1502中存储的计算机程序指令,以实现上述实施例中的任意一种基于依赖树的告警关联及派单优化方法。
在一个示例中,基于依赖树的告警关联及派单优化设备还可包括通信接口1503和总线1510。其中,如图15所示,处理器1501、存储器1502、通信接口1503通过总线1510连接并完成相互间的通信。
通信接口1503,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。
总线1510包括硬件、软件或两者,将基于依赖树的告警关联及派单优化设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、***组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线1510可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
该基于依赖树的告警关联及派单优化设备可以基于获取到待测小区的网管性能指标,执行本发明实施例中的基于依赖树的告警关联及派单优化方法,从而实现结合上述实施例中的任意一种基于依赖树的告警关联及派单优化方法。
另外,结合上述实施例中的基于依赖树的告警关联及派单优化方法,本发明实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种基于依赖树的告警关联及派单优化方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或***。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的***、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (6)

1.一种基于依赖树的告警关联及派单优化方法,其特征在于,所述方法包括:
对告警描述进行格式化和分词,生成最终的分词集合Seg;
依据所述最终的分词集合中的分词在告警描述中出现的概率形成路径,对所述路径进行合并形成概率层次树;
设置滑动窗口t;
基于滑动窗口t,对告警记录中的告警事件进行合并,形成告警同时发生记录集;
计算所述告警同时发生记录集中的分词词频,基于所述概率层次树,构建频率生长树,即告警依赖树,确定最终的频繁模式;
基于所述最终的频繁模式及所述频率生长树,确定所述频繁模式中各路径上各节点的频率依赖模式;
对所述频繁模式中各路径上各节点的频率依赖模式,构建节点概率列表,并构建路径概率列表;
对待派单告警事件,获取滑动窗口区间内所有待派单告警,结合所述节点概率列表和路径概率列表,遍历所述告警依赖树形成告警链路,基于所形成的各告警链路的相交层级进行派单;
所述对告警描述进行格式化和分词包括:
对第i条告警描述DESi,基于分割符集进行正则匹配,构成第i个分割分词集合SEGi;
统计所有告警描述相邻字同时出现的次数,构建隐马尔科夫模型及所述隐马尔科夫模型转移概率,基于所述转移概率确定第一分词集合Seg’I;
判断Seg’I集合中分词是否为SEGi中分词的子集或全集,若Seg’I集合中分词为SEGi中分词的子集或全集,则将Seg’I作为所述最终的分词集合Seg;所述依据所述最终的分词集合中的分词在告警描述中出现的概率形成路径,对所述路径进行合并形成概率层次树,包括:
统计所述最终的分词集合中第i个分词Segi的频率Pi1;
遍历告警描述DESi,对所述告警描述DESi所含分词的概率进行排序,将所述告警描述DESi所含分词的排序索引k作为所述告警描述所含分词所属层次,并形成路径Lk;
若相同Segi在不同路径上所属层次不同,则统计所述相同Segi所处层次的概率,以概率最高的层次作为所述相同Segi的层次;
若所述相同Segi所属路径索引与所述相同Segi的层次不一致,依次调整所述相同Segi所属路径索引上节点的层次;
对调整后所述相同Segi所属路径索引的路径进行合并,形成概率层次树;
所述计算所述告警同时发生记录集中的分词词频,基于所述概率层次树,构建频率生长树,将所述频率生长树作为告警依赖树,确定最终的频繁模式,包括:
提取DESj中所有告警事件的告警分词形成分词集合SEGj;
基于所有告警描述计算SEGj中的分词词频,并对所述SEGj中的分词词频进行排序,形成频繁项列表LSeg;
基于所述概率层次树和所述频繁项列表LSeg,构建频率生长树;
遍历所述频率生长树,获得各频繁模式的频度,若频繁模式的频度大于最小支持度门限e,则将所述频繁模式作为最终的频繁模式。
2.根据权利要求1所述的方法,其特征在于,所述基于滑动窗口t,对告警记录中的告警事件进行合并,形成告警同时发生记录集,包括:
基于告警记录对所述告警事件进行排序,并取所述告警事件的唯一值作为时间序列tj;
以时间序列tj及滑动窗口t确定时间区间[tj-t,tj+t];
对时间区间内的所述告警事件进行归并,构建告警同时发生记录集DESj。
3.根据权利要求1所述的方法,其特征在于,所述对待派单告警事件,获取滑动窗口区间内所有告警,结合所述节点概率列表和路径概率列表,遍历所述告警依赖树形成告警链路,基于所形成的各告警链路的相交层级进行派单,包括:
对于待派单告警事件,提取所述待派单告警事件的发生事件t0,构建滑动窗口区间[t0-t,t0+t];
对于发生时间处于[t0-t,t0+t]内的所有待派单告警事件,遍历告警依赖树;
若遍历告警依赖树成功,确定遍历成功的告警集合W=(L’i,Pi),其中L’i为路径,Pi为路径概率,比较集合W中的各告警所属路径L’i相交层次的数量N,若N大于设定阈值,则对相交最底层的待派单告警事件进行派单;
若遍历告警依赖树失败,对于遍历不成功的待派单告警事件,增加新的路径L’k,并根据已遍历成功的路径的概率Pi及同层节点的最大概率,计算路径L’k的概率P’k,依据P’k对待派单告警事件进行排序,依次派单。
4.一种基于依赖树的告警关联及派单优化装置,其特征在于,包括:
分词集合生成模块,用于对告警描述进行格式化和分词,生成最终的分词集合Seg;
概率层次树生成模块,用于依据所述最终的分词集合中的分词在告警描述中出现的概率形成路径,对所述路径进行合并形成概率层次树;
滑动窗口设置模块,用于设置滑动窗口t;
告警同时发生记录集生成模块,用于基于滑动窗口t,对告警记录中的告警事件进行合并,形成告警同时发生记录集;
频率生长树及频繁模式生成模块,用于计算所述告警同时发生记录集中的分词词频,基于所述概率层次树,构建频率生长树,确定最终的频繁模式;
频率依赖模式生成模块,用于基于所述最终的频繁模式及所述频率生长树,确定所述频繁模式中各路径上各节点的频率依赖模式;
概率列表生成模块,用于对所述频繁模式中各路径上各节点的频率依赖模式,构建节点概率列表,并构建路径概率列表;
派单模块,用于对待派单告警事件,获取滑动窗口区间内所有待派单告警,遍历告警依赖树形成告警链路,基于所形成的各告警链路的相交层级进行派单;
所述分词集合生成模块,用于对告警描述进行格式化和分词,生成最终的分词集合Seg,包括:
对第i条告警描述DESi,基于分割符集进行正则匹配,构成第i个分割分词集合SEGi;
统计所有告警描述相邻字同时出现的次数,构建隐马尔科夫模型及所述隐马尔科夫模型转移概率,基于所述转移概率确定第一分词集合Seg’I;
判断Seg’I集合中分词是否为SEGi中分词的子集或全集,若Seg’I集合中分词为SEGi中分词的子集或全集,则将Seg’I作为所述最终的分词集合Seg;
所述概率层次树生成模块,用于依据所述最终的分词集合中的分词在告警描述中出现的概率形成路径,对所述路径进行合并形成概率层次树,包括:
统计所述最终的分词集合中第i个分词Segi的频率Pi1;
遍历告警描述DESi,对所述告警描述DESi所含分词的概率进行排序,将所述告警描述所含分词的排序索引k作为所述告警描述DESi所含分词所属层次,并形成路径Lk;
若相同Segi在不同路径上所属层次不同,则统计所述相同Segi所处层次的概率,以概率最高的层次作为所述相同Segi的层次;
若所述相同Segi所属路径索引与所述相同Segi的层次不一致,依次调整所述相同Segi所属路径索引上节点的层次;
对调整后所述相同Segi所属路径索引的路径进行合并,形成概率层次树;
所述频率生长树及频繁模式生成模块,用于计算所述告警同时发生记录集中的分词词频,基于所述概率层次树,构建频率生长树,将所述频率生长树作为告警依赖树,确定最终的频繁模式,包括:
提取DESj中所有告警事件的告警分词形成分词集合SEGj;
基于所有告警描述计算SEGj中的分词词频,并对所述SEGj中的分词词频进行排序,形成频繁项列表LSeg;
基于所述概率层次树和所述频繁项列表LSeg,构建频率生长树;
遍历所述频率生长树,获得各频繁模式的频度,若频繁模式的频度大于最小支持度门限e,则将所述频繁模式作为最终的频繁模式。
5.一种基于依赖树的告警关联及派单优化设备,其特征在于,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现如权利要求1-3中任一项所述的方法。
6.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,当所述计算机程序指令被处理器执行时实现如权利要求1-3中任一项所述的方法。
CN201711494844.6A 2017-12-31 2017-12-31 告警关联及派单优化方法、装置、设备及介质 Active CN109993390B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711494844.6A CN109993390B (zh) 2017-12-31 2017-12-31 告警关联及派单优化方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711494844.6A CN109993390B (zh) 2017-12-31 2017-12-31 告警关联及派单优化方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN109993390A CN109993390A (zh) 2019-07-09
CN109993390B true CN109993390B (zh) 2021-06-25

Family

ID=67110821

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711494844.6A Active CN109993390B (zh) 2017-12-31 2017-12-31 告警关联及派单优化方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN109993390B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111950270B (zh) * 2019-04-29 2023-11-24 ***通信集团湖北有限公司 通信网络告警关联方法、装置及计算设备
CN112668733A (zh) * 2020-12-17 2021-04-16 国网冀北电力有限公司信息通信分公司 基于无监督学习的通信管理***缺陷故障派单方法及装置
CN114070593A (zh) * 2021-11-09 2022-02-18 全球能源互联网研究院有限公司 一种基于多级告警和联动防御的虚拟网络安全管控方法
CN115422263B (zh) * 2022-11-01 2023-01-13 广东亿能电力股份有限公司 一种电力现场多功能通用型故障分析方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014021723A1 (en) * 2012-07-30 2014-02-06 Fiduka Sp. Zo.O. Method of modifying the performance of the teleinformation system, especially generating responses of the teleinformation system after initiating the action by the object in the teleinformation network and applying this metod of modifying
WO2016201812A1 (zh) * 2015-06-19 2016-12-22 中兴通讯股份有限公司 告警的方法及装置
CN106714219A (zh) * 2016-12-20 2017-05-24 浪潮通信信息***有限公司 一种可并行处理的移动通信网管自动派单方法
CN106789347A (zh) * 2017-01-22 2017-05-31 山东浪潮商用***有限公司 一种基于告警数据实现告警关联和网络故障诊断的方法
CN107018030A (zh) * 2017-06-01 2017-08-04 厦门华厦学院 基于智能终端的移动网络故障分析***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014021723A1 (en) * 2012-07-30 2014-02-06 Fiduka Sp. Zo.O. Method of modifying the performance of the teleinformation system, especially generating responses of the teleinformation system after initiating the action by the object in the teleinformation network and applying this metod of modifying
WO2016201812A1 (zh) * 2015-06-19 2016-12-22 中兴通讯股份有限公司 告警的方法及装置
CN106714219A (zh) * 2016-12-20 2017-05-24 浪潮通信信息***有限公司 一种可并行处理的移动通信网管自动派单方法
CN106789347A (zh) * 2017-01-22 2017-05-31 山东浪潮商用***有限公司 一种基于告警数据实现告警关联和网络故障诊断的方法
CN107018030A (zh) * 2017-06-01 2017-08-04 厦门华厦学院 基于智能终端的移动网络故障分析***

Also Published As

Publication number Publication date
CN109993390A (zh) 2019-07-09

Similar Documents

Publication Publication Date Title
CN109993390B (zh) 告警关联及派单优化方法、装置、设备及介质
CN110609759B (zh) 一种故障根因分析的方法及装置
EP3975048A1 (en) Method for constructing cloud network alarm root cause relational tree model, device, and storage medium
CN104518905A (zh) 一种故障定位方法及装置
CN104462115A (zh) 垃圾短信的识别方法及装置
CN109684373A (zh) 基于出行和话单数据分析的重点关系人发现方法
CN112118551A (zh) 设备风险识别方法及相关设备
CN114428828A (zh) 基于行驶轨迹挖掘新增道路方法、装置及电子设备
CN116881430B (zh) 一种产业链识别方法、装置、电子设备及可读存储介质
CN113221960B (zh) 一种高质量漏洞数据收集模型的构建方法及收集方法
CN113723452A (zh) 一种基于kpi聚类的大规模异常检测***
CN115544519A (zh) 对计量自动化***威胁情报进行安全性关联分析的方法
CN113420396A (zh) 一种城市排水管网污染溯源的方法
CN109768878B (zh) 一种基于大数据的网络工单计算方法及装置
CN116523284A (zh) 基于机器学习的业务操作流程自动化评估方法、***
CN116150191A (zh) 一种用于云端数据架构的数据运算加速方法及***
CN111628888B (zh) 一种故障诊断方法、装置、设备及计算机存储介质
CN111522705A (zh) 一种工业大数据智能运维解决方法
CN111144429B (zh) 对象分类方法及其***、计算机***及计算机可读介质
CN110582091B (zh) 定位无线质量问题的方法和装置
CN108897680B (zh) 一种基于soa的软件***操作剖面构造方法
CN116151437A (zh) 一种浅层崩塌灾害预警模型建立方法、装置、设备及介质
CN115767601A (zh) 一种基于多维数据的5gc网元自动化纳管方法及装置
CN112100165B (zh) 基于质量评估的交通数据处理方法、***、设备和介质
CN111209158B (zh) 服务器集群的挖矿监控方法及集群监控***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant