CN114911654A - 一种故障分类方法、装置及*** - Google Patents

一种故障分类方法、装置及*** Download PDF

Info

Publication number
CN114911654A
CN114911654A CN202110180899.XA CN202110180899A CN114911654A CN 114911654 A CN114911654 A CN 114911654A CN 202110180899 A CN202110180899 A CN 202110180899A CN 114911654 A CN114911654 A CN 114911654A
Authority
CN
China
Prior art keywords
alarm
relationship
management system
network management
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110180899.XA
Other languages
English (en)
Inventor
柳丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202110180899.XA priority Critical patent/CN114911654A/zh
Publication of CN114911654A publication Critical patent/CN114911654A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2252Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using fault dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提供了一种故障分类方法、装置及***,网管***获取与目标故障对应的多条告警数据,以及指示对象关系的规则,其中,各条告警数据分别指示相应的第一对象,网管***根据所述告警数据以及所述指示对象关系的规则,确定第二对象,以及第一对象与第二对象之间的对象关系。然后根据所述第一对象与所述第二对象之间的对象关系,计算每个对象的向量特征。最后根据所述第一对象与所述第二对象之间的对象关系,以及每个对象的向量特征,确定所述目标故障的故障类型。本申请提供的故障分类方法可以利用告警数据和指示对象关系的规则来分析目标故障,可以有效解决现有利用多个规则匹配进行判断的延时问题,提高故障分类的效率。

Description

一种故障分类方法、装置及***
技术领域
本申请涉及通信技术领域,尤其涉及一种故障分类方法、装置及***。
背景技术
随着通信网络规模的不断扩大,网络结构也越来越复杂,网元上报到网管***的告警数量出现***式增长,告警用于提示网元上的故障(incident),每天运维人员需要从海量的告警中筛选出有效告警,并对这些有效告警所提示的故障进行诊断,以确定故障根因,以根据故障根因对故障进行修复,可见,对故障进行准确、快速地诊断,是修复故障的关键。
图1提供了一种网管***的结构示意图,网管***通过故障1-3-5的流程来处理运营商网络的故障,运营商网络故障的处理分为故障的发现、诊断与修复三个部分,分别占用1分钟、3分钟、5分钟的处理时间。如图1所示,网管***通过告警采集模块将网元上报的告警进行统一汇集,然后经过告警降噪模块的降噪处理后进行保存。降噪处理后的告警会被定期推送入告警聚合模块,以分成不同的聚合组(incidents),即故障,至此完成故障的发现。对每一个故障进行故障根因分析之前,需要对每个故障进行故障分类,以确定每一个故障对应的故障类型,再针对故障对应的故障类型,进行故障根因的分析,并根据每个故障的故障根因进行故障修复。
可以采用故障分类引擎来识别故障的故障类型,故障分类引擎是通过大量的故障类型,以及运维人员对这些故障类型的分类方法对应的开发规则代码构建的,因此,故障分类引擎中存在大量的规则语句,而故障分类引擎的分类本质就是通过对故障轮询这些规则语句,以确定故障的故障类型。可见,采用故障分类引擎来识别故障的故障类型,将在轮询规则语句的过程中耗费大量的时间,从而令后续分析故障根因超出原定时间,无法保证故障诊断的实时性。
发明内容
本申请提供了一种故障分类方法、装置及***,以提高故障分类的效率,从而保证故障诊断的实时性。
第一方面,本申请提供了一种故障分类方法。该方法包括:网管***获取与目标故障对应的多条告警数据,以及指示对象关系的规则,多条告警数据中的各条告警数据分别指示相应的第一对象,对象关系是指与告警数据指示的第一对象和与该第一对象相关的第二对象之间的关系。该网管***根据告警数据以及指示对象关系的规则,确定第二对象,以及第一对象与第二对象之间的对象关系。
该网管***根据第一对象与第二对象之间的对象关系,确定每个对象的向量特征,其中,对象包括第一对象和第二对象。
该网管***根据第一对象与第二对象之间的对象关系,以及每个对象的向量特征,确定目标故障的故障类型。
这样,可以利用告警数据和预存的指示对象关系的规则来分析目标故障,而无需依赖专家经验,例如专家分析得到一个故障的类型的过程,即无需根据专家经验生成的规则来进行故障类型的判断,解决现有利用多个规则匹配进行判断的延时问题,从而有效提升了故障分类的效率。
在一种实现方式中,该网管***获取与目标故障对应的告警数据包括:
该网管***获取与目标故障对应的告警的相关信息。
该网管***根据告警的相关信息,获取告警的相关参数。
该网管***确定告警数据,告警数据包括告警的相关信息和告警的相关参数。
这样,可以深度挖掘与目标故障对应的各个告警相关的信息和参数,从而提高故障类型判断的准确性。
在一种实现方式中,告警的相关信息包括告警的标识符、名称、对应物理位置的资源ID、对应的物理位置和/或对应的网元设备名称。告警的相关参数包括网络物理拓扑数据、网元配置数据和/或与网元相关的关键绩效指标数据。
这样,可以根据实际需求,灵活调整用于判断目标故障类型所使用的告警数据的类型。
在一种实现方式中,网管***获取指示对象关系的规则包括:
该网管***根据告警的相关信息和告警的相关参数,获取对应的指示对象关系的规则。
这样,可以通过与告警相关的数据准确匹配到对应的指示对象关系的规则。
在一种实现方式中,网管***根据告警数据以及指示对象关系的规则,确定第二对象,以及第一对象与第二对象之间的对象关系包括:
该网管***确定告警的相关信息以及告警的相关参数所指示的第一对象。
该网管***根据指示对象关系的规则,确定与第一对象对应的第二对象。
该网管***确定第一对象与第二对象之间的对象关系,该对象关系为指示对象关系的规则中所描述的关系。
这样,可以通过将告警数据在第一对象与第二对象对应的对象关系中实例化,以准确确定第一对象与第二对象在实际场景中的对象关系,从而提高故障分类的准确性。
在一种实现方式中,如果指示对象关系的规则为多个,且每个指示对象关系的规则对应告警的相关信息或者告警的相关参数,该网管***在根据指示对象关系的规则,确定与第一对象对应的第二对象之前还包括:
该网管***确定与告警的相关信息或者与告警的相关参数对应的指示对象关系的规则。
这样,可以通过建立每个指示对象关系的规则与每种告警数据之间的对应关系,便于将每个指示对象关系的规则应用于对应的告警数据中,保证实例化过程的准确性。
在一种实现方式中,如果指示对象关系的规则为一个,且指示对象关系的规则对应告警的相关信息和告警的相关参数,该网管***在根据指示对象关系的规则,确定与第一对象对应的第二对象之前还包括:
该网管***在指示对象关系的规则中确定与告警的相关信息或者与告警的相关参数对应的指示对象关系的规则。
这样,可以通过建立指示对象关系的规则中每部分规则与每种告警数据之间的对应关系,便于将每个指示对象关系的规则应用于对应的告警数据中,保证实例化过程的准确性。
在一种实现方式中,网管***构建拓扑图,该拓扑图包括每个对象、以及第一对象与第二对象之间的指向关系。
这样,可以将每个对象,以及对象之间的关系可视化,以便于相关人员查看。
在一种实现方式中,每个对象的向量特征包括入度向量特征、对象类型向量特征和告警类型向量特征。
这样,可以通过挖掘与告警相关的每个对象的不同类型的向量特征,以达到深度挖掘每个对象的特征,以保证用于判断目标故障的依据的准确性,进而提高判断目标故障类型的准确性。
在一种实现方式中,
该网管***根据第一对象与第二对象之间的对象关系,确定每个对象的向量特征包括:
该网管***计算每个对象的入度,其中,入度是指每个对象在所对应的全部指向关系中作为被指向对象的总数。
该网管***以入度为向量元素,建立每个对象的入度向量特征。
这样,可以有效挖掘每个对象在对象指向关系之间的特征,从而提高对每个对象与其它对象之间的对象关系判断的准确性。
在一种实现方式中,
指示对象关系的规则包括每个对象的对象类型,该网管***根据第一对象与第二对象之间的对象关系,确定每个对象的向量特征包括:
该网管***获取第一对象与第二对象在所确定的对象关系中对应的对象类型。
该网管***根据预存的对象类型与编码的对应关系,确定每个对象对应的编码。
该网管***以每个对象对应的编码作为向量元素,建立每个对象的对象类型向量特征。
这样,可以有效挖掘每个对象在对象类型方向的特征,从而提高对每个对象的对象类型判断的准确性。
在一种实现方式中,该网管***根据第一对象与第二对象之间的对象关系,确定每个对象的向量特征包括:
该网管***根据告警数据,确定告警类型。
该网管***根据预存的告警类型与编码的对应关系,确定告警类型对应的编码。
该网管***以告警类型对应的编码作为向量元素,建立每个对象的告警类型向量特征。
这样,可以有效挖掘每个对象在告警类型方向的特征,从而有效统一同一个告警对应的每个对象的告警类型。
在一种实现方式中,该网管***根据第一对象与第二对象之间的对象关系,计算每个对象的向量特征包括:
该网管***横向拼接每个对象对应的各个向量特征,得到每个对象的向量特征。
这样,可以汇总每个对象对应的特征向量,以便于对每个对象的特征向量的分析。
第二方面,本申请提供了一种故障分类装置。该装置包括:接收模块和处理模块。
该接收模块用于获取与目标故障对应的多条告警数据,以及指示对象关系的规则,多条告警数据中的各条告警数据分别指示相应的第一对象,对象关系是指与告警数据指示的第一对象和与该第一对象相关的第二对象之间的关系。
该处理模块用于根据告警数据以及指示对象关系的规则,确定第二对象,以及第一对象与第二对象之间的对象关系。
该处理模块还用于根据第一对象与第二对象之间的对象关系,确定每个对象的向量特征,其中,对象包括第一对象和第二对象。
该处理模块还用于根据第一对象与第二对象之间的对象关系,以及每个对象的向量特征,确定目标故障的故障类型。
这样,可以利用告警数据和预存的指示对象关系的规则来分析目标故障,而无需依赖专家经验,例如专家分析得到一个故障的类型的过程,即无需根据专家经验生成的规则来进行故障类型的判断,解决现有利用多个规则匹配进行判断的延时问题,从而有效提升了故障分类的效率。
在一种实现方式中,该接收模块还用于获取与目标故障对应的告警的相关信息。
该接收模块还用于根据告警的相关信息,获取告警的相关参数。
该处理模块还用于确定告警数据,告警数据包括告警的相关信息和告警的相关参数。
这样,可以深度挖掘与目标故障对应的各个告警相关的信息和参数,从而提高故障类型判断的准确性。
在一种实现方式中,告警的相关信息包括告警的标识符、名称、对应物理位置的资源ID、对应的物理位置和/或对应的网元设备名称;告警的相关参数包括网络物理拓扑数据、网元配置数据和/或与网元相关的关键绩效指标数据。
这样,可以根据实际需求,灵活调整用于判断目标故障类型所使用的告警数据的类型。
在一种实现方式中,该接收模块还用于根据告警的相关信息和告警的相关参数,获取对应的指示对象关系的规则。
这样,可以通过与告警相关的数据准确匹配到对应的指示对象关系的规则。
在一种实现方式中,该处理模块还用于确定告警的相关信息以及告警的相关参数所指示的第一对象;
该处理模块还用于根据指示对象关系的规则,确定与第一对象对应的第二对象;
该处理模块还用于确定第一对象与第二对象之间的对象关系,该对象关系为指示对象关系的规则中所描述的关系。
这样,可以通过将告警数据在第一对象与第二对象对应的对象关系中实例化,以准确确定第一对象与第二对象在实际场景中的对象关系,从而提高故障分类的准确性。
在一种实现方式中,如果指示对象关系的规则为多个,且每个指示对象关系的规则对应告警的相关信息或者告警的相关参数,该处理模块在根据指示对象关系的规则,确定与第一对象对应的第二对象之前还用于确定与告警的相关信息或者与告警的相关参数对应的指示对象关系的规则。
这样,可以通过建立每个指示对象关系的规则与每种告警数据之间的对应关系,便于将每个指示对象关系的规则应用于对应的告警数据中,保证实例化过程的准确性。
在一种实现方式中,如果指示对象关系的规则为一个,且指示对象关系的规则对应告警的相关信息和告警的相关参数,该处理模块在根据指示对象关系的规则,确定与第一对象对应的第二对象之前还用于在指示对象关系的规则中确定与告警的相关信息或者与告警的相关参数对应的指示对象关系的规则。
这样,可以通过建立指示对象关系的规则中每部分规则与每种告警数据之间的对应关系,便于将每个指示对象关系的规则应用于对应的告警数据中,保证实例化过程的准确性。
在一种实现方式中,该处理模块还用于构建拓扑图,该拓扑图包括每个对象、以及第一对象与第二对象之间的指向关系。
这样,可以将每个对象,以及对象之间的关系可视化,以便于相关人员查看。
在一种实现方式中,每个对象的向量特征包括入度向量特征、对象类型向量特征和告警类型向量特征。
这样,可以通过挖掘与告警相关的每个对象的不同类型的向量特征,以达到深度挖掘每个对象的特征,以保证用于判断目标故障的依据的准确性,进而提高判断目标故障类型的准确性。
在一种实现方式中,该处理模块还用于计算每个对象的入度,其中,入度是指每个对象在所对应的全部指向关系中作为被指向对象的总数。
该处理模块还用于以入度为向量元素,建立每个对象的入度向量特征。
这样,可以有效挖掘每个对象在对象指向关系之间的特征,从而提高对每个对象与其它对象之间的对象关系判断的准确性。
在一种实现方式中,指示对象关系的规则包括每个对象的对象类型,该处理模块还用于获取第一对象与第二对象在所确定的对象关系中对应的对象类型。
该处理模块还用于根据预存的对象类型与编码的对应关系,确定每个对象对应的编码。
该处理模块还用于以每个对象对应的编码作为向量元素,建立每个对象的对象类型向量特征。
这样,可以有效挖掘每个对象在对象类型方向的特征,从而提高对每个对象的对象类型判断的准确性。
在一种实现方式中,该处理模块还用于根据告警数据,确定告警类型。
该处理模块还用于根据预存的告警类型与编码的对应关系,确定告警类型对应的编码。
该处理模块还用于以告警类型对应的编码作为向量元素,建立每个对象的告警类型向量特征。
这样,可以有效挖掘每个对象在告警类型方向的特征,从而有效统一同一个告警对应的每个对象的告警类型。
在一种实现方式中,该处理模块还用于横向拼接每个对象对应的各个向量特征,得到每个对象的向量特征。
这样,可以汇总每个对象对应的特征向量,以便于对每个对象的特征向量的分析。
第三方面,本申请还提供了一种网管***。该网管***包括存储器和处理器,其中,存储器与处理器相耦合。该存储器用于存储计算机程序代码/指令,当计算机程序代码/指令被处理器执行时,使得该处理器执行上述第一方面及其实现方式中的方法对目标故障进行故障分类。
第四方面,本申请提供了一种网络***。该网络***包括网管***、网卡和至少一个网元,其中,该至少一个网元通过网卡向网管***发送告警指令,该网管***接收所述告警指令,并执行上述第一方面及其实现方式中的方法对目标故障进行故障分类。
第五方面,本申请还提供了一种计算机存储介质。该计算机存储介质存储有计算机指令,当所述计算机指令在存储设备上运行时,使得存储设备执行上述第一方面及其实现方式中的方法。
第六方面,本申请还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面及其实现方式中的方法。
第七方面,本申请还提供了一种芯片***,该芯片***包括处理器,用于支撑上述装置或设备实现上述第一方面及其实现方式中所涉及的功能,例如,生成或处理上述方法中所涉及的信息。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的一种网管***的结构示意图;
图2为申请实施例提供的一种网络***的结构示意图;
图3为本申请实施例提供的一种网管***的结构示意图;
图4为本申请实施例提供的一种故障数据的数据结构示意图;
图5为本申请实施例提供的一种alarms字段的数据结构示意图;
图6为本申请实施例提供的一种故障分类模块的结构示意图;
图7为本申请实施例提供的一种故障分类方法的流程示意图;
图8为本申请实施例提供的一种与告警本身属性相关的指示对象关系的规则的示意图;
图9为本申请实施例提供的一种与告警所在网元的局部拓扑相关的指示对象关系的规则的示意图;
图10为本申请实施例提供的一种与告警发生时所对应的网元配置相关的指示对象关系的规则的示意图;
图11为本申请实施例提供的一种与告警对应的KPI相关的指示对象关系的规则的示意图;
图12为本申请实施例提供的与告警本身属性相关的数据;
图13为本申请实施例提供的与告警所在网元的局部拓扑相关的数据;
图14为本申请实施例提供的与告警发生时所对应的网元配置相关的数据;
图15为本申请实施例提供的一种与告警对应的KPI相关的数据;
图16为本申请实施例提供的一种拓扑图的示意图;
图17为本申请实施例提供的一种网管***的软件模块示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图2提供了一种网络***的结构示意图,网络***包括网管***、网卡和至少一个网元,图2以网络***包括网管***1、网卡2和一个网元3为例。在网络***(实际运营商或企业部署的网络环境,包括物理链路和各级网络设备)中,网元3在监测到问题时,会针对监测到的问题生成告警(alarm)的相关信息,并通过网关2将告警的相关信息上报至网管***1,网管***1是指具有网络管理功能的集合,如图1所示的网管***1的结构,网管***1通过告警采集模块11对接收到的告警的相关信息进行汇总,并通过告警降噪模块12对汇总后的告警的相关信息进行降噪,例如去除抖动、工程态等无效告警的相关信息,并将降噪后的告警的相关信息存储至数据库。
图3为本申请实施例提供的一种网管***的结构示意图。该网关***具体可以是网络主机、服务器等,可以监控各个网元3的告警。网管***1可以包括:至少一个处理器、至少一个存储器和至少一个接口单元。作为示例地,如图3所示,网管***1具体可以包括处理器101、存储器102、接口单元103,处理器101、存储器102和接口单元103耦合连接。存储器102中存储有程序指令,处理器101可调用存储器102中的程序指令,使网管***1执行相关的方法,例如采集数据、数据实例化、提取向量特征、故障分类、根因分析、故障修复等。接口单元103用于与网卡2之间实现数据交换,接口单元103可以包括一个或者多个光纤链路接口、以太网接口、微波链路接口或者铜线接口等。
在本实施例中,告警的相关信息包括告警的标识符、告警的名称、告警发生的时间、告警发生时所对应的网元设备名称、告警发生时所对应的物理位置资源ID和/或告警发生时所对应的物理位置,即告警的相关信息可以是上述多个数据中的一个或者多个的组合,也可以根据实际需求,采用与告警相关的其它信息,此处不一一展开。网管***1通过告警聚合模块13对降噪后的告警数据进行聚合处理,可以综合告警发生时间、告警名称和网元物理拓扑等维度对告警数据进行聚合,以形成不同的聚合组(incident)数据,也就是故障数据,如图4所示,图4为本申请实施例提供的一种故障数据的数据结构示意图,由图4可知,故障数据主要包括name字段和alarms字段,name字段用于描述故障的名称,alarms字段用于描述故障所关联的所有告警的相关信息,其中,如图5所示,图5为本申请实施例提供的一种alarms字段的数据结构示意图,由图5可知,alarms字段主要包括csn字段、name字段、neName字段、moDn字段和moi字段,csn字段用于描述告警的唯一标识符,name字段用于描述告警的名称,neName字段用于描述告警发生时所对应的网元设备名称,moDn字段用于描述告警发生时所对应的物理位置资源ID,moi字段用于描述告警发生时所对应的物理位置。一个故障可以包括至少一个告警,即包括至少一个告警的相关信息。为了便于分析故障的故障根因,网管***1会首先通过故障分类模块14对每一个故障进行故障分类,并通过故障根因分析模块15对已经分类后的故障进行有针对性的根因分析,最后由故障修复模块16根据故障根因来修复对应的故障。
为了提高故障分类效率,可以采用如图6所示的故障分类模块对故障进行分类,图6为本申请实施例提供的一种故障分类模块的结构示意图,所述故障分类模块14包括数据获取模块141、故障实例化模块142、特征提取模块143、模型推理模块144和结果输出模块145。故障分类模块14按照如图7所示的故障分类方法对目标故障进行分类,图7为本申请实施例提供的一种故障分类方法的流程示意图,具体如下:
S1、获取与目标故障对应的多条告警数据,以及指示对象关系的规则,所述多条告警数据中的各条告警数据分别指示相应的第一对象,所述对象关系是指与所述告警数据指示的第一对象和与所述第一对象相关的第二对象之间的指向关系。
S2、根据所述告警数据以及所述指示对象关系的规则,确定所述第二对象,以及所述第一对象与所述第二对象之间的对象关系。
S3、根据所述第一对象与所述第二对象之间的对象关系,确定每个对象的向量特征,所述对象包括第一对象和第二对象。
S4、根据所述第一对象与所述第二对象之间的对象关系,以及每个对象的向量特征,确定所述目标故障的故障类型。
在本申请实施例中将需要当前进行故障分类的故障称为目标故障,为了对目标故障进行故障分类,需要首先获取与目标故障对应的告警数据。由上文可知,告警聚合模块13将故障数据存储至数据库,因此,可以通过数据获取模块141直接从数据库中获取与目标故障对应的故障数据,如图4可知,故障数据中包括name字段,因此,可以根据name字段从各个故障数据中获取与目标故障对应的故障数据,即alarms字段。在本实施例中,以alarms字段只包括一个alarm数据为例,具体的,csn字段为“10000”,name字段为“ETH_LOS”,neName字段为“网元A”,moDn字段为“moDn-10000”,moi字段为“card-1-port-1”。可见,alarms字段表示与目标故障对应的各个告警的相关信息。
数据获取模块141根据上述告警的相关信息实时采集告警的相关参数,在本实施例中,与告警的相关参数包括网络拓扑数据、网元配置数据和/或与网元相关的关键绩效指标(Key Performance Indicator,KPI)数据,在一些实施例中,可以根据需求,采集上述三种相关参数中的任意一种,或者几种的组合,在另一些实施例中,也可以采用与告警相关的其它参数,此处不一一展开。其中,网络拓扑数据可以包括物理链路数据、网元环链信息数据、网元信息数据,在一段时间内可以将这些网络拓扑数据视为静态数据;网元配置数据可以包括网元的路由花费表、单板配置、光模块的工作模式(WORKING_MODE)、光模块波道(OPTICAL_CHANNEL)(中心波长)、光模块速率(OPTICAL_MODULE_SPEED)、端口使能状态(PORT_ENABLE_STATUS)等;KPI数据是指针对于告警类型配置的指标数据,可以包括端口发光是否过低,例如小于-10即发光低(txPowerLowAbn),端口发光是否没有,例如小于-30即无发光(noTxPower),端口收光是否过低,例如小于-17即收光低(rxPowerLowAbn),端口收光是否没有,例如小于-40即无收光(noRxPower)等。在本实施例中,将告警的相关信息以及告警的相关参数定义为告警数据。
通过上述过程获取到目标故障的告警数据之后,需要将这些告警数据代入预存的对象关系中,以对上述对象关系进行实例化。
在本实施例中,网管***1中预先存储有指示对象关系的规则,对象关系是指与告警数据所指示的第一对象相关的第二对象与该第一对象之间的指向关系,可见,第二对象对应于告警的相关信息和告警的相关参数。由上文可知,告警数据包括告警的相关信息、网络拓扑数据、网元配置数据和KPI数据。因此,如果指示对象关系的规则为与告警的相关信息、网络拓扑数据、网元配置数据和KPI数据对应的规则的汇总,则可以按照上述告警数据将指示对象关系的规则拆分为四份,包括与告警的相关信息对应的指示规则(如图8所示)、与告警所在网元的局部拓扑对应的指示规则(如图9所示)、与告警发生时所对应的网元配置对应的指示规则(如图10所示)、以及与告警对应的KPI对应的指示规则(如图11所示),从而确定与告警的相关信息、网络拓扑数据、网元配置数据和KPI数据对应的指示规则。如果指示对象关系的规则有多个,且每一个指示对象关系的规则与告警的相关信息、网络拓扑数据、网元配置数据或者KPI数据对应,此时,可以直接将上述四种数据与每个指示对象关系的规则进行对应。
在一些实施例中,可以根据需求增加或者减少告警的相关参数,此处不做展开。
在建立告警的相关信息、网络拓扑数据、网元配置数据和KPI数据与指示对象关系的规则之间的对应关系之后,就可以通过故障实例化模块142,将上述数据代入对应的指示关系,对对象关系进行实例化。如图8-11所示,对象关系通常为“对象-关系-对象”形式,其中,关系即代表两个对象之间所具有的关系。如果将位于左列的对象称为第一对象,将位于右列的对象称为第二对象,则通过图8-11中的关系,可以获得与第一对象对应的第二对象。例如图9中第一对象为“NetworkElement”,第二对象为“NetworkElement”,两者之间的关系为“neNextToNe”即“当前网元的所有邻居网元”,即第一对象为当前网元,第二对象为第一对象的邻居网元。
将告警的相关信息代入与告警的相关信息对应的指示对象关系的规则中,可以得到如图12所示的第一对象、第二对象、以及第一对象与第二对象之间的指向关系。例如,图8中所示的“NetworkElement”为“网元A”,“sendAlarm”对应的查询内容为“当前网元发生的所有告警”。因此,与“NetworkElement”具有“sendAlarm”关系的“Alarm”为“10000”。
将网络拓扑数据代入与告警所在网元的局部拓扑相关的对象关系中,可以得到如图13所示的拓扑关系数据。例如,图9中所示的“NetworkElement”为“网元A”,“neNextToNe”对应的查询内容为“当前网元的所有邻居网元”,因此,与“NetworkElement”具有“neNextToNe”关系的“NetworkElement”分别为“网元B”、“网元C”、“网元D”。
将网元配置数据代入与告警发生时所对应的网元配置相关的对象关系中,可以得到如图14所示的网元配置相关数据,例如,图10中所示的“Port”为“网元A-card-1-port-1”,“workingMode”对应的查询内容为“上报端口类型告警的端口和对端的端口的光模块的工作模式”,在本实施例中,由图7可知,端口的告警类型为“ETH_LOS”,即查询内容为“上报ETH_LOS类型告警的端口和对端的端口的光模块的工作模式”,因此,与“Port”具有“workingMode”关系的“String”为“工作模式1”。
将KPI数据代入与告警对应的KPI相关的对象关系中,可以得到如图15所示的KPI相关数据,例如,图11中所示的“Port”为“网元A-card-1-port-1”,“noRxPower”对应的查询内容为“上报端口类型告警的端口和对端的端口的收光速率情况”,在本实施例中,由图7可知,端口的告警类型为“ETH_LOS”,即查询内容为“上报ETH_LOS类型告警的端口和对端的端口的收光速率情况”,因此,与“Port”具有“noRxPower”关系的“Boolean”为“TRUE”。
进一步地,为了便于管理和分析,可以将图12-15中的表格汇总为一张表格(未示出)。
由上述步骤确定与第一对象对应的第二对象、以及第一对象与第二对象之间的指向关系之后,可以进一步根据各个对象(包括第一对象和第二对象)、以及第一对象与第二对象之间的指向关系构建拓扑图。具体的,以每个第一对象和第二对象为节点,以第一对象与第二对象之间的指向关系为连线,该连线具有指向性,即根据第一对象与第二对象之间的指向关系,由发起指向的对象指向被指向的对象,从而构建拓扑图。例如,第一对象是“10000”,与其具有“has Type”关系的第二对象为“ETH_LOS”,那么,“10000”和“ETH_LOS”为两个节点,两者之间的连线为由“10000”指向“ETH_LOS”,连线的指向关系由关系“hasType”决定。又如,第一对象是“网元A”,与其具有“neNextToNe”关系的第二对象为“网元B”、“网元C”和“网元D”,那么,“网元A”、“网元B”、“网元C”和“网元D”为四个节点,其中,“网元A”与“网元B”、“网元A”与“网元C”、“网元A”与“网元D”之间的连线均为由“网元A”指向另一个对象,连线的指向关系由关系“neNextToNe”决定。
如图16所示,图16为本申请实施例提供的一种拓扑图的示意图,其上的节点以及连线与图12-15中的第一对象与第二对象的关系相对应。
得到第二对象、以及第一对象与第二对象之间的指示关系之后,就可以通过特征提取模块143对每个对象进行向量特征提取,在本实施例中,每个对象所要提取的向量特征包括入度向量特征、对象类型向量特征和告警类型向量特征,提取的过程具体如下:
入度(in degree)是图论算法中重要的概念之一,它通常指有向图(Directedgraphs)中某节点作为图中连线的终点的次数之和,而入度向量特征,就是指以入度为元素构建的向量特征。
在获取每个对象的入度向量特征时,首先需要计算每个对象的入度,然后以每个对象的入度为向量元素,确定每个对象的入度向量特征。例如,根据各个第一对象与第二对象的指向关系,可知,“网元E”仅作为“网元A”、“网元B”、“网元C”和“网元D”的第二对象,且分别与“网元A”、“网元B”、“网元C”和“网元D”具有“has Gate way”关系,可知,“网元A”、“网元B”、“网元C”和“网元D”均指向“网元E”,即“网元E”作为指向关系中的被指向对象的数量为4,如果对应至拓扑图中,则如16所示,“网元E”作为拓扑图中连线的终点的次数为4,因此,“网元E”的入度就是4,以4为向量元素,可以构建“网元E”的入度向量特征[4]。又如,根据各个第一对象与第二对象的指向关系,可知,“ETH_LOS”仅作为“10000”的第二对象,且与“10000”具有“hasName”关系,可知,“10000”指向“ETH_LOS”,即“ETH_LOS”作为指向关系中的被指向对象的数量为1,如果对应至拓扑图中,则如16所示,“ETH_LOS”作为拓扑图中连线的终点的次数为1,因此,“ETH_LOS”的入度就是1,以1为向量元素,可以构建“ETH_LOS”的入度向量特征[1]。
由图8-11可知,在预先建立的指示对象关系的规则中,一共定义了8种对象类型,即网元(NetworkElement)、告警标识符(Alarm)、单板(Card)、端口(Port)、告警类型(AlarmType)、布尔值(Boolean)、字符串(String)和浮点型(Float),可以用one-hot编码将指示类型的数据用数字的格式表示。例如,按照“NetworkElement、Alarm、Card、Port、AlarmType、Boolean、String、Float”的顺序,定义每一个对象所对应的对象类型为1,其余对象类型为0,以此为每一个对象对应的对象类型进行编码,例如对象对应的对象类型为“NetworkElement”,则该对象对应的编码为“10000000”。
确定每个对象对应的对象类型向量特征时,首先需要获取每个对象在对象关系中对应的对象类型,然后根据预存的对象类型与编码的对应关系,确定每个对象对应的编码,最后以每个对象对应的编码作为向量元素,确定每个对象的对象类型向量特征。
例如,对象“网元E”,其在对象关系中对应的对象类型为“NetworkElement”,因此,根据对象类型与编码的对应关系,可以确定“网元E”对应的编码为“10000000”,以“10000000”作为向量元素。因此对象“网元E”的对象类型向量特征为[10000000]。又如,对象“ETH_LOS”,其在对象关系中对应的对象类型为“AlarmType”,因此,根据对象类型与编码的对应关系,可以确定“AlarmType”对应的编码为“00001000”,以“00001000”作为向量元素。因此对象“ETH_LOS”的对象类型向量特征为[00001000]。
在本实施例中会预先定义一些告警类型,存储至网管***1的数据库中。为每个告警类型配置用于标识告警类型的参数(比如index)。,进一步的,用one-hot编码的方式将指示告警类型的数据转换为数字格式。比如,将告警类型按照顺序进行排序,以告警类型“ETH_LOS”排在第一位为例,以当前告警对应的告警类型显示index,其余告警类型为0,以此为当前告警对应的告警类型进行编码,如果当前告警对应的告警类型为“ETH_LOS”,则对应的index为1,那么,“ETH_LOS”对应的编码为“10…0”,其中,0的数量为84个。
确定每个对象对应的告警类型向量特征时,首先根据告警数据确定告警类型,然后根据预存的告警类型与编码的对应关系,确定这些告警类型对应的编码,最后以告警类型对应的编码作为每个对象的告警类型向量特征。
例如,在本实施例中,告警数据中仅包括一种告警类型,即“ETH_LOS”。根据预存的告警类型与编码的对应关系,“ETH_LOS”对应的index为1,其余告警类型对应的编码为0,则“ETH_LOS”对应的编码为“10…0”,其中,0的数量为84个。在一些实施例中,告警数据中还包括另一种告警类型,以告警“A”来表示,以“A”在告警的指定顺序中排在第二位为例,并且预存的告警类型与index的对应关系,“A”对应的index为1,除“ETH_LOS”和“A”以外的告警类型对应的编码为0,则这些告警类型对应的编码为“110…0”,其中,0的数量为83个。以告警类型对应的编码作为向量元素,就可以构建与“ETH_LOS”对应的告警类型向量特征[10…0],其中,0的数量为84个,构建与“ETH_LOS”和“A”对应的告警类型向量特征[110…0],其中,0的数量为83个。在本实施例中,告警类型向量特征属于全局特征,即所有对象同时具有相同的告警类型向量特征。
通过上述过程获得每个对象的各种向量特征之后,可以通过模型推理模块144将这些向量特征、以及第一对象与第二对象之间的指向关系作为参数,输入图卷积神经网络(Graph Convolutional Network,GCN)分类模型中,进行故障分类计算。
在本实施例中,首先将每个对象上的各种向量特征进行横向拼接,以得到最终的向量特征,以上文中节点“网元E”为例,“网元E”的入度向量特征为[4],“网元E”的对象类型向量特征为[10000000],“网元E”的告警类型向量特征为[10…0],其中,0的数量为84个,将三种向量特征进行横向拼接,可以得到“网元E”的向量特征[4100000010…0],其中,省略部分的0的数量为84个。
将每个第一对象和第二对象的向量特征,以及第一对象与第二对象之间的指向关系作为参数输入GCN分类模型中,对目标故障进行故障分类。在本实施例中,GCN分类模型为预先训练的分类模型,其可以以已知故障类型的故障数据作为样本,通过训练获得,通过GCN分类模型可以快速获得目标故障的故障类型。在输出目标故障的故障类型之后,可以继续将目标故障的训练数据及训练结果,即目标故障的故障数据和故障类型作为样本数据反向训练GCN分类模型,以完善该GCN分类模型,并通过结果输出模块145输出分类结果。
在获得目标故障的故障类型之后,就可以通过故障根因分析模块15,根据拓扑图和目标故障的故障类型来分析目标故障的故障根因,并进一步通过故障修复模块16根据故障根因,结合目标故障的故障数据,例如网元设备名称、物理位置资源ID、物理位置等有针对性地修复目标故障。
上述本申请提供的实施例中,分别从设备本身、以及从设备之间交互的角度对本申请提供的流表上传方法的各方案进行了介绍。可以理解的是,各个设备,例如上述网络设备和存储设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
例如,上述设备通过软件模块来实现相应的功能。
在一个实施例中,如图17所示,用于实现上述网管***1行为的功能的故障分类装置包括:接收模块001和处理模块002。
所述接收模块001用于获取与目标故障对应的多条告警数据,以及指示对象关系的规则,所述多条告警数据中的各条告警数据分别指示相应的第一对象,所述对象关系是指与所述告警数据指示的第一对象和与所述第一对象相关的第二对象之间的关系;
所述处理模块002用于根据所述告警数据以及所述指示对象关系的规则,确定所述第二对象,以及所述第一对象与所述第二对象之间的对象关系;
所述处理模块002还用于根据所述第一对象与所述第二对象之间的对象关系,确定每个对象的向量特征,所述对象包括所述第一对象和所述第二对象;
所述处理模块002还用于根据所述第一对象与所述第二对象之间的对象关系,以及所述每个对象的向量特征,确定所述目标故障的故障类型。
在一种实现方式中,所述接收模块001还用于获取与所述目标故障对应的告警的相关信息;
所述接收模块001还用于根据所述告警的相关信息,获取所述告警的相关参数;
所述处理模块002还用于确定告警数据,所述告警数据包括所述告警的相关信息和所述告警的相关参数。
在一种实现方式中,所述告警的相关信息包括所述告警的标识符、名称、对应物理位置的资源ID、对应的物理位置和/或对应的网元设备名称;所述告警的相关参数包括网络物理拓扑数据、网元配置数据和/或与网元相关的关键绩效指标数据。
在一种实现方式中,所述接收模块001还用于根据所述告警的相关信息和所述告警的相关参数,获取对应的指示对象关系的规则。
在一种实现方式中,所述处理模块002还用于确定所述告警的相关信息以及所述告警的相关参数所指示的第一对象;
所述处理模块002还用于根据所述指示对象关系的规则,确定与所述第一对象对应的第二对象;
所述处理模块002还用于确定所述第一对象与所述第二对象之间的对象关系,所述对象关系为所述指示对象关系的规则中所描述的指向关系。
在一种实现方式中,如果所述指示对象关系的规则为多个,且每个所述指示对象关系的规则对应所述告警的相关信息或者所述告警的相关参数,所述处理模块002在根据所述指示对象关系的规则,确定与所述第一对象对应的第二对象之前还用于确定与所述告警的相关信息或者与所述告警的相关参数对应的指示对象关系的规则。
在一种实现方式中,如果所述指示对象关系的规则为一个,且所述指示对象关系的规则对应所述告警的相关信息和所述告警的相关参数,所述处理模块002在根据所述指示对象关系的规则,确定与所述第一对象对应的第二对象之前还用于在所述指示对象关系的规则中确定与所述告警的相关信息或者与所述告警的相关参数对应的指示对象关系的规则。
在一种实现方式中,所述处理模块002还用于构建拓扑图,所述拓扑图指示所述每个对象、以及所述第一对象与所述第二对象之间的指向关系。
在一种实现方式中,所述每个对象的向量特征包括入度向量特征、对象类型向量特征和告警类型向量特征。
在一种实现方式中,所述处理模块002还用于计算所述每个对象的入度,所述入度是指所述每个对象在所对应的全部指向关系中作为被指向对象的总数;
所述处理模块002还用于以所述入度为向量元素,建立所述每个对象的入度向量特征。
在一种实现方式中,所述指示对象关系的规则包括每个对象的对象类型,所述处理模块002还用于获取所述每个对象在所确定的对象关系中对应的对象类型;
所述处理模块002还用于根据预存的对象类型与编码的对应关系,确定所述每个对象对应的编码;
所述处理模块002还用于以所述每个对象对应的编码作为向量元素,建立所述每个对象的对象类型向量特征。
在一种实现方式中,所述处理模块002还用于根据所述告警数据,确定告警类型;
所述处理模块002还用于根据预存的告警类型与编码的对应关系,确定所述告警类型对应的编码;
所述处理模块002还用于以所述告警类型对应的编码作为向量元素,建立所述每个对象的告警类型向量特征。
在一种实现方式中,所述处理模块002还用于横向拼接所述每个对象对应的各个向量特征,得到所述每个对象的向量特征。
本申请实施例还提供一种计算机存储介质,计算机存储介质中存储有计算机指令,当其在计算机上运行时,使得计算机执行上述各方面的方法。
本申请实施例还提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各方面的方法。
本申请还提供了一种芯片***。该芯片***包括处理器,用于支持上述装置或设备实现上述方面中所涉及的功能,例如,生成或处理上述方法中所涉及的信息。在一种可能的设计中,芯片***还包括存储器,用于保存上述装置或设备必要的程序指令和数据。该芯片***,可以由芯片构成,也可以包含芯片和其他分立器件。
以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (28)

1.一种故障分类方法,其特征在于,所述方法包括:
网管***获取与目标故障对应的多条告警数据,以及指示对象关系的规则,所述多条告警数据中的各条告警数据分别指示相应的第一对象,所述对象关系是指与所述告警数据指示的第一对象和与所述第一对象相关的第二对象之间的关系;
所述网管***根据所述告警数据以及所述指示对象关系的规则,确定所述第二对象,以及所述第一对象与所述第二对象之间的对象关系;
所述网管***根据所述第一对象与所述第二对象之间的对象关系,确定每个对象的向量特征,所述对象包括所述第一对象和所述第二对象;
所述网管***根据所述第一对象与所述第二对象之间的对象关系,以及所述每个对象的向量特征,确定所述目标故障的故障类型。
2.根据权利要求1所述的方法,其特征在于,所述网管***获取与目标故障对应的告警数据包括:
所述网管***获取与所述目标故障对应的告警的相关信息;
所述网管***根据所述告警的相关信息,获取所述告警的相关参数;
所述网管***确定告警数据,所述告警数据包括所述告警的相关信息和所述告警的相关参数。
3.根据权利要求2所述的方法,其特征在于,所述告警的相关信息包括所述告警的标识符、名称、对应物理位置的资源ID、对应的物理位置和/或对应的网元设备名称;所述告警的相关参数包括网络物理拓扑数据、网元配置数据和/或与网元相关的关键绩效指标数据。
4.根据权利要求2或3所述的方法,其特征在于,所述网管***获取所述指示对象关系的规则包括:
所述网管***根据所述告警的相关信息和所述告警的相关参数,获取对应的指示对象关系的规则。
5.根据权利要求2-4中任一所述的方法,其特征在于,所述网管***根据所述告警数据以及所述指示对象关系的规则,确定所述第二对象以及所述第一对象与所述第二对象之间的对象关系包括:
所述网管***确定所述告警的相关信息以及所述告警的相关参数所指示的第一对象;
所述网管***根据所述指示对象关系的规则,确定与所述第一对象对应的第二对象;
所述网管***确定所述第一对象与所述第二对象之间的对象关系,所述对象关系为所述指示对象关系的规则中所描述的指向关系。
6.根据权利要求5所述的方法,其特征在于,如果所述指示对象关系的规则为多个,且每个所述指示对象关系的规则对应所述告警的相关信息或者所述告警的相关参数,所述网管***在根据所述指示对象关系的规则,确定与所述第一对象对应的第二对象之前还包括:
所述网管***确定与所述告警的相关信息或者与所述告警的相关参数对应的指示对象关系的规则。
7.根据权利要求5所述的方法,其特征在于,如果所述指示对象关系的规则为一个,且所述指示对象关系的规则对应所述告警的相关信息和所述告警的相关参数,所述网管***在根据所述指示对象关系的规则,确定与所述第一对象对应的第二对象之前还包括:
所述网管***在所述指示对象关系的规则中确定与所述告警的相关信息或者与所述告警的相关参数对应的指示对象关系的规则。
8.根据权利要求1-7中任一所述的方法,其特征在于,所述方法还包括:
所述网管***构建拓扑图,所述拓扑图指示所述每个对象、以及所述第一对象与所述第二对象之间的指向关系。
9.根据权利要求1-8中任一所述的方法,其特征在于,所述每个对象的向量特征包括入度向量特征、对象类型向量特征和告警类型向量特征。
10.根据权利要求9所述的方法,其特征在于,所述网管***根据所述第一对象与所述第二对象之间的对象关系,确定每个对象的向量特征包括:
所述网管***计算所述每个对象的入度,所述入度是指所述每个对象在所对应的全部指向关系中作为被指向对象的总数;
所述网管***以所述入度为向量元素,建立所述每个对象的入度向量特征。
11.根据权利要求9或10所述的方法,其特征在于,所述指示对象关系的规则包括每个对象的对象类型,所述网管***根据所述第一对象与所述第二对象之间的对象关系,确定所述每个对象的向量特征包括:
所述网管***获取所述每个对象在所确定的对象关系中对应的对象类型;
所述网管***根据预存的对象类型与编码的对应关系,确定所述每个对象对应的编码;
所述网管***以所述每个对象对应的编码作为向量元素,建立所述每个对象的对象类型向量特征。
12.根据权利要求9-11中任一所述的方法,其特征在于,所述网管***根据所述第一对象与所述第二对象之间的对象关系,确定每个对象的向量特征包括:
所述网管***根据所述告警数据,确定告警类型;
所述网管***根据预存的告警类型与编码的对应关系,确定所述告警类型对应的编码;
所述网管***以所述告警类型对应的编码作为向量元素,建立所述每个对象的告警类型向量特征。
13.根据权利要求9-12中任一所述的方法,其特征在于,所述网管***根据所述第一对象与所述第二对象之间的对象关系,确定每个对象的向量特征包括:
所述网管***横向拼接所述每个对象对应的各个向量特征,得到所述每个对象的向量特征。
14.一种故障分类装置,其特征在于,所述装置包括:接收模块和处理模块;
所述接收模块用于获取与目标故障对应的多条告警数据,以及指示对象关系的规则,所述多条告警数据中的各条告警数据分别指示相应的第一对象,所述对象关系是指与所述告警数据指示的第一对象和与所述第一对象相关的第二对象之间的关系;
所述处理模块用于根据所述告警数据以及所述指示对象关系的规则,确定所述第二对象,以及所述第一对象与所述第二对象之间的对象关系;
所述处理模块还用于根据所述第一对象与所述第二对象之间的对象关系,确定每个对象的向量特征,所述对象包括所述第一对象和所述第二对象;
所述处理模块还用于根据所述第一对象与所述第二对象之间的对象关系,以及所述每个对象的向量特征,确定所述目标故障的故障类型。
15.根据权利要求14所述的装置,其特征在于,
所述接收模块还用于获取与所述目标故障对应的告警的相关信息;
所述接收模块还用于根据所述告警的相关信息,获取所述告警的相关参数;
所述处理模块还用于确定告警数据,所述告警数据包括所述告警的相关信息和所述告警的相关参数。
16.根据权利要求15所述的装置,其特征在于,所述告警的相关信息包括所述告警的标识符、名称、对应物理位置的资源ID、对应的物理位置和/或对应的网元设备名称;所述告警的相关参数包括网络物理拓扑数据、网元配置数据和/或与网元相关的关键绩效指标数据。
17.根据权利要求15或16所述的装置,其特征在于,
所述接收模块还用于根据所述告警的相关信息和所述告警的相关参数,获取对应的指示对象关系的规则。
18.根据权利要求15-17中任一所述的装置,其特征在于,
所述处理模块还用于确定所述告警的相关信息以及所述告警的相关参数所指示的第一对象;
所述处理模块还用于根据所述指示对象关系的规则,确定与所述第一对象对应的第二对象;
所述处理模块还用于确定所述第一对象与所述第二对象之间的对象关系,所述对象关系为所述指示对象关系的规则中所描述的指向关系。
19.根据权利要求18所述的装置,其特征在于,如果所述指示对象关系的规则为多个,且每个所述指示对象关系的规则对应所述告警的相关信息或者所述告警的相关参数,所述处理模块在根据所述指示对象关系的规则,确定与所述第一对象对应的第二对象之前还用于确定与所述告警的相关信息或者与所述告警的相关参数对应的指示对象关系的规则。
20.根据权利要求18所述的装置,其特征在于,如果所述指示对象关系的规则为一个,且所述指示对象关系的规则对应所述告警的相关信息和所述告警的相关参数,所述处理模块在根据所述指示对象关系的规则,确定与所述第一对象对应的第二对象之前还用于在所述指示对象关系的规则中确定与所述告警的相关信息或者与所述告警的相关参数对应的指示对象关系的规则。
21.根据权利要求14-20中任一所述的装置,其特征在于,
所述处理模块还用于构建拓扑图,所述拓扑图指示所述每个对象、以及所述第一对象与所述第二对象之间的指向关系。
22.根据权利要求14-21中任一所述的装置,其特征在于,所述每个对象的向量特征包括入度向量特征、对象类型向量特征和告警类型向量特征。
23.根据权利要求22所述的装置,其特征在于,
所述处理模块还用于计算所述每个对象的入度,所述入度是指所述每个对象在所对应的全部指向关系中作为被指向对象的总数;
所述处理模块还用于以所述入度为向量元素,建立所述每个对象的入度向量特征。
24.根据权利要求22或23所述的装置,其特征在于,所述指示对象关系的规则包括每个对象的对象类型,
所述处理模块还用于获取所述每个对象在所确定的对象关系中对应的对象类型;
所述处理模块还用于根据预存的对象类型与编码的对应关系,确定所述每个对象对应的编码;
所述处理模块还用于以所述每个对象对应的编码作为向量元素,建立所述每个对象的对象类型向量特征。
25.根据权利要求22-24中任一所述的装置,其特征在于,
所述处理模块还用于根据所述告警数据,确定告警类型;
所述处理模块还用于根据预存的告警类型与编码的对应关系,确定所述告警类型对应的编码;
所述处理模块还用于以所述告警类型对应的编码作为向量元素,建立所述每个对象的告警类型向量特征。
26.根据权利要求14-25中任一所述的装置,其特征在于,
所述处理模块还用于横向拼接所述每个对象对应的各个向量特征,得到所述每个对象的向量特征。
27.一种网管***,其特征在于,所述网管***包括存储器和处理器,所述存储器与所述处理器相耦合;所述存储器用于存储计算机程序代码/指令;当所述计算机程序代码/指令被所述处理器执行时,使得所述处理器执行权利要求1-13中任一所述的方法。
28.一种网络***,其特征在于,所述网络***包括网管***、网卡和至少一个网元,其中,所述至少一个网元通过所述网卡向所述网管***发送告警指令,所述网管***接收所述告警指令,并按照如权利要求1-13中任一所述的方法对目标故障进行故障分类。
CN202110180899.XA 2021-02-08 2021-02-08 一种故障分类方法、装置及*** Pending CN114911654A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110180899.XA CN114911654A (zh) 2021-02-08 2021-02-08 一种故障分类方法、装置及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110180899.XA CN114911654A (zh) 2021-02-08 2021-02-08 一种故障分类方法、装置及***

Publications (1)

Publication Number Publication Date
CN114911654A true CN114911654A (zh) 2022-08-16

Family

ID=82761986

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110180899.XA Pending CN114911654A (zh) 2021-02-08 2021-02-08 一种故障分类方法、装置及***

Country Status (1)

Country Link
CN (1) CN114911654A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117544482A (zh) * 2024-01-05 2024-02-09 北京神州泰岳软件股份有限公司 基于ai的运维故障确定方法、装置、设备和存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117544482A (zh) * 2024-01-05 2024-02-09 北京神州泰岳软件股份有限公司 基于ai的运维故障确定方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
CN110493042B (zh) 故障诊断方法、装置及服务器
CN110493025B (zh) 一种基于多层有向图的故障根因诊断的方法及装置
CN113254254B (zh) ***故障的根因定位方法、装置、存储介质及电子装置
CN113935497A (zh) 智能运维故障处理方法、装置、设备及其存储介质
CN113497726B (zh) 告警监控方法、***、计算机可读存储介质及电子设备
CN114579407B (zh) 一种因果关系检验和微服务指标预测报警方法
CN103840967A (zh) 一种电力通信网中故障定位的方法
CN112559237B (zh) 运维***排障方法、装置、服务器和存储介质
JP7442001B1 (ja) 水力発電ユニットの故障総合診断方法
CN104267346A (zh) 一种发电机励磁***故障远程诊断方法
CN115022153A (zh) 故障根因分析方法、装置、设备和存储介质
CN112379325A (zh) 一种用于智能电表的故障诊断方法及***
CN109995558A (zh) 故障信息处理方法、装置、设备及存储介质
CN114911654A (zh) 一种故障分类方法、装置及***
CN117034149A (zh) 故障处理策略确定方法、装置、电子设备和存储介质
Zhang et al. Root cause analysis of concurrent alarms based on random walk over anomaly propagation graph
CN116016150A (zh) 物理网络的预警方法、装置、电子设备、存储介质
CN109450103A (zh) 压板的状态检测方法、装置及智能终端
Wang et al. LSTM-based alarm prediction in the mobile communication network
CN115426246B (zh) 告警处理方法、装置、服务器及存储介质
CN110889614A (zh) 基于scada大数据的电网***重要用户供电风险分析方法
CN112488337B (zh) 一种智能辅助的检修流程分析方法及***
CN115150255B (zh) 一种自适应的基于知识图谱的应用故障自动根因定位方法
CN117610938B (zh) 建筑风险评估方法及***
CN117118804A (zh) 告警数据处理方法、装置和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination