CN109981331A - 一种故障诊断方法及装置 - Google Patents

一种故障诊断方法及装置 Download PDF

Info

Publication number
CN109981331A
CN109981331A CN201711466261.2A CN201711466261A CN109981331A CN 109981331 A CN109981331 A CN 109981331A CN 201711466261 A CN201711466261 A CN 201711466261A CN 109981331 A CN109981331 A CN 109981331A
Authority
CN
China
Prior art keywords
fault diagnosis
order
parameter
command
input parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711466261.2A
Other languages
English (en)
Inventor
孙振航
吴俊�
叶浩楠
包德伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Huawei Digital Technologies Co Ltd
Original Assignee
Beijing Huawei Digital Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Huawei Digital Technologies Co Ltd filed Critical Beijing Huawei Digital Technologies Co Ltd
Priority to CN201711466261.2A priority Critical patent/CN109981331A/zh
Publication of CN109981331A publication Critical patent/CN109981331A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/0636Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis based on a decision tree analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种故障诊断方法及装置,以解决现有技术中故障诊断效率低以及故障诊断结果准确性地的问题。所述方法包括:网管服务器根据存储的至少一条对应关系,建立至少一个故障诊断命令树,将建立的至少一个故障诊断命令树、存储的所述至少一条对应关系发送到所述网管服务器管理的设备;其中,每条对应关系包括故障诊断命令、该故障诊断命令运行需要的输入参数、该故障诊断命令运行后的输出参数、以及该故障诊断命令的运行结果所标识的故障诊断依据;每个故障诊断命令树中,最顶层故障诊断命令运行不需要输入参数的命令或输入参数为设定值的命令、且相邻两层故障诊断命令中下一级故障诊断命令运行需要的输入参数为上一级故障诊断命令运行后的输出参数。

Description

一种故障诊断方法及装置
技术领域
本申请涉及***运维领域,尤其涉及一种故障诊断方法及装置。
背景技术
为了向用户持续提供高质量、高可靠性的服务,网络***的规模日趋增大,使得网络***中包括的网元个数越来越多。虽然主动的、预防性的事前管理方法及技术(如***自愈技术、自主计算技术等)可以在一定程度上提高网络***的可靠性和可用性,但是随着时间的推移,网络***失效风险会不断累积,必将导致失效事件的发生。因此,针对网络***的面向问题单(ticket)的事后管理也是必不可少的,其中,问题单是指一种用于记录、处理、跟踪特定事件完成情况的数据载体。
目前,基于问题单的故障诊断方法通常根据当前客户反馈的故障问题描述,采用推荐算法从问题单库中为一线技术人员推荐历史上相似故障问题的故障诊断命令和故障诊断依据,一线技术人员根据所推荐的故障诊断命令以及故障诊断依据,确定当前客户反馈的故障问题对应的故障诊断命令,在故障设备上运行所确定的故障诊断命令,以确定当前客户反馈的故障问题的原因,其中,所述故障诊断命令为确定故障原因时所使用的命令,所述故障诊断依据为所述故障诊断命令的输出结果中用于表征故障原因的信息。
由于现有基于问题单的故障诊断方法中所推荐的故障诊断命令、故障诊断依据准确性取决于客户所反馈的故障问题描述的准确性,且一线技术人员根据推荐的故障诊断命令、故障诊断依据对客户所反馈的故障问题进行故障诊断时,技术人员个人的经验对故障诊断结果的准确度以及效率影响较大,导致故障诊断效率以及结果准确性低。
发明内容
本申请提供了一种故障诊断方法及装置,以解决现有技术中故障诊断效率以及结果准确性较低的问题。
第一方面,本申请提供了一种故障诊断方法,该方法包括:网管服务器根据存储的至少一条对应关系,建立至少一个故障诊断命令树,将建立的至少一个故障诊断命令树、存储的所述至少一条对应关系发送到所述网管服务器管理的设备;所述网管设备管理的设备在确定自身发生故障时,依次执行所述网管服务器发送的每个故障诊断命令树,并在执行每个故障诊断命令树时从最顶层故障诊断命令依次向下层故障诊断命令遍历,分别执行遍历到的每个故障诊断命令,直至执行到目标故障诊断命令为止,输出执行所述目标故障诊断命令后得到的运行结果所标识的第一故障诊断依据;其中,执行所述目标故障诊断命令后得到的运行结果所标识的第一故障诊断依据,与所述网管服务器发送的至少一条对应关系中所述目标故障诊断命令对应的第二故障诊断依据相同,每条对应关系包括故障诊断命令、该故障诊断命令运行需要的输入参数、该故障诊断命令运行后的输出参数、以及该故障诊断命令的运行结果所标识的故障诊断依据;每个故障诊断命令树中,最顶层故障诊断命令为运行时不需要输入参数的命令或输入参数为设定值的命令、且相邻两层故障诊断命令中下一级故障诊断命令运行需要的输入参数为上一级故障诊断命令运行后的输出参数。
通过上述方法,所述网管服务器管理的任意一个设备确定自身发生故障时,依次执行所述网管服务器发送的每个故障诊断命令树,并在执行每个故障诊断命令树时从最顶层故障诊断命令依次向下层故障诊断命令遍历,分别执行遍历到的每个故障诊断命令,直至执行到目标故障诊断命令为止,输出执行所述目标故障诊断命令后得到的运行结果所标识的第一故障诊断依据,其中,执行所述目标故障诊断命令后得到的运行结果所标识的第一故障诊断依据,与所述网管服务器发送的至少一条对应关系中所述目标故障诊断命令对应的第二故障诊断依据相同。由于所述网管服务器建立的每个故障诊断命令树中,最顶层故障诊断命令为运行时不需要输入参数的命令或者输入参数为设定值的命令、且相邻两层故障诊断命令中下一级故障诊断命令运行需要的输入参数为上一级故障诊断命令运行后的输出参数,使得所述网管服务器管理的设备发生故障时,可以自动执行所述网管服务器发送的每个故障诊断命令树,进行故障诊断,不需要技术人员的参与,且故障诊断结果与所述设备的故障信息的描述准确性无关,从而可以提高故障诊断的效率以及故障诊断结果的准确性,进而可以节约解决故障问题所需的时间。
一种可能的实施方式中,所述网管服务器根据存储的至少一条对应关系,建立至少一个故障诊断命令树之前,根据问题单库中的至少一个问题单以及用户命令手册,建立所述至少一个对应关系,其中,每个问题单至少包括诊断故障问题所使用的故障诊断命令以及该故障诊断命令的运行结果所标识的故障诊断依据。
一种可能的实施方式中,针对所述每个问题单中的任意一个,所述网管服务器提取该问题单中的故障诊断命令以及该故障诊断命令的运行结果所标识的故障诊断依据,并根据提取到的故障诊断命令查询用户命令手册,确定该故障诊断命令运行需要的输入参数以及运行后的输出参数,根据提取到的故障诊断命令、该故障诊断命令的运行结果所标识的故障诊断依据、该故障诊断命令运行需要的输入参数以及运行后的输出参数,建立一条对应关系。
一种可能的实施方式中,所述每个问题单中的故障诊断命令可以通过第一标识进行标识,该故障诊断命令的运行结果所标识的故障诊断依据可以通过第二标识进行标识。所述网管服务器提取所述每个问题单中的故障诊断命令以及该故障诊断命令的运行结果所标识的故障诊断依据时,通过查询所述第一标识以及所述第二标识,分别获取所述每个问题单中的故障诊断命令以及该故障诊断命令的运行结果所标识的故障诊断依据。
一种可能的实施方式中,所述每个对应关系中还可以包括故障诊断命令的解释说明和/或该故障诊断命令对应的功能模块,以便于技术人员对所述至少一个对应关系进行查看以及管理。
一种可能的实施方式中,所述网管服务器根据存储的至少一条对应关系,建立至少一个故障诊断命令树,具体方法可以包括以下步骤:
(1):针对待建立的每个故障诊断树,所述网管服务器在所述至少一条对应关系中随机选择一个第一故障诊断命令作为该待建立的故障诊断树的最底层故障诊断命令,并在所述至少一条对应关系中为所述第一故障诊断命令设置标签,所述标签表征第一故障诊断命令已被选择;
(2):所述网管服务器针对所述第一故障诊断命令的每个输入参数分别执行:
判断在所述至少一条对应关系中是否存在第二故障诊断命令,所述第二故障诊断命令未被设置所述标签、且运行后的输出参数为所述第一故障诊断命令的第一输入参数,所述第一输入参数为所述第一故障诊断命令的每个输入参数中的任意一个;
若存在,所述网管服务器将所述第二故障诊断命令作为所述第一故障诊断命令的一个上级故障诊断命令,并在所述至少一条对应关系中为所述第二故障诊断命令设置所述标签。
若不存在,所述网管服务器将用户命令手册中记录的多个命令中对应的输出参数为所述第一输入参数的命令,作为所述第一故障诊断命令的一个上级故障诊断命令。
以此类推,直至在所述至少一条对应关系中或在用户命令手册中找到第三故障诊断命令为止,所述第三故障诊断命令为不需要输入参数的命令或输入参数为设定值的命令,所述网管服务器将所述第三故障诊断命令作为该待建立的故障诊断树的最顶层故障诊断命令。
通过上述方法,所述网管服务器在根据存储的至少一条对应关系,建立至少一个故障诊断命令树过程中,在确定当前确定的故障诊断命令的上一级故障诊断命令时,优先从所述至少一个对应关系中查找当前确定的故障诊断命令的上一级故障诊断命令,并将建立故障诊断命令书时使用的所述至少一个故障诊断命令标记为已选择,使得建立的每个故障诊断命令树中尽可能包括多个所述至少一个对应关系中的故障诊断命令,且建立的每个故障诊断命令树中不包括所述至少一个对应关系中相同的故障诊断命令,可以减少需要建立的故障诊断命令树的个数,进而可以提高获取到所述至少一个对应关系以及所建立的至少一个故障诊断命令树的设备故障诊断的效率。
一种可能的实施方式中,所述网管服务器具体可以通过以下步骤确定在所述至少一条对应关系中存在第二故障诊断命令:
(1)所述网管服务器在所述至少一条对应关系中确定各个未被设置所述标签的故障诊断命令。
(2)所述网管服务器在所述用户命令手册中查找所述第一故障诊断命令的第一输入参数对应的第一参数说明,以及在所述用户命令手册中查找各个未被设置所述标签的故障诊断命令运行后的输出参数分别对应的第二参数说明。
(3)所述网管服务器根据所述第一参数说明以及各个未被设置所述标签的故障诊断命令运行后的输出参数分别对应的第二参数说明,确定与所述第一参数说明的相似度大于设定阈值的至少一个第二参数说明。
(4)所述网管服务器在确定出的至少一个第二参数说明分别对应的故障诊断命令中,选择一个故障诊断命令作为所述第二故障诊断命令。
一种可能的实施方式中,所述网管服务器分别将所述第一参数说明以及所述各个未被设置所述标签的故障诊断命令运行后的输出参数分别对应的第二参数说明划分为多个词,通过余弦算法或者基于神经网络的文本相似度检测算法确定所述第一参数说明与所述各个未被设置所述标签的故障诊断命令运行后的输出参数分别对应的第二参数说明中的任意一个第二参数说明的相似度。
一种可能的实施方式中,所述网管服务器通过以下步骤在确定出的至少一个第二参数说明分别对应的故障诊断命令中,选择一个故障诊断命令作为所述第二故障诊断命令:
(1)针对确定出的至少一个第二参数说明分别对应的故障诊断命令中的每个故障诊断命令,分别执行:
所述网管服务器确定第四故障诊断命令运行需要的输入参数的个数以及各个输入参数在用户命令手册中所有命令的输入参数中出现的次数;
所述网管服务器确定所述第一故障诊断命令的第一输入参数在所述用户命令手册中所有命令的输入参数中出现的次数;
所述网管服务器根据所述第四故障诊断命令运行需要的输入参数的个数以及各个输入参数在用户命令手册中所有命令的输入参数中出现的次数,以及所述第一故障诊断命令的第一输入参数在所述用户命令手册中所有命令的输入参数中出现的次数,确定所述第四故障诊断命令对应的参与建树复杂度系数;其中,所述第四故障诊断命令为所述至少一个第二参数说明分别对应的故障诊断命令中的任意一个。
(2)所述网管服务器在至少一个第二参数说明分别对应的故障诊断命令中选择参与建树复杂度系数最小的故障诊断命令作为所述第二故障诊断命令。
通过上述方法,所述网管服务器确定所述第一故障诊断命令的上一级故障诊断命令时,综合考虑了所述第一故障诊断命令的输入参数在所述用户命令手册中所有命令的输入参数中出现的次数,以及所述第二故障诊断命令的输入参数的个数及其各个输入参数在所述用户命令手册中所有命令的输入参数中出现的次数,选择参与建树复杂度系数最小的故障诊断命令作为所述第一故障诊断命令的上一级故障诊断命令,可以减少所建立的故障诊断命令树的复杂程度以及提高建立故障诊断命令树的效率,进而可以提高获取到所述至少一个对应关系以及所建立的至少一个故障诊断命令树的设备故障诊断的效率。
一种可能的实施方式中,可选地,所述网管服务器确定所述第四故障诊断命令对应的参与建树复杂度系数满足以下公式:
其中,xi表示所述第一输入参数,C(xi)表示所述xi在所述用户命令手册中所有命令的输入参数中出现的次数的归一化处理结果;
其中,|Ω|表示所述第四故障诊断命令的输入参数的个数;ε为大于0的常数;j表示所述第四故障诊断命令的输入参数的序号;C(yij)表示所述第四故障诊断命令的第j个输入参数yij在所述用户命令手册中所有命令的输入参数中出现的次数的归一化处理结果;所述γi为大于1的常数或者γi=C(yij)+c,i,j为正整数,c为大于或等于1的常数。
一种可能的实施方式中,若所述每个对应关系的中还包括故障诊断命令所属的功能模块,且所述任意一个设备确定自身故障所属的功能模块,则所述任意一个设备选择所述网管服务器发送的至少一个故障诊断命令树中包括所述故障所属的功能模块中命令的故障诊断命令树,依次执行所选择的故障诊断命令树,并在执行所选择的每个故障诊断命令树时从最顶层故障诊断命令依次向下层故障诊断命令遍历,分别执行遍历到的每个故障诊断命令,直至执行到目标故障诊断命令为止,以减少所述任意一个设备执行的故障诊断命令树的个数,进一步提高所述任意一个设备故障诊断的效率。
第二方面,本申请提供了一种网管服务器,所述网管服务器具有实现上述方法实例中网管服务器行为的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
一种可能的实施方式中,所述网管服务器的结构中包括处理单元和发送单元,这些单元可以执行上述方法示例中的相应功能,具体参见方法示例中的详细描述,此处不做赘述。
一种可能的实施方式中,所述网管服务器的结构中包括通信接口、存储器以及处理器,该处理器被配置为支持所述网管服务器执行上述方法中相应的功能。所述存储器与所述处理器耦合,其保存所述网管服务器必要的程序指令和数据。
第三方面,本申请提供了一种设备,所述设备具有实现上述方法实例中网管服务器所管理的设备行为的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
一种可能的实施方式中,所述设备的结构中包括接收单元和处理单元,这些单元可以执行上述方法示例中的相应功能,具体参见方法示例中的详细描述,此处不做赘述。
一种可能的实施方式中,所述设备的结构中包括通信接口、存储器以及处理器,该处理器被配置为支持所述设备执行上述方法中相应的功能。所述存储器与所述处理器耦合,其保存所述设备必要的程序指令和数据。
第四方面,本申请还提供了一种网络***,所述网络***包括上述第一方面所述的网管服务器以及所述网关服务器管理的至少一个设备。
第五方面,本申请还提供一种计算机存储介质,该存储介质中存储有软件程序,该软件程序在被一个或多个处理器读取并执行时可实现任一方面的任意一种设计提供的方法。
第六方面,本申请还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面中的任一种方法。
附图说明
图1为本申请实施例提供的故障诊断命令树的结构示意图;
图2为本申请实施例提供的一种网络***架构的示意图;
图3为本申请实施例提供的一种故障诊断方法的流程示意图;
图4为本申请实施例中建立故障诊断命令树时网管服务器确定上一级故障诊断命令的流程示意图;
图5为本申请实施例提供的一种故障诊断方法的示意图;
图6为本申请实施例提供的一种网管服务器的结构示意图;
图7为本申请实施例提供的一种设备的结构示意图;
图8为本申请实施例提供的一种网管服务器的结构示意图;
图9为本申请实施例提供的一种设备的结构示意图。
具体实施方式
为了解决现有技术中故障诊断结果准确性较低的问题,本申请提供了一种故障诊断方法及装置。其中,方法和装置是基于同一发明构思的,由于方法及装置解决问题的原理相似,因此装置与方法的实施可以相互参见,重复之处不再赘述。
以下,对本申请实施例中涉及的部分术语进行解释说明,以便于本领域技术人员理解。
(1)故障诊断命令树,包括至少一个故障诊断命令,其中,最顶层故障诊断命令为运行时不需要输入参数的命令或者输入参数为设定值的命令、且相邻两层故障诊断命令中下一级故障诊断命令运行需要的输入参数为上一级故障诊断命令运行后的输出参数,故障诊断命令树的每层包括一个或多个故障诊断命令。
例如,如图1所示的故障诊断命令树,故障诊断命令1和故障诊断命令2运行时均需要两个输入参数,故障诊断命令3~故障诊断命令6运行时均需要一个输入参数,故障诊断命令7~故障诊断命令9运行时均不需要输入参数,故障诊断命令7、故障诊断命令8以及故障诊断命令9为最顶层故障诊断命令,故障诊断命令1为该故障诊断命令树中最底层故障诊断命令。其中,故障诊断命令2的输出参数为故障诊断命令1的一个输入参数,故障诊断命令3的输出参数为故障诊断命令1的另一个输入参数,即故障诊断命令2和故障诊断命令3为故障诊断命令1的上一级故障诊断命令,同理故障诊断命令5和故障诊断命令6为故障诊断命令2的上一级故障诊断命令,故障诊断命令9为故障诊断命令6的上一级故障诊断命令,故障诊断命令8为故障诊断命令5的上一级故障诊断命令,故障诊断命令4为故障诊断命令3的上一级故障诊断命令,故障诊断命令7为故障诊断命令4的上一级故障诊断命令。
(2)用户命令手册,包括在设备运行环境中可对该设备进行配置以及状态查看的所有命令及其运行需要的输参数、运行后的输出参数的参数说明。
(3)问题单,至少包括故诊断故障问题时所使用的故障诊断命令和该故障诊断命令的运行结果中所标识的故障诊断依据,还可以包括该障问题描述、该故障诊断命令的输入参数值、该故障诊断命令的运行结果以及该故障问题的解决方法。
(4)多个,是指两个或两个以上。
另外,需要理解的是,在本申请描述中,“第一”、“第二”等词汇,仅用于区分描述,而不能理解为指示或暗示相对重要性,也不能理解为指示或暗示顺序。
为了更加清晰地描述本申请实施例的技术方案,下面结合附图,对本申请实施例提供的一种故障诊断方法及装置进行详细说明。
图2示出了本申请实施例提供的故障诊断方法适用的一种可能的网络***架构,所述网络***200包括网管服务器(即网络管理设备)201以及所述网管服务器管理的至少一个设备(网元)202。其中,网管服务器101用于对网络中的所述至少一个设备202进行控制和监视,以确保网络的正常运行;所述至少一个设备202为网络中能够独立完成特定功能的设备,例如计算机、路由器等。
可选地,所述网络***200可以是集中式***,由所述网管服务器201对所述至少一个设备202进行集中控制和统一管理,或者所述网络***200也可以是分布式***,即所述网络***200包括多个网管服务器201,每个网管服务器201分别负责不同的功能管理(如故障诊断、设备监控等)。
例如,所述网络***为光网络***,所述网管服务器201管理的设备202可以为、光网络终端(optical network terminal,ONT)、光线路终端(optical line terminal,OLT)、宽带远程接入服务器(broadband remote access server,BRAS)以及核心路由器(corerouter,CR)等。
基于上述网络***200,本申请提出了一种故障诊断方法,参阅图3所述,所述故障诊断方法具体包括以下步骤:
S301:所述网管服务器根据存储的至少一条对应关系,建立至少一个故障诊断命令树。
其中,每条对应关系包括故障诊断命令、该故障诊断命令运行需要的输入参数、该故障诊断命令运行后的输出参数、以及该故障诊断命令的运行结果所标识的故障诊断依据。该故障诊断命令运行后的输出参数为用户命令手册中该故障诊断命令的输出中能够为其它命令提供输入参数的参数。
实施中,若所述至少一条对应关系中任意一条包括的故障诊断命令对应的故障诊断依据为该故障诊断命令多次执行的输出结果不相同,那么在包括该故障诊断命令的故障诊断命令树中还需要标识该故障诊断命令的执行次数。
实施中,所述网管服务器根据存储的至少一条对应关系,建立至少一个故障诊断命令树之前,根据问题单库中的至少一个问题单以及用户命令手册,建立所述至少一个对应关系,其中,每个问题单至少包括诊断故障问题所使用的故障诊断命令以及该故障诊断命令的运行结果所标识的故障诊断依据。
具体地,针对所述每个问题单中的任意一个,所述网管服务器提取该问题单中的故障诊断命令以及该故障诊断命令的运行结果所标识的故障诊断依据,并根据提取到的故障诊断命令查询用户命令手册,确定该故障诊断命令运行需要的输入参数以及运行后的输出参数,根据提取到的故障诊断命令、该故障诊断命令的运行结果所标识的故障诊断依据、该故障诊断命令运行需要的输入参数以及运行后的输出参数,建立一条对应关系。
具体地,所述每个问题单中的故障诊断命令通过第一标识进行标识,该故障诊断命令的运行结果所标识的故障诊断依据通过第二标识进行标识,所述网管服务器提取所述每个问题单中的故障诊断命令以及该故障诊断命令的运行结果所标识的故障诊断依据时,通过查询所述第一标识以及所述第二标识,分别获取所述每个问题单中的故障诊断命令以及该故障诊断命令的运行结果所标识的故障诊断依据。
为了方便技术人员对所述至少一个对应关系进行查看以及管理,每个对应关系中还可以包括故障诊断命令的解释说明和/或该故障诊断命令所属的功能模块。
实施中,技术人员在网络***中的设备发生除所述问题单库中所记载的新故障问题后,建立针对该新故障问题的故障诊断过程建立新的问题单,并将新的问题单导入所述问题单库,使得所述网管服务器根据该新的问题单建立一条新的对应关系,并根据该新的对应关系以及存储的至少一个对应关系,重新建立至少一个故障诊断命令树。
例如,问题单中包括故障诊断命令以及故障诊断命令的运行结果所标识的故障诊断依据的部分如下所示:
异常回显:VC state:down
<910I_102>display mpls 12vc interface GigabitEtherner 0/2/7
*client interface:GigabitEtherner is up
session state:up
AC status:up
VC state:down
其中,“异常回显”为故障诊断命令的运行结果所标识的故障诊断依据的标识,即第二标识,“<910I_102>”为故障诊断命令的标识,即第一标识。所述网管服务器通过第一标识获得上述问题单中的故障诊断命令“display mpls 12vc interface”,通过第二标识获得故障诊断命令“display mpls 12vc interface”对应的故障诊断依据“VC state:down”。所述网管服务器根据获得的故障诊断命令“display mpls 12vc interface”查询所述用户命令手册,确定故障诊断命令“display mpls 12vc interface”的输入参数为interfacetype和interface-number,输出参数为TNL ID,且故障诊断命令“display mpls 12vcinterface”属于X功能模块。此时,所述网管服务器根据从上述问题单中获取到的信息,建立一条对应关系,如表1所示。
表1一条对应关系
其中,视图表示故障诊断命令对应的功能模块,正则表达式表示故障诊断命令运行结果所标识的故障诊断依据。
可选地,所述网管服务器根据存储的至少一条对应关系,建立至少一个故障诊断命令树,包括以下步骤:
A1:针对待建立的每个故障诊断树,所述网管服务器在所述至少一条对应关系中随机选择一个第一故障诊断命令作为该待建立的故障诊断树的最底层故障诊断命令,并在所述至少一条对应关系中为所述第一故障诊断命令设置标签,所述标签表征第一故障诊断命令已被选择;
A2:所述网管服务器针对所述第一故障诊断命令的每个输入参数分别执行:
i:判断在所述至少一条对应关系中是否存在第二故障诊断命令,所述第二故障诊断命令未被设置所述标签、且运行后的输出参数为所述第一故障诊断命令的第一输入参数,所述第一输入参数为所述第一故障诊断命令的每个输入参数中的任意一个。
ii:若存在,所述网管服务器将所述第二故障诊断命令作为所述第一故障诊断命令的一个上级故障诊断命令,并在所述至少一条对应关系中为所述第二故障诊断命令设置所述标签。
iii:若不存在,所述网管服务器将用户命令手册中记录的多个命令中对应的输出参数为所述第一输入参数的命令,作为所述第一故障诊断命令的一个上级故障诊断命令。
以此类推,直至在所述至少一条对应关系中或在用户命令手册中找到第三故障诊断命令为止,所述第三故障诊断命令为不需要输入参数的命令或输入参数为设定值的命令,所述网管服务器将所述第三故障诊断命令作为该待建立的故障诊断树的最顶层故障诊断命令。
通过上述方法,所述网管服务器在根据存储的至少一条对应关系,建立至少一个故障诊断命令树过程中,在确定当前确定的故障诊断命令的上一级故障诊断命令时,优先从所述至少一个对应关系中查找当前确定的故障诊断命令的上一级故障诊断命令,并将建立故障诊断命令书时使用的所述至少一个故障诊断命令标记为已选择,使得建立的每个故障诊断命令树中尽可能包括多个所述至少一个对应关系中的故障诊断命令,且建立的每个故障诊断命令树中不包括所述至少一个对应关系中相同的故障诊断命令,可以减少需要建立的故障诊断命令树的个数,进而可以提高获取到所述至少一个对应关系以及所建立的至少一个故障诊断命令树的设备故障诊断的效率。
可选地,所述网管服务器通过以下步骤确定在所述至少一条对应关系中存在第二故障诊断命令:
B1:所述网管服务器在所述至少一条对应关系中确定各个未被设置所述标签的故障诊断命令。
B2:所述网管服务器在所述用户命令手册中查找所述第一故障诊断命令的第一输入参数对应的第一参数说明,以及在所述用户命令手册中查找各个未被设置所述标签的故障诊断命令运行后的输出参数分别对应的第二参数说明。
B3:所述网管服务器根据所述第一参数说明以及各个未被设置所述标签的故障诊断命令运行后的输出参数分别对应的第二参数说明,确定与所述第一参数说明的相似度大于设定阈值的至少一个第二参数说明。
实施中,所述网管服务器分别将所述第一参数说明以及所述各个未被设置所述标签的故障诊断命令运行后的输出参数分别对应的第二参数说明划分为多个词,通过余弦算法或者基于神经网络的文本相似度检测算法确定所述第一参数说明与所述各个未被设置所述标签的故障诊断命令运行后的输出参数分别对应的第二参数说明中的任意一个第二参数说明的相似度。
例如,所述用户命令手册中第一故障诊断命令“display tunnel-info”的输入参数“tunnel-id”的说明如表2所示:
表2输入参数说明
根据表2可知输入参数“tunnel-id”的说明为“tunnel-id隧道ID”(其中ID为identification(标识)的缩写),将输入参数“tunnel-id”的说明划分为多个词,得到“tunnel-id”、“隧道”和“ID”这3个词。所述用户命令手册中第二故障诊断命令“displaympls 12vc”的输出参数“TNL ID”的说明如表3所示:
表3输出参数说明
根据表3可知输出参数“TNL ID”的说明为“TNL ID该PW使用的隧道ID”,将输出参数“TNL ID”的说明划分为多个词,得到“TNL”、“ID”、“该”、“PW”、“使用”、“的”、“隧道”和“ID”这8个词。其中,“TNL”以及“PW”为所述用户命令手册中对不同参数定义的名称。
具体地,若采用余弦算法,所述网管服务器确定的所述第一参数说明与所述各个未被设置所述标签的故障诊断命令运行后的输出参数分别对应的第二参数说明中的任意一个第二参数说明的相似度sim满足以下公式:
其中,a1为根据集合S1与集合S确定的向量,若所述集合S1中任意一个元素在所述集合S中出现,则a1中所述集合S1中任意一个元素对应的元素取值为1,若所述集合S1中任意一个元素没有在所述集合S中出现,则a1中所述集合S1中任意一个元素对应的元素取值为0;a2为根据集合S2与集合S确定的向量,若所述集合S2中任意一个元素在所述集合S中出现,则a2中所述集合S2中任意一个元素对应的元素取值为1,若所述集合S2中任意一个元素没有在所述集合S中出现,则a2中所述集合S2中任意一个元素对应的元素取值为0;所述集合S1为所述第一参数说明分词处理后得到的多个词的集合,所述集合S2为任意一个所述第二参数说明分词处理后得到的多个词的集合,所述集合S为所述集合S1与集合S2的并集。
具体地,若采用基于神经网络的文本相似度检测算法,所述网管服务器确定的所述第一参数说明与所述各个未被设置所述标签的故障诊断命令运行后的输出参数分别对应的第二参数说明中的任意一个第二参数说明的相似度sim满足以下公式:
其中,w=argmax∑slogp(s|context(s)),context(s)表示词s的上文,p(s|context(s)表示上文为context(s)下文为s的概率,集合B1为所述集合S1中每个词通过公式w=argmax∑slogp(s|context(s))映射后得到的所述集合S1中每个词对应的w的集合,集合B2为所述集合S2中每个词通过公式w=argmax∑slogp(s|context(s))映射后得到的所述集合S2中每个词对应的w的集合,当w∈B1时,dist(w,B2)表示所述集合B1中元素w与集合B2中元素的距离,当w∈B2时,dist(w,B1)表示所述集合B2中元素w与集合B1中元素的距离,dim(B1)表示所述集合B1中包括的元素的个数,dim(B2)表示所述集合B2中包括的元素的个数,s为集合S1或集合S2中的任意一个词。
B4:所述网管服务器在确定出的至少一个第二参数说明分别对应的故障诊断命令中,选择一个故障诊断命令作为所述第二故障诊断命令。
可选地,所述网管服务器通过以下步骤在确定出的至少一个第二参数说明分别对应的故障诊断命令中,选择一个故障诊断命令作为所述第二故障诊断命令:
C1:针对确定出的至少一个第二参数说明分别对应的故障诊断命令中的每个故障诊断命令,分别执行:
i:所述网管服务器确定第四故障诊断命令运行需要的输入参数的个数以及各个输入参数在用户命令手册中所有命令的输入参数中出现的次数;
ii:所述网管服务器确定所述第一故障诊断命令的第一输入参数在所述用户命令手册中所有命令的输入参数中出现的次数。
iii:所述网管服务器根据所述第四故障诊断命令运行需要的输入参数的个数以及各个输入参数在用户命令手册中所有命令的输入参数中出现的次数,以及所述第一故障诊断命令的第一输入参数在所述用户命令手册中所有命令的输入参数中出现的次数,确定所述第四故障诊断命令对应的参与建树复杂度系数。
其中,所述第四故障诊断命令为所述至少一个第二参数说明分别对应的故障诊断命令中的任意一个。
C2:所述网管服务器在至少一个第二参数说明分别对应的故障诊断命令中选择参与建树复杂度系数最小的故障诊断命令作为所述第二故障诊断命令。
实施中,所述网管服务器通过上述步骤C1~C2确定所述第一故障诊断命令的上一级故障诊断命令时,综合考虑了所述第一故障诊断命令的输入参数在所述用户命令手册中所有命令的输入参数中出现的次数,以及所述第二故障诊断命令的输入参数的个数及其各个输入参数在所述用户命令手册中所有命令的输入参数中出现的次数,选择参与建树复杂度系数最小的故障诊断命令作为所述第一故障诊断命令的上一级故障诊断命令,可以减少所建立的故障诊断命令树的复杂程度以及提高建立故障诊断命令树的效率,进而可以提高获取到所述至少一个对应关系以及所建立的至少一个故障诊断命令树的设备故障诊断的效率。可选地,所述网管服务器确定所述第四故障诊断命令对应的参与建树复杂度系数满足以下公式:
其中,xi表示所述第一输入参数,C(xi)表示所述xi在所述用户命令手册中所有命令的输入参数中出现的次数的归一化处理结果;
其中,|Ω|表示所述第四故障诊断命令的输入参数的个数;ε为大于0的常数;j表示所述第四故障诊断命令的输入参数的序号;C(yij)表示所述第四故障诊断命令的第j个输入参数yij在所述用户命令手册中所有命令的输入参数中出现的次数的归一化处理结果;所述γi为大于1的常数或者γi=C(yij)+1,i,j为正整数。
具体地,C(xi)为所述xi在所述用户命令手册中所有命令的输入参数中出现的次数与所述用户命令手册中所有命令的输入参数出现的次数之和的比值,C(yij)为所述yij在所述用户命令手册中所有命令的输入参数中出现的次数与所述用户命令手册中所有命令的输入参数出现的次数之和的比值。
例如,如图4所示,所述网管服务器在建立故障诊断命令树的过程中,针对故障诊断命令A的一个输入参数a,确定所述至少一条对应关系中故障诊断命令B与故障诊断命令C的输出参数中都包括参数a。所述网管服务器根据上述计算参与建树复杂度系数公式,分别确定故障诊断命令B与故障诊断命令C对应的参与建树复杂度系数选择参与建树复杂度系数最小的故障诊断命B作为故障诊断命令A的上一级故障诊断命令。
可选地,在建立故障诊断命令树的过程中,所述网管服务器确定所述至少一条对应关系中不存在输出参数为当前确定的故障诊断命令的输入参数的故障诊断命令时,,针对该当前确定的故障诊断命令的第二输入参数,若所述第二输入参数在所述用户手册中所有命令的输入参数中出现的次数小于设定次数,则所述网管服务器可以停止确定该当前确定的故障诊断命令的上一级命令,并输出该当前确定的故障诊断命令,使得有经验的技术人员确定输出的故障诊断命令的上一级命令,直至在所述至少一条对应关系中或在用户命令手册中找到所述第三故障诊断命令为止,并将所确定的该输出的故障诊断命令的上一级命令、该输出的故障诊断命令的上一级命令到所述第三故障诊断命令之间的各级故障诊断命令以及所述第三故障诊断命令依次输入到所述网管服务器中,得到一个故障诊断命令树,进而达到减小所述网管服务器的负担以及提高建立故障诊断命令树的效率的目的。实施中,当所述网管服务器确定在所述至少一条对应关系中不存在第二故障诊断命令时,从所述用户命令手册中记录的多个命令中确定对应的输出参数为所述第一输入参数的命令方法,与所述网管服务器从所述至少一条对应关系中确定各个未被设置所述标签的故障诊断命令中确定所述第一故障诊断命令的上一级命令的方法类似,此处不再赘述,参见上述所述网管服务器从所述至少一条对应关系中确定各个未被设置所述标签的故障诊断命令中确定所述第一故障诊断命令的上一级命令的方法相关描述。
S302:所述网管服务器将建立的至少一个故障诊断命令树、存储的所述至少一条对应关系发送到所述网管设备管理的设备。
其中,每个故障诊断命令树中,最顶层故障诊断命令为运行时不需要输入参数的命令或输入参数为设定值的命令、且相邻两层故障诊断命令中下一级故障诊断命令运行需要的输入参数为上一级故障诊断命令运行后的输出参数。
一个具体的实施方式中,输入参数为设定值的命令可以为技术人员配置设定输入参数值的命令,也可以为输入参数为默认值的命令。
可选地,所述网管服务器建立所述至少一个故障诊断命令树之后,将建立的至少一个故障诊断命令树、存储的所述至少一条对应关系发送到各个被管理的设备。或者,所述网管服务器建立所述至少一个故障诊断命令树之后,若接收到所述网管服务器管理的任意一个设备发送的所述任意一个设备的故障信息,则将建立的至少一个故障诊断命令树、存储的所述至少一条对应关系发送到所述任意一个设备。
实施中,所述建立所述至少一个故障诊断命令树之后,保存所建立的至少一个故障诊断命令树。
S303:所述网管服务器管理的任意一个设备在确定自身发生故障时,依次执行所述网管服务器发送的每个故障诊断命令树,并在执行每个故障诊断命令树时从最顶层故障诊断命令依次向下层故障诊断命令遍历,分别执行遍历到的每个故障诊断命令,直至执行到目标故障诊断命令为止。
其中,执行所述目标故障诊断命令后得到的运行结果所标识的第一故障诊断依据,与所述网管服务器发送的至少一条对应关系中所述目标故障诊断命令对应的第二故障诊断依据相同。
具体地,若所述每个对应关系的中还包括故障诊断命令所属的功能模块,且所述任意一个设备确定自身故障所属的功能模块,则所述任意一个设备选择所述网管服务器发送的至少一个故障诊断命令树中包括所述故障所属的功能模块中命令的故障诊断命令树,依次执行所选择的故障诊断命令树,并在执行所选择的每个故障诊断命令树时从最顶层故障诊断命令依次向下层故障诊断命令遍历,分别执行遍历到的每个故障诊断命令,直至执行到目标故障诊断命令为止,可以减少所述任意一个设备执行的故障诊断命令树的个数,进一步提高所述任意一个设备故障诊断的效率。
S304:所述任意一个设备输出执行所述目标故障诊断命令后得到的运行结果所标识的第一故障诊断依据。
本申请实施例提供的故障诊断方法的实施过程也可以参见图5所示,其中,所述网管服务器根据存储的至少一条对应关系,建立至少一个故障诊断命令树的方法,参见上述步骤S301的相关描述,所述网管服务器管理的设备根据所述网管设备发送的至少一条对应关系以及所述至少一个故障诊断命令树进行故障诊断的方法,参见上述步骤S303以及S304的相关描述,此处不再赘述。其中,图5中以光网络中的网管服务器为例,所述网管服务器管理的设备包括ONT、OLT、BRAS以及CR等,图5的光网络***中仅示出了所述网管服务器管理的部分网元。
采用本申请实施例提供的故障诊断方法,网管服务器根据存储的至少一条对应关系,建立至少一个故障诊断命令树,将建立的至少一个故障诊断命令树和存储的所述至少一条对应关系发送到各个被管理的设备,其中,每条对应关系包括故障诊断命令、该故障诊断命令运行需要的输入参数、该故障诊断命令运行后的输出参数、以及该故障诊断命令的运行结果所标识的故障诊断依据,每个故障诊断命令树中,最顶层故障诊断命令运行为不需要输入参数的命令或输入参数为设定值的命令、且相邻两层故障诊断命令中下一级故障诊断命令运行需要的输入参数为上一级故障诊断命令运行后的输出参数;当所述网管服务器管理的任意一个设备确定自身发生故障时,依次执行所述网管服务器发送的每个故障诊断命令树,并在执行每个故障诊断命令树时从最顶层故障诊断命令依次向下层故障诊断命令遍历,分别执行遍历到的每个故障诊断命令,直至执行到目标故障诊断命令为止,输出执行所述目标故障诊断命令后得到的运行结果所标识的第一故障诊断依据,其中,执行所述目标故障诊断命令后得到的运行结果所标识的第一故障诊断依据,与所述网管服务器发送的至少一条对应关系中所述目标故障诊断命令对应的第二故障诊断依据相同。由于所述网管服务器建立的每个故障诊断命令树中,最顶层故障诊断命令为运行时不需要输入参数的命令或者输入参数为设定值、且相邻两层故障诊断命令中下一级故障诊断命令运行需要的输入参数为上一级故障诊断命令运行后的输出参数,使得所述网管服务器管理的设备发生故障时,可以自动执行所述网管服务器发送的每个故障诊断命令树,进行故障诊断,不需要技术人员的参与,且故障诊断结果与所述设备的故障信息的描述准确性无关,从而可以提高故障诊断的效率以及故障诊断结果的准确性,进而可以节约解决故障问题所需的时间。
基于以上实施例,本申请实施例提供了一种网管服务器,所述网管服务器应用于如图2所示的网络***,用于实现如图3所示的故障诊断方法中网管服务器的功能。参阅图6所示,所述网管服务器600包括:处理单元601和发送单元602。
所述处理单元601,用于根据存储的至少一条对应关系,建立至少一个故障诊断命令树。其中,每条对应关系包括故障诊断命令、该故障诊断命令运行需要的输入参数、该故障诊断命令运行后的输出参数、以及该故障诊断命令的运行结果所标识的故障诊断依据;每个故障诊断命令树中,最顶层故障诊断命令为运行时不需要输入参数的命令或者输入参数为设定值的命令、且相邻两层故障诊断命令中下一级故障诊断命令运行需要的输入参数为上一级故障诊断命令运行后的输出参数。
所述发送单元602,用于将所述处理单元601建立的至少一个故障诊断命令树、存储的所述至少一条对应关系发送到所述网管服务器管理的设备。
可选地,所述处理单元601还用于:在根据存储的至少一条对应关系以及用户命令手册,建立至少一个故障诊断命令树之前,根据问题单库中的至少一个问题单以及用户命令手册,建立所述至少一个对应关系,其中,每个问题单至少包括诊断故障问题所使用的故障诊断命令以及该故障诊断命令的运行结果所标识的故障诊断依据。
可选地,所述处理单元601在根据问题单库中的至少一个问题单,建立所述至少一个对应关系时,具体用于:针对所述每个问题单中的任意一个,提取该问题单中的故障诊断命令以及该故障诊断命令的运行结果所标识的故障诊断依据,并根据提取到的故障诊断命令查询用户命令手册,确定该故障诊断命令运行需要的输入参数以及运行后的输出参数,根据提取到的故障诊断命令、该故障诊断命令的运行结果所标识的故障诊断依据、该故障诊断命令运行需要的输入参数以及运行后的输出参数,建立一条对应关系。
可选地,所述处理单元601在根据存储的至少一条对应关系,建立至少一个故障诊断命令树时,具体用于:
针对待建立的每个故障诊断树,在所述至少一条对应关系中随机选择一个第一故障诊断命令作为该待建立的故障诊断树的最底层故障诊断命令,并在所述至少一条对应关系中为所述第一故障诊断命令设置标签,所述标签表征第一故障诊断命令已被选择;
针对所述第一故障诊断命令的每个输入参数分别执行:
判断在所述至少一条对应关系中是否存在第二故障诊断命令,所述第二故障诊断命令未被设置所述标签、且运行后的输出参数为所述第一故障诊断命令的第一输入参数,所述第一输入参数为所述第一故障诊断命令的每个输入参数中的任意一个;
若存在,将所述第二故障诊断命令作为所述第一故障诊断命令的一个上级故障诊断命令,并在所述至少一条对应关系中为所述第二故障诊断命令设置所述标签;
若不存在,将用户命令手册中记录的多个命令中对应的输出参数为所述第一输入参数的命令,作为所述第一故障诊断命令的一个上级故障诊断命令;
以此类推,直至在所述至少一条对应关系中或在用户命令手册中找到第三故障诊断命令为止,所述第三故障诊断命令为不需要输入参数的命令或输入参数为设定值的命令,将所述第三故障诊断命令作为该待建立的故障诊断树的最顶层故障诊断命令。
可选地,所述处理单元601在确定在所述至少一条对应关系中存在第二故障诊断命令时,具体用于:
在所述至少一条对应关系中确定各个未被设置所述标签的故障诊断命令;
在所述用户命令手册中查找所述第一故障诊断命令的第一输入参数对应的第一参数说明,以及在所述用户命令手册中查找各个未被设置所述标签的故障诊断命令运行后的输出参数分别对应的第二参数说明;
根据所述第一参数说明以及各个未被设置所述标签的故障诊断命令运行后的输出参数分别对应的第二参数说明,确定与所述第一参数说明的相似度大于设定阈值的至少一个第二参数说明;
在确定出的至少一个第二参数说明分别对应的故障诊断命令中,选择一个故障诊断命令作为所述第二故障诊断命令。
可选地,所述处理单元601在确定出的至少一个第二参数说明分别对应的故障诊断命令中,选择一个故障诊断命令作为所述第二故障诊断命令时,具体用于:
针对确定出的至少一个第二参数说明分别对应的故障诊断命令中的每个故障诊断命令,分别执行:
确定第四故障诊断命令运行需要的输入参数的个数以及各个输入参数在用户命令手册中所有命令的输入参数中出现的次数;
确定所述第一故障诊断命令的第一输入参数在所述用户命令手册中所有命令的输入参数中出现的次数;
根据所述第四故障诊断命令运行需要的输入参数的个数以及各个输入参数在用户命令手册中所有命令的输入参数中出现的次数,以及所述第一故障诊断命令的第一输入参数在所述用户命令手册中所有命令的输入参数中出现的次数,确定所述第四故障诊断命令对应的参与建树复杂度系数;
其中,所述第四故障诊断命令为所述至少一个第二参数说明分别对应的故障诊断命令中的任意一个;
在至少一个第二参数说明分别对应的故障诊断命令中选择参与建树复杂度系数最小的故障诊断命令作为所述第二故障诊断命令。
可选地,所述处理单元601确定的所述第四故障诊断命令对应的参与建树复杂度系数满足以下公式:
其中,xi表示所述第一输入参数,C(xi)表示所述xi在所述用户命令手册中所有命令的输入参数中出现的次数的归一化处理结果;
其中,|Ω|代表所述第四故障诊断命令的输入参数的个数;ε为大于0的常数;j代表所述第四故障诊断命令的输入参数的序号;C(yij)表示所述第四故障诊断命令的第j个输入参数yij在所述用户命令手册中所有命令的输入参数中出现的次数的归一化处理结果;所述γi为大于1的常数或者γi=C(yij)+c,i,j为正整数,c为大于或等于1的整数。
需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。在本申请的实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
基于以上实施例,本申请实施例还提供了一种网管服务器,所述网管服务器用于实现如图3所示的故障诊断方法,具有如图6所示的网管服务器600的功能。参阅图7所示,所述网管服务器700包括:存储器701、处理器802和通信接口703。处理器702与存储器701、通信接口703相互连接。
所述存储器701,用于存储程序指令以及至少一个对应关系,其中,每条对应关系包括故障诊断命令、该故障诊断命令运行需要的输入参数、该故障诊断命令运行后的输出参数、以及该故障诊断命令的运行结果所标识的故障诊断依据。
所述处理器702,用于调用所述存储器701中存储的指令,执行:根据所述存储器701存储的至少一个根据存储的至少一条对应关系,建立至少一个故障诊断命令树;以及控制所述通信接口703将建立的至少一个故障诊断命令树、存储的所述至少一条对应关系发送到所述网管服务器管理的设备;其中,每个故障诊断命令树中,最顶层故障诊断命令为运行不需要输入参数的命令或者输入参数为设定值的命令、且相邻两层故障诊断命令中下一级故障诊断命令运行需要的输入参数为上一级故障诊断命令运行后的输出参数。
所述通信接口703,用于在所述处理器702控制下将建立的至少一个故障诊断命令树、存储的所述至少一条对应关系发送到所述网管服务器管理的设备。
上述存储器701可以包括易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器也可以包括非易失性存储器(non-volatilememory),例如快闪存储器(flash memory,也称闪存),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);所述存储器701还可以包括上述种类的存储器的组合。
上述处理器702可以是中央处理器(central processing unit,CPU),网络处理器(network processor,NP)或者CPU和NP的组合。所述处理器702还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(application-specific integrated circuit,ASIC),可编程逻辑器件(programmable logic device,PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complex programmable logic device,CPLD),现场可编程逻辑门阵列(field-programmable gate array,FPGA),通用阵列逻辑(generic array logic,GAL)或其任意组合。
一种可实现的方案中,所述处理器702与所述存储器701、所述通信接口703可以通过总线706相互连接。所述总线706可以是外设部件互连标准(peripheral componentinterconnect,PCI)总线或扩展工业标准结构(extended industry standardarchitecture,EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
具体地,所述存储器701可能包含RAM,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
可选地,所述处理器702还用于:在根据存储的至少一条对应关系,建立至少一个故障诊断命令树之前,根据问题单库中的至少一个问题单以及用户命令手册,建立所述至少一个对应关系,其中,每个问题单至少包括诊断故障问题所使用的故障诊断命令以及该故障诊断命令的运行结果所标识的故障诊断依据。可选地,所述存储器701还用于存储所述问题单库。
可选地,所述处理器702在根据问题单库中的至少一个问题单,建立所述至少一个对应关系时,具体用于:针对所述每个问题单中的任意一个,提取该问题单中的故障诊断命令以及该故障诊断命令的运行结果所标识的故障诊断依据,并根据提取到的故障诊断命令查询用户命令手册,确定该故障诊断命令运行需要的输入参数以及运行后的输出参数,根据提取到的故障诊断命令、该故障诊断命令的运行结果所标识的故障诊断依据、该故障诊断命令运行需要的输入参数以及运行后的输出参数,建立一条对应关系。
可选地,所述处理器702在根据存储的至少一条对应关系,建立至少一个故障诊断命令树时,具体用于:
针对待建立的每个故障诊断树,在所述至少一条对应关系中随机选择一个第一故障诊断命令作为该待建立的故障诊断树的最底层故障诊断命令,并在所述至少一条对应关系中为所述第一故障诊断命令设置标签,所述标签表征第一故障诊断命令已被选择;
针对所述第一故障诊断命令的每个输入参数分别执行:
判断在所述至少一条对应关系中是否存在第二故障诊断命令,所述第二故障诊断命令未被设置所述标签、且运行后的输出参数为所述第一故障诊断命令的第一输入参数,所述第一输入参数为所述第一故障诊断命令的每个输入参数中的任意一个;
若存在,将所述第二故障诊断命令作为所述第一故障诊断命令的一个上级故障诊断命令,并在所述至少一条对应关系中为所述第二故障诊断命令设置所述标签;
若不存在,将用户命令手册中记录的多个命令中对应的输出参数为所述第一输入参数的命令,作为所述第一故障诊断命令的一个上级故障诊断命令;
以此类推,直至在所述至少一条对应关系中或在用户命令手册中找到第三故障诊断命令为止,所述第三故障诊断命令为不需要输入参数的命令或输入参数为设定值的命令,将所述第三故障诊断命令作为该待建立的故障诊断树的最顶层故障诊断命令。
可选地,所述处理器702在确定在所述至少一条对应关系中存在第二故障诊断命令时,具体用于:
在所述至少一条对应关系中确定各个未被设置所述标签的故障诊断命令;
在所述用户命令手册中查找所述第一故障诊断命令的第一输入参数对应的第一参数说明,以及在所述用户命令手册中查找各个未被设置所述标签的故障诊断命令运行后的输出参数分别对应的第二参数说明;
根据所述第一参数说明以及各个未被设置所述标签的故障诊断命令运行后的输出参数分别对应的第二参数说明,确定与所述第一参数说明的相似度大于设定阈值的至少一个第二参数说明;
在确定出的至少一个第二参数说明分别对应的故障诊断命令中,选择一个故障诊断命令作为所述第二故障诊断命令。
可选地,所述处理器702在确定出的至少一个第二参数说明分别对应的故障诊断命令中,选择一个故障诊断命令作为所述第二故障诊断命令时,具体用于:
针对确定出的至少一个第二参数说明分别对应的故障诊断命令中的每个故障诊断命令,分别执行:
确定第四故障诊断命令运行需要的输入参数的个数以及各个输入参数在用户命令手册中所有命令的输入参数中出现的次数;
确定所述第一故障诊断命令的第一输入参数在所述用户命令手册中所有命令的输入参数中出现的次数;
根据所述第四故障诊断命令运行需要的输入参数的个数以及各个输入参数在用户命令手册中所有命令的输入参数中出现的次数,以及所述第一故障诊断命令的第一输入参
数在所述用户命令手册中所有命令的输入参数中出现的次数,确定所述第四故障诊断命令对应的参与建树复杂度系数;
其中,所述第四故障诊断命令为所述至少一个第二参数说明分别对应的故障诊断命令中的任意一个;
在至少一个第二参数说明分别对应的故障诊断命令中选择参与建树复杂度系数最小的故障诊断命令作为所述第二故障诊断命令。
可选地,所述处理器702确定的所述第四故障诊断命令对应的参与建树复杂度系数满足以下公式:
其中,xi表示所述第一输入参数,C(xi)表示所述xi在所述用户命令手册中所有命令的输入参数中出现的次数的归一化处理结果;
其中,|Ω|代表所述第四故障诊断命令的输入参数的个数;ε为大于0的常数;j代表所述第四故障诊断命令的输入参数的序号;C(yij)表示所述第四故障诊断命令的第j个输入参数yij在所述用户命令手册中所有命令的输入参数中出现的次数的归一化处理结果;所述γi为大于1的常数或者γi=C(yij)+c,i,j为正整数,c为大于或等于1的常数。
本申请实施例提供的网管服务器根据存储的至少一条对应关系,建立至少一个故障诊断命令树,将建立的至少一个故障诊断命令树、存储的所述至少一条对应关系发送到所述网管服务器管理的设备。由于所述网管服务器建立的每个故障诊断命令树中,最顶层故障诊断命令为运行时不需要输入参数的命令或输入参数为设定值的命令、且相邻两层故障诊断命令中下一级故障诊断命令运行需要的输入参数为上一级故障诊断命令运行后的输出参数,使得所述网管服务器管理的设备发生故障时,可以自动执行所述网管服务器发送的每个故障诊断命令树,进行故障诊断,不需要技术人员的参与,且故障诊断结果与所述设备的故障信息的描述准确性无关,从而可以提高故障诊断的效率以及故障诊断结果的准确性,进而可以节约解决故障问题所需的时间。
基于以上实施例,本申请实施例提供了一种设备,所述设备应用于如图2所示的网络***,用于实现如图3所示的故障诊断方法中网管服务器管理的设备的功能。参阅图8所示,所述设备800包括:接收单元801和处理单元802。
所述接收单元801,用于接收网管服务器发送的至少一条对应关系以及至少一个故障诊断命令树,其中,所述网管服务器发送的至少一条对应关系中每条对应关系包括故障诊断命令、该故障诊断命令运行需要的输入参数、该故障诊断命令运行后的输出参数、以及该故障诊断命令的运行结果所标识的故障诊断依据;所述网管服务器发送的每个故障诊断命令树是根据所述至少一条对应关系建立的,每个故障诊断命令树中,最顶层故障诊断命令为运行时不需要输入参数的命令或输入参数为设定值的命令、且相邻两层故障诊断命令中下一级故障诊断命令运行需要的输入参数为上一级故障诊断命令运行后的输出参数。
所述处理单元802,用于在确定所述设备发生故障时,依次执行网管服务器发送的每个故障诊断命令树,并在执行每个故障诊断命令树时从最顶层故障诊断命令依次向下层故障诊断命令遍历,分别执行遍历到的每个故障诊断命令,直至执行到目标故障诊断命令为止;以及输出执行所述目标故障诊断命令后得到的运行结果所标识的第一故障诊断依据;其中,执行所述目标故障诊断命令后得到的运行结果所标识的第一故障诊断依据,与所述网管服务器发送的至少一条对应关系中所述目标故障诊断命令对应的第二故障诊断依据相同。
可选地,若所述每个对应关系的中还包括故障诊断命令所属的功能模块,所述处理单元802还用于:确定所述设备的故障所属的功能模块,选择所述网管服务器发送的至少一个故障诊断命令树中包括所述故障所属的功能模块中命令的故障诊断命令树,依次执行所选择的故障诊断命令树,并在执行所选择的每个故障诊断命令树时从最顶层故障诊断命令依次向下层故障诊断命令遍历,分别执行遍历到的每个故障诊断命令,直至执行到目标故障诊断命令为止。
基于以上实施例,本申请实施例还提供了一种设备,所述设备用于实现如图3所示的故障诊断方法,具有如图8所示的设备800的功能。参阅图9所示,所述设备900包括:通信接口901、存储器902和处理器903。所述处理器903与通信接口901、存储器902相互连接。
所述通信接口901,用于接收网管服务器发送的至少一条对应关系以及至少一个故障诊断命令树,其中,所述网管服务器发送的至少一条对应关系中每条对应关系包括故障诊断命令、该故障诊断命令运行需要的输入参数、该故障诊断命令运行后的输出参数、以及该故障诊断命令的运行结果所标识的故障诊断依据;所述网管服务器发送的每个故障诊断命令树是根据所述至少一条对应关系建立的,每个故障诊断命令树中,最顶层故障诊断命令为运行时不需要输入参数的命令或输入参数为设定值的命令、且相邻两层故障诊断命令中下一级故障诊断命令运行需要的输入参数为上一级故障诊断命令运行后的输出参数。
所述存储器902,用于存储程序指令。
所述处理器903,用于调用所述存储器902中存储的指令,执行:在确定所述设备发生故障时,依次执行网管服务器发送的每个故障诊断命令树,并在执行每个故障诊断命令树时从最顶层故障诊断命令依次向下层故障诊断命令遍历,分别执行遍历到的每个故障诊断命令,直至执行到目标故障诊断命令为止;以及输出执行所述目标故障诊断命令后得到的运行结果所标识的第一故障诊断依据;其中,执行所述目标故障诊断命令后得到的运行结果所标识的第一故障诊断依据,与所述网管服务器发送的至少一条对应关系中所述目标故障诊断命令对应的第二故障诊断依据相同。
一种具体的实施方式中,所述存储器903可以包括易失性存储器,例如RAM;所述存储器902也可以包括非易失性存储器,例如快闪存储器,HDD或SSD;所述存储器902还可以包括上述种类的存储器的组合。
上述处理器903可以是CPU,NP或者CPU和NP的组合。所述处理器903还可以进一步包括硬件芯片。上述硬件芯片可以是ASIC,PLD或其组合。上述PLD可以是CPLD,FPGA,GAL或其任意组合。
一种可能的实施方式中,所述处理器903与所述存储器902、所述通信接口901可以通过总线904相互连接。所述总线904可以是PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选地,所述存储器902可能包含RAM,也可能还包括非易失性存储器,例如至少一个磁盘存储器。
实施中,若所述每个对应关系的中还包括故障诊断命令所属的功能模块,所述处理器903还用于:确定所述设备的故障所属的功能模块,选择所述网管服务器发送的至少一个故障诊断命令树中包括所述故障所属的功能模块中命令的故障诊断命令树,依次执行所选择的故障诊断命令树,并在执行所选择的每个故障诊断命令树时从最顶层故障诊断命令依次向下层故障诊断命令遍历,分别执行遍历到的每个故障诊断命令,自动执行到目标故障诊断命令为止。
本申请实施例提供的设备,在确定自身发生故障时,自动依次执行网管服务器发送的每个故障诊断命令树,并在执行每个故障诊断命令树时从最顶层故障诊断命令依次向下层故障诊断命令遍历,分别执行遍历到的每个故障诊断命令,直至执行到目标故障诊断命令为止,并输出执行所述目标故障诊断命令后得到的运行结果所标识的第一故障诊断依据;其中,执行所述目标故障诊断命令后得到的运行结果所标识的第一故障诊断依据,与所述网管服务器发送的至少一条对应关系中所述目标故障诊断命令对应的第二故障诊断依据相同,使得所述设备制在故障诊断过程中不需要技术人员的参与,且故障诊断结果与所述设备的故障信息的描述准确性无关,可以实现故障诊断流程的自动化,进而提高故障诊断的效率和故障诊断结果的准确性,可以减少设备故障恢复所需的时间。
综上所述,本申请实施例提供了一种故障诊断方法及装置,所述故障诊断方法中网管服务器根据存储的至少一条对应关系,建立至少一个故障诊断命令树,将建立的至少一个故障诊断命令树和存储的所述至少一条对应关系发送到各个被管理的设备,其中,每条对应关系包括故障诊断命令、该故障诊断命令运行需要的输入参数、该故障诊断命令运行后的输出参数、以及该故障诊断命令的运行结果所标识的故障诊断依据,每个故障诊断命令树中,最顶层故障诊断命令为运行时不需要输入参数的命令或输入参数为设定值的命令、且相邻两层故障诊断命令中下一级故障诊断命令运行需要的输入参数为上一级故障诊断命令运行后的输出参数;当所述网管服务器管理的任意一个设备确定自身发生故障时,依次执行所述网管服务器发送的每个故障诊断命令树,并在执行每个故障诊断命令树时从最顶层故障诊断命令依次向下层故障诊断命令遍历,分别执行遍历到的每个故障诊断命令,直至执行到目标故障诊断命令为止,输出执行所述目标故障诊断命令后得到的运行结果所标识的第一故障诊断依据,其中,执行所述目标故障诊断命令后得到的运行结果所标识的第一故障诊断依据,与所述网管服务器发送的至少一条对应关系中所述目标故障诊断命令对应的第二故障诊断依据相同。由于所述网管服务器建立的每个故障诊断命令树中,最顶层故障诊断命令为运行时不需要输入参数的命令或输入参数为设定值的命令、且相邻两层故障诊断命令中下一级故障诊断命令运行需要的输入参数为上一级故障诊断命令运行后的输出参数,使得所述网管服务器管理的设备发生故障时,可以自动执行所述网管服务器发送的每个故障诊断命令树,进行故障诊断,不需要技术人员的参与,且故障诊断结果与所述设备的故障信息的描述准确性无关,从而可以提高故障诊断的效率以及故障诊断结果的准确性,进而可以节约解决故障问题所需的时间。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请实施例进行各种改动和变型而不脱离本申请实施例的精神和范围。这样,倘若本申请实施例的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (14)

1.一种故障诊断方法,其特征在于,包括:
网管服务器根据存储的至少一条对应关系,建立至少一个故障诊断命令树;
所述网管服务器将建立的至少一个故障诊断命令树、存储的所述至少一条对应关系发送到所述网管服务器管理的设备;
其中,每条对应关系包括故障诊断命令、该故障诊断命令运行需要的输入参数、该故障诊断命令运行后的输出参数、以及该故障诊断命令的运行结果所标识的故障诊断依据;
每个故障诊断命令树中,最顶层故障诊断命令为运行时不需要输入参数的命令或者运行需要的输入参数为设定值的命令、且相邻两层故障诊断命令中下一级故障诊断命令运行需要的输入参数为上一级故障诊断命令运行后的输出参数。
2.如权利要求1所述的方法,其特征在于,网管服务器根据存储的至少一条对应关系,建立至少一个故障诊断命令树,包括:
针对待建立的每个故障诊断树,所述网管服务器在所述至少一条对应关系中随机选择一个第一故障诊断命令作为该待建立的故障诊断树的最底层故障诊断命令,并在所述至少一条对应关系中为所述第一故障诊断命令设置标签,所述标签表征第一故障诊断命令已被选择;
所述网管服务器针对所述第一故障诊断命令的每个输入参数分别执行:
判断在所述至少一条对应关系中是否存在第二故障诊断命令,所述第二故障诊断命令未被设置所述标签、且运行后的输出参数为所述第一故障诊断命令的第一输入参数,所述第一输入参数为所述第一故障诊断命令的每个输入参数中的任意一个;
若存在,所述网管服务器将所述第二故障诊断命令作为所述第一故障诊断命令的一个上级故障诊断命令,并在所述至少一条对应关系中为所述第二故障诊断命令设置所述标签;
若不存在,所述网管服务器将用户命令手册中记录的多个命令中对应的输出参数为所述第一输入参数的命令,作为所述第一故障诊断命令的一个上级故障诊断命令;
以此类推,直至在所述至少一条对应关系中或在用户命令手册中找到第三故障诊断命令为止,所述第三故障诊断命令为不需要输入参数的命令或输入参数为设定值的命令,所述网管服务器将所述第三故障诊断命令作为该待建立的故障诊断树的最顶层故障诊断命令。
3.如权利要求2所述的方法,其特征在于,所述网管服务器确定在所述至少一条对应关系中存在第二故障诊断命令,包括:
所述网管服务器在所述至少一条对应关系中确定各个未被设置所述标签的故障诊断命令;
所述网管服务器在所述用户命令手册中查找所述第一故障诊断命令的第一输入参数对应的第一参数说明,以及
在所述用户命令手册中查找各个未被设置所述标签的故障诊断命令运行后的输出参数分别对应的第二参数说明;
所述网管服务器根据所述第一参数说明以及各个未被设置所述标签的故障诊断命令运行后的输出参数分别对应的第二参数说明,确定与所述第一参数说明的相似度大于设定阈值的至少一个第二参数说明;
所述网管服务器在确定出的至少一个第二参数说明分别对应的故障诊断命令中,选择一个故障诊断命令作为所述第二故障诊断命令。
4.如权利要求3所述的方法,其特征在于,所述网管服务器在确定出的至少一个第二参数说明分别对应的故障诊断命令中,选择一个故障诊断命令作为所述第二故障诊断命令,包括:
针对确定出的至少一个第二参数说明分别对应的故障诊断命令中的每个故障诊断命令,分别执行:
所述网管服务器确定第四故障诊断命令运行需要的输入参数的个数以及各个输入参数在用户命令手册中所有命令的输入参数中出现的次数;
所述网管服务器确定所述第一故障诊断命令的第一输入参数在所述用户命令手册中所有命令的输入参数中出现的次数;
所述网管服务器根据所述第四故障诊断命令运行需要的输入参数的个数以及各个输入参数在用户命令手册中所有命令的输入参数中出现的次数,以及所述第一故障诊断命令的第一输入参数在所述用户命令手册中所有命令的输入参数中出现的次数,确定所述第四故障诊断命令对应的参与建树复杂度系数;
其中,所述第四故障诊断命令为所述至少一个第二参数说明分别对应的故障诊断命令中的任意一个;
所述网管服务器在至少一个第二参数说明分别对应的故障诊断命令中选择参与建树复杂度系数最小的故障诊断命令作为所述第二故障诊断命令。
5.如权利要求4所述的方法,其特征在于,所述网管服务器确定的所述第四故障诊断命令对应的参与建树复杂度系数满足以下公式:
其中,xi表示所述第一输入参数,C(xi)表示所述xi在所述用户命令手册中所有命令的输入参数中出现的次数的归一化处理结果;
其中,|Ω|表示所述第四故障诊断命令的输入参数的个数;ε为大于0的常数;j表示所述第四故障诊断命令的输入参数的序号;C(yij)表示所述第四故障诊断命令的第j个输入参数yij在所述用户命令手册中所有命令的输入参数中出现的次数的归一化处理结果;
所述γi为大于1的常数或者γi=C(yij)+c,i,j为正整数,c为大于或等于1的常数。
6.如权利要求1-5任意一项所述的方法,其特征在于,网管服务器根据存储的至少一条对应关系,建立至少一个故障诊断命令树之前,还包括:
根据问题单库中的至少一个问题单以及用户命令手册,建立所述至少一个对应关系,其中,每个问题单至少包括诊断故障问题所使用的故障诊断命令以及该故障诊断命令的运行结果所标识的故障诊断依据。
7.一种故障诊断方法,其特征在于,包括:
设备在确定自身发生故障时,依次执行网管服务器发送的每个故障诊断命令树,并
在执行每个故障诊断命令树时从最顶层故障诊断命令依次向下层故障诊断命令遍历,分别执行遍历到的每个故障诊断命令,直至执行到目标故障诊断命令为止,其中,执行所述目标故障诊断命令后得到的运行结果所标识的第一故障诊断依据,与所述网管服务器发送的至少一条对应关系中所述目标故障诊断命令对应的第二故障诊断依据相同;
所述设备输出执行所述目标故障诊断命令后得到的运行结果所标识的第一故障诊断依据;
其中,所述网管服务器发送的至少一条对应关系中每条对应关系包括故障诊断命令、该故障诊断命令运行需要的输入参数、该故障诊断命令运行后的输出参数、以及该故障诊断命令的运行结果所标识的故障诊断依据;
所述网管服务器发送的每个故障诊断命令树是根据所述至少一条对应关系建立的,每个故障诊断命令树中,最顶层故障诊断命令为运行时不需要输入参数的命令或输入参数为设定值的命令、且相邻两层故障诊断命令中下一级故障诊断命令运行需要的输入参数为上一级故障诊断命令运行后的输出参数。
8.一种网管服务器,其特征在于,包括:
存储器,用于存储程序指令以及至少一个对应关系,其中,每条对应关系包括故障诊断命令、该故障诊断命令运行需要的输入参数、该故障诊断命令运行后的输出参数、以及该故障诊断命令的运行结果所标识的故障诊断依据;
处理器,用于调用所述存储器中存储的指令,执行:根据所述存储器存储的至少一个根据存储的至少一条对应关系,建立至少一个故障诊断命令树;以及控制通信接口将建立的至少一个故障诊断命令树、存储的所述至少一条对应关系发送到所述网管服务器管理的设备;其中,每个故障诊断命令树中,最顶层故障诊断命令为运行时不需要输入参数的命令或者输入参数为设定值的命令、且相邻两层故障诊断命令中下一级故障诊断命令运行需要的输入参数为上一级故障诊断命令运行后的输出参数;
所述通信接口,用于在所述处理器控制下将建立的至少一个故障诊断命令树、存储的所述至少一条对应关系发送到所述网管服务器管理的设备。
9.如权利要求8所述的网管服务器,其特征在于,所述处理器在根据存储的至少一条对应关系,建立至少一个故障诊断命令树时,具体用于:
针对待建立的每个故障诊断树,在所述至少一条对应关系中随机选择一个第一故障诊断命令作为该待建立的故障诊断树的最底层故障诊断命令,并在所述至少一条对应关系中为所述第一故障诊断命令设置标签,所述标签表征第一故障诊断命令已被选择;
针对所述第一故障诊断命令的每个输入参数分别执行:
判断在所述至少一条对应关系中是否存在第二故障诊断命令,所述第二故障诊断命令未被设置所述标签、且运行后的输出参数为所述第一故障诊断命令的第一输入参数,所述第一输入参数为所述第一故障诊断命令的每个输入参数中的任意一个;
若存在,将所述第二故障诊断命令作为所述第一故障诊断命令的一个上级故障诊断命令,并在所述至少一条对应关系中为所述第二故障诊断命令设置所述标签;
若不存在,将用户命令手册中记录的多个命令中对应的输出参数为所述第一输入参数的命令,作为所述第一故障诊断命令的一个上级故障诊断命令;
以此类推,直至在所述至少一条对应关系中或在用户命令手册中找到第三故障诊断命令为止,所述第三故障诊断命令为不需要输入参数的命令或输入参数为设定值的命令,将所述第三故障诊断命令作为该待建立的故障诊断树的最顶层故障诊断命令。
10.如权利要求9所述的网管服务器,其特征在于,所述处理器在确定在所述至少一条对应关系中存在第二故障诊断命令时,具体用于:
在所述至少一条对应关系中确定各个未被设置所述标签的故障诊断命令;
在所述用户命令手册中查找所述第一故障诊断命令的第一输入参数对应的第一参数说明,以及在所述用户命令手册中查找各个未被设置所述标签的故障诊断命令运行后的输出参数分别对应的第二参数说明;
根据所述第一参数说明以及各个未被设置所述标签的故障诊断命令运行后的输出参数分别对应的第二参数说明,确定与所述第一参数说明的相似度大于设定阈值的至少一个第二参数说明;
在确定出的至少一个第二参数说明分别对应的故障诊断命令中,选择一个故障诊断命令作为所述第二故障诊断命令。
11.如权利要求10所述的网管服务器,其特征在于,所述处理器在确定出的至少一个第二参数说明分别对应的故障诊断命令中,选择一个故障诊断命令作为所述第二故障诊断命令时,具体用于:
针对确定出的至少一个第二参数说明分别对应的故障诊断命令中的每个故障诊断命令,分别执行:
确定第四故障诊断命令运行需要的输入参数的个数以及各个输入参数在用户命令手册中所有命令的输入参数中出现的次数;
确定所述第一故障诊断命令的第一输入参数在所述用户命令手册中所有命令的输入参数中出现的次数;
根据所述第四故障诊断命令运行需要的输入参数的个数以及各个输入参数在用户命令手册中所有命令的输入参数中出现的次数,以及所述第一故障诊断命令的第一输入参数在所述用户命令手册中所有命令的输入参数中出现的次数,确定所述第四故障诊断命令对应的参与建树复杂度系数;
其中,所述第四故障诊断命令为所述至少一个第二参数说明分别对应的故障诊断命令中的任意一个;
在至少一个第二参数说明分别对应的故障诊断命令中选择参与建树复杂度系数最小的故障诊断命令作为所述第二故障诊断命令。
12.如权利要求11所述的网管服务器,其特征在于,所述处理器确定的所述第四故障诊断命令对应的参与建树复杂度系数满足以下公式:
其中,xi表示所述第一输入参数,C(xi)表示所述xi在所述用户命令手册中所有命令的输入参数中出现的次数的归一化处理结果;
其中,|Ω|表示所述第四故障诊断命令的输入参数的个数;ε为大于0的常数;j表示所述第四故障诊断命令的输入参数的序号;C(yij)表示所述第四故障诊断命令的第j个输入参数yij在所述用户命令手册中所有命令的输入参数中出现的次数的归一化处理结果;
所述γi为大于1的常数或者γi=C(yij)+c,i,j为正整数,c为大于或等于1的常数。
13.如权利要求8-12任意一项所述的网管服务器,其特征在于,所述处理器还用于:
在根据存储的至少一条对应关系,建立至少一个故障诊断命令树之前,根据问题单库中的至少一个问题单以及用户命令手册,建立所述至少一个对应关系,其中,每个问题单至少包括诊断故障问题所使用的故障诊断命令以及该故障诊断命令的运行结果所标识的故障诊断依据。
14.一种设备,其特征在于,包括:
通信接口,用于接收网管服务器发送的至少一条对应关系以及至少一个故障诊断命令树,其中,所述网管服务器发送的至少一条对应关系中每条对应关系包括故障诊断命令、该故障诊断命令运行需要的输入参数、该故障诊断命令运行后的输出参数、以及该故障诊断命令的运行结果所标识的故障诊断依据;所述网管服务器发送的每个故障诊断命令树是根据所述至少一条对应关系建立的,每个故障诊断命令树中,最顶层故障诊断命令为运行时不需要输入参数的命令或输入参数为设定值的命令、且相邻两层故障诊断命令中下一级故障诊断命令运行需要的输入参数为上一级故障诊断命令运行后的输出参数;
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的指令,执行:在确定所述设备发生故障时,依次执行网管服务器发送的每个故障诊断命令树,并在执行每个故障诊断命令树时从最顶层故障诊断命令依次向下层故障诊断命令遍历,分别执行遍历到的每个故障诊断命令,直至执行到目标故障诊断命令为止;以及输出执行所述目标故障诊断命令后得到的运行结果所标识的第一故障诊断依据;其中,执行所述目标故障诊断命令后得到的运行结果所标识的第一故障诊断依据,与所述网管服务器发送的至少一条对应关系中所述目标故障诊断命令对应的第二故障诊断依据相同。
CN201711466261.2A 2017-12-28 2017-12-28 一种故障诊断方法及装置 Pending CN109981331A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711466261.2A CN109981331A (zh) 2017-12-28 2017-12-28 一种故障诊断方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711466261.2A CN109981331A (zh) 2017-12-28 2017-12-28 一种故障诊断方法及装置

Publications (1)

Publication Number Publication Date
CN109981331A true CN109981331A (zh) 2019-07-05

Family

ID=67075374

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711466261.2A Pending CN109981331A (zh) 2017-12-28 2017-12-28 一种故障诊断方法及装置

Country Status (1)

Country Link
CN (1) CN109981331A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113484684A (zh) * 2021-07-16 2021-10-08 国网辽宁省电力有限公司 一种非健全故障信息下的配电网多重故障诊断***及方法

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001086443A1 (en) * 2000-05-05 2001-11-15 Aprisma Management Technologies, Inc. Systems and methods for managing and analysing faults in computer networks
CN1852153A (zh) * 2005-11-09 2006-10-25 华为技术有限公司 基于简单网络管理协议的故障/告警管理***及方法
CN101616019A (zh) * 2008-06-26 2009-12-30 华为技术有限公司 一种实现网络故障检测的方法、网络节点和***
CN102611568A (zh) * 2011-12-21 2012-07-25 华为技术有限公司 一种故障业务路径诊断方法及装置
CN102711161A (zh) * 2012-06-25 2012-10-03 华为技术有限公司 告警方法和装置
CN102722722A (zh) * 2012-05-25 2012-10-10 清华大学 基于逻辑推理和故障辨识的混合故障检测诊断方法
CN103019227A (zh) * 2012-11-30 2013-04-03 北京控制工程研究所 一种基于故障要素描述的卫星控制***故障识别方法
CN104122882A (zh) * 2013-04-24 2014-10-29 中烟机械技术中心有限责任公司 巴鲁夫自诊断型传感器的故障诊断***
CN104135070A (zh) * 2014-07-14 2014-11-05 国家电网公司 一种配电自动化***的前置通道故障诊断方法
CN104298825A (zh) * 2014-10-10 2015-01-21 中国科学院合肥物质科学研究院 一种基于权限管理和模型分解的故障树协同分析***
CN104683129A (zh) * 2013-11-28 2015-06-03 富士通株式会社 诊断树建立方法、网络故障诊断方法及其节点
CN105867360A (zh) * 2016-06-14 2016-08-17 江南大学 一种机电控制***的初值预估迭代学习故障诊断算法
CN106301522A (zh) * 2016-08-20 2017-01-04 航天恒星科技有限公司 遥感卫星地面站数据接收任务的可视化故障诊断方法及***
CN106357423A (zh) * 2016-08-19 2017-01-25 南京国电南自电网自动化有限公司 一种基于故障树的智能变电站二次设备异常诊断方法
CN106354118A (zh) * 2016-08-25 2017-01-25 株洲中车时代电气股份有限公司 一种基于故障树的列车故障诊断***及方法
CN107171819A (zh) * 2016-03-07 2017-09-15 北京华为数字技术有限公司 一种网络故障诊断方法及装置

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001086443A1 (en) * 2000-05-05 2001-11-15 Aprisma Management Technologies, Inc. Systems and methods for managing and analysing faults in computer networks
CN1852153A (zh) * 2005-11-09 2006-10-25 华为技术有限公司 基于简单网络管理协议的故障/告警管理***及方法
CN101616019A (zh) * 2008-06-26 2009-12-30 华为技术有限公司 一种实现网络故障检测的方法、网络节点和***
CN102611568A (zh) * 2011-12-21 2012-07-25 华为技术有限公司 一种故障业务路径诊断方法及装置
CN102722722A (zh) * 2012-05-25 2012-10-10 清华大学 基于逻辑推理和故障辨识的混合故障检测诊断方法
CN102711161A (zh) * 2012-06-25 2012-10-03 华为技术有限公司 告警方法和装置
CN103019227A (zh) * 2012-11-30 2013-04-03 北京控制工程研究所 一种基于故障要素描述的卫星控制***故障识别方法
CN104122882A (zh) * 2013-04-24 2014-10-29 中烟机械技术中心有限责任公司 巴鲁夫自诊断型传感器的故障诊断***
CN104683129A (zh) * 2013-11-28 2015-06-03 富士通株式会社 诊断树建立方法、网络故障诊断方法及其节点
CN104135070A (zh) * 2014-07-14 2014-11-05 国家电网公司 一种配电自动化***的前置通道故障诊断方法
CN104298825A (zh) * 2014-10-10 2015-01-21 中国科学院合肥物质科学研究院 一种基于权限管理和模型分解的故障树协同分析***
CN107171819A (zh) * 2016-03-07 2017-09-15 北京华为数字技术有限公司 一种网络故障诊断方法及装置
CN105867360A (zh) * 2016-06-14 2016-08-17 江南大学 一种机电控制***的初值预估迭代学习故障诊断算法
CN106357423A (zh) * 2016-08-19 2017-01-25 南京国电南自电网自动化有限公司 一种基于故障树的智能变电站二次设备异常诊断方法
CN106301522A (zh) * 2016-08-20 2017-01-04 航天恒星科技有限公司 遥感卫星地面站数据接收任务的可视化故障诊断方法及***
CN106354118A (zh) * 2016-08-25 2017-01-25 株洲中车时代电气股份有限公司 一种基于故障树的列车故障诊断***及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113484684A (zh) * 2021-07-16 2021-10-08 国网辽宁省电力有限公司 一种非健全故障信息下的配电网多重故障诊断***及方法

Similar Documents

Publication Publication Date Title
Rafique et al. Cognitive assurance architecture for optical network fault management
EP4091110B1 (en) Systems and methods for distributed incident classification and routing
CN110888755A (zh) 一种微服务***异常根因节点的查找方法及装置
CN106165345A (zh) 标识用于化解网络故障的故障排除选项
CN105302112A (zh) Icni***智能故障诊断***
CN111858123A (zh) 基于有向图网络的故障根因分析方法和装置
US10444746B2 (en) Method for managing subsystems of a process plant using a distributed control system
US12055902B2 (en) Failure mode analytics
CN109213773A (zh) 一种在线故障的诊断方法、装置及电子设备
CN107426019A (zh) 网络故障确定方法、计算机设备及计算机可读存储介质
US11656589B2 (en) Systems and methods for automatic power topology discovery
JP2023547849A (ja) ラベルなしセンサデータを用いた産業システム内の稀な障害の自動化されたリアルタイムの検出、予測、及び予防に関する、方法または非一時的コンピュータ可読媒体
CN108121716A (zh) 处理问题单的方法和问题单处理***
CN113900844A (zh) 一种基于服务码级别的故障根因定位方法、***及存储介质
CN112817785A (zh) 一种微服务***的异常检测方法及装置
CN114218302A (zh) 信息处理方法、装置、设备以及存储介质
CN109981331A (zh) 一种故障诊断方法及装置
CN117608904A (zh) 一种故障定位方法、装置、电子设备和存储介质
US8510254B2 (en) Ontology model to accelerate engineering analysis in manufacturing
CN108023740A (zh) 监控中异常信息的风险提示方法和装置
CN1559034A (zh) 用于处理故障假设的方法和***
US10454808B2 (en) Managing physical network cross-connects in a datacenter
CN113076350B (zh) 焊接异常检测方法、装置、计算机设备和存储介质
US11188405B1 (en) Similar alert identification based on application fingerprints
CN109040155A (zh) 资产识别方法和计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190705