CN101674196A - 一种多域协作的分布式故障诊断方法及*** - Google Patents

一种多域协作的分布式故障诊断方法及*** Download PDF

Info

Publication number
CN101674196A
CN101674196A CN200910148371A CN200910148371A CN101674196A CN 101674196 A CN101674196 A CN 101674196A CN 200910148371 A CN200910148371 A CN 200910148371A CN 200910148371 A CN200910148371 A CN 200910148371A CN 101674196 A CN101674196 A CN 101674196A
Authority
CN
China
Prior art keywords
symptom
domain
territory
cross
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910148371A
Other languages
English (en)
Other versions
CN101674196B (zh
Inventor
邹仕洪
褚灵伟
程时端
王文东
田春歧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN2009101483713A priority Critical patent/CN101674196B/zh
Publication of CN101674196A publication Critical patent/CN101674196A/zh
Application granted granted Critical
Publication of CN101674196B publication Critical patent/CN101674196B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明涉及一种多域协作的分布式故障诊断方法及***。该***的每个域中均包括一个域管理器;域管理器可以和其他域管理器通信,将跨域告警/症状分配给最可能导致该跨域症状的一个域;域管理器负责该域管理器所在域内的故障诊断。本发明中在交换症状时,当前域只与可能导致症状的部分其他域进行通信,能够减少通信开销;采用域内症状进行初步诊断,再根据初步故障假设评估导致每个跨域症状的可能性,提高影响评估的准确性;考虑了错误分配症状的可能性,为每个分配的症状计算一个虚假症状概率,可以减小错误分配对诊断带来的影响。

Description

一种多域协作的分布式故障诊断方法及***
技术领域
本发明涉及计算机网络中的故障诊断领域,尤其涉及一种多域协作的分布式故障诊断方法及***。
背景技术
在大规模的复杂环境中,服务管理***需要处理大量的信息。研究人员普遍认为,应当划分管理信息和功能,并用分布式的方式对其管理(参见论文:计算机网络中故障定位技术综述,A survey of fault localization techniques incomputer networks)。在管理器间划分数据将迫使管理器基于不完整信息进行故障管理。由于域间故障传播,管理器可能收到其他管理器管辖域内传播来的问题,而某域内特定故障相关的症状可能在该域内不可见。为了在这样复杂的环境中定位故障,需要有效的分布式故障诊断算法。
Katzela等人(参见论文:集中式vs分布式故障定位,Centralized vsDistributed Fault Localization)提出了设计分布式故障诊断***的理论基础,比较了三种故障诊断机制:集中式(Centralized),非集中式(Decentralized)以及分布式(Distributed),并且评估了这些机制的准确性和可行性。分布式故障诊断不存在中央管理器,由分域管理器协同工作诊断故障。在分析告警时,每个域都需要处理所有与其相关的跨域告警。域需要为每个跨域告警关联代理节点,表示该告警可能由其他域中的故障解释,同时为代理节点分配一个概率值,表示告警由其他域中故障引起的概率,之后使用单域故障诊断算法计算最优故障解释。
Steinder和Sethi(参见论文:分级路由网络中端到端服务故障的多域诊断,MultiDomain diagnosis of end-to-end service failures in hierarchically routednetworks)提出了跨多个自治域的分布式故障诊断算法。包含多个自治域的网络由多个域管理器进行管理,并由网络管理器进行协调。全局故障传播模型划分到各个自治域,并在各个域的故障传播模型中增加代理节点,表示从其他自治域传播过来的故障。在故障管理平台接收到告警信息时,故障定位需要在所有自治域内进行,以寻找最可能的故障假设。在实际中,这将是非常耗时和低效的。另外,该文算法还依赖部分全局结构信息的存在。
Fischer等人(参见论文:跨域故障定位-图形摘要方法的案例,Cross-DomainFault Localization:A Case for a Graph Digest Approach)提出了一个二域环境下的分布式故障诊断方案。发现症状的域对其依赖图进行修剪和合并操作后,将已经隐藏内部结构信息的依赖图发送给另一个域,由该域负责诊断得出假设。该文假设的场景过于简单,难于将其方法推广到更多域情况。
发明内容
为了解决上述的技术问题,提出了一种多域协作的分布式故障诊断方法及***,其目的在于,使用一定方法评估导致跨域症状的各域可能性,并将这些症状分配到最可能导致该症状的域,在完成对跨域症状的处理后,可使用已有单域故障诊断算法推理故障假设。
本发明提供了一种多域协作的分布式故障诊断***,每个域中均包括一个域管理器;域管理器用于负责该域管理器所在域内的故障诊断;当前域的域管理器与最可能导致跨域症状的域中的域管理器进行通信,将跨域告警/症状分配给该最可能导致跨域症状的域。
域管理器包括接口模块,管理/信息呈现模块,症状交换模块,影响评估模块,症状分配模块,告警/故障信息模块,故障诊断模块以及依赖模型;
接口模块,用于将当前域的域管理器的管理信息或者数据发送到可能导致跨域症状的域中的域管理器,并将接收的管理信息或数据发送到当前域的域管理器中的症状交换模块、影响评估模块、症状分配模块或故障诊断模块;
管理/信息呈现模块,用于将症状或依赖关系数据写入对应数据库;
症状交换模块,用于在当前域的域管理器发现跨域症状时,将该跨域症状映射为选定域的相关子服务,并将选定域的相关子服务作为跨域症状报告至可能导致跨域症状的域中的域管理器;
影响评估模块,用于在当前域的域管理器收到跨域症状后,评估当前域内故障引发该跨域症状的可能性,并将评估值返回到报告该跨域症状的域;
症状分配模块,在当前域的域管理器收到评估值后,采用相应的比较机制比较评估值,再将跨域症状分配给最可能导致该症状的域来诊断;
故障诊断模块,用于将分配到当前域的跨域症状和当前域内的症状一起进行诊断,从而得出故障假设;
依赖模型,用于存储症状-故障依赖模型。
管理/信息呈现模块,用于向管理员呈现管理界面,并按照来自管理员的指令管理***。
域管理器还包括告警/故障信息模块,用于存储告警和故障记录。
所述依赖模型为二分贝叶斯网络依赖模型,二分贝叶斯网络依赖模型中的节点连接模型为Noisy-OR模型。
症状交换模块根据当前域观察到的症状以及二分贝叶斯网络依赖模型推理当前域使用的其他域中子服务的异常概率,并根据预先设定的概率值选出与符合条件的子服务对应的域,该域为可能导致跨域症状的域。
影响评估模块根据当前域观察到域内症状集和二分贝叶斯网络依赖模型做单域故障诊断,得出初步的故障假设H′;如果当前域接收的症状可由H′解释,则评估值修改为H′中发生故障引发该症状的最大值;如果当前域接收的症状不可由H′中故障解释,则评估值为先验故障概率和条件概率乘积的最大值。
症状分配模块为每个分配症状增加关联一个代理故障节点,该代理节点表示该症状实际由其他域中故障导致,节点先验概率为该症状由其他域导致的可能程度即虚假症状概率;虚假症状概率应由发现跨域症状的域进行评估,再随症状分配到最可能引发症状的域;虚假症状概率为当前域收到的评估值中除分配该跨域症状的域发送的评估值之外的评估值中的最大值。
故障诊断模块在对分配到症状进行故障诊断前,为分配到的每个跨域症状增加关联一个代理节点,该代理节点表示对应症状是错误分配的,其先验概率为分配到的虚假症状概率;去除二分贝叶斯网络依赖模型中与之相关的域外组件节点,之后使用单域诊断方法推理得出一个故障假设,如果诊断假设中包含代理节点,则将该节点从最终结果中删除。
本发明提供了一种多域协作的分布式故障诊断***的故障诊断方法,其特征在于,包括:
步骤1,在每个域中均设置一个域管理器;域管理器用于负责该域管理器所在域内的故障诊断;
步骤2,当前域的域管理器与可能导致跨域症状的域中的域管理器进行通信,将跨域告警/症状分配给该最可能导致跨域症状的域。
采用本发明的装置,可以实现如下有益效果:
基于多域协作的分布式故障诊断***。该***在每个管理域中部署一个管理器,管理器之间交互管理信息并协作完成故障诊断任务。
在症状交换阶段:为跨域症状设置协商域比率SDR,仅选择部分相关域协商症状分配,从而减少管理通信开销。
在影响评估阶段:采用域内症状进行初步诊断,再根据初步故障假设评估导致每个跨域症状的可能性。
在症状分配阶段:为每个分配的症状计算一个虚假症状概率,表示错误分配症状的可能性。
本发明相对于不考虑域间协作处理症状的诊断方法来说,可以通过对跨域症状的诊断来提高故障诊断的精确度。
本发明在症状交换模块中,为每个跨域症状增加了选择部分协商域的比率SDR。如果当前域观察到一个跨域症状,该症状与m个域存在依赖关系。本发明仅选择其中SDR*m个域协商症状分配。通过调节SDR值,即可以控制通信开销。因此,本发明相对选择全部协商域的方法来说,有效减少了管理通信开销。
本发明采用域内症状(即只存在域内依赖关系的服务症状)进行初步诊断,再根据初步故障假设评估导致每个跨域症状的可能性。相对于未考虑初步诊断的方法来说,本发明可以提高影响评估的准确性。
本发明考虑了错误分配症状的可能性,为每个分配的症状计算一个虚假症状概率。相对于未考虑虚假症状概率的方法来说,本发明可以减小错误分配对诊断带来的影响。
附图说明
图1是本发明提供的分布式故障诊断***;
图2是本发明提供的分布式故障诊断处理流程示意图。
具体实施方式
本发明包括一个分布式的故障诊断***,如图1所示。该***在每个管理域内均包含一个域管理器。该管理器负责与部分其他域管理器(即为与每个跨域症状相关的,且可能导致该症状的一部分域)进行管理通信,将跨域症状(即该症状可能由其他域内故障导致)分配给最可能导致该症状的域;并且负责本域内的故障诊断。每个域管理器均包括接口模块,管理/信息呈现模块,症状交换模块,影响评估模块,症状分配模块,故障诊断模块,依赖模型,告警/故障信息模块。
管理/信息呈现模块可对依赖模型和告警/故障信息模块进行读取和修改操作,以满足管理策略和***状态变化的需求;症状交换模块,影响评估模块,以及故障诊断模块仅可对依赖模型和告警/故障信息模块执行读取操作;症状分配模块可对告警/故障信息模块进行读取和修改操作。
接口模块负责将域管理器内部的管理信息或者数据发送到其他域管理器,并将来自外部的管理信息和数据发送到相应的内部模块。管理/信息呈现模块向管理员呈现管理界面;按照来自管理员的指令管理***;将症状或依赖关系数据写入对应数据库。当域管理器发现跨域症状时,症状交换模块将这些症状映射为选定域的相关子服务,并将子服务作为症状报告至相应的该子服务对应的域管理器。当一个域管理器收到其他域报告的症状后,需要使用影响评估模块评估本域内故障引发这些症状的可能性,并将这些值返回报告症状的域。当一个域管理器收到返回的评估值后,该域的症状分配模块采用一定的比较机制比较评估值,再将跨域症状分配给最可能导致该症状的域来诊断。故障诊断模块将分配到的所有症状和域内症状一起进行诊断,从而得出更准确的故障假设。依赖模型存储当前症状-故障依赖模型。告警/故障信息存储所有的告警和故障记录。
依赖模型:
为了表示多域环境下的依赖关系且保护各域内的结构和信息安全,本发明采用分布式依赖模型同时表示域内和域外依赖关系,这些依赖关系可以在服务运行过程或服务创建过程获得。本发明为每个域建立一个二分贝叶斯网络依赖模型。依赖模型的上层节点为本域内的服务集S={si},si=1表示服务异常,si=0表示服务正常。下层节点包括域内组件集F={fi}和域外相关子服务集S′={s′i}。fi=1表示组件发生故障,fi=0表示组件正常,s′i=1表示该子服务发生异常且传播故障到本域,s′i=0表示该子服务未传播故障到本域。每个组件关联一个先验故障概率P(f);每条有向边关联一个表示依赖强度的条件概率P(s|f)。与上层节点a存在依赖关系的下层节点集表示为Par(a),与下层节点b存在依赖关系的上层节点集表示为Child(b)。本发明假设服务异常的可能原因相互独立并且以逻辑运算符号OR结合,即noisy-OR模型。
症状交换:
在当前域发现跨域症状时,症状交换模块应当根据依赖模型选择可能引发该症状的部分域来协商症状分配。在交换症状前,当前域根据观察到的症状和依赖模型推理本域使用的其他域中子服务的异常概率,就能根据这些概率值选出存在高概率子服务的域,这些域就是可能导致该跨域症状的域。假设域Di当前观察到的跨域症状集合为SN,其依赖模型中与SN相关的域外子服务为FSN,可以建立上层节点为SN,下层节点为FSN的二分贝叶斯网络模型。每个子服务f的异常概率表示为在给定观察SN的条件下,f向本域传播故障的概率。由于这些子服务实际处于其他域中,本域无法获得定它们的先验故障概率,在此假设它们的先验故障概率为相同值。
以Sf表示f的后代节点中观察到的跨域症状集合,即Sf=Child(f)∩SN。对域外子服务的后验概率推理如下:
P ( f | S N ) = P ( f | S f ) = P ( f ) * P ( S f | f ) / P ( S f ) = P ( f ) * Π s ∈ S f P ( s | f ) / P ( s )
= P ( f ) * Π s ∈ S f P ( s | f ) / Σ f ∈ Par ( s ) P ( f ) * P ( s | f ) - - - ( 1 )
在计算结束后,当前域为每个跨域症状选择一部分协商域来交互症状,这些域中应当存在后验概率较大的子服务。
影响评估:
假设当前域Dk观察到域内症状集SN,即只存在域内依赖关系的服务症状,本发明可以使用这些症状和依赖模型做单域故障诊断,得出初步的故障假设H′。H′是根据域内症状推理得到的,可信度较高,可假设H′中故障实际发生。如果其他域报告的症状可由H′解释,则评估值修改为H′中发生故障引发该症状的最大值;如果该症状不可由H′中故障解释,则使用依赖模型中该症状所依赖故障的先验故障概率和条件概率来评估。评估函数如下:
P D k ( s ) = max f ∈ H ′ P ( s | f ) ifs ∈ child ( H ′ ) max f ∈ Par ( s ) P ( f ) * P ( s | f ) ifs ∉ child ( H ′ ) - - - ( 2 )
其中 H ′ = arg max H ′ ⊆ F P ( H ′ | S N ) , Child ( H ′ ) = ∪ f ∈ H ′ Child ( f ) .
症状分配:
由于可能存在错误分配症状,即分配到症状的域实际上没有引发该症状,如果直接诊断该症状将会降低诊断精确度。为了减小这种现象带来的影响,本发明在依赖模型中为每个分配症状增加关联一个代理故障节点,该代理节点表示该症状实际由其他域中故障导致,节点先验概率为该症状由其他域导致的可能程度,即虚假症状概率。虚假症状概率应由发现跨域症状的域进行评估,再随症状分配到最可能引发症状的域。
假设域Di观察到跨域症状s,且已经收到来自相关域的最大评估值{PDk(s)},根据这些值确定分配该症状的域为Dk,需要计算错误分配的虚假概率值PS(s)。如果该症状不由Dk中故障导致,则必然由其他相关域中故障引发,本发明选择其他域中的最大评估值为虚假概率。
P s ( s ) = max j ≠ k ( P D j ( s ) ) - - - ( 3 )
故障诊断:
在对分配到症状进行故障诊断前,需要在依赖模型中为分配到的每个跨域症状增加关联一个代理节点,该代理节点表示对应症状是错误分配的,其先验概率为分配到的虚假症状概率;并去除原模型中与之相关的域外组件节点。之后可以使用单域诊断算法根据症状和依赖模型推理得出一个故障假设,如单域诊断算法IBU(参见论文:基于信度网络的通信***概率故障诊断,Probabilisticfault diagnosis in communication systems using belief networks)和IHU(参见论文:基于增量假设更新的通信***概率故障诊断,Probabilistic Fault Diagnosis inCommunication Systems Through Incremental Hypothesis Updating)。如果诊断假设中包含代理节点,则可以简单地将该节点从最终结果中删除。
图2展示了本发明的处理流程。本发明流程包括4个阶段:症状交换,影响评估,症状分配,故障诊断。每个域管理器均包含上述流程阶段。
步骤101:当域管理器发现跨域症状时,首先根据这些症状推理与它们相关的域外子服务将故障传播到当前域的概率。
步骤102:故障传播概率高说明该子服务很有可能向本域传播了故障,考虑到通信开销,本发明根据这些传播概率选择部分协商域。
步骤103:由于一个症状可能对应多个域外子服务,因此将症状映射为步骤102所选择域中的相关子服务,并报告给这些域。
步骤104:使用当前域观察到的域内症状推理部分故障假设H’。
步骤105:根据H′,故障概率和依赖强度,计算本域内故障引发其他域报告症状的评估值。
步骤106:将计算得到的评估值返回给报告该症状的域。
步骤107:在接收到其他域返回的评估值之后,当前域可以根据这些评估值选出最可能引发每个跨域症状的域。
步骤108:由于症状可能被错误分配,因此为该域计算症状错误分配的虚假症状概率。
步骤109:将跨域症状和虚假概率值同时分配给选定域。
步骤110:为每个分配到的症状节点增加关联一个代理故障节点,其先验概率为分配的虚假概率值。
步骤111:使用单域故障诊断算法对域内症状和分配的症状进行诊断,得出故障假设H。
本领域的技术人员在不脱离权利要求书确定的本发明的精神和范围的条件下,还可以对以上内容进行各种各样的修改。因此本发明的范围并不仅限于以上的说明,而是由权利要求书的范围来确定的。

Claims (10)

1.一种多域协作的分布式故障诊断***,其特征在于,每个域中均包括一个域管理器;域管理器用于负责该域管理器所在域内的故障诊断;当前域的域管理器与可能导致跨域症状的域中的域管理器进行通信,将跨域告警/症状分配给该最可能导致跨域症状的域。
2.如权利要求1所述的多域协作的分布式故障诊断***,其特征在于,域管理器包括接口模块,管理/信息呈现模块,症状交换模块,影响评估模块,症状分配模块,告警/故障信息模块,故障诊断模块以及依赖模型;
接口模块,用于将当前域的域管理器的管理信息或者数据发送到可能导致跨域症状的域中的域管理器,并将接收的管理信息或数据发送到当前域的域管理器中的症状交换模块、影响评估模块、症状分配模块或故障诊断模块;
管理/信息呈现模块,用于将症状或依赖关系数据写入对应数据库;
症状交换模块,用于在当前域的域管理器发现跨域症状时,将该跨域症状映射为选定域的相关子服务,并将选定域的相关子服务作为跨域症状报告至可能导致跨域症状的域中的域管理器;
影响评估模块,用于在当前域的域管理器收到跨域症状后,评估当前域内故障引发该跨域症状的可能性,并将评估值返回到报告该跨域症状的域;
症状分配模块,在当前域的域管理器收到评估值后,采用相应的比较机制比较评估值,再将跨域症状分配给最可能导致该症状的域来诊断;
故障诊断模块,用于将分配到当前域的跨域症状和当前域内的症状一起进行诊断,从而得出故障假设;
依赖模型,用于存储症状-故障依赖模型。
3.如权利要求2所述的多域协作的分布式故障诊断***,其特征在于,管理/信息呈现模块,用于向管理员呈现管理界面,并按照来自管理员的指令管理***。
4.如权利要求2所述的多域协作的分布式故障诊断***,其特征在于,域管理器还包括告警/故障信息模块,用于存储告警和故障记录。
5.如权利要求2所述的多域协作的分布式故障诊断***,其特征在于,所述依赖模型为二分贝叶斯网络依赖模型,二分贝叶斯网络依赖模型中的节点连接模型为Noisy-OR模型。
6.如权利要求5所述的多域协作的分布式故障诊断***,其特征在于,症状交换模块根据当前域观察到的症状以及二分贝叶斯网络依赖模型推理当前域使用的其他域中子服务的异常概率,并根据预先设定的概率值选出与符合条件的子服务对应的域,该域为可能导致跨域症状的域。
7.如权利要求6所述的多域协作的分布式故障诊断***,其特征在于,影响评估模块根据当前域观察到域内症状集和二分贝叶斯网络依赖模型做单域故障诊断,得出初步的故障假设H′;如果当前域接收的症状可由H′解释,则评估值修改为H′中发生故障引发该症状的最大值;如果当前域接收的症状不可由H′中故障解释,则评估值为先验故障概率和条件概率乘积的最大值。
8.如权利要求7述的多域协作的分布式故障诊断***,其特征在于,症状分配模块为每个分配症状增加关联一个代理故障节点,该代理节点表示该症状实际由其他域中故障导致,节点先验概率为该症状由其他域导致的可能程度即虚假症状概率;虚假症状概率应由发现跨域症状的域进行评估,再随症状分配到最可能引发症状的域;虚假症状概率为当前域收到的评估值中除分配该跨域症状的域发送的评估值之外的评估值中的最大值。
9.如权利要求8的多域协作的分布式故障诊断***,其特征在于,故障诊断模块在对分配到症状进行故障诊断前,为分配到的每个跨域症状增加关联一个代理节点,该代理节点表示对应症状是错误分配的,其先验概率为分配到的虚假症状概率;去除二分贝叶斯网络依赖模型中与之相关的域外组件节点,之后使用单域诊断方法推理得出一个故障假设,如果诊断假设中包含代理节点,则将该节点从最终结果中删除。
10.一种如权利要求1-9任意一项所述的多域协作的分布式故障诊断***的故障诊断方法,其特征在于,包括:
步骤1,在每个域中均设置一个域管理器;域管理器用于负责该域管理器所在域内的故障诊断;
步骤2,当前域的域管理器与可能导致跨域症状的域中的域管理器进行通信,将跨域告警/症状分配给该最可能导致跨域症状的域。
CN2009101483713A 2009-06-16 2009-06-16 一种多域协作的分布式故障诊断方法及*** Expired - Fee Related CN101674196B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009101483713A CN101674196B (zh) 2009-06-16 2009-06-16 一种多域协作的分布式故障诊断方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101483713A CN101674196B (zh) 2009-06-16 2009-06-16 一种多域协作的分布式故障诊断方法及***

Publications (2)

Publication Number Publication Date
CN101674196A true CN101674196A (zh) 2010-03-17
CN101674196B CN101674196B (zh) 2011-12-07

Family

ID=42021200

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101483713A Expired - Fee Related CN101674196B (zh) 2009-06-16 2009-06-16 一种多域协作的分布式故障诊断方法及***

Country Status (1)

Country Link
CN (1) CN101674196B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017035736A1 (zh) * 2015-08-31 2017-03-09 华为技术有限公司 一种网络服务的故障处理方法及装置
CN107301131A (zh) * 2017-06-30 2017-10-27 郑州云海信息技术有限公司 一种分布式存储管理软件故障诊断方法及***
CN107896168A (zh) * 2017-12-08 2018-04-10 国网安徽省电力有限公司信息通信分公司 一种网络虚拟化环境下的电力通信网多域故障诊断方法
CN109218406A (zh) * 2018-08-13 2019-01-15 广西大学 一种面向智慧城市的跨域协作服务方法
CN110391947A (zh) * 2019-08-21 2019-10-29 广东电网有限责任公司 一种多控制器协作的电力通信网设备故障诊断方法
CN112383934A (zh) * 2020-10-22 2021-02-19 深圳供电局有限公司 一种5g网络切片下多域协作的服务故障诊断方法
WO2021208979A1 (zh) * 2020-04-17 2021-10-21 华为技术有限公司 一种网络故障的处理方法及装置
CN113746679A (zh) * 2019-04-22 2021-12-03 腾讯科技(深圳)有限公司 跨子域通信运维方法、总运维服务器和介质
WO2022018626A1 (en) * 2020-07-23 2022-01-27 International Business Machines Corporation Cross-environment event correlation using domain-space exploration and machine learning techniques

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5768501A (en) * 1996-05-28 1998-06-16 Cabletron Systems Method and apparatus for inter-domain alarm correlation
CA2461069C (en) * 2003-03-17 2013-08-13 Tyco Telecommunications (Us) Inc. System and method for fault diagnosis using distributed alarm correlation
CN101192997A (zh) * 2006-11-24 2008-06-04 中国科学院沈阳自动化研究所 分布式设备远程状态监测与故障诊断***
CN101170447A (zh) * 2007-11-22 2008-04-30 北京邮电大学 基于主动探针的服务故障诊断***及其方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107925585B (zh) * 2015-08-31 2020-07-21 华为技术有限公司 一种网络服务的故障处理方法及装置
WO2017035736A1 (zh) * 2015-08-31 2017-03-09 华为技术有限公司 一种网络服务的故障处理方法及装置
CN107925585A (zh) * 2015-08-31 2018-04-17 华为技术有限公司 一种网络服务的故障处理方法及装置
CN107301131A (zh) * 2017-06-30 2017-10-27 郑州云海信息技术有限公司 一种分布式存储管理软件故障诊断方法及***
CN107896168A (zh) * 2017-12-08 2018-04-10 国网安徽省电力有限公司信息通信分公司 一种网络虚拟化环境下的电力通信网多域故障诊断方法
CN109218406A (zh) * 2018-08-13 2019-01-15 广西大学 一种面向智慧城市的跨域协作服务方法
CN109218406B (zh) * 2018-08-13 2020-12-15 广西大学 一种面向智慧城市的跨域协作服务方法
CN113746679A (zh) * 2019-04-22 2021-12-03 腾讯科技(深圳)有限公司 跨子域通信运维方法、总运维服务器和介质
CN113746679B (zh) * 2019-04-22 2023-05-02 腾讯科技(深圳)有限公司 跨子域通信运维方法、总运维服务器和介质
CN110391947A (zh) * 2019-08-21 2019-10-29 广东电网有限责任公司 一种多控制器协作的电力通信网设备故障诊断方法
WO2021208979A1 (zh) * 2020-04-17 2021-10-21 华为技术有限公司 一种网络故障的处理方法及装置
WO2022018626A1 (en) * 2020-07-23 2022-01-27 International Business Machines Corporation Cross-environment event correlation using domain-space exploration and machine learning techniques
GB2612541A (en) * 2020-07-23 2023-05-03 Ibm Cross-environment event correlation using domain-space exploration and machine learning techniques
CN112383934A (zh) * 2020-10-22 2021-02-19 深圳供电局有限公司 一种5g网络切片下多域协作的服务故障诊断方法
CN112383934B (zh) * 2020-10-22 2024-01-16 深圳供电局有限公司 一种5g网络切片下多域协作的服务故障诊断方法

Also Published As

Publication number Publication date
CN101674196B (zh) 2011-12-07

Similar Documents

Publication Publication Date Title
CN101674196B (zh) 一种多域协作的分布式故障诊断方法及***
CN101507185B (zh) 使用贝叶斯网络的电信网络中的故障定位
CN206537292U (zh) 承载城市轨道交通调度指挥及运营自动化***的云平台
CN107896168B (zh) 一种网络虚拟化环境下的电力通信网多域故障诊断方法
Cauffriez et al. Design of intelligent distributed control systems: a dependability point of view
CN110380514B (zh) 一种智能变电站继电保护二次回路故障诊断方法
WO2013189110A1 (zh) 一种电力通信故障预警分析方法及***
CN103412861A (zh) 基于知识的解析
CN102045192A (zh) 网络结构的假定所用的装置及***
CN101715203B (zh) 一种自动定位故障点的方法和设备
CN102684902B (zh) 基于探针预测的网络故障定位方法
CN110351391A (zh) 一种汽车诊断云平台***、业务实现方法
CN104660448B (zh) 分布式多层多域体系Multi-Agent协同故障诊断方法
JPH10502222A (ja) ハードウエアの分散管理方法およびシステム
TW202013304A (zh) 整合ict服務供裝與虛實資源監控之系統
CN106230638B (zh) 一种基于事件的云服务测试与调试方法及***
CN114745286A (zh) 基于知识图谱技术面向动态网络智能网络态势感知***
CN102281103A (zh) 基于模糊集合解算的光网络多故障恢复方法
CN108156061A (zh) esb监控服务平台
Kalech et al. Coordination diagnostic algorithms for teams of situated agents: Scaling up
CN105471926A (zh) 基于自律分散***的诊断数据云模型构建***
Brazier et al. Modeling Distributed Industrial Processes in a Multi-Agent Framework
Odintsova et al. Multi-fault diagnosis in dynamic systems
Meskina et al. An efficient simulator for fault detection and recovery in smart grids FDIRSY
CN110391947A (zh) 一种多控制器协作的电力通信网设备故障诊断方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20111207

Termination date: 20130616