CN109309576B - 一种故障社群检测方法及管理节点 - Google Patents

一种故障社群检测方法及管理节点 Download PDF

Info

Publication number
CN109309576B
CN109309576B CN201710618895.9A CN201710618895A CN109309576B CN 109309576 B CN109309576 B CN 109309576B CN 201710618895 A CN201710618895 A CN 201710618895A CN 109309576 B CN109309576 B CN 109309576B
Authority
CN
China
Prior art keywords
fault
slave nodes
keyword
topic
slave
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710618895.9A
Other languages
English (en)
Other versions
CN109309576A (zh
Inventor
张可力
褚令洋
潘璐伽
赫彩凤
王剑涛
裴健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201710618895.9A priority Critical patent/CN109309576B/zh
Publication of CN109309576A publication Critical patent/CN109309576A/zh
Application granted granted Critical
Publication of CN109309576B publication Critical patent/CN109309576B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提供一种故障社群检测方法及管理节点,涉及通信技术领域,用于提高故障社群检测的准确率。该方法包括:管理节点确定故障数据库网络,故障数据库网络包括N个从节点的连接关系、以及每个从节点的故障数据库,每个从节点的故障数据库包括一条或多条故障关键字记录,一条故障关键字记录包含该从节点的一条故障日志中出现的故障关键字,N为大于或等于2的整数;根据故障关键字集合确定故障主题集合,故障关键字集合包括至少一个故障关键字,故障主题集合中的每个故障主题由故障关键字集合中至少一个故障关键字组成;根据N个从节点的连接关系、N个从节点的故障数据库包括的故障关键字记录,从N个节点中确定与每个故障主题匹配的故障社群。

Description

一种故障社群检测方法及管理节点
技术领域
本申请涉及通信技术领域,尤其涉及一种故障社群检测方法及管理节点。
背景技术
随着通信网络规模的不断增大,网络中设备本身及通信所造成的故障种类和数量变得越来越多。由于设备之间的连通性,一个设备上的故障可能会导致其他设备上的故障,从而使得一些故障模式在多个设备之间进行传播,进而导致大面积的设备瘫痪。在网络维护过程中,如果能及时了解网络中的各种故障模式及对应的故障社群,即发生相同故障的设备集合(比如,路由器、交换机等),维护人员就可以快速的定位故障区域并消除故障,以防止这些故障在设备间的扩散。
网络中的设备也可以称为节点,目前常用的一种社群检测方法为:根据通信网络中的节点、节点之间连接的路径的密集程度、以及指定信息项,将密集度较高且同时包含指定信息项的多个节点确定为一个社群。比如,如图1所示的通信网络包括节点:Nd1至Nd10,各节点包括的信息项如图所示,若指定信息项为A和B,则根据该方法确定的社群为C0,C0中包括Nd1至Nd4。该方法只能通过指定信息项描述节点在当前一段时间内是否发生了某种故障,并不能描述节点发生故障的其他信息,因此该方法检测出的故障社群的准确性较低。
发明内容
本申请的实施例提供一种故障社群检测方法及管理节点,解决了现有技术中故障社群检测准确性较低的问题。
为达到上述目的,本申请的实施例采用如下技术方案:
第一方面,提供一种故障社群检测方法,应用于包括管理节点和从节点的通信网络中,该方法包括:管理节点确定故障数据库网络,故障数据库网络包括N个从节点的连接关系、以及N个从节点中每个从节点的故障数据库,每个从节点的故障数据库包括一条或多条故障关键字记录,一条故障关键字记录包含所述从节点的一条故障日志中出现的故障关键字,N 为大于或等于2的整数;根据故障关键字集合确定故障主题集合,故障关键字集合包括至少一个故障关键字,故障主题集合中的每个故障主题由故障关键字集合中至少一个故障关键字组成;根据N个从节点的连接关系、以及N个从节点的故障数据库包括的故障关键字记录,从N 个节点中确定与每个故障主题匹配的故障社群,故障社群为发生相同故障的从节点的集合。上述技术方案中,管理节点确定每个从节点的故障数据库中包括一条或多条故障关键字记录,并确定由故障关键字组成的故障主题,根据每个从节点的故障数据库包括的故障关键字记录和从节点之间的连接关系,确定与每个故障主题匹配的故障社群,从而可以提高故障社群检测的准确率,进而方便网络维护人员快速的定位故障区域并消除故障,防止了这些故障在节点间的传播,同时也提高了故障处理效率。
在第一方面的一种可能的实现方式中,管理节点确定故障数据库网络,包括:根据N个从节点中每个从节点的历史故障日志和故障关键字集合,对应确定一条或多条故障关键字记录,以得到每个从节点的故障数据库;根据通信网络的拓扑结构中N个从节点的连接关系,以及N个从节点的故障数据库,确定故障数据库网络。上述可能的实现方式中,管理节点可以根据每个从节点的每条故障日志中出现的故障关键字集合中的故障关键字确定故障关键字记录,并根据N个从节点的连接关系确定故障数据库,从而可以充分的利用故障日志提高故障社群检测的准确率。
在第一方面的一种可能的实现方式中,根据故障关键字集合确定故障主题集合,包括:将故障关键字集合中包括的故障关键字排列组合,获得故障主题集合,其中,一个故障主题的长度为k,用于表示故障主题由k个不同的故障关键字组成。上述可能的实现方式中,通过将故障关键字排列组合获得不同的故障主题,可以使管理节点针对不同的故障主题确定其匹配的故障社群,从而提高故障社群检测的全面性。
在第一方面的一种可能的实现方式中,将故障关键字集合中包括的故障关键字排列组合,获得故障主题集合,包括:分别将故障关键字集合中的每个故障关键字,确定为一个长度为1 的故障主题;分别将长度为1的故障主题两两组合,获得长度为2的故障主题;采用以下步骤分别获取长度为3≤k≤S的故障主题,S为正整数且小于或等于故障关键字集合包括的故障关键字的总个数;选择长度为k-1的两个故障主题,两个故障主题包含k-2个相同故障关键字;将长度为k-1的两个故障主题通过求同存异的方式组合,获得长度为k的故障主题。上述可能的实现方式中,通过两两组合的方式获得长度大于或等于2的故障主题,在后续可以根据组合时的两个故障主题匹配的故障社群的交集确定组合后得到的故障主题的有效性,从而可以提高管理节点的数据处理效率。
在第一方面的一种可能的实现方式中,根据N个从节点的连接关系、以及N个从节点的故障数据库包括的故障关键字记录,从N个节点中确定与每个故障主题匹配的故障社群,包括:根据N个从节点的故障数据库包括的故障关键字记录,确定故障数据库中包括该故障主题的多个从节点,故障数据库中包括该故障主题是指故障数据库中至少存在一条故障关键字记录包含该故障主题;若多个从节点中的M个从节点之间的每条路径相对于该故障主题的粘合度大于或等于预设阈值,则将M个从节点确定为与该故障主题匹配的故障社群,M为正整数。上述可能的实现方式中,管理节点基于每条路径相对于该故障主题的粘合度确定与该故障主题匹配的故障社群,从而可以保证故障社群检测的准确率。
在第一方面的一种可能的实现方式中,若故障主题的长度k>1,根据N个从节点的连接关系、以及N个从节点的故障数据库包括的故障关键字记录,从N个节点中确定与每个故障主题匹配的故障社群,还包括:获取两个长度为k-1的故障主题匹配的故障社群,两个长度为k-1 的故障主题可通过求同存异的方式组合得到故障主题;若获取的两个故障社群的交集不为空,则根据交集包括的从节点的故障数据库包括的故障关键字记录,确定故障数据库中包括该故障主题的多个从节点;若多个从节点中的M个从节点之间的每条路径相对于故障主题的粘合度大于或等于预设阈值,则将M个从节点确定为与故障主题匹配的故障社群。上述可能的实现方式中,根据长度为k的两个故障主题匹配的故障社群的交集,确定两两组合得到的长度为 k+1的故障主题匹配的故障社群,从而可以减小管理节点的数据处理范围,提高数据处理效率。
在第一方面的一种可能的实现方式中,确定每条路径相对于该故障主题的粘合度,包括:根据多个从节点组成的连接关系,确定包含路径的所有三角图;计算每个三角图中的每个从节点上故障主题在其故障数据库中的出现概率;将所有三角图中每个三角图中的从节点的最小出现概率进行累加,得到路径的粘合度。上述可能的实现方式中,通过粘合度可以同时考虑到多个从节点之间的紧密程度、以及该故障主题在每个从节点的故障数据库中的出现概率,从而可以保证故障社群检测的准确率。
在第一方面的一种可能的实现方式中,根据故障关键字集合确定故障主题集合,还包括:当故障关键字集合中存在第一故障主题匹配的故障社群为空时,删除第一故障主题。上述可能的实现方式中,当第一故障主题匹配的故障社群为空时,删除第一故障主题,从而管理节点后续无需再通过第一故障主题获得长度较大的其他故障主题,从而可以减小管理节点的数据处理范围,提高数据处理效率,同时也节省一定的存储空间。
在本申请的又一方面,提供了一种管理节点,该管理节点实现上述第一方面或第一方面的任一种可能的实现方式所提供的故障社群检测方法中的各种功能,所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个上述功能相应的单元。
在一种可能的设计中,该管理节点的结构中包括处理器和通信接口,该处理器被配置为支持该管理节点执行上述第一方面或第一方面的任一种可能的实现方式所提供的方法。该通信接口用于支持该管理节点与其他网元之间的通信。该管理节点还可以包括存储器,该存储器用于与处理器耦合,其保存该设备必要的程序代码和数据。
本申请的又一方面,提供一种***,该***包括管理节点和从节点;其中,管理节点用于实现上述第一方面或第一方面的任一种可能的实现方式所提供的故障社群检测方法。
本申请的又一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所提供的故障社群检测方法。
本申请的又一方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各方面所提供的故障社群检测方法。
可以理解地,上述提供的任一种故障社群检测方法的设备、计算机存储介质或者计算机程序产品均用于执行上文所提供的对应的方法,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
附图说明
图1为一种通信网络中社群检测的社群示意图;
图2为本申请实施例提供的一种通信网络的***架构图;
图3为本申请实施例提供的一种管理节点的结构示意图;
图4为本申请实施例提供的一种故障社群检测方法的流程示意图;
图5为本申请实施例提供的一种多个从节点之间的连接关系的示意图;
图6为本申请实施例提供的另一种故障社群检测方法的流程示意图;
图7为本申请实施例提供的一种故障社群检测的流程图;
图8为本申请实施例提供的一种管理节点的结构示意图;
图9为本申请实施例提供的另一种管理节点的结构示意图。
具体实施方式
在介绍本申请之前,首先介绍说明一下本申请实施例所涉及的技术名词。
故障数据库网络,泛指在一个网络中的每个节点都关联着一个故障数据库。其中,故障数据库由该节点上的故障日志构建而成,可以包括一条或者多条故障关键字记录,每条故障关键字记录对应一条故障日志中出现的故障关键字。
故障关键字,是指与某种故障相关的关键字,比如,某个网络设备上的电源发生故障,则该故障关键字可以为电源故障。
故障主题,泛指从故障数据库中网络中挖掘出的某个故障模式,也可以称为故障项集,由一个或者多个故障关键字组成。
故障社群,是指发生相同故障的多个节点的集合,且故障社群与故障主题对应。故障社群中的多个节点之间的每条路径的粘合度大于或等于预设阈值。
粘合度(Cohesion),泛指在一个网络中,用于度量节点、以及节点间路径的联系紧密程度的指标。
图2为本申请实例所应用的通信网络的***架构图,参见图2,该***架构可以包括管理节点101和从节点102,管理节点101可用于管理和监控从节点102,从节点102可以包括多个从节点。其中,管理节点101可以包括主机、服务器、服务器集群、或者管理控制台等,从节点 102可以包括路由器、交换机、或者主机等。
本申请实施例中,从节点102在发生故障时,从节点102可以记录和保存相应的故障日志。管理节点101可以对从节点102进行监控,收集从节点102的故障日志,以获取从节点102在一段时间内的历史故障日志。管理节点还可以收集通信网络的拓扑结构,从而得到该通信网络中各从节点102之间的连接关系。管理节点结合历史故障日志和各从节点102之间的连接关系,从各从节点102中检测出各种故障社群。比如,如图2所示的通信网络中,管理节点101检测出的故障社群可以包括C1、C2和C3,每个故障社群中的多个从节点发生相同的故障,且该多个从节点之间具有较强的连通性,即故障在该多个从节点之间很容易传播和扩散。在检测各种故障社群之后,可以方便网络维护人员快速的定位故障区域并消除故障,防止了这些故障在节点间的传播,同时也提高了故障处理效率。
图3为本申请实施例提供的一种管理节点的结构示意图,该管理节点包括:存储器、处理器、***总线、电源组件、输入\输出接口和通信组件等。
其中,图3中以该管理节点为服务器为例进行说明。存储器可用于存储数据、软件程序以及模块,主要包括存储程序区和存储数据区,存储程序区可存储操作***、至少一个功能所需的应用程序等,存储数据区可存储设备的使用所创建的数据等。存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘等等。处理器通过运行或执行存储在存储器内的软件程序和/或模块,以及调用存储在存储器内的数据,执行服务器的各种功能和处理数据。此外,处理器可以包括一个或多个模块,便于处理器和其他组件之间的交互。***总线包括地址总线、数据总线、控制总线,用于传输数据和指令;电源组件用于为服务器的各个组件提供电源;输入\输出接口为处理器和***接口模块之间提供接口;通信组件用于为服务器和其他设备之间进行有线或无线方式的通信,比如,通信组件可以用于为服务器提供与从节点之间的有线或无线方式的通信。
本领域技术人员可以理解,图3示出的管理节点的结构并不构成对其结构的限定。在实际应用中,管理节点还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
图4为本申请实施例提供的一种故障社群检测方法的流程图,该方法应用于包括管理节点和从节点的通信网络中,参见图4,该方法包括以下几个步骤。
步骤201:管理节点确定故障数据库网络,该故障数据库网络包括N个从节点的连接关系、以及N个从节点中每个从节点的故障数据库,每个从节点的故障数据库包括一条或多条故障关键字记录,一条故障关键字记录包含该从节点的一条故障日志中出现的故障关键字, N为大于或等于2的整数。
其中,通信网络中的从节点可以是主机、交换机、路由器或者网络中的其他网元等,管理节点可以是用于管理和监控从节点的主机或者服务器,当在大型通信网络中由服务器集群 (由多个服务器组成的集合)管理和监控多个从节点时,该服务器集群可以作为一个整体作为管理节点。
另外,管理节点可以收集通信网络中包括的多个从节点的历史故障日志和该多个从节点之间的连接关系。当管理节点确定故障数据库网络时,管理节点可以剔除该多个从节点中存在的无效从节点,该无效从节点可以包括无故障日志的从节点、以及无用的从节点等等。也即是,当通信网络中包括的多个从节点中不存在无效从节点时,该多个从节点即为N个从节点,当通信网络中包括的多个从节点中存在无效从节点时,N个从节点为该多个从节点中的有效从节点,N为大于或等于2的整数。
具体的,当管理节点确定故障数据库网络时,管理节点可以根据收集的N个从节点中每个从节点的历史故障日志和故障关键字集合,对应确定一条或多条故障关键字记录,以得到每个从节点的故障数据库;根据N个从节点的连接关系,以及N个从节点的故障数据库,确定故障数据库网络。
其中,故障关键字集合可以包括至少一个故障关键字,至少一个故障关键字可以是根据不同的故障种类预设的,比如,将需要检测的故障相关的关键字作为故障关键字等。每个从节点的历史故障日志可以包括一条或者多条故障日志,根据每条故障日志的具体内容可以确定与该条故障日志对应的故障关键字,与该条故障日志对应的故障关键字的个数可能为一个或者多个,该一个或者多个故障关键字是指故障关键字集合中出现在该条故障日志中的故障关键字。比如,一条故障日志的具体内容中同时包括故障关键字A1和A2,则该条故障日志与 A1、A2对应。
可选的,故障关键字记录可以表示为故障日志与故障关键字之间的对应关系,与故障关键字对应的故障日志可以通过故障日志的具体内容表示,也可以通过故障日志的标识表示,或者通过故障日志的其他信息表示,本申请实施例对此不做具体限定。比如,任一从节点的故障日志与故障关键字之间的对应关系可以如下表1,表1中与故障关键字对应的故障日志以故障日志的标识为例说明,表1中的A1、A2和A3表示故障关键字集合中包括的不同的三个故障关键字。
表1
故障日志 故障关键字
Log ID1 A1、A2
Log ID2 A2
Log ID3 A1、A2、A3
…… ……
需要说明的是,上述表1所示的故障日志与故障关键字之间的对应关系仅为示例性的,表 1并不对本申请实施例构成限定。
进一步的,管理节点确定故障数据库网络可以为管理节点生成故障数据库网络,或者管理节点更新故障数据库网络。即当管理节点第一次确定故障数据库网络时,管理节点可以N 个从节点中每个从节点的历史故障日志、故障关键字集合和N个从节点的连接关系,生成故障数据库网络。当管理节点后续再确定故障数据库网络时,管理节点可以更新之前的故障数据库网络,比如,故障关键字集合发生了变化、N个从节点的连接关系、以及N个从节点中每个从节点的历史故障日志等中的一项或者多项发生了变化,则管理节点可以根据变化后的信息更新故障数据库网络。
步骤202:管理节点根据故障关键字集合确定故障主题集合,故障主题集合中的每个故障主题由故障关键字集合中至少一个故障关键字组成。
其中,故障关键字集合可以包括至少一个故障关键字,至少一个故障关键字可以是根据不同的故障种类预设的,比如将需要检测的故障相关的关键字作为故障关键字等。管理节点在根据故障关键字集合确定故障主题集合时,可以将故障关键字集合包括故障关键字排列组合,从而获得故障主题集合。
比如,故障关键字集合包括的故障关键字为:A1、A2和A3,则经过排列组合获得的故障主题集合可以为{A1,A2,A3,A1A2,A1A3,A2A3,A1A2A3},该故障主题集合中包括 7个故障主题。若一个故障主题的长度为k,用于表示该故障主题由k个不同的故障关键字组成,则该故障主题集合中包括三个长度为1的故障主题{A1,A2,A3}、三个长度为2的故障主题{A1A2,A1A3,A2A3}和一个长度为4的故障主题{A1A2A3}。
进一步的,当故障关键字集合包括多个故障关键字时,管理节点还可以根据以下方法排序组合,获得故障主题集合,具体如下所述。
其中,管理节点分别将故障关键字集合中的每个故障关键字,确定为一个长度为1的故障主题。然后,分别将长度为1的故障主题两两组合,获得长度为2的故障主题。之后,采用以下步骤分别获取长度为3≤k≤S的故障主题,S为正整数且小于或等于故障关键字集合包括的故障关键字的总个数:选择长度为k-1的两个故障主题,该两个故障主题当且仅包含k-2个相同故障关键字;将长度为k-1的两个故障主题通过求同存异的方式组合,获得长度为k的故障主题。
需要说明的是,将两个故障主题通过求同存异的方式组合,是指将两个故障主题中相同的故障关键字仅保留一个,不同的故障关键字都保留。另外,对于长度为k的故障主题,可能会通过长度为k-1的故障主题以多种组合方式获得,对此需要进行去重处理,即相同的故障关键字在长度为k的故障主题中仅保留一个。
比如,故障关键字集合包括的故障关键字为:A1、A2和A3,管理节点将故障关键字集合中的每个故障关键字,确定为一个长度为1的故障主题,得到{A1,A2,A3}。然后,将{A1,A2,A3}中的两两组合,获得长度为2的故障主题{A1A2,A1A3,A2A3}。将包含1个相同故障关键字的两个长度为2的故障主题两两组合,且相同的故障关键字保留一个,即{A1A2, A1A3}组合得到{A1A2A3},{A1A3,A2A3}组合也得到{A1A2A3},将相同的故障主题只保留一个,则获得长度为3的故障主题{A1A2A3}。
步骤203:管理节点根据N个从节点的连接关系、以及N个从节点的故障数据库包括的故障关键字记录,从N个节点中确定与每个故障主题匹配的故障社群,故障社群为发生相同故障的从节点的集合。
其中,对于每个故障主题,管理节点可以根据N个从节点的故障数据库包括的故障关键字记录,确定故障数据库中包括该故障主题的多个从节点。若多个从节点中的M个从节点之间的每条路径相对于该故障主题的粘合度大于或等于预设阈值TS,则将M个从节点确定为与该故障主题匹配的故障社群,M为正整数。预设阈值TS可以事先进行设置,且对于不同的业务场景设置的预设阈值可以不同,本申请实施例对此不作具体限定。
具体的,该故障主题匹配的故障社群需要满足以下三个条件:a、该故障社群包括的M个从节点之间是连通的,即M个从节点之间存在路径相通;b、M个从节点之间的每条路径相对于该故障主题的粘合度均大于或等于预设阈值TS;c、不存在Q个从节点(Q>M)同时满足条件a和条件b。
可选的,管理节点确定每条路径相对于该故障主题的粘合度可以包括:根据多个从节点组成的连接关系,确定包含该路径的所有三角图;计算每个三角图中的每个从节点上该故障主题在其故障数据库中的出现概率;将所有三角图中每个三角图中的从节点的最小出现概率进行累加,得到该路径的粘合度。
其中,三角图是指由三个从节点作为三角形的三个端点,三个从节点间两两连接组成的三角形。计算一个从节点上该故障主题在其故障数据库中的出现概率具体包括:若一个从节点的故障数据库中包括X条故障关键字记录,有Y条故障关键字记录与该故障主题对应,则该从节点上该故障主题在该节点的故障数据库中的出现概率为Y/X,X和Y均为正整数,且X≥Y。比如,该故障主题为{A1A2},某一从节点的故障数据库中有10条故障关键字记录,若10条中有2条故障关键字记录中的故障关键字为A1和A2,有1条故障关键字记录中的故障关键字为 A1、A2和A3,其他7条故障关键字记录中均未同时出现A1和A2,则确定的出现概率为 3/10=0.3。
比如,如图5所示为多个从节点的连接关系,该多个从节点包括Nd1至Nd5,以图5中的路径e1为例确定其相对于该故障主题{A1A2}的粘合度,每个从节点的故障数据库相对于故障主题{A1A2}的出现概率分别为P1=0.3、P2=0.4、P3=0.2、P4=0.2和P5=0.05。多个从节点中包括路径e1的所有三角图包括:由Nd1、Nd2和Nd3组成的三角图,以及由Nd1、Nd3和Nd4组成的三角图。Nd1、Nd2、Nd3和Nd4的故障数据库中故障主题{A1A2}的出现概率分别为P1=0.3、 P2=0.4、P3=0.2和P4=0.2,则第一个三角图(Nd1、Nd2和Nd3)中的最小出现概率为min{0.3, 0.4,0.2}=0.2,第二个三角图(Nd1、Nd3和Nd4)中的最小出现概率为min{0.3,0.2,0.2}=0.2,两个三角图的最小出现概率累加得到路径e1的粘合度为0.4。
进一步的,管理节点在确定每个故障主题匹配的故障社群时,还可以按照故障主题的长度从小到大的顺序依次确定。以长度为k和k+1的故障主题为例说明(这里k为正整数),管理节点可以在确定长度为k的故障主题后,即确定长度为k的每个故障主题匹配的故障社群,之后再确定长度为k+1的故障主题、以及与每个长度为k+1的故障主题匹配的故障社群。
具体的,当确定长度为1的故障主题匹配的故障社群时,管理节点可以根据上述步骤203 确定每一个长度为1的故障主题匹配的故障社群。当确定长度k>1的故障主题匹配的故障社群时,管理节点可以获取两个长度为k-1的故障主题匹配的故障社群,这两个长度为k-1的故障主题可通过求同存异的方式组合得到长度为k的故障主题;若获取的两个故障社群的交集不为空,则根据该交集包括的从节点的故障数据库中包括的故障关键字记录,确定故障数据库中包括该长度为k的故障主题的多个从节点;若该多个从节点中的M个从节点之间的每条路径相对于该长度为k的故障主题的粘合度大于或等于预设阈值,则将M个从节点确定为与该长度为 k的故障主题匹配的故障社群。
进一步的,管理节点在确定与每个故障主题匹配的故障社群的过程中,若确定故障主题集合中存在第一故障主匹配的故障社群为空时,则从故障主题集合中删除第一故障主题,第一故障主题可以包括一个或者多个故障主题。
其中,长度为1的故障主题是由一个故障关键字组成的,故障关键字为故障关键字集合中预设的需要检测的。当长度为1的故障主题匹配的故障社群为空时,管理节点可以删除该长度为1的故障主题。因此,管理节点可以删除长度大于或等于1的故障主题中无故障社群匹配的故障主题。
具体的,在按照故障主题的长度从小到大的顺序依次确定每个故障主题匹配的故障社群时,还可以基于长度为k的故障主题匹配的故障社群,筛选掉长度为k+1的故障主题中无用的故障主题,即筛选掉不存在匹配的故障社群的故障主题。比如,当两个长度为k的故障主题通过求同存异的方式两两组合得到长度为k+1的故障主题时,可以基于这两个长度为k的故障主题匹配的故障社群的交集,确定该长度为k+1的故障主题是否为无用的故障主题。若这两个故障社群的交集为空,则可以确定该长度为k+1的故障主题为无用的故障主题;若这两个故障社群的交集不为空,则按照上述确定故障社群的方法确定出的故障社群为空时,该长度为k+1 的故障主题也为无用的故障主题,从而管理节点可以从故障主题集合中删除该长度为k+1的故障主题。管理节点通过删除无用的故障主题,可以节省一定的存储空间,并在确定与每个故障主题匹配的故障社群时,可以避免管理节点对无用的故障主题的处理操作,从而减小了管理节点的能耗,同时也提高故障社群的检测效率。
为了便于理解,下面对本申请实施例中按照故障主题的长度从小到大的顺序依次确定每个故障主题匹配的故障社群的方案进行详细说明。
具体的,图6为本申请实施例提供的一种故障社群检测方法的流程图。首先,可以将通信网络的拓扑结构、N个从节点的历史故障日志、以及预设阈值作为管理节点的输入信息,管理节点通过以下步骤进行检测:S1、对历史故障日志进行预处理,即根据N个从节点的历史故障日志和故障关键字集合,确定每个从节点的故障数据库,并根据通信网络的拓扑结构中 N个从节点的连接关系、以及每个从节点的故障数据库,确定故障数据库网络。S2、根据故障关键字集合中的每个故障关键字,确定长度为1的故障主题,并确定每个长度为1的故障主题匹配的故障社群。在确定长度大于1的故障主题、以及与每个长度大于1的故障主题匹配的故障社群时,通过以下步骤:S3、确定长度为k的故障主题是否为空,即确定是否存在长度为 k的故障主题。S4、若长度为k(k≥1)的故障主题不为空,则通过求同存异的方式两两组合,获取长度为k+1的故障主题;若为空,即不存在长度为k的故障主题,则流程结束。S5、根据两两组合的长度为k的故障主题匹配的故障社群的交集,确定长度为k+1的故障主题的有效性,即确定长度为k+1的故障主题是否存在匹配的故障社群。S6、若长度为k+1的故障主题存在匹配的故障社群,则确定长度为k+1的故障主题匹配的故障社群,其中,长度为k+1的故障社群可以包括多个,管理节点可以逐一确定故障主题的有效性及其匹配的故障社群。S7、通过迭代的方式将k更新为k+1。之后,返回步骤S3 继续执行,直至确定主题长度为S的故障主题匹配的故障社群后,流程结束。
进一步的,根据上述图6所示的方法中管理节点的各功能,可以将管理节点划分为如图7 所示的结构,该管理节点包括:数据预处理单元、故障主题确定单元、故障主题筛选单元、故障社群检测单元和迭代控制单元。其中,数据预处理单元可用于对管理节点的数据进行预处理,比如,该数据可以为管理节点收集的从节点的历史故障日志、以及收集的通信网络的拓扑节点等。故障主题确定单元和故障主题筛选单元可用于确定故障主题、以及筛选掉故障主题中无用的故障主题,故障主题也可以称为故障模式,用于表示某一种或多种故障。故障社群检测单元可用于从管理节点管理的多节点中检测发生相同故障的从节点的集合,即检测各种故障主题匹配的故障社群。迭代控制单元可用于负责故障社群检测流程的有序执行。
具体的,管理节点包括的各单元对应上述故障社群检测方法中的具体步骤可以为:首先,数据预处理单元根据通信网络的网络拓扑,收集的历史故障日志及故障关键字集合确定故障数据库网络。其次,故障主题确定单元、故障主题筛选单元和故障社群检测单元都受迭代控制单元控制,按层次检测故障主题匹配的故障社群。这里的按层次检测,即首先检测出所有长度为1的故障主题及其匹配的故障社群(第一层),然后在长度为1的故障主题及其匹配的故障社群基础上,检测长度为2的故障主题及其匹配的故障社群(第二层),接着在长度为2 的故障主题及其匹配的故障社群基础上,检测长度为3的故障主题及其匹配的故障社群(第三层),以此类推,直到迭代控制单元结束迭代。
可选的,故障主题确定单元初始时根据故障关键字集合确定所有长度为1的故障主题(第一层),然后该单元可以进入等待状态,即等待后续的故障主题筛选单元、故障社群检测单元对这些长度为1的故障主题进行有效性确认以及确定出其匹配的故障社群,并将这些结果输出到故障社群库(故障社群库用于存储故障主题及其匹配的故障社群)。完成上述操作后,再唤醒故障主题确定单元,查询故障社群库中所有长度为1的(有效)故障主题,通过求同存异的方式两两组合长度为1的故障主题来获得长度为2的故障主题,接着该单元又进入等待状态,即等待管理节点确定出所有长度为2的故障主题匹配的故障社群之后,再通过同存异的方式两两组合所有长度为2的故障主题来获得长度为3的故障主题,依次类推,直到迭代控制单元结束迭代。其中,迭代控制单元迭代终止的条件为:在当前层次,比如在层次k(k>=1的整数)时,检测出任何一个故障主题匹配的故障社群都为空(即确认当前层的所有故障主题均为无效的故障主题),则确定迭代结束,当前故障社群库的结果即为检测出的所有故障主题匹配的故障社群的集合。
本申请实施例提供的故障社群检测方法中,管理节点通过确定故障数据库网络,根据故障关键字集合确定故障主题集合,故障主题集合中每个故障主题由至少一个故障关键字组成,之后根据N个从节点的连接关系、以及故障数据库网络包括的故障关键字记录,确定每个故障主题匹配的故障社群,从而可以快速准确的检测得到各种故障社群,之后,可以方便网络维护人员快速的定位故障区域并消除故障,防止了这些故障在节点间的传播,同时也提高了故障处理效率。
上述主要从各个网元之间交互的角度对本申请实施例提供的方案进行了介绍。可以理解的是,各个网元,例如管理节点和从节点等为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的网元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对管理节点进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
在采用对应各个功能划分各个功能模块的情况下,图8示出了上述实施例中所涉及的管理节点的一种可能的结构示意图,管理节点包括:处理单元301。其中,处理单元301用于支持管理节点执行图4所提供的故障社群检测方法中的步骤201-步骤203、或者执行图6所提供的故障社群检测方法中的步骤S1-步骤S7。上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。另外,处理单元301可以是图7所示的管理节点的结构中各单元的集成设置,即处理单元301同时具有数据预处理单元、故障主题确定单元、故障主题筛选单元、故障社群检测单元和迭代控制单元的功能。
在硬件实现上,上述处理单元301可以为处理器;此外,管理节点还可以包括通信接口和存储器。
图9所示,为本申请的实施例提供的上述实施例中所涉及的管理节点的一种可能的逻辑结构示意图。管理节点包括:处理器312、通信接口313、存储器311以及总线314。处理器312、通信接口313以及存储器311通过总线314相互连接。在本申请的实施例中,处理器312用于对管理节点的动作进行控制管理,例如,处理器312用于支持管理节点执行图4所提供的故障社群检测方法中的步骤201-步骤203、或者执行图6所提供的故障社群检测方法中的步骤S1-步骤 S7,和/或用于本文所描述的技术的其他过程。通信接口313用于支持管理节点进行通信。存储器311,用于存储管理节点的程序代码和数据。
其中,处理器312可以是中央处理器单元,通用处理器,数字信号处理器,专用集成电路,现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,数字信号处理器和微处理器的组合等等。总线314可以是外设部件互连标准(PeripheralComponent Interconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA) 总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
在本申请的另一实施例中,还提供一种可读存储介质,可读存储介质中存储有计算机执行指令,当一个设备(可以是单片机,芯片等)或者处理器执行图4或图6所提供的故障社群检测方法。前述的可读存储介质可以包括:U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
在本申请的另一实施例中,还提供一种计算机程序产品,该计算机程序产品包括计算机执行指令,该计算机执行指令存储在计算机可读存储介质中;设备的至少一个处理器可以从计算机可读存储介质读取该计算机执行指令,至少一个处理器执行该计算机执行指令使得设备实施图4或图6所提供的故障社群检测方法。
在本申请的另一实施例中,还提供一种***,该***包括:管理节点和从节点;其中,管理节点可以为上述图3、图7、图8或者图9所示的管理节点,用于执行图4或图6所提供的故障社群检测方法。
在本申请实施例中,管理节点通过确定故障数据库网络,根据故障关键字集合确定故障主题集合,故障主题集合中每个故障主题由至少一个故障关键字组成,之后根据N个从节点的连接关系、以及故障数据库网络包括的故障关键字记录,确定每个故障主题匹配的故障社群,从而可以快速准确的检测得到各种故障社群,之后,可以方便网络维护人员快速的定位故障区域并消除故障,防止了这些故障在节点间的传播,同时也提高了故障处理效率。
最后应说明的是:以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (18)

1.一种故障社群检测方法,其特征在于,应用于通信网络中,所述通信网络包括管理节点和从节点,所述方法包括:
管理节点确定故障数据库网络,所述故障数据库网络包括N个从节点的连接关系、以及所述N个从节点中每个从节点的故障数据库,每个从节点的故障数据库包括一条或多条故障关键字记录,一条故障关键字记录包含所述从节点的一条故障日志中出现的故障关键字,所述N为大于或等于2的整数;
根据故障关键字集合确定故障主题集合,所述故障关键字集合包括至少一个故障关键字,所述故障主题集合中的每个故障主题由所述故障关键字集合中至少一个故障关键字组成;
根据所述N个从节点的连接关系、以及所述N个从节点的故障数据库包括的故障关键字记录,从所述N个从节点中确定与每个故障主题匹配的故障社群,所述故障社群为发生相同故障的从节点的集合。
2.根据权利要求1所述的方法,其特征在于,所述管理节点确定故障数据库网络,包括:
根据所述N个从节点中每个从节点的历史故障日志和所述故障关键字集合,对应确定一条或多条故障关键字记录,以得到每个从节点的故障数据库;
根据所述通信网络的拓扑结构中所述N个从节点的连接关系,以及所述N个从节点的故障数据库,确定故障数据库网络。
3.根据权利要求1所述的方法,其特征在于,所述根据所述故障关键字集合确定故障主题集合,包括:
将所述故障关键字集合中包括的故障关键字排列组合,获得所述故障主题集合,其中,一个故障主题的长度为k,用于表示所述故障主题由k个不同的故障关键字组成。
4.根据权利要求3所述的方法,其特征在于,所述将所述故障关键字集合中包括的故障关键字排列组合,获得所述故障主题集合,包括:
分别将所述故障关键字集合中的每个故障关键字,确定为一个长度为1的故障主题;
分别将长度为1的故障主题两两组合,获得长度为2的故障主题;
采用以下步骤分别获取长度为3≤k≤S的故障主题,所述S为正整数且小于或等于所述故障关键字集合包括的故障关键字的总个数;
选择长度为k-1的两个故障主题,所述两个故障主题包含k-2个相同故障关键字;
将所述长度为k-1的两个故障主题通过求同存异的方式组合,获得长度为k的故障主题。
5.根据权利要求1所述的方法,其特征在于,所述根据所述N个从节点的连接关系、以及所述N个从节点的故障数据库包括的故障关键字记录,从所述N个从节点中确定与每个故障主题匹配的故障社群,包括:
根据所述N个从节点的故障数据库包括的故障关键字记录,确定故障数据库中包括所述故障主题的多个从节点,所述故障数据库中包括所述故障主题是指所述故障数据库中至少存在一条故障关键字记录包含所述故障主题;
若所述多个从节点中的M个从节点之间的每条路径相对于所述故障主题的粘合度大于或等于预设阈值,则将所述M个从节点确定为与所述故障主题匹配的故障社群,所述M为正整数。
6.根据权利要求5所述的方法,其特征在于,若所述故障主题的长度k>1,所述根据所述N个从节点的连接关系、以及所述N个从节点的故障数据库包括的故障关键字记录,从所述N个从节点中确定与每个故障主题匹配的故障社群,还包括:
获取两个长度为k-1的故障主题匹配的故障社群,所述两个长度为k-1的故障主题可通过求同存异的方式组合得到所述故障主题;
若获取的两个故障社群的交集不为空,则根据所述交集包括的从节点的故障数据库包括的故障关键字记录,确定故障数据库中包括所述故障主题的多个从节点;
若所述多个从节点中的M个从节点之间的每条路径相对于所述故障主题的粘合度大于或等于预设阈值,则将所述M个从节点确定为与所述故障主题匹配的故障社群。
7.根据权利要求5或6所述的方法,其特征在于,所述确定每条路径相对于所述故障主题的粘合度,包括:
根据所述多个从节点组成的连接关系,确定包含所述路径的所有三角图;
计算每个三角图中的每个从节点上所述故障主题在其故障数据库中的出现概率;
将所有三角图中每个三角图中的从节点的最小出现概率进行累加,得到所述路径的粘合度。
8.根据权利要求3或4所述的方法,其特征在于,所述根据所述故障关键字集合确定故障主题集合,还包括:
当所述故障关键字集合中存在第一故障主题匹配的故障社群为空时,删除所述第一故障主题。
9.一种管理节点,其特征在于,应用于通信网络中,所述通信网络还包括从节点,所述管理节点包括:
处理单元,用于确定故障数据库网络,所述故障数据库网络包括N个从节点的连接关系、以及所述N个从节点中每个从节点的故障数据库,每个从节点的故障数据库包括一条或多条故障关键字记录,一条故障关键字记录包含所述从节点的一条故障日志中出现的故障关键字,所述N为大于或等于2的整数;
所述处理单元,还用于根据故障关键字集合确定故障主题集合,所述故障关键字集合包括至少一个故障关键字,所述故障主题集合中的每个故障主题由所述故障关键字集合中至少一个故障关键字组成;
所述处理单元,还用于根据所述N个从节点的连接关系、以及所述N个从节点的故障数据库包括的故障关键字记录,从所述N个从节点中确定与每个故障主题匹配的故障社群,所述故障社群为发生相同故障的从节点的集合。
10.根据权利要求9所述的管理节点,其特征在于,所述处理单元,具体用于:
根据所述N个从节点中每个从节点的历史故障日志和所述故障关键字集合,对应确定一条或多条故障关键字记录,以得到每个从节点的故障数据库;
根据所述通信网络的拓扑结构中所述N个从节点的连接关系,以及所述N个从节点的故障数据库,确定故障数据库网络。
11.根据权利要求9所述的管理节点,其特征在于,所述处理单元,具体用于:
将所述故障关键字集合中包括的故障关键字排列组合,获得所述故障主题集合,其中,一个故障主题的长度为k,用于表示所述故障主题由k个不同的故障关键字组成。
12.根据权利要求11所述的管理节点,其特征在于,所述处理单元,具体用于:
分别将所述故障关键字集合中的每个故障关键字,确定为一个长度为1的故障主题;
分别将长度为1的故障主题两两组合,获得长度为2的故障主题;
采用以下步骤分别获取长度为3≤k≤S的故障主题,所述S为正整数且小于或等于所述故障关键字集合包括的故障关键字的总个数;
选择长度为k-1的两个故障主题,所述两个故障主题包含k-2个相同故障关键字;
将所述长度为k-1的两个故障主题通过求同存异的方式组合,获得长度为k的故障主题。
13.根据权利要求9所述的管理节点,其特征在于,所述处理单元,具体用于:
根据所述N个从节点的故障数据库包括的故障关键字记录,确定故障数据库中包括所述故障主题的多个从节点,所述故障数据库中包括所述故障主题是指所述故障数据库中至少存在一条故障关键字记录包含所述故障主题;
若所述多个从节点中的M个从节点之间的每条路径相对于所述故障主题的粘合度大于或等于预设阈值,则将所述M个从节点确定为与所述故障主题匹配的故障社群,所述M为正整数。
14.根据权利要求13所述的管理节点,其特征在于,若所述故障主题的长度k>1,所述处理单元,还具体用于:
获取两个长度为k-1的故障主题匹配的故障社群,所述两个长度为k-1的故障主题可通过求同存异的方式组合得到所述故障主题;
若获取的两个故障社群的交集不为空,则根据所述交集包括的从节点的故障数据库包括的故障关键字记录,确定故障数据库中包括所述故障主题的多个从节点;
若所述多个从节点中的M个从节点之间的每条路径相对于所述故障主题的粘合度大于或等于预设阈值,则将所述M个从节点确定为与所述故障主题匹配的故障社群。
15.根据权利要求13或14所述的管理节点,其特征在于,所述处理单元,还用于:
根据所述多个从节点组成的连接关系,确定包含所述路径的所有三角图;
计算每个三角图中的每个从节点上所述故障主题在其故障数据库中的出现概率;
将所有三角图中每个三角图中的从节点的最小出现概率进行累加,得到所述路径的粘合度。
16.根据权利要求11或12所述的管理节点,其特征在于,所述处理单元,还用于:
当所述故障关键字集合中存在第一故障主题匹配的故障社群为空时,删除所述第一故障主题。
17.一种管理节点,其特征在于,所述管理节点包括存储器、处理器、总线和通信接口,所述存储器中存储代码和数据,所述处理器与所述存储器通过总线连接,所述处理器运行所述存储器中的代码使得所述管理节点执行上述权利要求1-8任一项所述的故障社群检测方法。
18.一种可读存储介质,其特征在于,所述可读存储介质中存储有指令,当所述可读存储介质在设备上运行时,使得所述设备执行上述权利要求1-8任一项所述的故障社群检测方法。
CN201710618895.9A 2017-07-26 2017-07-26 一种故障社群检测方法及管理节点 Active CN109309576B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710618895.9A CN109309576B (zh) 2017-07-26 2017-07-26 一种故障社群检测方法及管理节点

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710618895.9A CN109309576B (zh) 2017-07-26 2017-07-26 一种故障社群检测方法及管理节点

Publications (2)

Publication Number Publication Date
CN109309576A CN109309576A (zh) 2019-02-05
CN109309576B true CN109309576B (zh) 2020-05-08

Family

ID=65202348

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710618895.9A Active CN109309576B (zh) 2017-07-26 2017-07-26 一种故障社群检测方法及管理节点

Country Status (1)

Country Link
CN (1) CN109309576B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11693924B2 (en) * 2019-06-06 2023-07-04 Hitachi, Ltd. System and method for maintenance recommendation in industrial networks

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9419854B1 (en) * 2013-06-27 2016-08-16 The Boeing Company Methods and systems for shared awareness through local observations and global state consistency in distributed and decentralized systems
CN104301136B (zh) * 2014-09-11 2018-06-19 青岛海信电器股份有限公司 故障信息上报及处理的方法及设备
CN105812177B (zh) * 2016-03-08 2019-10-18 华为技术有限公司 一种网络故障处理方法和处理设备
CN106330531B (zh) * 2016-08-15 2019-05-03 东软集团股份有限公司 节点故障记录和处理的方法以及装置

Also Published As

Publication number Publication date
CN109309576A (zh) 2019-02-05

Similar Documents

Publication Publication Date Title
US11275641B2 (en) Automatic correlation of dynamic system events within computing devices
US9201742B2 (en) Method and system of self-managing nodes of a distributed database cluster with a consensus algorithm
WO2021073433A1 (zh) 一种监控方法、装置、服务器及存储介质
US8443078B2 (en) Method of determining equivalent subsets of agents to gather information for a fabric
CN112597153B (zh) 一种基于区块链的数据存储方法、装置及存储介质
CN106817402A (zh) 缓存数据的处理方法及装置
CN112738172A (zh) 区块链节点的管理方法、装置、计算机设备和存储介质
CN109753540A (zh) 共享资源访问方法、装置及计算机可读取存储介质
CN108809729A (zh) 一种分布式***中ctdb服务的故障处理方法及装置
CN115756955A (zh) 一种数据备份、数据恢复的方法、装置及计算机设备
CN109309576B (zh) 一种故障社群检测方法及管理节点
CN117376092A (zh) 故障根因定位方法、装置、设备及存储介质
CN114297037A (zh) 一种告警聚类方法及装置
CN114625554A (zh) 故障修复方法、装置、电子设备及存储介质
CN116302885A (zh) 问题处理方法及装置、计算机可读存储介质、终端
CN115150253A (zh) 一种故障根因确定方法、装置及电子设备
CN105786865B (zh) 一种检索***故障分析方法及装置
CN111221847B (zh) 监控数据存储方法、装置及计算机可读存储介质
CN108259545B (zh) 端口安全策略扩散方法及装置
CN110888929B (zh) 数据处理方法、装置、数据节点及存储介质
Li et al. Open heterogeneous quorum systems
CN109101187B (zh) 一种进行数据重构的方法和装置
Chen et al. t/t-Diagnosability of BCube Network
CN111723146B (zh) 监测数据库的方法、管理***及存储介质
CN114090551A (zh) 一种存储数据的方法、装置及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant