CN107590008B - 一种通过加权熵判断分布式集群可靠度的方法和*** - Google Patents

一种通过加权熵判断分布式集群可靠度的方法和*** Download PDF

Info

Publication number
CN107590008B
CN107590008B CN201710651527.4A CN201710651527A CN107590008B CN 107590008 B CN107590008 B CN 107590008B CN 201710651527 A CN201710651527 A CN 201710651527A CN 107590008 B CN107590008 B CN 107590008B
Authority
CN
China
Prior art keywords
reliability
node
value
sliding window
weighted entropy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710651527.4A
Other languages
English (en)
Other versions
CN107590008A (zh
Inventor
任睿
田帅
王磊
詹剑锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Computing Technology of CAS
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CN201710651527.4A priority Critical patent/CN107590008B/zh
Publication of CN107590008A publication Critical patent/CN107590008A/zh
Application granted granted Critical
Publication of CN107590008B publication Critical patent/CN107590008B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Complex Calculations (AREA)

Abstract

本发明涉及一种通过加权熵判断分布式集群可靠度的方法和***,属于分布式集群可靠性领域,通过预先为不同严重性的日志事件分别进行赋权,然后利用滑动窗口统计该时段内集群各节点的不同类型***日志数量,进而计算各节点的错误率,并根据该错误率计算集群的可靠性加权熵,最后根据波动大小判断集群稳定性。通过该方法量化了***可靠性,不但可以通过简单部署就能对整个集群的可靠性进行量化判定,而且还可对集群的稳定程度进行实时监控,及时了解集群的环境变化,当集群的可靠性出现较大波动时可及时采取相应措施处理。

Description

一种通过加权熵判断分布式集群可靠度的方法和***
技术领域
本发明涉及分布式集群可靠性领域,特别涉及一种通过加权熵判断分布式集群可靠度的方法和***。
背景技术
集群技术,顾名思义,它将多个***连接到一起,使多台服务器能够像一台机器那样工作或者看起来好像一台机器。由于单台机器的处理能力有限,此技术能把有限的资源整合成一个庞大的资源,从而应对更大计算或存储性能的需求,进而提高***稳定性和网络中心的数据处理能力及服务能力。鉴于该优势,集群技术大行其道,常用的工具如Hadoop、spark、flink等便是集群技术的典型应用。现有的海量数据分析都是基于大量节点组成的集群来解决的,且随着人工智能、机器学习等技术的持续更新发展,集群越来越发挥其不可替代的作用。
总体来说,集群具有以下特点:
高可伸缩性:服务器集群具有很强的可伸缩性。随着需求和负荷的增长,可以向集群***添加更多的服务器。在这样的配置中,可以有多台服务器执行相同的应用和数据库操作;
高可用性:服务器集群具有防止***发生故障或从故障中自动恢复的能力。通过把故障服务器上的应用程序转移到备份服务器上运行,集群***能够把正常运行时间提高到大于99.9%,大大减少服务器和应用程序的停机时间;
高可管理性:***管理员可以从远程管理一个、甚至一组集群,就好象在单机***中一样。
基于以上种种优势,集群被广泛的部署应用,大型企业集群的节点数量已成百上千,更有甚者部署上万也不足为奇。但随着规模的不断增大,各种问题接踵而至,节点的可靠性便为一个急需解决的问题。集群可以建立在很多廉价的硬件设备上,因此任何时候都很容易出现故障,可靠性无法保证,如果放任不管,集群性能会越来越差,甚至崩溃。且集群运行时,如果有异常干扰,性能便会有较大的波动,如果不能及时发现这些潜在威胁,很可能会导致不可估量的损失。
目前,国内外在对集群的可靠性进行判断方面研究从数据来源看大致分为两类:根据***日志分析和根据节点性能指标分析。
***日志策略可以在故障刚刚发生时就向你发送警告信息,帮助用户在最短的时间内发现问题,它会在问题出现时记录硬件、软件和***问题的信息,同时还可以监视***中发生的事件。用户可以通过它来检查错误发生的原因,或者寻找受到攻击时攻击者留下的痕迹,也可以通过监测该日志来获取目前节点的状态。因此如有监测到日志警报异常,则证明此时该节点可能出现可靠性波动。
节点性能指标根据硬件类别包含:CPU、内存、I/O、硬盘及其它指标,这些指标均代表机器在该方面的性能状态,某一项指标过高,则证明其利用率增加。单个指标之间也不是毫无联系,常常存在耦合性。如果某些指标在正常状态下出现较大波动,则证明该节点可能出现异常。用户可以通过实时监测这些指标来获取节点目前的性能状态,进而判断其可靠性。
论文《加权模糊相对熵在电机转子故障模糊识别中的应用》,该论文的方法将加权思想引入到模糊相对熵,用于识别电机转子故障严重程度。主要基于符号时间序列分析模糊相对熵,然后根据加权模糊相对熵识别方法进行电机故障诊断识别。本发明与该论文的相同点包括:都是通过加权思想与熵结合,用于检测时间序列中的异常;不同点包括:首先,应用方面不同,该论文是检测电机转子故障,而本发明是检测集群可靠性;其次,该论文运用相对熵来衡量异常,而本发明用信息熵大小来衡量可靠性的波动性。
发明人在集群环境下进行研究时,发现同一类型作业在同一个集群上运行时会出现性能波动,即作业的执行速率快慢会受到集群环境的影响。在集群环境下,由于故障的不确定性会导致集群***的故障定位和排除难度大、维护成本高;又由于***熵是计算机***中不确定性的度量,***熵越高,***的不确定性越大。于是,在进行充分调研后,本发明提出了一种基于***熵对集群可靠性进行量化的方法。为了对集群性能有一个量化的判定,本发明提出一种基于加权熵来判断集群可靠性程度的方法来度量集群稳定性,主要对各种故障进行预赋权后通过熵计算来判定波动大小,以判断集群的可靠程度和稳定性。
发明内容
为了解决上述技术问题,本发明目的在于对集群的可靠程度进行判定,从而量化集群的可靠性和稳定性,达到集群故障程度实时检测的目的。
具体地说,本发明公开了一种通过加权熵判断分布式集群可靠度的方法,其中包括:
步骤1、根据预先设定的日志事件等级,为分布式集群中各节点的日志事件赋予权值;
步骤2、通过用户设置的滑动窗口,获取该滑动窗口内该分布式集群各节点的***日志,并统计该***日志内各日志事件等级对应的日志事件数目,通过依次对该日志事件数目进行归一化操作,得到各日志事件等级的归一化值;
步骤3、根据该归一化值和该权值,计算当前该滑动窗口中各节点错误率;
步骤4、根据该节点错误率,通过加权熵算法,计算当前该滑动窗口内该分布式集群的可靠性加权熵;
步骤5、随着滑动窗口的移动,统计预设时间内各滑动窗口的该可靠性加权熵的波动值,并通过比较该波动值与预先设定的波动阈值,判定该分布式集群的可靠度。
该通过加权熵判断分布式集群可靠度的方法,其中步骤2中该归一化操作包括:
其中Nij代表节点i下j事件的归一化后的该归一化值,x代表该日志事件数目,max代表各日志事件数目中的最大值。
该通过加权熵判断分布式集群可靠度的方法,其中步骤3中该节点错误率的计算方法包括:
其中weight为该权值,t为该滑动窗口的时间长度值,Nij代表节点i下j事件等级的该归一化值,ratioi代表该节点错误率,m代表预先设定的该日志事件等级的数目。
该通过加权熵判断分布式集群可靠度的方法,其中步骤4中该可靠性加权熵的计算方法包括:
其中Ri为步骤3计算的该节点错误率,n表示集群中节点的个数,H(u)表示该可靠性加权熵。
该通过加权熵判断分布式集群可靠度的方法,其中步骤5中该波动值的计算方法包括:统计该预设时间内各滑动窗口的该可靠性加权熵的均值,并对每个该均值求方差,将该方差作为该波动值。
本发明还提出一种通过加权熵判断分布式集群可靠度的***,其中包括:
赋权模块,用于根据预先设定的日志事件等级,为分布式集群中各节点的日志事件赋予权值;
归一化处理模块,用于根据用户设置的滑动窗口,获取该滑动窗口内该分布式集群各节点的***日志,并统计该***日志内各日志事件等级对应的日志事件数目,通过依次对该日志事件数目进行归一化操作,求出各日志事件等级的归一化值;
错误率计算模块,用于根据该归一化值和该权值,计算当前该滑动窗口中各节点错误率;
加权熵计算模块,用于根据该节点错误率,通过加权熵算法,计算当前该滑动窗口内该分布式集群的可靠性加权熵;
可靠度判定模块,用于随着滑动窗口的移动,统计预设时间内各滑动窗口的该可靠性加权熵的波动值,并通过比较该波动值与预先设定的波动阈值,判定该分布式集群的可靠度。
该通过加权熵判断分布式集群可靠度的***,其中归一化处理模块中该归一化操作包括:
其中Nij代表节点i下j事件的归一化后的该归一化值,x代表该日志事件数目,max代表各日志事件数目中的最大值。
该通过加权熵判断分布式集群可靠度的***,其中错误率计算模块中该节点错误率的计算包括:
其中weight为该权值,t为该滑动窗口的时间长度值,Nij代表节点i下j事件等级的该归一化值,ratioi代表该节点错误率,m代表预先设定的该日志事件等级的数目。
该通过加权熵判断分布式集群可靠度的***,其中加权熵计算模块中该可靠性加权熵的计算包括:
其中Ri为错误率计算模块生成的该节点错误率,n表示集群中节点的个数,H(u)表示该可靠性加权熵。
该通过加权熵判断分布式集群可靠度的***,其中可靠度判定模块中该波动值的计算包括:统计该预设时间内各滑动窗口的该可靠性加权熵的均值,并对每个该均值求方差,将该方差作为该波动值。
本发明通过上述方法和***量化了***可靠性,不但可以通过简单部署即可对整个集群的可靠性进行量化判定,而且还可对集群的稳定程度进行实时监控,及时了解集群的环境变化,当集群的可靠性出现较大波动时可及时采取相应措施处理。
附图说明
图1为本发明的方法流程图。
具体实施方式
本发明总体思路为,首先要预先为不同严重性的日志事件(这里选取的日志事件是一些表示***出错或失效的日志事件)分别进行赋权,然后利用滑动窗口统计该时段内集群各节点的不同类型***日志数量,进而计算各节点的错误率,并根据该错误率计算集群的可靠性加权熵,最后根据波动大小判断集群稳定性。
为让本发明的上述特征和效果能阐述的更明确易懂,下文特举实施例,并配合说明书附图作详细说明如下。
如图1所示,本发明提出一种基于加权熵来判断集群可靠性程度的方法和***,该方法包含如下几个步骤:
步骤1:根据预先设定的日志事件等级,为分布式集群中各节点的日志事件赋予权值。具体包括,预先为不同严重性程度的日志事件赋予不同的权值,其中选取的日志事件可以进一步筛选为一些表示***出错或失效的日志事件,日志事件的严重性程度越大,所赋予的权重也越大,同时保证各类权值的和为1。
例如,本发明所测***将其日志信息分为七个主要的等级,依序是由不重要排列到重要讯息等级:
info:仅是一些基本的讯息说明而已;
notice:比info还需要被注意到的一些信息内容;
warning或warn:警示讯息,可能有问题,但是还不至于影响到某个daemon运作;
err或error:一些重大的错误讯息,用以通知***去找错误原因;
crit:比error还要严重的错误信息,crit是临界点(critical)的缩写;
alert:警告警告,已经很有问题的等级,比crit还要严重;
emerg或panic:疼痛等级,意指***已经几乎要当机的状态,属于最严重的错误信息。
本发明分别给这七个日志事件赋权(实际操作中,权重可由用户自行指定)。分别为:
weight(info)=0.01,weight(notice)=0.03,weight(warn)=0.07,weight(error)=0.1,weight(error)=0.13,weight(crit)=0.16,weight(crit)=0.2,weight(emerg)=0.3。
步骤2:通过用户设置的滑动窗口,获取该滑动窗口内该分布式集群各节点的***日志,并统计该***日志内各日志事件等级对应的日志事件数目,通过依次对该日志事件数目进行归一化操作,得到各日志事件等级的归一化值。用户设置滑动窗口,实时获取该分布式集群各节点的该***日志和该权值,以统计各该严重性等级对应的该***日志事件的日志个数,各节点根据事件分别进行归一化操作,求出各个事件的归一化值,其中日志事件的个数是指***日志中(内容中)不同类型信息的个数而非***日志个数,例如,日志里的信息会带有info、error、warming等信息类型,该信息类型即为一个日志事件,并按照该提示进行分类统计。例如,可以选择最大值法作为归一化的方法:
其中Nij代表节点i下j事件的归一化后的值,x代表该事件统计的数值,即***日志里各事件等级对应的个数,比如info类型事件20个、error类型事件15个、warming类型事件15个;max则代表事件统计数值里的最大值,即划分事件类型后各类型事件就会有相应的统计值,例如上述三个类型的统计值20、15、15,最大值归一法就是取其中的最大值(即前边例子中的20)作为分母进行归一化。
步骤3:根据各节点的该归一化值和该权值,计算当前该滑动窗口中各节点错误率,具体包括,统计在实时滑动窗口中各个节点的错误率ratio_i,计算方法为节点中每个日志事件的归一化后的值与其权重的积的累加和除以滑动窗口时间t(例如,滑动窗口时间大小以s为单位),具体公式如下:
其中weight为该权值,m为预先定义的事件类型的个数。
步骤4:根据该节点错误率,通过加权熵算法,计算当前该滑动窗口内该分布式集群的可靠性加权熵,该可靠性加权熵H(u):
其中Ri为步骤3计算的节点错误率ratio_i,n表示集群中节点的个数。
步骤5:随着滑动窗口的移动,统计预设时间内各滑动窗口的该可靠性加权熵的波动值,并通过比较该波动值与预先设定的波动阈值,判定该分布式集群的可靠度。因为随着滑动窗口的移动,集群的信息熵也会随之改变,如果某一段时间内,该熵值波动大于预先设定的波动阈值,则认为该熵值波动较大,判定该集群可靠性较低,不稳定。其中该波动值的计算方法包括:统计该预设时间内各滑动窗口的该可靠性加权熵的均值,并对每个该均值求方差,将该方差作为该波动值。
例如是采用10个滑动窗口作为分析广度,首先求10个滑动窗口信息熵的均值,然后每个值分别对该均值求方差,可得十个方差值,如果一组数据中有3个数值(该值可根据实际更改,数值越小对波动越敏感)大于5(该数字可根据实际调整,具体可参考前期平稳时方差相对最大值并向上取整),则认为集群目前处于波动状态。
下特举具体实施案例,进一步说明本发明。本发明以五个节点组成的集群进行分析:首先预先为不同严重性程度的日志事件赋予不同的权值,为了易于理解,本发明只取其中三个日志等级:
weight(alert)=0.5,weight(crit)=0.3,weight(error)=0.2,
设置实时滑动窗口时长为10秒,某个滑动窗口时段下收集到的日志并分类统计后为:
Node Alert crit Error
Node1 3 7 11
Node2 2 9 10
Node3 3 8 13
Node4 4 11 9
Node5 4 9 15
接下来求各节点的不同事件的归一化值,结果为:
Node Alert crit Error
Node1 0.27 0.64 1
Node2 0.20 0.90 1
Node3 0.23 0.62 1
Node4 0.44 1 0.81
Node5 0.27 0.81 1
然后结合权重求出每一个节点的错误率ratio_i:
rationode1=(0.27*0.5+0.64*0.3+1*0.2)/10=0.053
rationode2=(0.20*0.5+0.90*0.3+1*0.2)/10=0.057
rationode3=(0.23*0.5+0.38*0.3+1*0.2)/10=0.043
rationode4=(0.44*0.5+0.88*0.3+1*0.2)/10=0.068
rationode5=(0.27*0.5+0.33*0.3+1*0.2)/10=0.043
进而根据公式计算集群的加权熵:
H(u)=-(0.053*log(2,0.053)+0.057*log(2,0.057)+0.043*log(2,0.043)+0.068*log(2,0.068)+0.043*log(2,0.043)+)=0.225+0.236+0.195+0.263+0.195=1.11
此时为一个时间窗口内的信息熵值,假设连续十个窗口内的信息熵为:
2.56,2.89,2.73,3.12,3.45,2.96,3.88,3.32,8.91,9.99。
为了衡量波动大小,本发明求最近十个滑动窗口的均值,然后每一个值对其均值求方差,本发明假设有2个数值大于5时表示集群的稳定性出现波动。
上述数据均值为:4.38,各值对其方差分别为:
3.31,2.22,2.72,1.58,0.86,2.01,0.25,1.12,20.52,31.47
以上数据中有2个数值大于5,则认为集群的稳定性在相应的时刻处于波动状态。
以下为与上述方法实施例对应的***实施例,本实施***可与上述实施方式互相配合实施。上述施方式中提到的相关技术细节在本实施***中依然有效,为了减少重复,这里不再赘述。相应地,本实施***中提到的相关技术细节也可应用在上述实施方式中。
本发明还提出一种通过加权熵判断分布式集群可靠度的***,其中包括:
赋权模块,用于根据预先设定的日志事件等级,为分布式集群中各节点的日志事件赋予权值;
归一化处理模块,用于根据用户设置的滑动窗口,获取该滑动窗口内该分布式集群各节点的***日志,并统计该***日志内各日志事件等级对应的日志事件数目,通过依次对该日志事件数目进行归一化操作,求出各日志事件等级的归一化值;
错误率计算模块,用于根据该归一化值和该权值,计算当前该滑动窗口中各节点错误率;
加权熵计算模块,用于根据该节点错误率,通过加权熵算法,计算当前该滑动窗口内该分布式集群的可靠性加权熵;
可靠度判定模块,用于随着滑动窗口的移动,统计预设时间内各滑动窗口的该可靠性加权熵的波动值,并通过比较该波动值与预先设定的波动阈值,判定该分布式集群的可靠度。
该通过加权熵判断分布式集群可靠度的***,其中归一化处理模块中该归一化操作包括:
其中Nij代表节点i下j事件的归一化后的该归一化值,x代表该日志事件数目,max代表各日志事件数目中的最大值。
该通过加权熵判断分布式集群可靠度的***,其中错误率计算模块中该节点错误率的计算包括:
其中weight为该权值,t为该滑动窗口的时间长度值,Nij代表节点i下j事件等级的该归一化值,ratioi代表该节点错误率,m代表预先设定的该日志事件等级的数目。
该通过加权熵判断分布式集群可靠度的***,其中加权熵计算模块中该可靠性加权熵的计算包括:
其中Ri为错误率计算模块生成的该节点错误率,n表示集群中节点的个数,H(u)表示该可靠性加权熵。
该通过加权熵判断分布式集群可靠度的***,其中可靠度判定模块中该波动值的计算包括:统计该预设时间内各滑动窗口的该可靠性加权熵的均值,并对每个该均值求方差,将该方差作为该波动值。
虽然本发明以上述实施例公开,但具体实施例仅用以解释本发明,并不用于限定本发明,任何本技术领域技术人员,在不脱离本发明的构思和范围内,可作一些的变更和完善,故本发明的权利保护范围以权利要求书为准。

Claims (8)

1.一种通过加权熵判断分布式集群可靠度的方法,其特征在于,包括:
步骤1、根据预先设定的日志事件等级,为分布式集群中各节点的日志事件赋予权值;
步骤2、通过用户设置的滑动窗口,获取该滑动窗口内该分布式集群各节点的***日志,并统计该***日志内各日志事件等级对应的日志事件数目,通过依次对该日志事件数目进行归一化操作,得到各日志事件等级的归一化值;
步骤3、根据该归一化值和该权值,计算当前该滑动窗口中各节点错误率;
步骤4、根据该节点错误率,通过加权熵算法,计算当前该滑动窗口内该分布式集群的可靠性加权熵;
步骤5、随着滑动窗口的移动,统计预设时间内各滑动窗口的该可靠性加权熵的波动值,并通过比较该波动值与预先设定的波动阈值,判定该分布式集群的可靠度;
步骤4中该可靠性加权熵的计算方法包括:
其中Ri为步骤3计算的该节点错误率,n表示集群中节点的个数,H(u)表示该可靠性加权熵。
2.如权利要求1所述的通过加权熵判断分布式集群可靠度的方法,其特征在于,步骤2中该归一化操作包括:
其中Nij代表节点i下j事件的归一化后的该归一化值,x代表该日志事件数目,max代表各日志事件数目中的最大值。
3.如权利要求1所述的通过加权熵判断分布式集群可靠度的方法,其特征在于,步骤3中该节点错误率的计算方法包括:
其中weight为该权值,t为该滑动窗口的时间长度值,Nij代表节点i下j事件等级的该归一化值,ratioi代表该节点错误率,m代表预先设定的该日志事件等级的数目。
4.如权利要求1所述的通过加权熵判断分布式集群可靠度的方法,其特征在于,步骤5中该波动值的计算方法包括:统计该预设时间内各滑动窗口的该可靠性加权熵的均值,并对每个该均值求方差,将该方差作为该波动值。
5.一种通过加权熵判断分布式集群可靠度的***,其特征在于,包括:
赋权模块,用于根据预先设定的日志事件等级,为分布式集群中各节点的日志事件赋予权值;
归一化处理模块,用于根据用户设置的滑动窗口,获取该滑动窗口内该分布式集群各节点的***日志,并统计该***日志内各日志事件等级对应的日志事件数目,通过依次对该日志事件数目进行归一化操作,求出各日志事件等级的归一化值;
错误率计算模块,用于根据该归一化值和该权值,计算当前该滑动窗口中各节点错误率;
加权熵计算模块,用于根据该节点错误率,通过加权熵算法,计算当前该滑动窗口内该分布式集群的可靠性加权熵;
可靠度判定模块,用于随着滑动窗口的移动,统计预设时间内各滑动窗口的该可靠性加权熵的波动值,并通过比较该波动值与预先设定的波动阈值,判定该分布式集群的可靠度;
加权熵计算模块中该可靠性加权熵的计算包括:
其中Ri为错误率计算模块生成的该节点错误率,n表示集群中节点的个数,H(u)表示该可靠性加权熵。
6.如权利要求5所述的通过加权熵判断分布式集群可靠度的***,其特征在于,归一化处理模块中该归一化操作包括:
其中Nij代表节点i下j事件的归一化后的该归一化值,x代表该日志事件数目,max代表各日志事件数目中的最大值。
7.如权利要求5所述的通过加权熵判断分布式集群可靠度的***,其特征在于,错误率计算模块中该节点错误率的计算包括:
其中weight为该权值,t为该滑动窗口的时间长度值,Nij代表节点i下j事件等级的该归一化值,ratioi代表该节点错误率,m代表预先设定的该日志事件等级的数目。
8.如权利要求5所述的通过加权熵判断分布式集群可靠度的***,其特征在于,可靠度判定模块中该波动值的计算包括:统计该预设时间内各滑动窗口的该可靠性加权熵的均值,并对每个该均值求方差,将该方差作为该波动值。
CN201710651527.4A 2017-08-02 2017-08-02 一种通过加权熵判断分布式集群可靠度的方法和*** Active CN107590008B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710651527.4A CN107590008B (zh) 2017-08-02 2017-08-02 一种通过加权熵判断分布式集群可靠度的方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710651527.4A CN107590008B (zh) 2017-08-02 2017-08-02 一种通过加权熵判断分布式集群可靠度的方法和***

Publications (2)

Publication Number Publication Date
CN107590008A CN107590008A (zh) 2018-01-16
CN107590008B true CN107590008B (zh) 2019-11-15

Family

ID=61042028

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710651527.4A Active CN107590008B (zh) 2017-08-02 2017-08-02 一种通过加权熵判断分布式集群可靠度的方法和***

Country Status (1)

Country Link
CN (1) CN107590008B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112115030B (zh) * 2020-09-28 2023-12-19 曙光信息产业(北京)有限公司 一种节点确定方法、装置、电子设备及存储介质
CN115801203B (zh) * 2023-01-19 2023-04-25 苏州浪潮智能科技有限公司 一种分布式集群可靠性管理方法、装置及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101378394A (zh) * 2008-09-26 2009-03-04 成都市华为赛门铁克科技有限公司 分布式拒绝服务检测防御方法及网络设备
CN102831234A (zh) * 2012-08-31 2012-12-19 北京邮电大学 基于新闻内容和主题特征的个性化新闻推荐装置和方法
CN105589800A (zh) * 2015-12-25 2016-05-18 ***股份有限公司 预测复杂***故障的应用***
CN106776331A (zh) * 2016-12-26 2017-05-31 智车优行科技(北京)有限公司 软件成熟度的测评方法、装置和***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101378394A (zh) * 2008-09-26 2009-03-04 成都市华为赛门铁克科技有限公司 分布式拒绝服务检测防御方法及网络设备
CN102831234A (zh) * 2012-08-31 2012-12-19 北京邮电大学 基于新闻内容和主题特征的个性化新闻推荐装置和方法
CN105589800A (zh) * 2015-12-25 2016-05-18 ***股份有限公司 预测复杂***故障的应用***
CN106776331A (zh) * 2016-12-26 2017-05-31 智车优行科技(北京)有限公司 软件成熟度的测评方法、装置和***

Also Published As

Publication number Publication date
CN107590008A (zh) 2018-01-16

Similar Documents

Publication Publication Date Title
CN106209432B (zh) 基于动态阈值的网络设备亚健康预警方法及装置
Chen et al. Outage prediction and diagnosis for cloud service systems
US9672085B2 (en) Adaptive fault diagnosis
Khaledian et al. Real-time synchrophasor data anomaly detection and classification using isolation forest, kmeans, and loop
US11748227B2 (en) Proactive information technology infrastructure management
CN107707431A (zh) 一种面向云平台的数据安全监测方法及***
US20040168100A1 (en) Fault detection and prediction for management of computer networks
US8392760B2 (en) Diagnosing abnormalities without application-specific knowledge
CN103797468A (zh) ***异常的自动化检测
US11240119B2 (en) Network operation
CN113438110B (zh) 一种集群性能的评价方法、装置、设备及存储介质
CN115118581B (zh) 一种基于5g的物联网数据全链路监控和智能保障***
CN104574219A (zh) 电网业务信息***运行工况的监测预警方法及***
CN113055249B (zh) 一种关键基础设施网络弹性检测方法及***
KR20170084445A (ko) 시계열 데이터를 이용한 이상 감지 방법 및 그 장치
CN112367191B (zh) 一种5g网络切片下服务故障定位方法
CN107590008B (zh) 一种通过加权熵判断分布式集群可靠度的方法和***
US20210359899A1 (en) Managing Event Data in a Network
Ikeda et al. Anomaly detection and interpretation using multimodal autoencoder and sparse optimization
CN114362994B (zh) 多层异粒度智能聚合铁路***运行行为安全风险识别方法
CN117421188A (zh) 告警定级方法、装置、设备及可读存储介质
CN113162793A (zh) 一种环境感知的用于网络测量的节点重要性度量方法
CN112699048A (zh) 基于人工智能的程序故障处理方法、装置、设备及存储介质
CN116541728A (zh) 一种基于密度聚类的故障诊断方法及装置
CN112437091B (zh) 一种面向主机社区行为的异常流量检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant