CN113176962B - 一种用于数据中心的机房it设备故障精准检测方法及*** - Google Patents

一种用于数据中心的机房it设备故障精准检测方法及*** Download PDF

Info

Publication number
CN113176962B
CN113176962B CN202110400918.5A CN202110400918A CN113176962B CN 113176962 B CN113176962 B CN 113176962B CN 202110400918 A CN202110400918 A CN 202110400918A CN 113176962 B CN113176962 B CN 113176962B
Authority
CN
China
Prior art keywords
target
performance data
equipment
preset
fault type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110400918.5A
Other languages
English (en)
Other versions
CN113176962A (zh
Inventor
赵希峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongda Kehui Technology Development Co ltd
Original Assignee
Beijing Zhongda Kehui Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhongda Kehui Technology Development Co ltd filed Critical Beijing Zhongda Kehui Technology Development Co ltd
Priority to CN202110400918.5A priority Critical patent/CN113176962B/zh
Publication of CN113176962A publication Critical patent/CN113176962A/zh
Application granted granted Critical
Publication of CN113176962B publication Critical patent/CN113176962B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种用于数据中心的机房IT设备故障精准检测方法及***,其方法包括:按照目标周期采集目标IT设备的性能指标信息,获得周期性能数据序列,对所述周期性能数据序列进行归一化处理,按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果,计算聚类结果中每个预设故障类型对应的周期性能数据子序列的目标异常值分数,根据每个预设故障类型对应的目标异常值分数判断目标IT设备是否出现故障以及具体故障信息。可智能地根据计算的分数确定目标IT设备是否出现故障以及当出现故障时的具体故障信息,无需人工逐个进行故障排查,快速准确地确定目标IT设备的具体故障,节省了人力成本的同时也可以快速地使维修人员进行后续维修。

Description

一种用于数据中心的机房IT设备故障精准检测方法及***
技术领域
本发明涉及设备管理技术领域,尤其涉及一种用于数据中心的机房IT设备故障精准检测方法及***。
背景技术
随着信息化社会的高速发展,现代化信息技术和自动化设备呈现爆发式增长趋势,数据中心规模也持续增长,对数据中心的安全性和稳定性要求越来越高。机房作为一个重要的数据中心,对其故障检测和排除变得至关重要。机房设备故障隐患主要在于机房内网络设备、存储设备和服务器等用电设备长时间通电工作、设备老化和人工误操作等造成的。这些情况导致的资产设备故障,如果不及时报警并指出机房运行中出现的异常情况,将导致信息数据存在安全隐患。
现有的及房IT设备故障检测方法为采集机房IT设备的工作参数,人为地根据采集到的工作参数逐一进行故障排查,严重地浪费了人力成本的同时也大大地影响了后续的维修效率,进而造成机房设备的定期维护工作不到位而降低了设备的使用寿命。
发明内容
针对上述所显示出来的问题,本发明提供了一种用于数据中心的机房IT设备故障精准检测方法及***用以解决背景技术中提到的人为地根据采集到的工作参数逐一进行故障排查,严重地浪费了人力成本的同时也大大地影响了后续的维修效率,进而造成机房设备的定期维护工作不到位而降低了设备的使用寿命的问题。
一种用于数据中心的机房IT设备故障精准检测方法,包括以下步骤:
按照目标周期采集目标IT设备的性能指标信息,获得周期性能数据序列;
对所述周期性能数据序列进行归一化处理;
按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果;
计算聚类结果中每个预设故障类型对应的周期性能数据子序列的目标异常值分数;
根据每个预设故障类型对应的目标异常值分数判断所述目标IT设备是否出现故障以及当出现故障时的具体故障信息。
优选的,所述按照目标周期采集目标IT设备的性能指标信息,获得周期性能数据序列,包括:
确定所述目标IT设备的已使用时长;
根据所述已使用时长确定目标IT设备的性能检测周期,将所述性能检测周期确定为所述目标周期;
按照所述目标周期获取所述目标IT设备的工作参数;
将每个性能指标对应的目标工作参数相互结合;
结合完毕后,采集每个性能指标在不同维度下的子性能指标值;
根据每个性能指标在不同维度下的子性能指标值生成每个性能指标的性能数据子序列;
根据所有性能指标的性能数据子序列生成目标IT设备的周期性能数据序列。
优选的,所述对所述周期性能数据序列进行归一化处理,包括:对所述周期性能数据序列进行最大最小归一化处理。
优选的,所述按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果,包括:
确定与每个预设故障类型相关的目标性能指标;
在所述周期性能数据中获得所述目标性能指标对应的目标性能数据;
根据每个预设故障类型对应的目标性能数据将处理后的周期性能数据进行聚类,获得聚类结果。
优选的,所述计算聚类结果中每个预设故障类型对应的周期性能数据子序列的目标异常值分数,包括:
确定所述目标IT设备的工作机能水平值;
确认所述工作机能水平值是否大于等于预设阈值,若是,确认所述每个聚类结果中周期性能数据子序列的异常值分数的准确度为100,否则,确认所述每个聚类结果中周期性能数据子序列的异常值分数的准确度为90;
根据每个预设故障类型对应的周期性能数据子序列的第一子序列值与目标IT设备在正常工作状态下的性能指标的第二子序列值进行除法计算以获得每个预设故障类型对应的周期性能数据子序列的第一异常值分数;
当确认所述准确度为100时,将所述每个预设故障类型对应的周期性能数据子序列的第一异常值分数确认为该聚类结果中周期性能数据子序列的目标异常值分数;
当确认所述准确度为90时,将所述每个预设故障类型对应的周期性能数据子序列的第一异常值分数乘以预设比例以获得每个预设故障类型对应的周期性能数据子序列的第二异常值分数,将每个预设故障类型对应的周期性能数据子序列的第二异常值分数确认为该预设故障类型对应的周期性能数据子序列的目标异常值分数。
优选的,所述根据每个预设故障类型对应的目标异常值分数判断所述目标IT设备是否出现故障以及当出现故障时的具体故障信息,包括:
确认每个预设故障类型对应的目标异常值分数是否大于等于该预设故障类型对应的预设异常值分数,若是,确认所述目标IT设备无故障,否则,确认所述目标IT设备有故障;
确定目标异常值分数小于预设异常值分数的目标故障类型,根据所述目标故障类型与目标IT设备的性能指标信息确定目标IT设备的具体故障信息。
优选的,所述方法还包括:
根据所述目标IT设备的具体故障信息生成目标IT设备的故障代码;
查找与所述故障代码对应的故障点,对所述故障点进行定位,获取电子定位结果;
查询与所述故障点对应的故障解决方案;
将所述故障解决方案以及电子定位结果进行显示。
优选的,所述按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果之后,还包括:
获取与所述聚类结果相关的目标业务操作,并获取所述目标业务操作相关的业务输入指令,并从设备数据库和管理数据库中调取与所述业务输入指令相关第一数据A1和第二数据A2
确定所述第一数据A1的第一容量,同时确定第二数据A2的第二容量,并判断所述第一容量和第二容量是否为空,若是,向所述目标IT设备的子部件进行无效反馈;
否则,确定所述第一数据A1的第一编码χ1,并进行第一归类处理;
同时,确定所述第二数据A2的第二编码χ2,并进行第二归类处理;
其中,i=1,2;表示第i数据中的j=1,2...n的不同特征指标的指标值χij的累乘;rij+1表示第i数据中的第j+1个特征指标的特征编码值;rij表示第i数据中的第j个特征指标的特征编码值;K1表示第i数据中第j个特征指标的特征编码序列个数;/>表示第i数据中第j个特征指标中的第k个特征编码序列的序列值;αk表示第i数据中第j个特征指标中的第k个特征编码序列的序列权值,n表示为特征指标的数量;
且根据第一归类处理结果S1和第二归类处理结果S2对应的归类区域,向所述目标IT设备中的对应子部件进行有效反馈,并发送相应的反馈信息进行显示。
一种用于数据中心的机房IT设备故障精准检测***,该***包括:
采集模块,用于按照目标周期采集目标IT设备的性能指标信息,获得周期性能数据序列;
处理模块,用于对所述周期性能数据序列进行归一化处理;
聚类模块,用于按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果;
计算模块,用于计算聚类结果中每个预设故障类型对应的周期性能数据子序列的目标异常值分数;
判断模块,用于根据每个预设故障类型对应的目标异常值分数判断所述目标IT设备是否出现故障以及当出现故障时的具体故障信息。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
图1为本发明所提供的一种用于数据中心的机房IT设备故障精准检测方法的工作流程图;
图2为本发明所提供的一种用于数据中心的机房IT设备故障精准检测方法的另一工作流程图;
图3为本发明所提供的一种用于数据中心的机房IT设备故障精准检测方法的又一工作流程图;
图4为本发明所提供的一种用于数据中心的机房IT设备故障精准检测***的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
随着信息化社会的高速发展,现代化信息技术和自动化设备呈现爆发式增长趋势,数据中心规模也持续增长,对数据中心的安全性和稳定性要求越来越高。机房作为一个重要的数据中心,对其故障检测和排除变得至关重要。机房设备故障隐患主要在于机房内网络设备、存储设备和服务器等用电设备长时间通电工作、设备老化和人工误操作等造成的。这些情况导致的资产设备故障,如果不及时报警并指出机房运行中出现的异常情况,将导致信息数据存在安全隐患。
现有的及房IT设备故障检测方法为采集机房IT设备的工作参数,人为地根据采集到的工作参数逐一进行故障排查,严重地浪费了人力成本的同时也大大地影响了后续的维修效率,进而造成机房设备的定期维护工作不到位而降低了设备的使用寿命。为了解决上述问题,本实施例公开了一种用于数据中心的机房IT设备故障精准检测方法。
一种用于数据中心的机房IT设备故障精准检测方法,如图1所示,包括以下步骤:
步骤S101、按照目标周期采集目标IT设备的性能指标信息,获得周期性能数据序列;
步骤S102、对所述周期性能数据序列进行归一化处理;
步骤S103、按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果;
步骤S104、计算聚类结果中每个预设故障类型对应的周期性能数据子序列的目标异常值分数;
步骤S105、根据每个预设故障类型对应的目标异常值分数判断所述目标IT设备是否出现故障以及当出现故障时的具体故障信息。
上述技术方案的工作原理为:按照目标周期采集目标IT设备的性能指标信息,获得周期性能数据序列,对所述周期性能数据序列进行归一化处理,按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果,计算聚类结果中每个预设故障类型对应的周期性能数据子序列的目标异常值分数,根据每个预设故障类型对应的目标异常值分数判断所述目标IT设备是否出现故障以及当出现故障时的具体故障信息。
上述技术方案的有益效果为:通过对周期性能数据序列进行聚类进而计算每个预设故障类型对应的目标异常值分数即可智能地根据计算的分数确定目标IT设备是否出现故障以及当出现故障时的具体故障信息,无需人工逐个进行故障排查,快速准确地确定目标IT设备的具体故障,节省了人力成本的同时也可以快速地使维修人员进行后续维修,提高了目标IT设备的使用寿命,解决了现有技术中人为地根据采集到的工作参数逐一进行故障排查,严重地浪费了人力成本的同时也大大地影响了后续的维修效率,进而造成机房设备的定期维护工作不到位而降低了设备的使用寿命的问题。
在一个实施例中,所述按照目标周期采集目标IT设备的性能指标信息,获得周期性能数据序列,包括:
确定所述目标IT设备的已使用时长;
根据所述已使用时长确定目标IT设备的性能检测周期,将所述性能检测周期确定为所述目标周期;
按照所述目标周期获取所述目标IT设备的工作参数;
将每个性能指标对应的目标工作参数相互结合;
结合完毕后,采集每个性能指标在不同维度下的子性能指标值;
根据每个性能指标在不同维度下的子性能指标值生成每个性能指标的性能数据子序列;
根据所有性能指标的性能数据子序列生成目标IT设备的周期性能数据序列。
上述技术方案的有益效果为:使得目标IT设备的周期性能数据序列更加准确和实际,为后续故障判断流程提供数据保障,进一步地,通过智能设定检测周期可以根据目标IT设备的使用寿命灵活的确定检测周期的长短,进而可以实现频繁地对于目标IT设备的故障检测,进一步地挺高了目标IT设备的使用寿命。
在一个实施例中,所述对所述周期性能数据序列进行归一化处理,包括:对所述周期性能数据序列进行最大最小归一化处理。
在一个实施例中,如图2所示,所述按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果,包括:
步骤S201、确定与每个预设故障类型相关的目标性能指标;
步骤S202、在所述周期性能数据中获得所述目标性能指标对应的目标性能数据;
步骤S203、根据每个预设故障类型对应的目标性能数据将处理后的周期性能数据进行聚类,获得聚类结果。
上述技术方案的有益效果为:通过对性能数据进行分类可以快速直观地确定每个预设故障类型在周期性能数据中对应的性能数据,使得分类过程更加简洁和方便。
在一个实施例中,所述计算聚类结果中每个预设故障类型对应的周期性能数据子序列的目标异常值分数,包括:
确定所述目标IT设备的工作机能水平值;
确认所述工作机能水平值是否大于等于预设阈值,若是,确认所述每个聚类结果中周期性能数据子序列的异常值分数的准确度为100,否则,确认所述每个聚类结果中周期性能数据子序列的异常值分数的准确度为90;
根据每个预设故障类型对应的周期性能数据子序列的第一子序列值与目标IT设备在正常工作状态下的性能指标的第二子序列值进行除法计算以获得每个预设故障类型对应的周期性能数据子序列的第一异常值分数;
当确认所述准确度为100时,将所述每个预设故障类型对应的周期性能数据子序列的第一异常值分数确认为该聚类结果中周期性能数据子序列的目标异常值分数;
当确认所述准确度为90时,将所述每个预设故障类型对应的周期性能数据子序列的第一异常值分数乘以预设比例以获得每个预设故障类型对应的周期性能数据子序列的第二异常值分数,将每个预设故障类型对应的周期性能数据子序列的第二异常值分数确认为该预设故障类型对应的周期性能数据子序列的目标异常值分数。
上述技术方案的有益效果为:通过根据目标IT设备的工作机能水平值来对计算出的异常值分数进行调整可以在考虑到目标IT设备自身工作能力的情况下实际地评估出目标IT设备是否发生故障。
在一个实施例中,所述根据每个预设故障类型对应的目标异常值分数判断所述目标IT设备是否出现故障以及当出现故障时的具体故障信息,包括:
确认每个预设故障类型对应的目标异常值分数是否大于等于该预设故障类型对应的预设异常值分数,若是,确认所述目标IT设备无故障,否则,确认所述目标IT设备有故障;
确定目标异常值分数小于预设异常值分数的目标故障类型,根据所述目标故障类型与目标IT设备的性能指标信息确定目标IT设备的具体故障信息。
上述技术方案的有益效果为:通过直接利用分数比较的方式确定目标IT设备是否发生故障可以直观地根据评分确定目标IT设备是否发生故障,提高了判定的效率。
在一个实施例中,如图3所示,所述方法还包括:
步骤S301、根据所述目标IT设备的具体故障信息生成目标IT设备的故障代码;
步骤S302、查找与所述故障代码对应的故障点,对所述故障点进行定位,获取电子定位结果;
步骤S303、查询与所述故障点对应的故障解决方案;
步骤S304、将所述故障解决方案以及电子定位结果进行显示。
上述技术方案的有益效果为:使得维修人员可以快速精准地知晓目标IT设备发生故障的故障点以及具体的维修方案,进而可以快速地对目标IT设备进行维修以保证目标IT设备的工作效率以及服务质量,进一步地提高了用户的体验感。
在一个实施例中,所述按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果之后,还包括:
获取与所述聚类结果相关的目标业务操作,并获取所述目标业务操作相关的业务输入指令,并从设备数据库和管理数据库中调取与所述业务输入指令相关第一数据A1和第二数据A2
确定所述第一数据A1的第一容量,同时确定第二数据A2的第二容量,并判断所述第一容量和第二容量是否为空,若是,向所述目标IT设备的子部件进行无效反馈;
否则,确定所述第一数据A1的第一编码χ1,并进行第一归类处理;
同时,确定所述第二数据A2的第二编码χ2,并进行第二归类处理;
其中,i=1,2;表示第i数据中的j=1,2...n的不同特征指标的指标值χij的累乘;rij+1表示第i数据中的第j+1个特征指标的特征编码值;rij表示第i数据中的第j个特征指标的特征编码值;K1表示第i数据中第j个特征指标的特征编码序列个数;/>表示第i数据中第j个特征指标中的第k个特征编码序列的序列值;αk表示第i数据中第j个特征指标中的第k个特征编码序列的序列权值,n表示为特征指标的数量;
且根据第一归类处理结果S1和第二归类处理结果S2对应的归类区域,向所述目标IT设备中的对应子部件进行有效反馈,并发送相应的反馈信息进行显示。
上述技术方案的有益效果为:可以准确地确认聚类结果的分类是否为有效分类以及对于目标IT设备是否具有合理效应,进一步地,通过对目标IT设备的中的对应子部件进行有效或者无效反馈可以根据反馈结果精确地确定目标IT设备是否具备某种故障,从另一方面来实现对于目标IT设备的故障的判定,提高了故障判定的准确性。
本实施例还公开了一种用于数据中心的机房IT设备故障精准检测***,如图4所示,该***包括:
采集模块401,用于按照目标周期采集目标IT设备的性能指标信息,获得周期性能数据序列;
处理模块402,用于对所述周期性能数据序列进行归一化处理;
聚类模块403,用于按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果;
计算模块404,用于计算聚类结果中每个预设故障类型对应的周期性能数据子序列的目标异常值分数;
判断模块405,用于根据每个预设故障类型对应的目标异常值分数判断所述目标IT设备是否出现故障以及当出现故障时的具体故障信息。
上述技术方案的工作原理及有益效果在方法权利要求中已经说明,此处不再赘述。
本领域技术人员应当理解的是,本发明中的第一、第二指的是不同应用阶段而已。
本领域技术用户员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (8)

1.一种用于数据中心的机房IT设备故障精准检测方法,其特征在于,包括以下步骤:
按照目标周期采集目标IT设备的性能指标信息,获得周期性能数据序列;
对所述周期性能数据序列进行归一化处理;
按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果;
计算聚类结果中每个预设故障类型对应的周期性能数据子序列的目标异常值分数;
根据每个预设故障类型对应的目标异常值分数判断所述目标IT设备是否出现故障以及当出现故障时的具体故障信息;
所述计算聚类结果中每个预设故障类型对应的周期性能数据子序列的目标异常值分数,包括:
确定所述目标IT设备的工作机能水平值;
确认所述工作机能水平值是否大于等于预设阈值,若是,确认所述每个聚类结果中周期性能数据子序列的异常值分数的准确度为100,否则,确认所述每个聚类结果中周期性能数据子序列的异常值分数的准确度为90;
根据每个预设故障类型对应的周期性能数据子序列的第一子序列值与目标IT设备在正常工作状态下的性能指标的第二子序列值进行除法计算以获得每个预设故障类型对应的周期性能数据子序列的第一异常值分数;
当确认所述准确度为100时,将所述每个预设故障类型对应的周期性能数据子序列的第一异常值分数确认为该聚类结果中周期性能数据子序列的目标异常值分数;
当确认所述准确度为90时,将所述每个预设故障类型对应的周期性能数据子序列的第一异常值分数乘以预设比例以获得每个预设故障类型对应的周期性能数据子序列的第二异常值分数,将每个预设故障类型对应的周期性能数据子序列的第二异常值分数确认为该预设故障类型对应的周期性能数据子序列的目标异常值分数。
2.根据权利要求1所述用于数据中心的机房IT设备故障精准检测方法,其特征在于,所述按照目标周期采集目标IT设备的性能指标信息,获得周期性能数据序列,包括:
确定所述目标IT设备的已使用时长;
根据所述已使用时长确定目标IT设备的性能检测周期,将所述性能检测周期确定为所述目标周期;
按照所述目标周期获取所述目标IT设备的工作参数;
将每个性能指标对应的目标工作参数相互结合;
结合完毕后,采集每个性能指标在不同维度下的子性能指标值;
根据每个性能指标在不同维度下的子性能指标值生成每个性能指标的性能数据子序列;
根据所有性能指标的性能数据子序列生成目标IT设备的周期性能数据序列。
3.根据权利要求1所述用于数据中心的机房IT设备故障精准检测方法,其特征在于,所述对所述周期性能数据序列进行归一化处理,包括:对所述周期性能数据序列进行最大最小归一化处理。
4.根据权利要求1所述用于数据中心的机房IT设备故障精准检测方法,其特征在于,所述按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果,包括:
确定与每个预设故障类型相关的目标性能指标;
在所述周期性能数据中获得所述目标性能指标对应的目标性能数据;
根据每个预设故障类型对应的目标性能数据将处理后的周期性能数据进行聚类,获得聚类结果。
5.根据权利要求1所述用于数据中心的机房IT设备故障精准检测方法,其特征在于,所述根据每个预设故障类型对应的目标异常值分数判断所述目标IT设备是否 出现故障以及当出现故障时的具体故障信息,包括:
确认每个预设故障类型对应的目标异常值分数是否大于等于该预设故障类型对应的预设异常值分数,若是,确认所述目标IT设备无故障,否则,确认所述目标IT设备有故障;
确定目标异常值分数小于预设异常值分数的目标故障类型,根据所述目标故障类型与目标IT设备的性能指标信息确定目标IT设备的具体故障信息。
6.根据权利要求1所述用于数据中心的机房IT设备故障精准检测方法,其特征在于,所述方法还包括:
根据所述目标IT设备的具体故障信息生成目标IT设备的故障代码;
查找与所述故障代码对应的故障点,对所述故障点进行定位,获取电子定位结果;
查询与所述故障点对应的故障解决方案;
将所述故障解决方案以及电子定位结果进行显示。
7.根据权利要求1所述用于数据中心的机房IT设备故障精准检测方法,其特征在于,所述按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果之后,还包括:
获取与所述聚类结果相关的目标业务操作,并获取所述目标业务操作相关的业务输入指令,并从设备数据库和管理数据库中调取与所述业务输入指令相关第一数据A1和第二数据A2
确定所述第一数据A1的第一容量,同时确定第二数据A2的第二容量,并判断所述第一容量和第二容量是否为空,若是,向所述目标IT设备的子部件进行无效反馈;
否则,确定所述第一数据A1的第一编码,并进行第一归类处理;
同时,确定所述第二数据A2的第二编码,并进行第二归类处理;
其中,i=1,2;表示第i数据中的j=1,2...n的不同特征指标的指标值/>的累乘;/>表示第i数据中的第j+1个特征指标的特征编码值;/>表示第i数据中的第j个特征指标的特征编码值;K1表示第i数据中第j个特征指标的特征编码序列个数;/>表示第i数据中第j个特征指标中的第k个特征编码序列的序列值;/>表示第i数据中第j个特征指标中的第k个特征编码序列的序列权值,n表示为特征指标的数量;
且根据第一归类处理结果和第二归类处理结果/>对应的归类区域,向所述目标IT设备中的对应子部件进行有效反馈,并发送相应的反馈信息进行显示。
8.一种用于数据中心的机房IT设备故障精准检测***,其特征在于,该***包括:
采集模块,用于按照目标周期采集目标IT设备的性能指标信息,获得周期性能数据序列;
处理模块,用于对所述周期性能数据序列进行归一化处理;
聚类模块,用于按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果;
计算模块,用于计算聚类结果中每个预设故障类型对应的周期性能数据子序列的目标异常值分数;
判断模块,用于根据每个预设故障类型对应的目标异常值分数判断所述目标IT设备是否出现故障以及当出现故障时的具体故障信息;
所述计算模块用于计算聚类结果中每个预设故障类型对应的周期性能数据子序列的目标异常值分数的方法,包括:
确定所述目标IT设备的工作机能水平值;
确认所述工作机能水平值是否大于等于预设阈值,若是,确认所述每个聚类结果中周期性能数据子序列的异常值分数的准确度为100,否则,确认所述每个聚类结果中周期性能数据子序列的异常值分数的准确度为90;
根据每个预设故障类型对应的周期性能数据子序列的第一子序列值与目标IT设备在正常工作状态下的性能指标的第二子序列值进行除法计算以获得每个预设故障类型对应的周期性能数据子序列的第一异常值分数;
当确认所述准确度为100时,将所述每个预设故障类型对应的周期性能数据子序列的第一异常值分数确认为该聚类结果中周期性能数据子序列的目标异常值分数;
当确认所述准确度为90时,将所述每个预设故障类型对应的周期性能数据子序列的第一异常值分数乘以预设比例以获得每个预设故障类型对应的周期性能数据子序列的第二异常值分数,将每个预设故障类型对应的周期性能数据子序列的第二异常值分数确认为该预设故障类型对应的周期性能数据子序列的目标异常值分数。
CN202110400918.5A 2021-04-14 2021-04-14 一种用于数据中心的机房it设备故障精准检测方法及*** Active CN113176962B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110400918.5A CN113176962B (zh) 2021-04-14 2021-04-14 一种用于数据中心的机房it设备故障精准检测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110400918.5A CN113176962B (zh) 2021-04-14 2021-04-14 一种用于数据中心的机房it设备故障精准检测方法及***

Publications (2)

Publication Number Publication Date
CN113176962A CN113176962A (zh) 2021-07-27
CN113176962B true CN113176962B (zh) 2024-05-07

Family

ID=76923379

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110400918.5A Active CN113176962B (zh) 2021-04-14 2021-04-14 一种用于数据中心的机房it设备故障精准检测方法及***

Country Status (1)

Country Link
CN (1) CN113176962B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113391982B (zh) * 2021-08-17 2021-11-23 云智慧(北京)科技有限公司 一种监控数据的异常检测方法、装置及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105205111A (zh) * 2015-09-01 2015-12-30 西安交通大学 一种挖掘时序数据故障模式的***及方法
CN106649438A (zh) * 2016-09-09 2017-05-10 西安交通大学 一种时序数据非预期故障检测方法
KR101761781B1 (ko) * 2016-12-30 2017-07-26 강원석 It 통합 관리 프레임워크를 위한 오픈소스 데이터베이스를 적용한 빅데이터 처리 방법 및 장치
CN110826648A (zh) * 2020-01-09 2020-02-21 浙江鹏信信息科技股份有限公司 一种利用时序聚类算法实现故障检测的方法
KR102141391B1 (ko) * 2019-12-16 2020-08-05 주식회사 한국가스기술공사 군집 평가에 기반한 고장 데이터의 관리 방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8731724B2 (en) * 2009-06-22 2014-05-20 Johnson Controls Technology Company Automated fault detection and diagnostics in a building management system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105205111A (zh) * 2015-09-01 2015-12-30 西安交通大学 一种挖掘时序数据故障模式的***及方法
CN106649438A (zh) * 2016-09-09 2017-05-10 西安交通大学 一种时序数据非预期故障检测方法
KR101761781B1 (ko) * 2016-12-30 2017-07-26 강원석 It 통합 관리 프레임워크를 위한 오픈소스 데이터베이스를 적용한 빅데이터 처리 방법 및 장치
KR102141391B1 (ko) * 2019-12-16 2020-08-05 주식회사 한국가스기술공사 군집 평가에 기반한 고장 데이터의 관리 방법
CN110826648A (zh) * 2020-01-09 2020-02-21 浙江鹏信信息科技股份有限公司 一种利用时序聚类算法实现故障检测的方法

Also Published As

Publication number Publication date
CN113176962A (zh) 2021-07-27

Similar Documents

Publication Publication Date Title
CN114091912B (zh) 一种应用知识图谱分析中压电网拓扑异动方法
CN113176962B (zh) 一种用于数据中心的机房it设备故障精准检测方法及***
CN112085710A (zh) 保护定值与压板巡检***及方法
CN114202304A (zh) 一种电网故障智能监控处理方法及***
CN113312200A (zh) 一种事件处理方法、装置、计算机设备及存储介质
CN114255784A (zh) 一种基于声纹识别的变电站设备故障诊断方法及相关装置
CN112182233B (zh) 用于存储设备故障记录的知识库、及利用其辅助定位设备故障的方法及***
CN114740343A (zh) 断路器用实时检测***
CN114970665A (zh) 模型训练方法、电解电容剩余寿命预测方法及***
CN114460519A (zh) 基于电力互感器检验的现场与终端融合管理***和方法
CN117808456A (zh) 一种基于智慧运营管理的设备故障预警方法及装置
CN117331790A (zh) 一种用于数据中心的机房故障检测方法及装置
CN113010394A (zh) 一种用于数据中心的机房故障检测方法
CN115587312A (zh) 一种基于多维大数据分析的故障点定位方法和***
CN107450030B (zh) 一种通信蓄电池遥测数据处理方法、装置及***
CN112737120B (zh) 区域电网控制报告的生成方法、装置和计算机设备
CN114037010A (zh) 一种电量数据异常的识别方法及装置
CN114740419A (zh) 基于“三维图”分析台区电表误差的方法、装置、设备和介质
CN115372752A (zh) 故障检测方法、装置、电子设备以及存储介质
CN112949951A (zh) 数据预测方法、装置、电子设备及存储介质
CN113807690A (zh) 区域电网调控***运行状态在线评估预警方法及***
CN107958505A (zh) 一种安稳运行状态智能巡检***及其控制方法
CN116387652B (zh) 化成/分容电源设备的在线维护***及方法
CN117614132B (zh) 用于配电网的配电变压器电压越限画像方法及装置
CN118245264A (zh) 服务器故障处理方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant