CN108710555A - 一种基于监督学习的服务器错误诊断方法 - Google Patents

一种基于监督学习的服务器错误诊断方法 Download PDF

Info

Publication number
CN108710555A
CN108710555A CN201810501684.1A CN201810501684A CN108710555A CN 108710555 A CN108710555 A CN 108710555A CN 201810501684 A CN201810501684 A CN 201810501684A CN 108710555 A CN108710555 A CN 108710555A
Authority
CN
China
Prior art keywords
supervised learning
tuple
server
failure
fault message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810501684.1A
Other languages
English (en)
Inventor
梁盛楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201810501684.1A priority Critical patent/CN108710555A/zh
Publication of CN108710555A publication Critical patent/CN108710555A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2263Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/26Functional testing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种基于监督学习的服务器错误诊断方法,具体方法为利用海量的故障信息训练监督学习模型,生成故障预测模型,并利用故障预测模型对服务器的错误进行预测分析。本发明的一种基于监督学习的服务器错误诊断方法破除了传统设定阈值来检测故障的方法,利用高效算法自动分析并预测日志内容,解放人工服务器故障的时间成本,完全自动化分析及预测故障等级。

Description

一种基于监督学习的服务器错误诊断方法
技术领域
本发明涉及服务器故障管理技术领域,具体地说是一种基于监督学习的服务器错误诊断方法。
背景技术
一台正在运行的服务器上每时每刻都在承载着无数的业务流量,会产生大量数据。虽然服务器作为一个非常稳定的产品,但是随着运行时间的增加,以及周围物理环境的变化(比如散热等),不可避免的会给服务器带来一定的影响,严重者甚至可能会给服务器带来宕机的风险,因此能够对服务器上可能出现的各种故障进行预测,成为一个非常有价值的研究方向。
目前对服务器进行故障分析,一般对特定的指标进行性监控,比如温度、风扇转速以及一些其他的硬件活软件指标,设定一定的阈值,进行判断,超出一定的界限后则服务器会自动上报故障。
但是,存在的弊端如下:
1、这种设定固定值来检测故障的方法非常不灵活,适应多种设备,必须针对不同的环境进行不同的配置,比较繁琐。
发明内容
本发明的技术任务是针对以上不足之处,提供一种简单高效的一种基于监督学习的服务器错误诊断方法。
本发明解决其技术问题所采用的技术方案是:一种基于监督学习的服务器错误诊断方法,所述的方法应用在服务器***上,利用海量的故障信息训练监督学习模型,生成故障预测模型,并利用故障预测模型对服务器的错误进行预测分析。
进一步的,优选的方法为:
S1、收集服务器故障信息;
S2、将收集的故障信息进行分类,先按照故障类型进行分类,然后每种类型的故障信息再分为输入组和输出组两部分;
S3、将收集的故障信息分为训练集和测试集;
S4、把输入组和输出组两部分故障信息组织为监督学习模型;
S5、利用训练集对监督学习模型进行训练,利用测试集测试监督学习模型的精度;
S6、筛选精度较高的监督学习模型作为故障预测模型;
S7、利用故障预测模型对服务器的错误进行预测分析。
进一步的,优选的方法为:所述的监督学习模型为最邻近节点算法或逻辑回归算法。
进一步的,优选的方法为:所述的最邻近节点算法的具体步骤如下:
S41、准备数据,对数据进行预处理;
S42、选用合适的数据结构存储训练数据和测试元组;
S43、设定参数为K;
S44、维护一个大小为k的的按距离由大到小的优先级队列,用于存储最近邻训练元组;随机从训练元组中选取k个元组作为初始的最近邻元组,分别计算测试元组到这k个元组的距离,将训练元组标号和距离存入优先级队列;
S45、遍历训练元组集,计算当前训练元组与测试元组的距离,将所得距离 L与优先级队列中的最大距离Lmax;
S46、进行比较,若L>=Lmax,则舍弃该元组,遍历下一个元组;若L<Lmax,删除优先级队列中最大距离的元组,将当前训练元组存入优先级队列;
S47、遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别。
S48、测试元组集测试完毕后计算误差率,继续设定不同的k值重新进行训练,最后取误差率最小的k值。
进一步的,优选的方法为:所述的故障信息的类型包括散热故障、硬盘故障和CPU故障。
进一步的,优选的方法为:所述的散热故障的输入组信息包括CPU温度、内存温度、GPU温度和硬盘温度。
一种服务器错误诊断***的生成装置,包括收集故障信息单元、故障信息分类单元、监督学习模型训练单元、监督学习模型筛选单元;
所述的收集故障信息单元,用于收集服务器故障信息;
所述的故障信息分类单元,用于将收集的故障信息进行分类;
所述的监督学习模型训练单元,用于利用服务器故障信息对监督学习模型进行训练;
所述的监督学习模型筛选单元,用于筛选精度较高的监督学习模型作为故障预测模型。
进一步的,优选的结构为:所述的故障信息分类单元包括故障类型分类装置、输入组和输出组分类装置、训练集和测试集分类装置;
所述的故障类型分类装置,用于将服务器的故障信息进行按照故障类型进行分类;
所述的输入组和输出组分类装置,用于将每一种类型的故障分为输入组和输出组两部分;
所述的训练集和测试集分类装置,用于将故障信息分为训练集和测试集。
本发明的一种基于监督学习的服务器错误诊断方法和现有技术相比,有益效果如下:
1、通过训练监督学习模型,得到故障预测模型,并利用故障预测模型对服务器上可能出现的各种故障进行预测,降低服务器宕机风险;
2、测试方法灵活,并且一种测试模型可以适应多种设备;
3、配置方法简单高效;
4、破除了传统设定阈值来检测故障的方法,利用高效算法自动分析并预测日志内容,解放人工服务器故障的时间成本,完全自动化分析及预测故障等级。
附图说明
下面结合附图对本发明进一步说明。
附图1为一种基于监督学习的服务器错误诊断方法的逻辑框图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明。
其中:KNN最邻近节点算法;Machine Learning机器学习;Supervised Learning监督学习;
监督学习是机器学习的一个分支,简单来讲,就是通过收集一组一直类别的样本书数据,这个数据集可分为两部分,第一部分称之为“输入”,第二部分可称之为“输出”,监督学习就是通过学习每组“输入”与“输出”的关系,从而预测将来遇到一个未知的输入时,能够精准预测到期对应的输出。
本发明为一种基于监督学习的服务器错误诊断方法,通过训练监督学习模型,得到故障预测模型,并利用故障预测模型对服务器上可能出现的各种故障进行预测,降低服务器宕机风险。
实施例1:
一种基于监督学习的服务器错误诊断方法,通过收集大量的已有故障信息,作为监督学习模型的训练集,对其进行训练,然后将此模型部署在待监控的服务器主机上,对未来可能出现的故障错误进行预测分析并自动上报。
具体步骤:
S1、收集服务器故障信息;
S2、将收集的故障信息进行分类,先按照故障类型进行分类,然后每种类型的故障信息再分为输入组和输出组两部分;
S3、将收集的故障信息分为训练集和测试集;
S4、把输入组和输出组两部分故障信息组织为监督学习模型;
S5、利用训练集对监督学习模型进行训练,利用测试集测试监督学习模型的精度;
S6、筛选精度较高的监督学习模型作为故障预测模型;
S7、利用故障预测模型对服务器的错误进行预测分析。
其中的监督学习模型为最邻近节点算法或逻辑回归算法。所述的最邻近节点算法的具体步骤如下:
S41、准备数据,对数据进行预处理;
S42、选用合适的数据结构存储训练数据和测试元组;
S43、设定参数为K;
S44、维护一个大小为k的的按距离由大到小的优先级队列,用于存储最近邻训练元组;随机从训练元组中选取k个元组作为初始的最近邻元组,分别计算测试元组到这k个元组的距离,将训练元组标号和距离存入优先级队列;
S45、遍历训练元组集,计算当前训练元组与测试元组的距离,将所得距离 L与优先级队列中的最大距离Lmax;
S46、进行比较,若L>=Lmax,则舍弃该元组,遍历下一个元组;若L<Lmax,删除优先级队列中最大距离的元组,将当前训练元组存入优先级队列;
S47、遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别。
S48、测试元组集测试完毕后计算误差率,继续设定不同的k值重新进行训练,最后取误差率最小的k值。
其中,所述的故障信息的类型包括散热故障、硬盘故障和CPU故障。
其中,所述的散热故障的输入组信息包括CPU温度、内存温度、GPU温度和硬盘温度。
一种服务器错误诊断***的生成装置,包括收集故障信息单元、故障信息分类单元、监督学习模型训练单元、监督学习模型筛选单元;
所述的收集故障信息单元,用于收集服务器故障信息;
所述的故障信息分类单元,用于将收集的故障信息进行分类;
所述的监督学习模型训练单元,用于利用服务器故障信息对监督学习模型进行训练;
所述的监督学习模型筛选单元,用于筛选精度较高的监督学习模型作为故障预测模型。
所述的故障信息分类单元包括故障类型分类装置、输入组和输出组分类装置、训练集和测试集分类装置;
所述的故障类型分类装置,用于将服务器的故障信息进行按照故障类型进行分类;
所述的输入组和输出组分类装置,用于将每一种类型的故障分为输入组和输出组两部分;
所述的训练集和测试集分类装置,用于将故障信息分为训练集和测试集。
具体操作方式:首先对故障信息进行分类,比如散热故障、硬盘故障、cpu 故障等。每种故障总是在满足一定的条件下才会发生,因此要把这些条件进行数字化处理。比如散热故障,可以手机cpu温度、内存温度、GPU温度等一些关键硬件模块的温度信息,然后找到对应温度条件下是否发生故障,以及如果发生故障,其对应的等级是什么,如下表格所示。
数字化后的故障“输入”与“输出”结构表。
表中前四列相当于训练集的“输入”内容(feature),最后一列故障等级相当于监督学习模型需要预测的“输出”信息(label)。这样,通过大量已存在的feature与label数据对监督学习模型进行训练,从而使其能够对未来可能出现的未知feature进行分析,并预测出一个合理的故障等级。
例如,获得服务器中十万条故障记录信息,从中提取故障feature与故障等级信息,编写程序进行数字化处理,形成数据结构,这个结构中将有十万行数据。然后可以随机的对这十万条数据进行分割,其中九万条作为训练集,剩余一万条作为测试数集,以便测试经过训练的模型精度如何。算法上,由于这是个分类的监督学习场景,可以选择KNN或者逻辑回归等算法作为学习模型,最终选择一个精度较高的模型作为最终方案。
确定最终学习模型后,以后服务器中记录的每条相关信息,先将其分解为feature信息,然后经过模型后预测对应的level,根据level来自动通知维护人员进行后续处理。
本发明的一种基于监督学习的服务器错误诊断方法可应用于任何服务器***,以及需要对一些特定故障信息进行分析预测的场景。
通过上面具体实施方式,所述技术领域的技术人员可容易的实现本发明。但是应当理解,本发明并不限于上述的几种具体实施方式。在公开的实施方式的基础上,所述技术领域的技术人员可任意组合不同的技术特征,从而实现不同的技术方案。

Claims (8)

1.一种基于监督学习的服务器错误诊断方法,其特征在于,所述的方法应用在服务器***上,利用海量的故障信息训练监督学习模型,生成故障预测模型,并利用故障预测模型对服务器的错误进行预测分析。
2.根据权利要求1所述的一种基于监督学习的服务器错误诊断方法,其特征在于,具体方法如下:
S1、收集服务器故障信息;
S2、将收集的故障信息进行分类,先按照故障类型进行分类,然后每种类型的故障信息再分为输入组和输出组两部分;
S3、将收集的故障信息分为训练集和测试集;
S4、把输入组和输出组两部分故障信息组织为监督学习模型;
S5、利用训练集对监督学习模型进行训练,利用测试集测试监督学习模型的精度;
S6、筛选精度较高的监督学习模型作为故障预测模型;
S7、利用故障预测模型对服务器的错误进行预测分析。
3.根据权利要求2所述的一种基于监督学习的服务器错误诊断方法,其特征在于,所述的监督学习模型为最邻近节点算法或逻辑回归算法。
4.根据权利要求3所述的一种基于监督学习的服务器错误诊断方法,其特征在于,所述的最邻近节点算法的具体步骤如下:
S41、准备数据,对数据进行预处理;
S42、选用合适的数据结构存储训练数据和测试元组;
S43、设定参数为K;
S44、维护一个大小为k的的按距离由大到小的优先级队列,用于存储最近邻训练元组;随机从训练元组中选取k个元组作为初始的最近邻元组,分别计算测试元组到这k个元组的距离,将训练元组标号和距离存入优先级队列;
S45、遍历训练元组集,计算当前训练元组与测试元组的距离,将所得距离L与优先级队列中的最大距离Lmax;
S46、进行比较,若L>=Lmax,则舍弃该元组,遍历下一个元组;若L<Lmax,删除优先级队列中最大距离的元组,将当前训练元组存入优先级队列;
S47、遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别。
S48、测试元组集测试完毕后计算误差率,继续设定不同的k值重新进行训练,最后取误差率最小的k值。
5.根据权利要求2所述的一种基于监督学习的服务器错误诊断方法,其特征在于,所述的故障信息的类型包括散热故障、硬盘故障和CPU故障。
6.根据权利要求5所述的一种基于监督学习的服务器错误诊断方法,其特征在于,所述的散热故障的输入组信息包括CPU温度、内存温度、GPU温度和硬盘温度。
7.一种服务器错误诊断***的生成装置,其特征在于,包括收集故障信息单元、故障信息分类单元、监督学习模型训练单元、监督学习模型筛选单元;
所述的收集故障信息单元,用于收集服务器故障信息;
所述的故障信息分类单元,用于将收集的故障信息进行分类;
所述的监督学习模型训练单元,用于利用服务器故障信息对监督学习模型进行训练;
所述的监督学习模型筛选单元,用于筛选精度较高的监督学习模型作为故障预测模型。
8.根据权利要求7中所述的一种服务器错误诊断***的生成装置,其特征在于,所述的故障信息分类单元包括故障类型分类装置、输入组和输出组分类装置、训练集和测试集分类装置;
所述的故障类型分类装置,用于将服务器的故障信息进行按照故障类型进行分类;
所述的输入组和输出组分类装置,用于将每一种类型的故障分为输入组和输出组两部分;
所述的训练集和测试集分类装置,用于将故障信息分为训练集和测试集。
CN201810501684.1A 2018-05-23 2018-05-23 一种基于监督学习的服务器错误诊断方法 Pending CN108710555A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810501684.1A CN108710555A (zh) 2018-05-23 2018-05-23 一种基于监督学习的服务器错误诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810501684.1A CN108710555A (zh) 2018-05-23 2018-05-23 一种基于监督学习的服务器错误诊断方法

Publications (1)

Publication Number Publication Date
CN108710555A true CN108710555A (zh) 2018-10-26

Family

ID=63869372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810501684.1A Pending CN108710555A (zh) 2018-05-23 2018-05-23 一种基于监督学习的服务器错误诊断方法

Country Status (1)

Country Link
CN (1) CN108710555A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109446049A (zh) * 2018-11-01 2019-03-08 郑州云海信息技术有限公司 一种基于监督学习的服务器错误诊断方法和装置
CN109492826A (zh) * 2018-12-06 2019-03-19 远光软件股份有限公司 一种基于机器学习的信息***运行状态风险预测方法
CN109800139A (zh) * 2018-12-18 2019-05-24 东软集团股份有限公司 服务器健康度分析方法,装置,存储介质及电子设备
CN111382029A (zh) * 2020-03-05 2020-07-07 清华大学 基于pca和多维监测数据的主板异常诊断方法及装置
CN111860667A (zh) * 2020-07-27 2020-10-30 海尔优家智能科技(北京)有限公司 设备故障的确定方法及装置、存储介质、电子装置
CN112988444A (zh) * 2021-03-25 2021-06-18 腾讯科技(深圳)有限公司 用于服务器集群故障诊断的处理方法
TWI736079B (zh) * 2019-12-23 2021-08-11 瑞昱半導體股份有限公司 晶片及其異常處理方法
TWI794041B (zh) * 2022-03-09 2023-02-21 英業達股份有限公司 硬碟效能問題分類模型的建立方法、硬碟效能問題分析方法及硬碟效能問題分類模型建立系統
CN116107794A (zh) * 2023-04-10 2023-05-12 中国船舶集团有限公司第七一九研究所 一种舰船软件故障自动诊断方法、***及存储介质
WO2023109251A1 (zh) * 2021-12-17 2023-06-22 浪潮电子信息产业股份有限公司 一种***故障检测方法、装置、设备及介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101601005A (zh) * 2007-01-31 2009-12-09 惠普开发有限公司 数字媒体驱动器故障预测***和方法
CN104503874A (zh) * 2014-12-29 2015-04-08 南京大学 一种云计算平台的硬盘故障预测方法
CN105574183A (zh) * 2015-12-23 2016-05-11 中山大学深圳研究院 一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法
CN106371422A (zh) * 2016-08-31 2017-02-01 北京航空航天大学 一种预测关键基础设施故障传播的方法
CN106598791A (zh) * 2016-09-12 2017-04-26 湖南微软创新中心有限公司 一种基于机器学习的工业设备故障预防性识别方法
CN106650694A (zh) * 2016-12-30 2017-05-10 江苏四点灵机器人有限公司 一种以卷积神经网络作为特征提取器的人脸识别方法
CN107392320A (zh) * 2017-07-28 2017-11-24 郑州云海信息技术有限公司 一种使用机器学习预测硬盘故障的方法
CN107967485A (zh) * 2017-11-16 2018-04-27 国网冀北电力有限公司电力科学研究院 用电计量设备故障分析方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101601005A (zh) * 2007-01-31 2009-12-09 惠普开发有限公司 数字媒体驱动器故障预测***和方法
CN104503874A (zh) * 2014-12-29 2015-04-08 南京大学 一种云计算平台的硬盘故障预测方法
CN105574183A (zh) * 2015-12-23 2016-05-11 中山大学深圳研究院 一种基于协同过滤推荐算法-K最近邻分类算法的App推荐方法
CN106371422A (zh) * 2016-08-31 2017-02-01 北京航空航天大学 一种预测关键基础设施故障传播的方法
CN106598791A (zh) * 2016-09-12 2017-04-26 湖南微软创新中心有限公司 一种基于机器学习的工业设备故障预防性识别方法
CN106650694A (zh) * 2016-12-30 2017-05-10 江苏四点灵机器人有限公司 一种以卷积神经网络作为特征提取器的人脸识别方法
CN107392320A (zh) * 2017-07-28 2017-11-24 郑州云海信息技术有限公司 一种使用机器学习预测硬盘故障的方法
CN107967485A (zh) * 2017-11-16 2018-04-27 国网冀北电力有限公司电力科学研究院 用电计量设备故障分析方法及装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109446049A (zh) * 2018-11-01 2019-03-08 郑州云海信息技术有限公司 一种基于监督学习的服务器错误诊断方法和装置
CN109492826A (zh) * 2018-12-06 2019-03-19 远光软件股份有限公司 一种基于机器学习的信息***运行状态风险预测方法
CN109492826B (zh) * 2018-12-06 2021-12-14 远光软件股份有限公司 一种基于机器学习的信息***运行状态风险预测方法
CN109800139A (zh) * 2018-12-18 2019-05-24 东软集团股份有限公司 服务器健康度分析方法,装置,存储介质及电子设备
TWI736079B (zh) * 2019-12-23 2021-08-11 瑞昱半導體股份有限公司 晶片及其異常處理方法
CN111382029A (zh) * 2020-03-05 2020-07-07 清华大学 基于pca和多维监测数据的主板异常诊断方法及装置
CN111382029B (zh) * 2020-03-05 2021-09-03 清华大学 基于pca和多维监测数据的主板异常诊断方法及装置
CN111860667A (zh) * 2020-07-27 2020-10-30 海尔优家智能科技(北京)有限公司 设备故障的确定方法及装置、存储介质、电子装置
CN112988444A (zh) * 2021-03-25 2021-06-18 腾讯科技(深圳)有限公司 用于服务器集群故障诊断的处理方法
CN112988444B (zh) * 2021-03-25 2023-03-14 腾讯科技(深圳)有限公司 用于服务器集群故障诊断的处理方法、处理装置、及处理设备、用于服务器故障诊断的方法及计算机可读存储介质
WO2023109251A1 (zh) * 2021-12-17 2023-06-22 浪潮电子信息产业股份有限公司 一种***故障检测方法、装置、设备及介质
TWI794041B (zh) * 2022-03-09 2023-02-21 英業達股份有限公司 硬碟效能問題分類模型的建立方法、硬碟效能問題分析方法及硬碟效能問題分類模型建立系統
CN116107794A (zh) * 2023-04-10 2023-05-12 中国船舶集团有限公司第七一九研究所 一种舰船软件故障自动诊断方法、***及存储介质

Similar Documents

Publication Publication Date Title
CN108710555A (zh) 一种基于监督学习的服务器错误诊断方法
Klinkenberg et al. Data mining-based analysis of HPC center operations
CN1750021A (zh) 用于管理及预测自动分类器性能的方法和装置
CN109446049A (zh) 一种基于监督学习的服务器错误诊断方法和装置
CN105653444A (zh) 基于互联网日志数据的软件缺陷故障识别方法和***
Borghesi et al. Anomaly detection and anticipation in high performance computing systems
KR20220114986A (ko) 가상 네트워크 관리를 위한 머신 러닝 기반 vnf 이상 탐지 시스템 및 방법
CN1749987A (zh) 用于管理及预测自动分类器性能的方法和装置
Turhan et al. Empirical evaluation of mixed-project defect prediction models
CN110287552A (zh) 基于改进随机森林算法的电机轴承故障诊断方法及***
WO2014131262A1 (zh) 一种缺陷预测方法及装置
CN103699698A (zh) 一种基于改进贝叶斯的轨道交通故障识别方法及***
CN111010291A (zh) 业务流程异常告警方法、装置、电子设备及存储介质
CN110865924B (zh) 电力信息***内部服务器健康度诊断方法与健康诊断框架
CN106845526A (zh) 一种基于大数据融合聚类分析的关联参数故障分类方法
CN104252401A (zh) 一种基于权重的设备状态判断方法及其***
CN111949429A (zh) 基于密度聚类算法的服务器故障监测方法及***
CN110502677A (zh) 一种设备识别方法、装置及设备、存储介质
CN107579858A (zh) 云主机的告警方法及装置、通信***
US11777982B1 (en) Multidimensional security situation real-time representation method and system and applicable to network security
CN107463963A (zh) 一种故障分类方法及装置
CN108055152B (zh) 基于分布式服务日志的通信网络信息***异常检测方法
CN207992717U (zh) 一种水电站闸门在线状态监测***
Tahat et al. An evaluation of machine learning algorithms in an experimental structural health monitoring system incorporating lora iot connectivity
CN1750020A (zh) 用于管理及预测自动分类器性能的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181026