CN115659826A - 一种服务器故障率检测方法、装置、电子设备及存储介质 - Google Patents
一种服务器故障率检测方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115659826A CN115659826A CN202211379607.6A CN202211379607A CN115659826A CN 115659826 A CN115659826 A CN 115659826A CN 202211379607 A CN202211379607 A CN 202211379607A CN 115659826 A CN115659826 A CN 115659826A
- Authority
- CN
- China
- Prior art keywords
- fault
- server
- failure
- influence data
- rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本发明公开一种服务器故障率检测方法、装置、电子设备及存储介质,方法包括:获取历史服务器故障率以及与历史服务器故障率对应的故障影响数据,对故障影响数据进行预处理;基于历史服务器故障率以及故障影响数据,对待训练的故障率预测模型进行训练,获得训练完成的模型;获取未来若干个日期对应的故障影响数据并进行预处理,分别将若干个预处理后的故障影响数据输入所述训练完成的故障率预测模型,获得若干个故障影响数据对应的服务器故障率的预测值;基于若干个故障影响数据对应的服务器故障率的预测值,确定服务器的故障告警日期,并发出相应的报警信息。本发明解决了目前无法在研发流程上对服务器的故障率进行检测的技术问题。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种服务器故障率检测方法、装置、电子设备及存储介质。
背景技术
当今各式软件应用井喷式增加,每时每刻都有成千上万的软件应用***被开发,并随后被部署到服务器上。然而,争分夺秒的需求时效跟软件的质量成反比。需求时效约短,开发出来的软件质量就越差。这成了一个互联网公司都必然会面对的问题。低质量的软件应用部署到服务器上后,必然会导致应用故障率的不断上升。
虽然现在有很多维护服务器健康的方案,但是都是从服务器本身指标来监控预警的,比如检测服务器的CPU、内存、硬件健康等服务器本身的属性。但是,却没有一个是从研发流程的研发质量来进行应用发布后的健康预测预警。
因此,亟需一种能够从研发流程上检测服务器故障率的方法。
发明内容
本发明的目的在于克服上述技术不足,提供一种可应用于金融科技或其它相关技术领域的服务器故障率检测方法、装置、电子设备及存储介质,解决现有技术中无法在研发流程上对服务器的故障率进行检测的技术问题。
为达到上述技术目的,本发明采取了以下技术方案:
第一方面,本发明提供一种服务器故障率检测方法,包括如下步骤:
获取历史服务器故障率以及与所述历史服务器故障率对应的故障影响数据,并对所述故障影响数据进行预处理,其中,所述故障影响数据与需求延迟情况相关;
基于所述历史服务器故障率以及预处理后的所述历史服务器故障率对应的故障影响数据,对待训练的故障率预测模型进行训练,获得训练完成的故障率预测模型;
获取未来若干个日期对应的故障影响数据并进行预处理,分别将若干个预处理后的故障影响数据输入所述训练完成的故障率预测模型,获得若干个故障影响数据对应的服务器故障率的预测值;
基于所述若干个故障影响数据对应的服务器故障率的预测值,确定所述服务器的故障告警日期,并发出相应的报警信息。
在一些实施例中,所述故障影响数据包括需求延误个数以及其对应的日期。
在一些实施例中,所述预处理的方式为归一化处理。
在一些实施例中,所述故障率预测模型为XGBoost模型。
在一些实施例中,所述基于所述历史服务器故障率以及预处理后的所述历史服务器故障率对应的故障影响数据,对待训练的故障率预测模型进行训练,获得训练完成的故障率预测模型,包括:
将所述历史服务器故障率以及预处理后的所述历史服务器故障率对应的历史故障影响数据分为k-1个训练集和1个测试集,并在所述k-1个训练集上对所述待训练的XGBoost模型进行训练,获得训练后的XGBoost模型,所述k为大于1的整数;
在所述1个测试集上对所述训练后的XGBoost模型进行测试,并基于测试结果计算模型评价指标;
若所述模型评价指标不满足预设条件,重新划分k-1个训练集和1个测试集,并将所述训练后的XGBoost模型作为所述待训练的XGBoost模型,进行模型训练;
若所述模型评价指标满足预设条件,获得所述训练完成的XGBoost模型。
在一些实施例中,所述基于所述若干个故障影响数据对应的服务器故障率的预测值,确定所述服务器的故障告警日期,包括:
根据各个故障影响数据的日期先后顺序,依次将若干个故障影响数据对应的服务器故障率的预测值与预设的故障率阈值进行比较,当所述服务器故障率的预测值达到或超过所述预设的故障率阈值时,停止比较,并以该服务器故障率的预测值对应的故障影响数据的日期作为故障告警日期。
在一些实施例中,所述报警信息的发出方式为邮件、短信中的一种或多种。
第二方面,本发明还提供一种服务器故障率检测装置,包括:
获取模块,用于获取历史服务器故障率以及与所述历史服务器故障率对应的故障影响数据,并对所述故障影响数据进行预处理,其中,所述故障影响数据与需求延迟情况相关;
训练模块,用于基于所述历史服务器故障率以及预处理后的所述历史服务器故障率对应的故障影响数据,对待训练的故障率预测模型进行训练,获得训练完成的故障率预测模型;
预测模块,用于获取未来若干个日期对应的故障影响数据并进行预处理,分别将若干个预处理后的故障影响数据输入所述训练完成的故障率预测模型,获得若干个故障影响数据对应的服务器故障率的预测值;
报警模块,用于基于所述若干个故障影响数据对应的服务器故障率的预测值,确定所述服务器的故障告警日期,并发出相应的报警信息。
第三方面,本发明还提供一种电子设备,包括:处理器和存储器;
所述存储器上存储有可被所述处理器执行的计算机程序;
所述处理器执行所述计算机程序时实现如上所述的服务器故障率检测方法中的步骤。
第四方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上所述的服务器故障率检测方法中的步骤。
与现有技术相比,本发明提供的服务器故障率检测方法、装置、电子设备及存储介质,首先获取历史服务器故障率以及与所述历史服务器故障率对应的与需求延迟情况相关的故障影响数据,并对所述故障影响数据进行预处理,之后基于所述历史服务器故障率以及预处理后的所述历史服务器故障率对应的故障影响数据,对待训练的故障率预测模型进行训练,获得训练完成的故障率预测模型,之后获取未来若干个日期对应的故障影响数据并进行预处理,分别将若干个预处理后的故障影响数据输入所述训练完成的故障率预测模型,获得若干个故障影响数据对应的服务器故障率的预测值,最后基于所述若干个故障影响数据对应的服务器故障率的预测值,确定所述服务器的故障告警日期,并发出相应的报警信息。本发明通过分析与需求延迟情况相关的故障影响数据,通过故障影响数据构建故障率预测模型,然后通过故障率预测模型对故障率进行预测,从而判断达到故障率报警的时间点,帮助运维等相关人员对软件应用以及服务器健康进行科学的治理。
附图说明
图1是本发明实施例提供的服务器故障率检测方法的流程图;
图2是本发明实施例提供的服务器故障率检测方法中,步骤S200的一实施例的流程图;
图3是本发明实施例提供的服务器故障率检测装置的功能模块示意图;
图4是本发明实施例提供的电子设备的硬件结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1,图1是本发明实施例提供的一种服务器故障率检测方法的流程示意图,本发明所涉及的服务器故障率检测方法可用于银行等金融领域的服务器故障率检测中,以从研发流程上对服务器的故障率进行检测报警。本发明所涉及的服务器故障率检测方法可由电子设备执行,该电子设备能够进行接收或发送数据等操作,可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、便携式计算机和台式服务器等等。如图1所示,该方法具体包括以下步骤S100至步骤S400。
S100、获取历史服务器故障率以及与所述历史服务器故障率对应的故障影响数据,并对所述故障影响数据进行预处理,其中,所述故障影响数据与需求延迟情况相关。
本实施例中,为了对服务器故障率进行预测,需要先获取训练数据,该训练数据由历史服务器故障率以及历史服务器故障率对应的故障影响数据构成,通过构建该训练数据,可用于后续模型的训练。由于本发明中的训练数据是与需求延迟情况相关的故障影响数据,因此最终能够通过模型得到需求延误引起的服务器故障的增长曲线。为了方便模型训练,本实施例中,还对所述故障影响数据进行预处理,从而得到方便训练的数据
S200、基于所述历史服务器故障率以及预处理后的所述历史服务器故障率对应的故障影响数据,对待训练的故障率预测模型进行训练,获得训练完成的故障率预测模型。
本实施例中,当得到了训练数据后,可将该训练集输入至待训练的故障率预测模型中,该故障率预测模型的输入为故障影响数据,该故障率预测模型的输出为服务器故障率,通过利用训练数据训练该故障率预测模型,从而可使该故障率预测模型能够根据输入的故障影响数据预测出服务器故障率,进而达到预警的目的。
S300、获取未来若干个日期对应的故障影响数据并进行预处理,分别将若干个预处理后的故障影响数据输入所述训练完成的故障率预测模型,获得若干个故障影响数据对应的服务器故障率的预测值。
本实施例中,当模型训练完成后,即可利用该模型对未来若干个日期的服务器故障率进行预测,具体的,通过输入未来若干个日期对应的故障影响数据并进行预处理后,将预处理的故障影响数据输入模型中,模型即可自动输出对应的服务器故障率,从而在研发流程上对服务器故障率进行预测。
S400、基于所述若干个故障影响数据对应的服务器故障率的预测值,确定所述服务器的故障告警日期,并发出相应的报警信息。
本实施例中,当得到了若干个预测的服务器故障率后,即可对若干个服务器故障率进行分析,得到需要进行服务器故障报警的故障告警日期,然后发出相应的报警信息给应用运维人员以及应用管理员等相关人员,由相关人员对该服务器以及相关软件应用进行收到告警的后续处理。
本发明实施例首先获取历史服务器故障率以及与所述历史服务器故障率对应的与需求延迟情况相关的故障影响数据,并对所述故障影响数据进行预处理,之后基于所述历史服务器故障率以及预处理后的所述历史服务器故障率对应的故障影响数据,对待训练的故障率预测模型进行训练,获得训练完成的故障率预测模型,之后获取未来若干个日期对应的故障影响数据并进行预处理,分别将若干个预处理后的故障影响数据输入所述训练完成的故障率预测模型,获得若干个故障影响数据对应的服务器故障率的预测值,最后基于所述若干个故障影响数据对应的服务器故障率的预测值,确定所述服务器的故障告警日期,并发出相应的报警信息。本发明通过分析与需求延迟情况相关的故障影响数据,通过故障影响数据构建故障率预测模型,然后通过故障率预测模型对故障率进行预测,从而判断达到故障率报警的时间点,帮助运维等相关人员对软件应用以及服务器健康进行科学的治理。
在一些实施例中,所述故障影响数据包括需求延误个数以及其对应的日期。
本实施例中,按天对需求延误个数进行统计,例如,以银行研发需求为例,本方案对银行所有高频率发版的应用进行研发需求统计,统计银行应用当前研发版本中的研发需求的延迟个数。具体如下表所示,将日期、延误需求个数这两列作为x1、x2,FM(延误需求对应服务器故障率,该故障率计算为:故障次数/统计天数)作为Y,作为模型的训练数据,来预测未来的FM,进行负荷情况判断,从而计算出服务器达到指定故障率的时间点。示例性的,利用2022年7月1日至16日的数据来预测未来的故障率曲线。
日期 | 需求延误个数 | FM |
2022/7/1 | 16 | 12.18 |
2022/7/2 | 18 | 14.71 |
2022/7/3 | 19 | 14.85 |
在一些实施例中,所述预处理的方式为归一化处理。
本实施例中,归一化公式如下:
此公式中,Xnorm表示需求延误个数归一化后的数值,也就是将所有需求延误个数数值转换为0-1之间的数。
X表示当前数值,例如,2022/7/1日的需求延误个数为16。
Xmin表示7月1日至3日中,最小的数值,例如上表中最小数值为16。
Xmax表示7月1日至3日中,最大的数值,例如上表中最小数值为19。
在一些实施例中,所述故障率预测模型为XGBoost模型。
本实施例中,XGBoost是机器学习中的集成学习算法Boosting方法中的一种,Boosting方法通过将多个弱学习器集成起来形成一个强学习器。XGBoost模型是一种提升树模型,其本质是多个分类回归树(classification and regression tree,CART)的集成,即用多个CART树来进行预测,将每棵树的预测值相加后获得模型最终的预测值。利用XGBoost模型可以解决回归问题。
具体的,XGBoost的目标函数如下,其中,yi为真实标签,yi为预测结果。
这个目标函数分为两部分:损失函数和正则化项。且损失函数揭示训练误差(即预测分数和真实分数的差距),正则化定义复杂度。
函数右边部分,Ω(fk)表示正则项,K表示叶子节点的个数,a=1表示第K轮决策树第1个叶子节点的预测值。
T表示叶子节点的个数,w表示叶子节点的分数。直观上看,目标要求预测误差尽量小,且叶子节点T尽量少(γ控制叶子结点的个数),节点数值w尽量不极端(λ控制叶子节点的分数不会过大),防止过拟合。
在一些实施例中,请参阅图2,所述步骤S200具体包括:
S210、将所述历史服务器故障率以及预处理后的所述历史服务器故障率对应的历史故障影响数据分为k-1个训练集和1个测试集,并在所述k-1个训练集上对所述待训练的XGBoost模型进行训练,获得训练后的XGBoost模型,所述k为大于1的整数;
S220、在所述1个测试集上对所述训练后的XGBoost模型进行测试,并基于测试结果计算模型评价指标;
S230、若所述模型评价指标不满足预设条件,重新划分k-1个训练集和1个测试集,并将所述训练后的XGBoost模型作为所述待训练的XGBoost模型,进行模型训练;
S240、若所述模型评价指标满足预设条件,获得所述训练完成的XGBoost模型。
本实施例中,根据k折交叉验证法,将所述总样本数据分为k-1个训练集和1个测试集,并在所述k-1个训练集上对所述待训练的XGBoost模型进行训练,获得训练后的XGBoost模型,所述k为大于1的整数;具体的,k可以为10,即采用10折交叉验证法来划分数据集。即,在训练集上建立m个CART回归树进行预测:每一个CART回归树都是一个弱学习器,通过一步步加入新的弱学习器,来努力纠正前面所有弱学习器的残差,因此,最终这m个学习器相加在一起可以用来对服务器故障率进行预测。其中,m为大于1的整数。
在所述1个测试集上对所述训练后的XGBoost模型进行测试,并基于测试结果计算模型评价指标;具体的,该模型评价指标可以包括平均绝对误差、均方误差、均方根误差、平均绝对百分误差中的一种。
若所述模型评价指标不满足预设条件,重新划分k-1个训练集和1个测试集,并将所述训练后的XGBoost模型作为所述待训练的XGBoost模型,继续进行模型训练;该预设条件可以根据实际情况进行设定。例如,该预设条件可以设为:均方根误差小于指标阈值。若所述模型评价指标满足预设条件,获得所述训练完成的XGBoost模型。
优选的,经过反复训练后,最终得到的XGBoost模型的最优参数具体如下:learning_rate为0.071,n_estimators为500,max_depth为5,min_child_weight为1,subsample为0.75,colsample_bytree为0.8,gamma为0,reg_alpha为0,reg_lambda为1。
在一些实施例中,所述基于所述若干个故障影响数据对应的服务器故障率的预测值,确定所述服务器的故障告警日期,包括:
根据各个故障影响数据的日期先后顺序,依次将若干个故障影响数据对应的服务器故障率的预测值与预设的故障率阈值进行比较,当所述服务器故障率的预测值达到或超过所述预设的故障率阈值时,停止比较,并以该服务器故障率的预测值对应的故障影响数据的日期作为故障告警日期。
本实施例中,通过预设故障率阈值,将预测出的各个服务器故障率按照先后顺序依次与该故障率阈值进行比较,如果发现预测出的故障率达到或者超过故障率阈值,则表示此日期的服务器故障率会超过研发承受范围,需要及时进行处理,此时则无需再进行后续的比较,直接将该服务器故障率的预测值对应的故障影响数据的日期作为故障告警日期,提示应用运维人员以及应用管理员等相关人员。
在一些实施例中,所述报警信息的发出方式为邮件、短信中的一种或多种。本实施例中,将本次检测的应用故障率相关信息通过邮件、短信等方式向应用运维人员以及应用管理员等相关人员进行告警。由相关人员对该服务器以及相关软件应用进行收到告警的后续处理,简单方便。
本发明提供的技术方案,首先获取历史服务器故障率以及与所述历史服务器故障率对应的与需求延迟情况相关的故障影响数据,并对所述故障影响数据进行预处理,之后基于所述历史服务器故障率以及预处理后的所述历史服务器故障率对应的故障影响数据,对待训练的故障率预测模型进行训练,获得训练完成的故障率预测模型,之后获取未来若干个日期对应的故障影响数据并进行预处理,分别将若干个预处理后的故障影响数据输入所述训练完成的故障率预测模型,获得若干个故障影响数据对应的服务器故障率的预测值,最后基于所述若干个故障影响数据对应的服务器故障率的预测值,确定所述服务器的故障告警日期,并发出相应的报警信息。本发明通过分析与需求延迟情况相关的故障影响数据,通过故障影响数据构建故障率预测模型,然后通过故障率预测模型对故障率进行预测,从而判断达到故障率报警的时间点,帮助运维等相关人员对软件应用以及服务器健康进行科学的治理。
本发明另一实施例提供一种服务器故障率检测装置,请参阅图3,该服务器故障率检测装置包括获取模块11、训练模块12、预测模块13以及报警模块14。
获取模块11用于获取历史服务器故障率以及与所述历史服务器故障率对应的故障影响数据,并对所述故障影响数据进行预处理,其中,所述故障影响数据与需求延迟情况相关。
训练模块12用于基于所述历史服务器故障率以及预处理后的所述历史服务器故障率对应的故障影响数据,对待训练的故障率预测模型进行训练,获得训练完成的故障率预测模型。
预测模块13用于获取未来若干个日期对应的故障影响数据并进行预处理,分别将若干个预处理后的故障影响数据输入所述训练完成的故障率预测模型,获得若干个故障影响数据对应的服务器故障率的预测值。
报警模块14用于基于所述若干个故障影响数据对应的服务器故障率的预测值,确定所述服务器的故障告警日期,并发出相应的报警信息。
本实施例中,首先获取历史服务器故障率以及与所述历史服务器故障率对应的与需求延迟情况相关的故障影响数据,并对所述故障影响数据进行预处理,之后基于所述历史服务器故障率以及预处理后的所述历史服务器故障率对应的故障影响数据,对待训练的故障率预测模型进行训练,获得训练完成的故障率预测模型,之后获取未来若干个日期对应的故障影响数据并进行预处理,分别将若干个预处理后的故障影响数据输入所述训练完成的故障率预测模型,获得若干个故障影响数据对应的服务器故障率的预测值,最后基于所述若干个故障影响数据对应的服务器故障率的预测值,确定所述服务器的故障告警日期,并发出相应的报警信息。本发明通过分析与需求延迟情况相关的故障影响数据,通过故障影响数据构建故障率预测模型,然后通过故障率预测模型对故障率进行预测,从而判断达到故障率报警的时间点,帮助运维等相关人员对软件应用以及服务器健康进行科学的治理。
需要说明的是,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述反洗钱黑名单筛查的执行过程,各模块的具体实施方式请参考上述对应的方法实施例,此处不再赘述。
在一些实施例中,所述故障影响数据包括需求延误个数以及其对应的日期。
在一些实施例中,所述预处理的方式为归一化处理。
在一些实施例中,所述故障率预测模型为XGBoost模型。
在一些实施例中,所述训练模块具体用于:
将所述历史服务器故障率以及预处理后的所述历史服务器故障率对应的历史故障影响数据分为k-1个训练集和1个测试集,并在所述k-1个训练集上对所述待训练的XGBoost模型进行训练,获得训练后的XGBoost模型,所述k为大于1的整数;
在所述1个测试集上对所述训练后的XGBoost模型进行测试,并基于测试结果计算模型评价指标;
若所述模型评价指标不满足预设条件,重新划分k-1个训练集和1个测试集,并将所述训练后的XGBoost模型作为所述待训练的XGBoost模型,进行模型训练;
若所述模型评价指标满足预设条件,获得所述训练完成的XGBoost模型。
在一些实施例中,所述报警模块具体用于:
根据各个故障影响数据的日期先后顺序,依次将若干个故障影响数据对应的服务器故障率的预测值与预设的故障率阈值进行比较,当所述服务器故障率的预测值达到或超过所述预设的故障率阈值时,停止比较,并以该服务器故障率的预测值对应的故障影响数据的日期作为故障告警日期。
在一些实施例中,所述报警信息的发出方式为邮件、短信中的一种或多种。
本发明另一实施例提供一种电子设备,如图4所示,电子设备10包括:
一个或多个处理器110以及存储器120,图4中以一个处理器110为例进行介绍,处理器110和存储器120可以通过总线或者其他方式连接,图4中以通过总线连接为例。
处理器110用于完成电子设备10的各种控制逻辑,其可以为通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、单片机、ARM(Acorn RISCMachine)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。还有,处理器110还可以是任何传统处理器、微处理器或状态机。处理器110也可以被实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、一个或多个微处理器结合DSP和/或任何其它这种配置。
存储器120作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的服务器故障率检测方法对应的程序指令。处理器110通过运行存储在存储器120中的非易失性软件程序、指令以及单元,从而执行电子设备10的各种功能应用以及数据处理,即实现上述方法实施例中的服务器故障率检测方法。
存储器120可以包括存储程序区和存储数据区,其中,存储程序区可存储操作平台、至少一个功能所需要的应用程序;存储数据区可存储根据电子设备10使用所创建的数据等。此外,存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器120可选包括相对于处理器110远程设置的存储器,这些远程存储器可以通过网络连接至电子设备10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个单元存储在存储器120中,当被一个或者多个处理器110执行时,执行上述任意方法实施例中的服务器故障率检测方法,例如,执行以上描述的图1中的方法步骤S100至步骤S400。
本发明另一实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,例如,执行以上描述的图1中的方法步骤S100至步骤S400。
作为示例,计算机可读存储介质能够包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦ROM(EEPROM)或闪速存储器。易失性存储器能够包括作为外部高速缓存存储器的随机存取存储器(RAM)。通过说明而非限制,RAM可以以诸如同步RAM(SRAM)、动态RAM、(DRAM)、同步DRAM(SDRAM)、双数据速率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、Synchlink DRAM(SLDRAM)以及直接Rambus(兰巴斯)RAM(DRRAM)之类的许多形式得到。本文中所描述的操作环境的所公开的存储器组件或存储器旨在包括这些和/或任何其他适合类型的存储器中的一个或多个。
综上所述,本发明提供的服务器故障率检测方法、装置、电子设备及存储介质,首先获取历史服务器故障率以及与所述历史服务器故障率对应的与需求延迟情况相关的故障影响数据,并对所述故障影响数据进行预处理,之后基于所述历史服务器故障率以及预处理后的所述历史服务器故障率对应的故障影响数据,对待训练的故障率预测模型进行训练,获得训练完成的故障率预测模型,之后获取未来若干个日期对应的故障影响数据并进行预处理,分别将若干个预处理后的故障影响数据输入所述训练完成的故障率预测模型,获得若干个故障影响数据对应的服务器故障率的预测值,最后基于所述若干个故障影响数据对应的服务器故障率的预测值,确定所述服务器的故障告警日期,并发出相应的报警信息。本发明通过分析与需求延迟情况相关的故障影响数据,通过故障影响数据构建故障率预测模型,然后通过故障率预测模型对故障率进行预测,从而判断达到故障率报警的时间点,帮助运维等相关人员对软件应用以及服务器健康进行科学的治理。
以上所述本发明的具体实施方式,并不构成对本发明保护范围的限定。任何根据本发明的技术构思所做出的各种其他相应的改变与变形,均应包含在本发明权利要求的保护范围内。
Claims (10)
1.一种服务器故障率检测方法,其特征在于,包括如下步骤:
获取历史服务器故障率以及与所述历史服务器故障率对应的故障影响数据,并对所述故障影响数据进行预处理,其中,所述故障影响数据与需求延迟情况相关;
基于所述历史服务器故障率以及预处理后的所述历史服务器故障率对应的故障影响数据,对待训练的故障率预测模型进行训练,获得训练完成的故障率预测模型;
获取未来若干个日期对应的故障影响数据并进行预处理,分别将若干个预处理后的故障影响数据输入所述训练完成的故障率预测模型,获得若干个故障影响数据对应的服务器故障率的预测值;
基于所述若干个故障影响数据对应的服务器故障率的预测值,确定所述服务器的故障告警日期,并发出相应的报警信息。
2.根据权利要求1所述的服务器故障率检测方法,其特征在于,所述故障影响数据包括需求延误个数以及其对应的日期。
3.根据权利要求1所述的服务器故障率检测方法,其特征在于,所述预处理的方式为归一化处理。
4.根据权利要求1所述的服务器故障率检测方法,其特征在于,所述故障率预测模型为XGBoost模型。
5.根据权利要求4所述的服务器故障率检测方法,其特征在于,所述基于所述历史服务器故障率以及预处理后的所述历史服务器故障率对应的故障影响数据,对待训练的故障率预测模型进行训练,获得训练完成的故障率预测模型,包括:
将所述历史服务器故障率以及预处理后的所述历史服务器故障率对应的历史故障影响数据分为k-1个训练集和1个测试集,并在所述k-1个训练集上对所述待训练的XGBoost模型进行训练,获得训练后的XGBoost模型,所述k为大于1的整数;
在所述1个测试集上对所述训练后的XGBoost模型进行测试,并基于测试结果计算模型评价指标;
若所述模型评价指标不满足预设条件,重新划分k-1个训练集和1个测试集,并将所述训练后的XGBoost模型作为所述待训练的XGBoost模型,进行模型训练;
若所述模型评价指标满足预设条件,获得所述训练完成的XGBoost模型。
6.根据权利要求1所述的服务器故障率检测方法,其特征在于,所述基于所述若干个故障影响数据对应的服务器故障率的预测值,确定所述服务器的故障告警日期,包括:
根据各个故障影响数据的日期先后顺序,依次将若干个故障影响数据对应的服务器故障率的预测值与预设的故障率阈值进行比较,当所述服务器故障率的预测值达到或超过所述预设的故障率阈值时,停止比较,并以该服务器故障率的预测值对应的故障影响数据的日期作为故障告警日期。
7.根据权利要求1所述的服务器故障率检测方法,其特征在于,所述报警信息的发出方式为邮件、短信中的一种或多种。
8.一种服务器故障率检测装置,其特征在于,包括:
获取模块,用于获取历史服务器故障率以及与所述历史服务器故障率对应的故障影响数据,并对所述故障影响数据进行预处理,其中,所述故障影响数据与需求延迟情况相关;
训练模块,用于基于所述历史服务器故障率以及预处理后的所述历史服务器故障率对应的故障影响数据,对待训练的故障率预测模型进行训练,获得训练完成的故障率预测模型;
预测模块,用于获取未来若干个日期对应的故障影响数据并进行预处理,分别将若干个预处理后的故障影响数据输入所述训练完成的故障率预测模型,获得若干个故障影响数据对应的服务器故障率的预测值;
报警模块,用于基于所述若干个故障影响数据对应的服务器故障率的预测值,确定所述服务器的故障告警日期,并发出相应的报警信息。
9.一种电子设备,其特征在于,包括:处理器和存储器;
所述存储器上存储有可被所述处理器执行的计算机程序;
所述处理器执行所述计算机程序时实现如权利要求1-7任意一项所述的服务器故障率检测方法中的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1-7任意一项所述的服务器故障率检测方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211379607.6A CN115659826A (zh) | 2022-11-04 | 2022-11-04 | 一种服务器故障率检测方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211379607.6A CN115659826A (zh) | 2022-11-04 | 2022-11-04 | 一种服务器故障率检测方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115659826A true CN115659826A (zh) | 2023-01-31 |
Family
ID=85016279
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211379607.6A Pending CN115659826A (zh) | 2022-11-04 | 2022-11-04 | 一种服务器故障率检测方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115659826A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117014784A (zh) * | 2023-09-27 | 2023-11-07 | 深圳市冉希古科技有限公司 | 一种头带式耳机的头带故障自检方法及*** |
-
2022
- 2022-11-04 CN CN202211379607.6A patent/CN115659826A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117014784A (zh) * | 2023-09-27 | 2023-11-07 | 深圳市冉希古科技有限公司 | 一种头带式耳机的头带故障自检方法及*** |
CN117014784B (zh) * | 2023-09-27 | 2024-01-30 | 深圳市冉希古科技有限公司 | 一种头戴式耳机的头带故障自检方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111178456B (zh) | 异常指标检测方法、装置、计算机设备和存储介质 | |
CN112188531B (zh) | 异常检测方法、装置、电子设备及计算机存储介质 | |
CN110362612B (zh) | 由电子设备执行的异常数据检测方法、装置和电子设备 | |
CN111625516A (zh) | 检测数据状态的方法、装置、计算机设备和存储介质 | |
CN114138625A (zh) | 服务器健康状态的评估方法、***、电子设备和存储介质 | |
CN112989332B (zh) | 一种异常用户行为检测方法和装置 | |
CN116451142A (zh) | 一种基于机器学习算法的水质传感器故障检测方法 | |
CN115659826A (zh) | 一种服务器故障率检测方法、装置、电子设备及存储介质 | |
Sundararajan et al. | Nonparametric change point detection in multivariate piecewise stationary time series | |
US8301584B2 (en) | System and method for adaptive pruning | |
CN113704389A (zh) | 一种数据评估方法、装置、计算机设备及存储介质 | |
CN111522736A (zh) | 一种软件缺陷预测方法、装置、电子设备及计算机存储介质 | |
CN112836937A (zh) | 基于熵权与bp神经网络技术的洪涝灾害损失评估方法 | |
CN117196322B (zh) | 智能风控方法、装置、计算机设备及存储介质 | |
CN111222769A (zh) | 一种年报数据质量评价方法、装置、电子设备及存储介质 | |
CN113947076A (zh) | 保单数据的检测方法、装置、计算机设备及存储介质 | |
CN116860562B (zh) | 一种用于数据中台数据质量的监控方法及*** | |
CN112329862A (zh) | 基于决策树的反洗钱方法及*** | |
CN111783883A (zh) | 一种异常数据的检测方法及装置 | |
CN116915710A (zh) | 流量预警方法、装置、设备及可读存储介质 | |
CN111277465A (zh) | 一种异常数据报文检测方法、装置及电子设备 | |
CN113535449B (zh) | 异常事件修复处理方法、装置、计算机设备及存储介质 | |
CN115660101A (zh) | 一种基于业务节点信息的数据服务提供方法及装置 | |
CN114416467A (zh) | 一种异常检测方法及装置 | |
US20220376989A1 (en) | Management of predictive models of a communication network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |