WO2020048047A1

WO2020048047A1 - ***故障的预警方法、装置、设备及存储介质

Info

Publication number: WO2020048047A1
Application number: PCT/CN2018/122807
Authority: WO
Inventors: 王伟
Original assignee: 平安科技（深圳）有限公司
Priority date: 2018-09-03
Filing date: 2018-12-21
Publication date: 2020-03-12
Also published as: CN109684179B; CN109684179A

Abstract

一种***故障的预警方法、装置、设备及计算机可读存储介质，所述预警方法包括：根据预设的时间单位，获取目标***在当前时间单位的当前待监控参数（S10）；获取预设监控模型中的标准参数，并根据所述标准参数判断所述当前待监控参数是否存在异常参数（S20）；若判定所述当前待监控参数存在所述异常参数，则根据所述当前待监控参数中的异常参数以及所述标准参数生成预警消息，并上报所述预警消息（S30）。所述方法可将***的核心指标数据设置为待监控参数，根据预设时间单位对核心监控数据进行实时监控，以便能够及时检测发生异常的核心监控数据，从而对即将发生异常的***数据进行预警，实现在异常即将发生时进行提前预警，提升***工作效率。

Description

***故障的预警方法、装置、设备及存储介质

本申请要求于2018年9月3日提交中国专利局、申请号为201811023379.2、发明名称为“***故障的预警方法、装置、设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在申请中。

技术领域

本申请涉及计算机通信领域，尤其涉及一种***故障的预警方法、装置、设备及计算机可读存储介质。

背景技术

***故障是指***不能完成规定功能，或性能退化不满足规定要求的状态。在现有的很多应用***中，例如数据中心***，通信***，卫星***，车载***等中，故障都有可能发生。因此，故障预测成为提供***可靠性的有效方式之一。现有故障告警方式只能在故障发生后，即***参数超过设定阈值时，才会进行告警，从而给出故障提示信息，以便于运维人员通过人工干预的方式采取相应措施以解决故障，例如迁移故障节点、更换故障节点等。但是，在***参数已经超过设定阈值时，***异常问题已经发生，所以现有故障预测方式并不能达到提前预警的目的。

因此，如何解决现有预测技术需要人工核查且不能进行提前预警的问题，成为了目前亟待解决的技术问题。

发明内容

本申请的主要目的在于提供一种***故障的预警方法、装置、设备及计算机可读存储介质，旨在解决现有故障预测技术需要人工核查且不能进行提前预警的技术问题。

为实现上述目的，本申请提供一种***故障的预警方法，所述***故障的预警方法包括以下步骤：

根据预设的时间单位，获取目标***在当前时间单位的当前待监控参数；

获取预设监控模型中的标准参数，并根据所述标准参数判断所述当前待监控参数是否存在异常参数；

若判定所述当前待监控参数存在所述异常参数，则根据所述当前待监控参数中的异常参数以及所述标准参数生成预警消息，并上报所述预警消息。

可选地，所述获取预设监控模型中的标准参数，并根据所述标准参数判断所述当前待监控参数是否存在异常参数的步骤包括：

根据所述预设监控模型，获取所述目标***在所述当前时间单位对应的当前待监控标准参数，作为标准参数；

判断所述当前待监控参数中是否存在与所述标准参数不匹配的异常参数。

根据所述预设监控模型，获取所述目标***在其他时间单位对应的其他待监控标准参数，作为标准参数；

可选地，所述根据预设的时间单位，获取目标***在当前时间单位的当前待监控参数的步骤之前，还包括：

获取所述目标***的历史***数据，根据预设的时间单位，统计所述历史***数据中各个时间单位的待监控参数，其中，所述待监控参数包括内存参数、应用参数和业务参数；

将所述待监控参数中的异常监控参数和正常监控参数进行分类存储，并根据异常监控参数和正常监控参数训练生成所述预设监控模型。

可选地，所述若判定所述当前待监控参数存在所述异常参数，则根据所述当前待监控参数中的异常参数以及所述标准参数生成预警消息，并上报所述预警消息的步骤之后，还包括：

根据所述异常参数，在预设策略库中查找对应的目标修复策略，并根据所述目标修复策略进行异常处理；

获取异常处理结果，并将所述异常处理结果反馈至管理端。

获取所述当前时间单位之后若干个时间单位对应的待监控参数；

根据所述预设监控模型中所述若干个时间单位对应的标准参数，判断所述若干个时间单位对应的待监控参数是否持续异常；

若所述若干个时间单位对应的待监控参数持续异常，则根据持续异常的异常参数生成紧急预警消息，并将所述紧急预警消息发送至管理端。

可选地，所述根据所述预设监控模型中所述若干个时间单位对应的标准参数，判断所述若干个时间单位对应的待监控参数是否持续异常的步骤之后，还包括：

若所述若干个时间单位对应的待监控参数不是持续异常，则根据存在的异常参数在预设策略库中查找对应的目标修复策略，并根据所述目标修复策略进行异常处理。

此外，为实现上述目的，本申请还提供一种***故障的预警装置，其特征在于，所述***故障的预警装置包括：

参数获取模块，用于根据预设的时间单位，获取目标***在当前时间单位的当前待监控参数；

参数监控模块，用于获取预设监控模型中的标准参数，并根据所述标准参数判断所述当前待监控参数是否存在异常参数；

异常预警模块，用于若判定所述当前待监控参数存在所述异常参数，则根据所述当前待监控参数中的异常参数以及所述标准参数生成预警消息，并上报所述预警消息。

此外，为实现上述目的，本申请还提供一种***故障的预警设备，所述***故障的预警设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的***故障的预警程序，其中所述***故障的预警程序被所述处理器执行时，实现如上述的***故障的预警方法的步骤。

此外，为实现上述目的，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有***故障的预警程序，其中所述***故障的预警程序被处理器执行时，实现如上述的***故障的预警方法的步骤。

本申请提供一种***故障的预警方法，即根据预设的时间单位，获取目标***在当前时间单位的当前待监控参数；获取预设监控模型中的标准参数，并根据所述标准参数判断所述当前待监控参数是否存在异常参数；若判定所述当前待监控参数存在所述异常参数，则根据所述当前待监控参数中的异常参数以及所述标准参数生成预警消息，并上报所述预警消息。通过上述方式，本申请可将***的核心指标数据设置为待监控参数，如内存参数、应用参数以及业务参数，根据预设时间单位对核心监控数据进行实时监控，以便能够及时检测发生异常的核心监控数据，从而对即将发生异常的***数据进行预警，实现在异常即将发生时提前进行预警，提升***工作效率。

附图说明

图1为本申请实施例方案中涉及的***故障的预警设备的硬件结构示意图；

图2为本申请***故障的预警方法第一实施例的流程示意图；

图3为本申请***故障的预警方法第二实施例的流程示意图；

图4为本申请***故障的预警方法第三实施例的流程示意图；

图5为本申请***故障的预警装置第一实施例的功能模块示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请实施例涉及的***故障的预警方法主要应用于***故障的预警设备，该***故障的预警设备可以是PC、便携计算机、移动终端等具有显示和处理功能的设备。

参照图1，图1为本申请实施例方案中涉及的***故障的预警设备的硬件结构示意图。本申请实施例中，***故障的预警设备可以包括处理器1001（例如CPU），通信总线1002，用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信；用户接口1003可以包括显示屏（Display）、输入单元比如键盘（Keyboard）；网络接口1004可选的可以包括标准的有线接口、无线接口（如WI-FI接口）；存储器1005可以是高速RAM存储器，也可以是稳定的存储器（non-volatile memory），例如磁盘存储器，存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的硬件结构并不构成对***故障的预警设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

继续参照图1，图1中作为一种计算机可读存储介质的存储器1005可以包括操作***、网络通信模块以及***故障的预警程序。

在图1中，网络通信模块主要用于连接服务器，与服务器进行数据通信；而处理器1001可以调用存储器1005中存储的***故障的预警程序，并执行本申请实施例提供的***故障的预警方法。

本申请实施例提供了一种***故障的预警方法。

参照图2，图2为本申请***故障的预警方法第一实施例的流程示意图。

本实施例中，所述***故障的预警方法包括以下步骤：

步骤S10, 根据预设的时间单位，获取目标***在当前时间单位的当前待监控参数；

目前，故障预测方法通常是基于规则的预测技术，即是通过采集***运行信息，并与预警规则进行匹配，若存在与***运行信息匹配的预设规则，如检测到***参数在大于某一阈值，说明***已经出现故障，从而给出故障提示信息，以便于运维人员通过人工干预的方式采取相应措施以解决故障，例如迁移故障节点、更换故障节点等。但是，在检测到***参数在大于某一阈值后，即表示当前已经发生了***故障，因此不能及时对故障作出预警，达不到预警效果。因此，如何解决现有预测技术预警不及时的问题，成为了目前亟待解决的技术问题。

本实施例中，为了解决上述问题，提供一种***故障的预警方法，通过对***的核心指标数据，如内存参数、应用参数以及业务参数，进行实时监控，以便能够及时对即将发生异常的***数据进行预警。具体地，采集目标***的历史***数据，该历史***数据可以是目标***一年或者更长时间的相关历史数据，可以包括：内存参数，如CPU、内存占用数据、磁盘空间数据等，应用参数，如线程数、请求数、日志数量等，以及业务参数，如在线用户数量、事务数以及上传图片数量等。将所述历史***数据中的各个参数按照预设的时间单位进行统计，预设的时间单位指的是以预先设置的一个时间段作为一个时间单位，该预设的时间单位可以是1分钟、5分钟或者是10分钟等时间集。例如，从00:00开始，00:00-00:01为一时间段，或者00:00-00:05为一时间段。若当前时间为12:02，则当前时间单位为12:00-12:05。具体实施例中，还可以将历史***数据中的各个参数对应存储至一时序数据库，将上述参数量化并生成一个二维表。其中，二维表的横轴为各个***参数（CPU，内存占用数据，磁盘空间数据，线程数，请求数，日志数量…)，纵轴为每个独立的时间片段（1分钟或者5分钟为一个时间片），二维表中存放每个***参数在各个时间片段的***参数数据。将各个***参数数据进行状态标注，如是否异常，具体可将异常***参数数据添加异常标识。分别将异常***参数以及非异常***参数进行归一化处理，然后根据随机森林算法、处理后的异常***参数和非异常***参数对预设监控模型进行训练，从而通过该预设监控模型实现***参数异常的自动识别。具体实施例中，可将***异常对应的***参数变化进行归纳，如网络延迟异常，即当网络开始发生延迟但没有中断时，会导致业务***的业务量（减少）、异常日志量（增加）、应用线程（增加）等***参数变化。如内存占用异常，会导致CPU（占用率升高）、内存占用（增大）、磁盘空间占比（增加）等***参数变化。

进一步地，所述步骤S10之前，还包括：

本实施例中，将历史***数据中的各个参数对应存储至一时序数据库，将上述参数量化并生成一个二维表。其中，二维表的横轴为各个***参数（CPU，内存占用数据，磁盘空间数据，线程数，请求数，日志数量…)，纵轴为每个独立的时间单位（1分钟或者5分钟为一个时间片），二维表中存放每个***参数在各个时间片段的***参数数据。将各个***参数数据进行状态标注，如是否异常，具体可将异常***参数数据添加异常标识。分别将异常***参数以及非异常***参数进行归一化处理，然后根据随机森林算法、处理后的异常***参数和非异常***参数对预设监控模型进行训练，从而通过该预设监控模型实现***参数异常的自动识别。

步骤S20，获取预设监控模型中的标准参数，并根据所述标准参数判断所述当前待监控参数是否存在异常参数；

本实施例中，按照上述的预设时间单位，获取当前时间段所述目标***的当前待监控参数。通过所述预设监控模型，获取所述当前时间段所关联的异常待监控数据以及非异常待监控数据，并将所述当前待监控参数分别与所述异常待监控数据、非异常待监控数据进行比较判断，判断所述当前待监控参数是否异常。具体实施例中，可从横向和纵向两方面进行***参数的异常监控。横向可以为将各个时间片段对应的待监控参数进行比较，判断是否有异常波动的***参数。如当网络开始发生延迟但没有中断时，会导致业务***的业务量（减少）、异常日志量（增加）、应用线程（增加）等***参数发生异常变化。但是在现有技术中由于上述参数变化并未达到预设变化阈值，因此难以触发告警信息。具体实施例中，若监测到所述***参数的异常变化符合某一预存异常情况时，将各个异常参数以及对应的标准数据推送至管理端，以便进行异常确认。纵向为将当前时间片段的当前待监控参数与对应时间片段的标准待监控参数进行比对。

步骤S30，若判定所述当前待监控参数存在所述异常参数，则根据所述当前待监控参数中的异常参数以及所述标准参数生成预警消息，并上报所述预警消息。

本实施例中，若横向对比数据时发现异常，即判定所述当前待监控参数发生异常波动，或者是纵向对比数据时发生异常，即判定所述当前待监控参数与标准参数存在偏差。可提取出所述当前待监控参数中的异常参数，如减少的业务量、增加的异常***日志以及增加的应用线程数量，并根据对应的标准参数（可以为标准参数范围），生成预警提醒消息，并将所述预警消息发送至管理端，以便对应的管理人员进行异常确认，以提前对即将发生的***故障进行处理。

进一步地，所述步骤S30之后，还包括：

获取异常处理结果，并将所述异常处理结果反馈至管理端。

本实施例中，可以将一些常用的异常处理策略与异常参数进行关联，并存储至预设策略库中。如针对内存占用异常的异常参数时，即CPU（占用率升高）、内存占用（增大）、磁盘空间占比（增加），可将关闭后台运行的程序，减小内存占用作为对应关联存储的目标修改策略等。在进行异常处理后，获取异常处理后原异常参数对应的监控参数，并将监控参数反馈至管理端，以便管理员判断异常情况是否被解决。

本实施例提供一种***故障的预警方法，即根据预设的时间单位，获取目标***在当前时间单位的当前待监控参数；获取预设监控模型中的标准参数，并根据所述标准参数判断所述当前待监控参数是否存在异常参数；若判定所述当前待监控参数存在所述异常参数，则根据所述当前待监控参数中的异常参数以及所述标准参数生成预警消息，并上报所述预警消息。通过上述方式，本申请可将***的核心指标数据设置为待监控参数，如内存参数、应用参数以及业务参数，根据预设时间单位对核心监控数据进行实时监控，以便能够及时检测发生异常的核心监控数据，从而对即将发生异常的***数据进行预警，实现在异常即将发生时进行提前预警，提升***工作效率。

参照图3，图3为本申请***故障的预警方法第二实施例的流程示意图。

基于上述图2所示实施例，本实施例中，所述步骤S20包括：

步骤S21，根据所述预设监控模型，获取所述目标***在所述当前时间单位对应的当前待监控标准参数，作为标准参数；

步骤S22，判断所述当前待监控参数中是否存在与所述标准参数不匹配的异常参数。

本实施例中，在预设监控模型中设置有每个时间单位对应的预设标准参数，即将各个事件单位的待监控参数进行纵向对比，即将所述当前监控参数与对应的预设标准参数进行对比。若某个时间单位的待监控参数与预设标准参数差异较大，则该时间单位对应的待监控参数可能发生异常，需要进行对应的异常处理或者是从该时间单位开始进行异常参数的持续监控，进一步确认是否持续异常。

进一步地，本实施例中，所述步骤S20还包括：

步骤S23，根据所述预设监控模型，获取所述目标***在其他时间单位对应的其他待监控标准参数，作为标准参数；

步骤S24，判断所述当前待监控参数中是否存在与所述标准参数不匹配的异常参数。

本实施例中，***在正常运行情况下，各个时间单位对应的待监控参数应处于同一范围标准内。将所述目标***的当前待监控参数与其他时间单位对应的其他待监控参数进行横向对比。其中，所述其他时间单位是指非当前时间单位，可以是若干个时间单位。即与前后预设个时间单位对应的待监控参数进行对比，若某个时间单位的待监控参数与前后预设个时间单位对应的待监控参数差异较大，则该时间单位对应的待监控参数可能发生异常，需要进行对应的异常处理或者是从该时间单位开始进行异常参数的持续监控，进一步确认是否持续异常。

参照图4，图4为本申请***故障的预警方法第三实施例的流程示意图。

基于上述图2所示实施例，本实施例中，所述步骤S30之后，还包括：

步骤S31，获取所述当前时间单位之后若干个时间单位对应的待监控参数；

步骤S32，根据所述预设监控模型中所述若干个时间单位对应的标准参数，判断所述若干个时间单位对应的待监控参数是否持续异常；

步骤S33，若所述若干个时间单位对应的待监控参数持续异常，则根据持续异常的异常参数生成紧急预警消息，并将所述紧急预警消息发送至管理端。

步骤S34，若所述若干个时间单位对应的待监控参数不是持续异常，则根据存在的异常参数在预设策略库中查找对应的目标修复策略，并根据所述目标修复策略进行异常处理。

本实施例中，为了避免***产生暂时性异常问题，可在监测到异常参数后，进一步对该时间单位后的预设个时间单位对应的待监控参数进行监控。其中，暂时性异常问题为***可自行调整的异常问题，或者可根据预设策略库即可解决的异常问题。具体地，在检测到当前待监控参数存在异常参数时，可针对所述异常参数对应的核心指标数据进行持续性监测。获取所述当前时间单位之后预设个时间单位对应的待监控参数，其中，预设个可以是一个、三个或者五个等，可以是对***核心指标对应的参数进行持续监控，也可以是针对异常参数对应的待监控指标进行持续监控。其中，判断若干个时间单位对应的待监控参数是否持续异常的判断过程是将若干个时间单位中的标准参数和待监控参数按照相同的时间单位一一对应判断的。如将当前时间单位12:00-12:05的待监控参数与模型中12:00-12:05时间单位对应的标准参数进行比对，将下个时间单位的12:05-12:10对应的待监控参数与模型中12:05-12:10时间单位对应的标准参数进行比对，以此类推。即在检测到当前时间单位的某个待监控指标发生异常时，可对该待监控指标进行持续监控，判断是否持续异常。或者对整个***的核心监控数据，即待监控参数，进行持续监控，并获取所述预设监控模型中所述若干个时间单位对应的标准参数，根据所述若干个时间单位对应的标准参数，判断所述待监控参数是否持续存在异常参数情况。若持续异常，则生成紧急预警，以便管理员及时进行异常处理，避免发生***故障。若未发生持续异常，即***当前的异常为暂时性异常，***可自行调整，可根据该异常参数进行目标修复策略查找，从而自动进行异常处理。

此外，本申请实施例还提供一种***故障的预警装置。

参照图5，图5为本申请***故障的预警装置第一实施例的功能模块示意图。

本实施例中，所述***故障的预警装置包括：

参数获取模块10，用于根据预设的时间单位，获取目标***在当前时间单位的当前待监控参数；

参数监控模块20，用于获取预设监控模型中的标准参数，并根据所述标准参数判断所述当前待监控参数是否存在异常参数；

异常预警模块30，用于若判定所述当前待监控参数存在所述异常参数，则根据所述当前待监控参数中的异常参数以及所述标准参数生成预警消息，并上报所述预警消息。

进一步地，所述***故障的预警装置还包括：

参数统计模块，用于获取所述目标***的历史***数据，根据预设的时间单位，统计所述历史***数据中各个时间单位的待监控参数，其中，所述待监控参数包括内存参数、应用参数和业务参数；

模型建立模块，用于将所述待监控参数中的异常监控参数和正常监控参数进行分类存储，并根据异常监控参数和正常监控参数训练生成所述预设监控模型。

进一步地，所述***故障的预警装置还包括：

异常修复模块，用于根据所述异常参数，在预设策略库中查找对应的目标修复策略，并根据所述目标修复策略进行异常处理；

结果反馈模块，用于获取异常处理结果，并将所述异常处理结果反馈至管理端。

进一步地，所述参数监控模块20包括：

参数第一获取单元，用于根据所述预设监控模型，获取所述目标***在所述当前时间单位对应的预设标准参数，作为标准参数；

参数第一判断单元，用于判断所述当前待监控参数中是否存在与所述标准参数不匹配的异常参数。

参数第二获取单元，用于根据所述预设监控模型，获取所述目标***在其他时间单位对应的其他待监控标准参数，作为标准参数；

参数第二判断单元，用于判断所述当前待监控参数中是否存在与所述标准参数不匹配的异常参数。

进一步地，所述异常预警模块30还包括：

参数第三获取单元，用于若判定所述当前待监控参数存在所述异常参数，则获取所述当前时间单位之后若干个时间单位对应的待监控参数；

参数第三判断单元，用于根据所述预设监控模型中所述若干个时间单位对应的标准参数，判断所述若干个时间单位对应的待监控参数是否持续异常；

紧急预警单元，用于若所述若干个时间单位对应的待监控参数持续异常，则根据持续异常的异常参数生成紧急预警消息，并将所述紧急预警消息发送至管理端。

异常修复单元，用于若所述若干个时间单位对应的待监控参数不是持续异常，则根据存在的异常参数在预设策略库中查找对应的目标修复策略，并根据所述目标修复策略进行异常处理。

其中，上述***故障的预警装置中各个模块与上述***故障的预警方法实施例中各步骤相对应，其功能和实现过程在此处不再一一赘述。

此外，本申请实施例还提供一种计算机可读存储介质。

本申请计算机可读存储介质上存储有***故障的预警程序，其中所述***故障的预警程序被处理器执行时，实现如上述的***故障的预警方法的步骤。

其中，***故障的预警程序被执行时所实现的方法可参照本申请***故障的预警方法的各个实施例，此处不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种***故障的预警方法，其特征在于，所述***故障的预警方法包括以下步骤：

根据预设的时间单位，获取目标***在当前时间单位的当前待监控参数；

获取预设监控模型中的标准参数，并根据所述标准参数判断所述当前待监控参数是否存在异常参数；

若判定所述当前待监控参数存在所述异常参数，则根据所述当前待监控参数中的异常参数以及所述标准参数生成预警消息，并上报所述预警消息。
如权利要求1所述的***故障的预警方法，其特征在于，所述获取预设监控模型中的标准参数，并根据所述标准参数判断所述当前待监控参数是否存在异常参数的步骤包括：

根据所述预设监控模型，获取所述目标***在所述当前时间单位对应的当前待监控标准参数，作为标准参数；

判断所述当前待监控参数中是否存在与所述标准参数不匹配的异常参数。
如权利要求1所述的***故障的预警方法，其特征在于，所述获取预设监控模型中的标准参数，并根据所述标准参数判断所述当前待监控参数是否存在异常参数的步骤包括：

根据所述预设监控模型，获取所述目标***在其他时间单位对应的其他待监控标准参数，作为标准参数；

判断所述当前待监控参数中是否存在与所述标准参数不匹配的异常参数。
如权利要求1所述的***故障的预警方法，其特征在于，所述根据预设的时间单位，获取目标***在当前时间单位的当前待监控参数的步骤之前，还包括：

获取所述目标***的历史***数据，根据预设的时间单位，统计所述历史***数据中各个时间单位的待监控参数，其中，所述待监控参数包括内存参数、应用参数和业务参数；

将所述待监控参数中的异常监控参数和正常监控参数进行分类存储，并根据异常监控参数和正常监控参数训练生成所述预设监控模型。
如权利要求1所述的***故障的预警方法，其特征在于，所述若判定所述当前待监控参数存在所述异常参数，则根据所述当前待监控参数中的异常参数以及所述标准参数生成预警消息，并上报所述预警消息的步骤之后，还包括：

根据所述异常参数，在预设策略库中查找对应的目标修复策略，并根据所述目标修复策略进行异常处理；

获取异常处理结果，并将所述异常处理结果反馈至管理端。
如权利要求1所述的***故障的预警方法，其特征在于，所述若判定所述当前待监控参数存在所述异常参数，则根据所述当前待监控参数中的异常参数以及所述标准参数生成预警消息，并上报所述预警消息的步骤之后，还包括：

获取所述当前时间单位之后若干个时间单位对应的待监控参数；

根据所述预设监控模型中所述若干个时间单位对应的标准参数，判断所述若干个时间单位对应的待监控参数是否持续异常；

若所述若干个时间单位对应的待监控参数持续异常，则根据持续异常的异常参数生成紧急预警消息，并将所述紧急预警消息发送至管理端。
如权利要求6所述的***故障的预警方法，其特征在于，所述根据所述预设监控模型中所述若干个时间单位对应的标准参数，判断所述若干个时间单位对应的待监控参数是否持续异常的步骤之后，还包括：

若所述若干个时间单位对应的待监控参数不是持续异常，则根据存在的异常参数在预设策略库中查找对应的目标修复策略，并根据所述目标修复策略进行异常处理。
一种***故障的预警装置，其特征在于，所述***故障的预警装置包括：

参数获取模块，用于根据预设的时间单位，获取目标***在当前时间单位的当前待监控参数；

参数监控模块，用于获取预设监控模型中的标准参数，并根据所述标准参数判断所述当前待监控参数是否存在异常参数；

异常预警模块，用于若判定所述当前待监控参数存在所述异常参数，则根据所述当前待监控参数中的异常参数以及所述标准参数生成预警消息，并上报所述预警消息。
如权利要求8所述的***故障的预警装置，其特征在于，所述***故障的预警装置包括：

根据所述预设监控模型，获取所述目标***在所述当前时间单位对应的当前待监控标准参数，作为标准参数；

判断所述当前待监控参数中是否存在与所述标准参数不匹配的异常参数。
如权利要求8所述的***故障的预警装置，其特征在于，所述参数监控模块包括：

参数第一获取单元，用于根据所述预设监控模型，获取所述目标***在其他时间单位对应的其他待监控标准参数，作为标准参数；

参数第一判断单元，用于判断所述当前待监控参数中是否存在与所述标准参数不匹配的异常参数。
如权利要求8所述的***故障的预警装置，其特征在于，所述***故障的预警装置包括：

参数统计模块，用于获取所述目标***的历史***数据，根据预设的时间单位，统计所述历史***数据中各个时间单位的待监控参数，其中，所述待监控参数包括内存参数、应用参数和业务参数；

模型建立模块，用于将所述待监控参数中的异常监控参数和正常监控参数进行分类存储，并根据异常监控参数和正常监控参数训练生成所述预设监控模型。
如权利要求8所述的***故障的预警装置，其特征在于，所述***故障的预警装置包括：

异常修复模块，用于根据所述异常参数，在预设策略库中查找对应的目标修复策略，并根据所述目标修复策略进行异常处理；

结果反馈模块，用于获取异常处理结果，并将所述异常处理结果反馈至管理端。
一种***故障的预警设备，其特征在于，所述***故障的预警设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的***故障的预警程序，其中所述***故障的预警程序被所述处理器执行时，实现如权利要求1所述的***故障的预警方法的步骤。
一种***故障的预警设备，其特征在于，所述***故障的预警设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的***故障的预警程序，其中所述***故障的预警程序被所述处理器执行时，实现如权利要求2所述的***故障的预警方法的步骤。
一种***故障的预警设备，其特征在于，所述***故障的预警设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的***故障的预警程序，其中所述***故障的预警程序被所述处理器执行时，实现如权利要求3所述的***故障的预警方法的步骤。
一种***故障的预警设备，其特征在于，所述***故障的预警设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的***故障的预警程序，其中所述***故障的预警程序被所述处理器执行时，实现如权利要求4所述的***故障的预警方法的步骤。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有***故障的预警程序，其中所述***故障的预警程序被处理器执行时，实现如权利要求1所述的***故障的预警方法的步骤。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有***故障的预警程序，其中所述***故障的预警程序被处理器执行时，实现如权利要求2所述的***故障的预警方法的步骤。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有***故障的预警程序，其中所述***故障的预警程序被处理器执行时，实现如权利要求3所述的***故障的预警方法的步骤。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有***故障的预警程序，其中所述***故障的预警程序被处理器执行时，实现如权利要求4所述的***故障的预警方法的步骤。