CN105678388A - 一种基于基线的运维管理健康分析方法 - Google Patents

一种基于基线的运维管理健康分析方法 Download PDF

Info

Publication number
CN105678388A
CN105678388A CN201610012262.9A CN201610012262A CN105678388A CN 105678388 A CN105678388 A CN 105678388A CN 201610012262 A CN201610012262 A CN 201610012262A CN 105678388 A CN105678388 A CN 105678388A
Authority
CN
China
Prior art keywords
management
data
baseline
management object
analysis method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610012262.9A
Other languages
English (en)
Inventor
王俊
郑剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI BETA SOFTWARE CO Ltd
Original Assignee
SHANGHAI BETA SOFTWARE CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI BETA SOFTWARE CO Ltd filed Critical SHANGHAI BETA SOFTWARE CO Ltd
Priority to CN201610012262.9A priority Critical patent/CN105678388A/zh
Publication of CN105678388A publication Critical patent/CN105678388A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明公开了一种基于基线的运维管理健康分析方法,通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况,并加以保存以形成历史数据;根据所述历史数据通过四分位算法运算得到所述管理对象指标按时间变化的健康运行基准线;以所述基准线为中心,根据历史记录数据点在上下偏离幅度内的百分比来设置合理偏离幅度的大小;若所述管理对象指标数据在合理偏离幅度内进行波动,则判断为正常状态,否则为越界状态;通过统计越界的频繁度来判断运维管理***的健康趋势;运用四分位算法提炼出健康运行基准线,使得基准线更加接近某指标运行的正常值;而偏离幅度的百分比等参数由用户设置,简单易懂,判断标准更加准确,判断更精确。

Description

一种基于基线的运维管理健康分析方法
技术领域
本发明涉及运维管理技术领域,尤其涉及一种基于基线的运维管理健康分析方法。
背景技术
随着信息化建设的深入发展,IT***日益成为核心业务处理的关键基础设施;为了保证网络、服务器、数据库等IT资源的正常运行,需要对其进行维护;当***出现异常时能够及时产生告警并通知到运维人员,运维人员根据告警对异常进行定位,诊断,并完成相应的维护操作。在运维的管理上,有很多的管理对象是不一样的,因而它们需要监视的指标是不同的,监视的密度是不同的,指标正常与否的判断标准是不同的,发现指标偏离后的处置分析、处置操作也是不同的。但又有很多管理对象一般是相同或近似的,目前,针对所有管理对象,通常是通过完全不同的监视指标、监视密度、判断标准、处置分析和处置操作来进行运维管理,因而在碰到相同或近似的时,很多就是在重复进行运维管理,使得运维管理变得复杂化。
而在运维管理过程中,怎么针对指标的状态进行分析及判断是一个关键的问题,关系到运维管理***的管理质量和管理效率,所以,需要一个比较好的分析方法来提高运维管理***的管理质量和管理效率。
发明内容
鉴于目前运维管理技术领域存在的上述不足,本发明提供一种基于基线的运维管理健康分析方法,通过基线的基准线和上下偏离幅度来进行健康分析判断,判断标准更加准确,判断更精确。
为达到上述目的,本发明的实施例采用如下技术方案:
一种基于基线的运维管理健康分析方法,所述基于基线的运维管理健康分析方法包括以下步骤:
通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况,并加以保存以形成历史数据;
根据所述历史数据通过四分位算法运算得到所述管理对象指标按时间变化的数据曲线---健康运行基准线;
以所述基准线为中心,根据历史记录数据点在上下偏离幅度内的百分比来设置合理偏离幅度的大小;
若所述管理对象指标数据在合理偏离幅度内进行波动,则判断为正常状态,否则为越界状态;
通过统计越界的频繁度来判断运维管理***的健康趋势。
依照本发明的一个方面,所述通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况,并加以保存以形成历史数据具体可为:通过监测模板预置的管理规则对每个管理对象和每个监测点进行连续、大量的数据采集,对采集到的实时状况信息加以保存以形成历史数据。
依照本发明的一个方面,所述管理规则根据所述监测模板上的针对管理对象和监测点的监测规则进行制定。
依照本发明的一个方面,所述根据所述历史数据通过四分位算法运算得到所述管理对象指标按时间变化的数据曲线---健康运行基准线中历史数据具体可为:在管理对象正常运转周期内采集和保存的历史数据。
依照本发明的一个方面,所述历史记录数据点在上下偏离幅度内的百分比由用户进行设置。
依照本发明的一个方面,所述基于基线的运维管理健康分析方法包括:通过发现越界实时调用智能处理策略。
依照本发明的一个方面,所述智能处理策略基于所述健康趋势进行分析,以决定是否需要采取措施及采取什么样的措施。
本发明实施的优点:本发明所述的基于基线的运维管理健康分析方法,通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况,并加以保存以形成历史数据;根据所述历史数据通过四分位算法运算得到所述管理对象指标按时间变化的数据曲线---健康运行基准线;所述基准线为中心,根据历史记录数据点在上下偏离幅度内的百分比来设置合理偏离幅度的大小;若所述管理对象指标数据在合理偏离幅度内进行波动,则判断为正常状态,否则为越界状态;通过统计越界的频繁度来判断运维管理***的健康趋势;采集持续一段时间后,运用四分位算法提炼出“与时段维度”关联的每个管理对象的“健康标准”也就是健康运行基准线,使得基准线更加接近某指标运行的正常值;而偏离幅度的百分比等参数由用户设置,简单易懂,能够让用户从宏观上对基线监测的严格程度有个比较准确的把握;判断标准更加准确,判断更精确。不断收集各个监测点运行数据,与该时段健康标准做比对,得出健康状况偏差值,当偏差值越过许可范围时,则触发处理;可得到***运行健康度趋势,发现问题征兆进行提示,防患于未然,提高了运维管理质量和效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所述的一种基于基线的运维管理健康分析方法示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种基于基线的运维管理健康分析方法,所述基于基线的运维管理健康分析方法包括以下步骤:
步骤S1:通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况,并加以保存以形成历史数据;
所述步骤S1通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况,并加以保存以形成历史数据的具体实施方式可为:通过监测模板预置的管理规则对每个管理对象和每个监测点进行连续、大量的数据采集。例如,若监测模板预置的管理规则为“采集CPU的使用率”,则通过监测模板对CPU的使用率进行连续、周期、大量的采集。将采集到的对应管理对象指标的实时状况数据进行保存,以时间为轴形成大量的历史数据,这是未来我们进行***分析的“数据”基础。
在实际应用中,所述管理规则根据所述监测模板上的针对管理对象和监测点的监测规则进行制定。
步骤S2:根据所述历史数据通过四分位算法运算得到所述管理对象指标按时间变化的数据曲线---健康运行基准线;
在实际应用中,所述步骤S2根据所述历史数据通过四分位算法运算得到所述管理对象指标按时间变化的数据曲线---健康运行基准线的具体实施方式可为:基于这些历史数据,取***正常运转的工作周期,比如某几日或某几周,将该时间段内的监测模板采集到的所有实时状况信息保存形成的历史数据提取出来,用数学方法四分位算法处理后得到一条某管理对象关键指标按时间变化的数据曲线---健康运行基准线。例如,根据某个时间段内正常运行的CPU的使用率得到了一条随时间变化的数据曲线。通过四分位算法使得基准线更加接近某指标运行的正常值。
在实际应用中,所述基准线可包括日基线和周基线。
日基线:从该指标的历史记录中选择最近某几日正常运行的数据进行综合判断;
周基线:从该指标的历史记录中选择最近某几周正常运行的数据进行综合判断。
在实际应用中,所述健康运行基准线是一根曲线,其横坐标是时间轴,纵坐标是指标的值。
例如,日基线类型,基准线的横坐标的范围是一天,从0点到24点。
例如,周基线类型,基准线的横坐标的范围是一周,从周一的0点到周日的24点。
在实际应用中,以某台服务器“CPU使用率”指标的“日基线”为例,其形成过程可如下:
1、取一段正常运行的周期,如:2015年9月6日到9月9日,共四天。将这段周期内所有该指标的历史记录点映射到一个二维坐标中,横坐标是时间,纵坐标是指标的历史记录值。
2、将二位坐标中所有历史记录点合并到“一天”中显示,如原某个历史记录点(时间:2015年9月7日9点30分30秒指标的值:65%),合并后时间去除年月日信息,保留时分秒,形成新的二维坐标。
3、将“一天”按某个“间隔”等分成N个点,间隔可以是5分钟、10分钟、1小时等等,若以1小时为例,那么一天可以平均分成24个时刻。计算出每个时刻指标的平均值:将每个时刻前后各1/2“间隔”的时间范围内的历史记录点,采用四分位算法计算出该范围内的平均值。
4、将上述步骤中每个时刻前后半个间隔内按照数据点的值连接成直线,这条线就是基线的基准线。
步骤S3:以所述基准线为中心,根据历史记录数据点在上下偏离幅度内的百分比来设置合理偏离幅度的大小;
所述步骤S3以所述基准线为中心,根据历史记录数据点在上下偏离幅度内的百分比来设置合理偏离幅度的大小具体实施方式可为:我们认为在IT环境稳定、业务使用稳定的前提下,未来正常的业务开展过程中,某具体对象的重要管理指标实时值的波动应在是围绕基准线的一个合理的波动范围内,以基准线为中心,上下合理的波动范围我们称为上下偏离幅度,具体是根据历史记录数据点在上下偏离幅度内的百分比来进行合理偏离幅度大小的设置。
在实际应用中,所述历史记录数据点在上下偏离幅度内的百分比由用户进行设置。而偏离幅度的百分比等参数由用户设置,简单易懂,能够让用户从宏观上对基线监测的严格程度有个比较准确的把握;判断标准更加准确,判断更精确。
在实际应用中,所述上下偏离幅度加基准线后形成上下偏离门限,其设置方法可如下:
首先偏离门限的分三种类型,用户可以任意指定其中一种:上下偏离门限、上偏离门限、下偏离门限。
如果指标仅需要通过基线判断不超过某个值,如“内存使用率”指标,用户只关心有没有超过某阈值,那么这种阈值就是上偏离门限,应先计算出上偏离幅度,上偏离门限=基准线+上偏离幅度。
如果指标仅需要通过基线判断不低于某个值,如“连接数”指标,用户只关心有没有低于某阈值,那么这种阈值就是下偏离门限,应先计算出下偏离幅度,下偏离门限=基准线-下偏离幅度。
如果指标及需要判断在某个区间内,如“温度”指标,用户关心是否在某个温度区间内,那么这种阈值就是上下偏离门限,应先计算出上下偏离幅度,上偏离门限=基准线+上偏离幅度,下偏离门限=基准线-下偏离幅度。
步骤S4:若所述管理对象指标数据在合理偏离幅度内进行波动,则判断为正常状态,否则为越界状态;
所述步骤S4若所述管理对象指标数据在合理偏离幅度内进行波动,则判断为正常状态,否则为越界状态的具体实施方式可为:上下偏离幅度间的数据波动是正常的,称为健康,而超出偏离幅度的波动,我们称为越界。
例如,用户关心服务器“CPU使用率”指标是否在某个区间内,那么我们需要计算出上偏离幅度和下偏离幅度,可通过如下步骤进行:
1、用户选择偏离门限的类型:上下偏离门限、上偏离门限、下偏离门限。
2、用户设置偏离门限的参数:偏离门限在恰好保证这些指标越界次数不超过采集总数的P1%的前提下再增加放宽一定余量,余量为偏离幅度的P2%。
其中用户应设置P1,P2的值。
3、***根据用户设置的参数,计算出上偏离幅度、下偏离幅度,确保使用这个偏离幅度后,和历史记录的数据点比较后的越界次数满足用户的设置,其中历史记录的数据点的范围同计算基准线选择的范围一致。
4、基准线、上偏离门限、下偏离门限已经确定,后续采集的指标值使用上偏离门限或下偏离门限进行越界判断。
例如2015年11月18日19点30分30秒,服务器“CPU使用率”采集到的值为80%,那么根据“日基线”进行判断时,首先确定在19点30分30秒时,基线对应的上偏离门限值、下偏离门限值,假设其分别为23%、11%,很显然80%不在偏离区间内,那么认定指标值越界。
步骤S5:通过统计越界的频繁度来判断运维管理***的健康趋势。
所述步骤S5通过统计越界的频繁度来判断运维管理***的健康趋势的具体实施方式可为:越界约频繁,预示着业务运行的隐患越大,越不健康,则可以通过统计越界的频繁度来判断运维管理***的健康趋势。
本发明实施的优点:本发明所述的基于基线的运维管理健康分析方法,通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况,并加以保存以形成历史数据;根据所述历史数据通过四分位算法运算得到所述管理对象指标按时间变化的数据曲线---健康运行基准线;所述基准线为中心,根据历史记录数据点在上下偏离幅度内的百分比来设置合理偏离幅度的大小;若所述管理对象指标数据在合理偏离幅度内进行波动,则判断为正常状态,否则为越界状态;通过统计越界的频繁度来判断运维管理***的健康趋势;采集持续一段时间后,运用四分位算法提炼出“与时段维度”关联的每个管理对象的“健康标准”也就是健康运行基准线,使得基准线更加接近某指标运行的正常值;而偏离幅度的百分比等参数由用户设置,简单易懂,能够让用户从宏观上对基线监测的严格程度有个比较准确的把握;判断标准更加准确,判断更精确。不断收集各个监测点运行数据,与该时段健康标准做比对,得出健康状况偏差值,当偏差值越过许可范围时,则触发处理;可得到***运行健康度趋势,发现问题征兆进行提示,防患于未然,提高了运维管理质量和效率。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本领域技术的技术人员在本发明公开的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (7)

1.一种基于基线的运维管理健康分析方法,其特征在于,所述基于基线的运维管理健康分析方法包括以下步骤:
通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况,并加以保存以形成历史数据;
根据所述历史数据通过四分位算法运算得到所述管理对象指标按时间变化的数据曲线---健康运行基准线;
以所述基准线为中心,根据历史记录数据点在上下偏离幅度内的百分比来设置合理偏离幅度的大小;
若所述管理对象指标数据在合理偏离幅度内进行波动,则判断为正常状态,否则为越界状态;
通过统计越界的频繁度来判断运维管理***的健康趋势。
2.根据权利要求1所述的基于基线的运维管理健康分析方法,其特征在于,所述通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况,并加以保存以形成历史数据具体可为:通过监测模板预置的管理规则对每个管理对象和每个监测点进行连续、大量的数据采集,对采集到的实时状况信息加以保存以形成历史数据。
3.根据权利要求2所述的基于基线的运维管理健康分析方法,其特征在于,所述管理规则根据所述监测模板上的针对管理对象和监测点的监测规则进行制定。
4.根据权利要求1所述的基于基线的运维管理健康分析方法,其特征在于,所述根据所述历史数据通过四分位算法运算得到所述管理对象指标按时间变化的数据曲线---健康运行基准线中历史数据具体可为:在管理对象正常运转周期内采集和保存的历史数据。
5.根据权利要求1至4之一所述的基于基线的运维管理健康分析方法,其特征在于,所述历史记录数据点在上下偏离幅度内的百分比由用户进行设置。
6.根据权利要求5所述的基于基线的运维管理健康分析方法,其特征在于,所述基于基线的运维管理健康分析方法包括:通过发现越界实时调用智能处理策略。
7.根据权利要求6所述的基于基线的运维管理健康分析方法,其特征在于,所述智能处理策略基于所述健康趋势进行分析,以决定是否需要采取措施及采取什么样的措施。
CN201610012262.9A 2016-01-08 2016-01-08 一种基于基线的运维管理健康分析方法 Pending CN105678388A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610012262.9A CN105678388A (zh) 2016-01-08 2016-01-08 一种基于基线的运维管理健康分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610012262.9A CN105678388A (zh) 2016-01-08 2016-01-08 一种基于基线的运维管理健康分析方法

Publications (1)

Publication Number Publication Date
CN105678388A true CN105678388A (zh) 2016-06-15

Family

ID=56299650

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610012262.9A Pending CN105678388A (zh) 2016-01-08 2016-01-08 一种基于基线的运维管理健康分析方法

Country Status (1)

Country Link
CN (1) CN105678388A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106683340A (zh) * 2016-12-15 2017-05-17 歌尔股份有限公司 一种用户行为监测方法和可穿戴设备
CN108718303A (zh) * 2018-05-09 2018-10-30 北京仁和诚信科技有限公司 安全运维管理方法及***
CN114064760A (zh) * 2021-11-18 2022-02-18 广州泰禾大数据服务有限公司 一种数据的多维度预警分析判断方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101964997A (zh) * 2009-07-21 2011-02-02 ***通信集团黑龙江有限公司 网络性能预警方法及装置
CN102270271A (zh) * 2011-05-03 2011-12-07 北京中瑞泰科技有限公司 基于相似度曲线的设备故障早期预警及优化的方法和***
CN104954154A (zh) * 2014-03-24 2015-09-30 北京神州泰岳软件股份有限公司 运维管理平台的监控及故障维护方法和***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101964997A (zh) * 2009-07-21 2011-02-02 ***通信集团黑龙江有限公司 网络性能预警方法及装置
CN102270271A (zh) * 2011-05-03 2011-12-07 北京中瑞泰科技有限公司 基于相似度曲线的设备故障早期预警及优化的方法和***
CN104954154A (zh) * 2014-03-24 2015-09-30 北京神州泰岳软件股份有限公司 运维管理平台的监控及故障维护方法和***

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106683340A (zh) * 2016-12-15 2017-05-17 歌尔股份有限公司 一种用户行为监测方法和可穿戴设备
CN108718303A (zh) * 2018-05-09 2018-10-30 北京仁和诚信科技有限公司 安全运维管理方法及***
CN108718303B (zh) * 2018-05-09 2021-03-23 北京仁和诚信科技有限公司 安全运维管理方法及***
CN114064760A (zh) * 2021-11-18 2022-02-18 广州泰禾大数据服务有限公司 一种数据的多维度预警分析判断方法
CN114064760B (zh) * 2021-11-18 2022-12-13 广州泰禾大数据服务有限公司 一种数据的多维度预警分析判断方法

Similar Documents

Publication Publication Date Title
CN105515820A (zh) 一种用于运维管理的健康分析方法
CN105406991A (zh) 基于网络监控指标由历史数据生成业务阈值的方法及***
CN105159239B (zh) 一种spc策略自动更新方法及spc自动策略***
CN107086944A (zh) 一种异常检测方法和装置
CN104636450B (zh) 一种数据库表空间监控方法
CN111506478A (zh) 基于人工智能实现告警管理控制的方法
CN105956734A (zh) 动态设置it设备的性能的指标阈值的方法及***
CN105721187A (zh) 一种业务故障诊断方法及装置
CN105678388A (zh) 一种基于基线的运维管理健康分析方法
CN111324639A (zh) 数据监测方法、装置及计算机可读存储介质
CN106407082A (zh) 一种信息***告警方法和装置
CN104217004B (zh) 一种交易***的数据库热点的监控方法及装置
CN108572905A (zh) 一种基于分布式计算的监控方法及***
CN110912775A (zh) 物联网企业网络故障的监控方法及装置
CN116389223B (zh) 一种基于大数据的人工智能可视化预警***及方法
CN109063885A (zh) 一种变电站异常量测数据预测方法
CN107276808A (zh) 一种流量异常监测的优化方法
CN104731970B (zh) 高速公路多源异构数据的数据质量评价与控制方法
CN112488502A (zh) 一种标准的水资源管理一体化管控平台
CN112131081A (zh) 一种故障报警参数调整方法、装置、电子设备及存储介质
CN117422938B (zh) 基于三维分析平台的坝坡混凝土结构异常分析方法
CN106709659A (zh) 一种lng加气站设备管理***
WO2024119919A1 (zh) 一种多源配网监测数据的电网运行状态监测方法及***
CN117519006A (zh) 生产线数据处理方法、装置、计算机设备和存储介质
CN112446645A (zh) 一种基于物联网的电力管理服务***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160615