CN109144816A - 一种节点健康度检测方法和*** - Google Patents

一种节点健康度检测方法和*** Download PDF

Info

Publication number
CN109144816A
CN109144816A CN201810862680.6A CN201810862680A CN109144816A CN 109144816 A CN109144816 A CN 109144816A CN 201810862680 A CN201810862680 A CN 201810862680A CN 109144816 A CN109144816 A CN 109144816A
Authority
CN
China
Prior art keywords
node
health degree
performance monitoring
cpu
monitoring data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810862680.6A
Other languages
English (en)
Inventor
王传芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201810862680.6A priority Critical patent/CN109144816A/zh
Publication of CN109144816A publication Critical patent/CN109144816A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种节点健康度检测方法和***。涉及云计算领域,解决了如何定义及检测健康度的问题。该方法包括:采集节点的性能监控数据;根据预置的健康标准,分析所述性能监控数据,判定所述节点的健康度。本发明提供的技术方案,适用于虚拟化平台,实现了实时准确的健康度检测。

Description

一种节点健康度检测方法和***
技术领域
本发明涉及云计算技术,尤指一种节点健康度检测方法和***。
背景技术
在云计算时代,虚拟化作为云计算的基石尤为重要,在服务器虚拟化管理***中各节点健康度影响整个***健康状态,如何合理有效的定义及检测各服务器节点的健康度是一个需要面临解决的问题。
发明内容
为了解决上述技术问题,本发明提供了一种节点健康度检测方法和***。解决了如何定义及检测健康度的问题,实现了实时准确的健康度检测。
为了达到本发明目的,本发明提供了一种节点健康度检测方法,包括:
采集节点的性能监控数据;
根据预置的健康标准,分析所述性能监控数据,判定所述节点的健康度。
优选的,采集节点的性能监控数据的步骤包括:
采集所述节点的CPU、内存、存储的性能指标。
优选的,采集节点的性能监控数据的步骤之前,包括:
设置节点CPU多个不同告警级别的CPU告警阈值;
设置节点内存多个不同告警级别的内存告警阈值;
设置节点存储多个不同告警级别的存储告警阈值。
优选的,根据预置的健康标准,分析所述性能监控数据,判定所述节点的健康度的步骤包括:
分别确定所述节点的CPU、内存、存储的性能监控数据对应的告警级别,以所述CPU、内存、存储的告警级别构成所述节点的健康度数据。
优选的,根据预置的健康标准,分析所述性能监控数据,判定所述节点的健康度的步骤之后包括:
可视化显示输出所述健康度数据。
本发明还提供了一种节点健康度检测***,包括:
性能监控采集装置,用于采集节点的性能监控数据;
健康度分析装置,用于根据预置的健康标准,分析所述性能监控数据,判定所述节点的健康度。
优选的,所述性能监控采集装置,具体用于采集所述节点的CPU、内存、存储的性能指标。
优选的,该***还包括:
阈值配置装置,用于设置节点CPU多个不同告警级别的CPU告警阈值,设置节点内存多个不同告警级别的内存告警阈值,及设置节点存储多个不同告警级别的存储告警阈值。
优选的,所述健康度分析装置,具体用于分别确定所述节点的CPU、内存、存储的性能监控数据对应的告警级别,以所述CPU、内存、存储的告警级别构成所述节点的健康度数据。
优选的,该***还包括:
可视化装置,用于可视化显示输出所述健康度数据。
本发明提供了一种节点健康度检测方法和***,采集节点的监控数据,然后根据预置的健康标准,分析所述性能监控数据,判定所述节点的健康度。解决了如何定义及检测健康度的问题,实现了实时准确的健康度检测。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本发明的一实施例提供的一种健康度检测方法的流程示意图;
图2为本发明的一实施例提供的一种健康度检测***的架构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在云计算时代,虚拟化作为云计算的基石尤为重要,在服务器虚拟化管理***中各节点健康度影响整个***健康状态,如何合理有效的定义及检测各服务器节点的健康度是一个需要面临解决的问题。
为了解决上述问题,本发明的实施例提供了一种节点健康度检测方法和***。可以实时动态抓取节点性能监控,根据用户自定义阈值,合理有效检测节点健康度,从而及时反映整个***运行健康状态,管理员更***直观的把控***的管理。
本发明的一实施例提供了一种节点健康度检测方法,使用该方法评价节点健康度的流程如图1所示,包括:
步骤101、设置告警阈值。
本步骤中所进行的设置如要涉及如下内容:
设置节点CPU多个不同告警级别的CPU告警阈值;
设置节点内存多个不同告警级别的内存告警阈值;
设置节点存储多个不同告警级别的存储告警阈值。
节点告警可以划分为几个不同的级别,***管理用户通过阈值配置装置配置节点CPU、内存、存储触发不同级别告警时的使用率阈值。
步骤102、采集节点的性能监控数据。
本步骤中,采集所述节点的CPU、内存、存储的性能指标,包括已用资源、总资源及使用率。可周期性采集,也可依用户操作指令采集。
步骤103、根据预置的健康标准,分析所述性能监控数据,判定所述节点的健康度。
本步骤中,分别确定所述节点的CPU、内存、存储的性能监控数据对应的告警级别,以所述CPU、内存、存储的告警级别构成所述节点的健康度数据。在采集到性能监控数据之后触发健康度计算过程,以性能监控数据和各项告警阈值作为输入,输出节点的健康度指标等健康度数据。
步骤104、可视化显示输出所述健康度数据。
本步骤中,将检测到的各个节点的健康度以可视化热力图形式展示,对健康度划分等级,不同等级用不同颜色展示,用户可以对***节点健康度总览。
本发明的一实施例还提供了一种节点健康度检测***,其结构如图2所示,包括:
性能监控采集装置201,用于采集节点的性能监控数据;
健康度分析装置202,用于根据预置的健康标准,分析所述性能监控数据,判定所述节点的健康度。
优选的,所述性能监控采集装置202,具体用于采集所述节点的CPU、内存、存储的性能指标。
优选的,该***还包括:
阈值配置装置203,用于设置节点CPU多个不同告警级别的CPU告警阈值,设置节点内存多个不同告警级别的内存告警阈值,及设置节点存储多个不同告警级别的存储告警阈值。
优选的,所述健康度分析装置202,具体用于分别确定所述节点的CPU、内存、存储的性能监控数据对应的告警级别,以所述CPU、内存、存储的告警级别构成所述节点的健康度数据。
优选的,该***还包括:
可视化装置204,用于可视化显示输出所述健康度数据。
本发明实施例中,性能监控采集装置定时采集节点的CPU、内存、存储的性能指标;阈值配置装置,配置节点CPU、内存、存储触发不同级别告警的阈值;健康度分析装置,通过采集的节点性能监控数据及阈值配置装置的阈值计算节点的健康度;可视化装置,可以把当前虚拟化管理***中的所有节点的健康度以图形化形式展示,供用户对***健康状态进行判断及后续处理。
本发明的实施例提供了一种节点健康度检测方法和***,采集节点的监控数据,然后根据预置的健康标准,分析所述性能监控数据,判定所述节点的健康度。解决了如何定义及检测健康度的问题,实现了实时准确的健康度检测。主要应用于服务器虚拟化管理***的节点管理,通过本发明的实施例提供的节点健康度检测方法和***,可以根据节点的性能监控数据和阈值检测节点的健康度,并以图形化形式展示当前***所有节点的健康度,实时动态检测节点的健康度,并以图形化形式展示所有节点健康状态供用户总览。能够根据用户定义的告警阈值和采集各个节点的性能数据,实时动态检测节点的健康度。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、***、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

Claims (10)

1.一种节点健康度检测方法,其特征在于,包括:
采集节点的性能监控数据;
根据预置的健康标准,分析所述性能监控数据,判定所述节点的健康度。
2.根据权利要求1所述的节点健康度检测方法,其特征在于,采集节点的性能监控数据的步骤包括:
采集所述节点的CPU、内存、存储的性能指标。
3.根据权利要求1所述的节点健康度检测方法,其特征在于,采集节点的性能监控数据的步骤之前,包括:
设置节点CPU多个不同告警级别的CPU告警阈值;
设置节点内存多个不同告警级别的内存告警阈值;
设置节点存储多个不同告警级别的存储告警阈值。
4.根据权利要求3所述的节点健康度检测方法,其特征在于,根据预置的健康标准,分析所述性能监控数据,判定所述节点的健康度的步骤包括:
分别确定所述节点的CPU、内存、存储的性能监控数据对应的告警级别,以所述CPU、内存、存储的告警级别构成所述节点的健康度数据。
5.根据权利要求4所述的节点健康度检测方法,其特征在于,根据预置的健康标准,分析所述性能监控数据,判定所述节点的健康度的步骤之后包括:
可视化显示输出所述健康度数据。
6.一种节点健康度检测***,其特征在于,包括:
性能监控采集装置,用于采集节点的性能监控数据;
健康度分析装置,用于根据预置的健康标准,分析所述性能监控数据,判定所述节点的健康度。
7.根据权利要求6所述的节点健康度检测***,其特征在于,
所述性能监控采集装置,具体用于采集所述节点的CPU、内存、存储的性能指标。
8.根据权利要求6所述的节点健康度检测***,其特征在于,该***还包括:
阈值配置装置,用于设置节点CPU多个不同告警级别的CPU告警阈值,设置节点内存多个不同告警级别的内存告警阈值,及设置节点存储多个不同告警级别的存储告警阈值。
9.根据权利要求8所述的节点健康度检测***,其特征在于,
所述健康度分析装置,具体用于分别确定所述节点的CPU、内存、存储的性能监控数据对应的告警级别,以所述CPU、内存、存储的告警级别构成所述节点的健康度数据。
10.根据权利要求9所述的节点健康度检测***,其特征在于,该***还包括:
可视化装置,用于可视化显示输出所述健康度数据。
CN201810862680.6A 2018-08-01 2018-08-01 一种节点健康度检测方法和*** Pending CN109144816A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810862680.6A CN109144816A (zh) 2018-08-01 2018-08-01 一种节点健康度检测方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810862680.6A CN109144816A (zh) 2018-08-01 2018-08-01 一种节点健康度检测方法和***

Publications (1)

Publication Number Publication Date
CN109144816A true CN109144816A (zh) 2019-01-04

Family

ID=64798530

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810862680.6A Pending CN109144816A (zh) 2018-08-01 2018-08-01 一种节点健康度检测方法和***

Country Status (1)

Country Link
CN (1) CN109144816A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111107158A (zh) * 2019-12-26 2020-05-05 远景智能国际私人投资有限公司 用于物联网设备集群中的告警方法、装置、设备及介质
CN111404595A (zh) * 2020-03-20 2020-07-10 西安电子科技大学 一种天基网络通信卫星健康度评估方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103164279A (zh) * 2011-12-13 2013-06-19 中国电信股份有限公司 云计算资源分配方法和***
CN106776214A (zh) * 2016-12-12 2017-05-31 广州市申迪计算机***有限公司 一种服务器健康度评估方法
CN107181616A (zh) * 2017-05-19 2017-09-19 郑州云海信息技术有限公司 一种监控存储***性能数据的方法及***
CN107943677A (zh) * 2017-10-13 2018-04-20 东软集团股份有限公司 应用性能监控方法、装置、可读存储介质及电子设备
CN108038036A (zh) * 2017-10-23 2018-05-15 山东中创软件商用中间件股份有限公司 应用***性能监控方法、装置、设备及计算机存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103164279A (zh) * 2011-12-13 2013-06-19 中国电信股份有限公司 云计算资源分配方法和***
CN106776214A (zh) * 2016-12-12 2017-05-31 广州市申迪计算机***有限公司 一种服务器健康度评估方法
CN107181616A (zh) * 2017-05-19 2017-09-19 郑州云海信息技术有限公司 一种监控存储***性能数据的方法及***
CN107943677A (zh) * 2017-10-13 2018-04-20 东软集团股份有限公司 应用性能监控方法、装置、可读存储介质及电子设备
CN108038036A (zh) * 2017-10-23 2018-05-15 山东中创软件商用中间件股份有限公司 应用***性能监控方法、装置、设备及计算机存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111107158A (zh) * 2019-12-26 2020-05-05 远景智能国际私人投资有限公司 用于物联网设备集群中的告警方法、装置、设备及介质
CN111107158B (zh) * 2019-12-26 2023-02-17 远景智能国际私人投资有限公司 用于物联网设备集群中的告警方法、装置、设备及介质
CN111404595A (zh) * 2020-03-20 2020-07-10 西安电子科技大学 一种天基网络通信卫星健康度评估方法
CN111404595B (zh) * 2020-03-20 2021-04-06 西安电子科技大学 一种天基网络通信卫星健康度评估方法

Similar Documents

Publication Publication Date Title
CN105787248B (zh) 基于时间序列数据的分析的异常感测和预测***及方法
US9424288B2 (en) Analyzing database cluster behavior by transforming discrete time series measurements
CN105554007B (zh) 一种web异常检测方法和装置
CN106104496B (zh) 用于任意时序的不受监督的异常检测
CN110601900B (zh) 一种网络故障预警方法及装置
US20140282597A1 (en) Bottleneck Detector for Executing Applications
CN112882796B (zh) 异常根因分析方法和装置,及存储介质
US10938847B2 (en) Automated determination of relative asset importance in an enterprise system
CN105608517B (zh) 基于流的业务交易性能管理及可视化方法和装置
CN111126153B (zh) 基于深度学习的安全监测方法、***、服务器及存储介质
CN111858254B (zh) 数据的处理方法、装置、计算设备和介质
CN109284220B (zh) 集群故障恢复时长估算方法、装置、设备及存储介质
US20160080229A1 (en) Application performance monitoring method and device
CN113949652B (zh) 基于人工智能的用户异常行为检测方法、装置及相关设备
US10705940B2 (en) System operational analytics using normalized likelihood scores
WO2014206131A1 (en) Method and apparatus for report generation
CN109597746B (zh) 故障分析方法及装置
CN111400189A (zh) 代码覆盖率监测方法、装置、电子设备及存储介质
CN108696486B (zh) 一种异常操作行为检测处理方法及装置
US10114731B2 (en) Including kernel object information in a user dump
CN109144816A (zh) 一种节点健康度检测方法和***
US20170171041A1 (en) System capacity heatmap
CN106301979B (zh) 检测异常渠道的方法和***
KR102059112B1 (ko) 사물 인터넷 스트림 데이터 품질 측정 지표 및 프로파일링 방법 및 그 시스템
CN109800052B (zh) 应用于分布式容器云平台的异常检测与定位方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190104