CN109062772A - 集群指标告警的实现方法及集群指标告警*** - Google Patents
集群指标告警的实现方法及集群指标告警*** Download PDFInfo
- Publication number
- CN109062772A CN109062772A CN201810776204.2A CN201810776204A CN109062772A CN 109062772 A CN109062772 A CN 109062772A CN 201810776204 A CN201810776204 A CN 201810776204A CN 109062772 A CN109062772 A CN 109062772A
- Authority
- CN
- China
- Prior art keywords
- index
- node
- alarm
- under
- color
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/324—Display of status information
- G06F11/327—Alarm or error message display
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/161—Computing infrastructure, e.g. computer clusters, blade chassis or hardware partitioning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- User Interface Of Digital Computer (AREA)
- Debugging And Monitoring (AREA)
- Alarm Systems (AREA)
Abstract
本发明提供一种集群指标告警的实现方法及集群指标告警***。所述方法包括:加载资源类型信息、各资源类型下所有的节点信息以及各节点的指标信息,并加载告警数据;当检测到用户点击节点的操作时,显示所述节点的节点信息以及所述节点下指标的采集情况;当指标的采集情况表示指标产生告警时,在检测到用户点击该指标之后,展示告警页面,所述告警页面中显示指标产生告警的原因。本发明能够减少数据访问量,缩短查询时间,方便用户操作。
Description
技术领域
本发明涉及服务器技术领域,尤其涉及一种集群指标告警的实现方法及集群指标告警***。
背景技术
在大规模的服务器集群***中,运维工作显得尤为重要。而对运维来说,监控应该是其重中之重。一个精确完善的监控要保证能在第一时间发现问题并通知相关人员解决。构建一个智能的监控平台***,要以运行监控和指标告警这两个方面为重点,将所有业务***中所涉及的网络资源、硬件资源、软件资源统一展示到集群指标告警中。
随着互联网和大数据的兴起,单一的告警***和热图***需要来回的点击切换,在热图***中查看指标的采集是否正常,去告警***中查看异常指标产生的原因。这样的反复切换,造成了操作上的冗余。
发明内容
本发明提供的集群指标告警的实现方法及集群指标告警***,能够减少数据访问量,缩短查询时间,方便用户操作。
第一方面,本发明提供一种集群指标告警的实现方法,包括:
加载资源类型信息、各资源类型下所有的节点信息以及各节点的指标信息,并加载告警数据;
当检测到用户点击节点的操作时,显示所述节点的节点信息以及所述节点下指标的采集情况;
当指标的采集情况表示指标产生告警时,在检测到用户点击该指标之后,展示告警页面,所述告警页面中显示指标产生告警的原因。
可选地,所述显示所述节点的节点信息以及所述节点下指标的采集情况包括:以分为上下两部分的弹出框的形式显示所述节点的节点信息以及所述节点下指标的采集情况,其中,上部分显示所述节点的节点信息,下部分以表格形式显示,各表格行对应所述节点下各指标的采集情况,产生告警的指标对应的表格行的颜色区别于未产生告警的指标对应的表格行。
可选地,所述方法还包括:每隔预定时间,对节点下所有的指标信息进行查询,当有指标产生告警时,将所述节点的颜色进行刷新,以提示用户。
可选地,所述方法还包括:对各节点下产生告警的指标对应的表格行的颜色以及未产生告警的指标对应的表格行的颜色进行设置,使得不同节点下显示的颜色不同。
可选地,所述方法还包括:根据用户的请求,对节点类型和指标属性进行配置。
第二方面,本发明提供一种集群指标告警***,包括:
加载单元,用于加载资源类型信息、各资源类型下所有的节点信息以及各节点的指标信息,并加载告警数据;
显示单元,用于当检测到用户点击节点的操作时,显示所述节点的节点信息以及所述节点下指标的采集情况;
展示单元,用于当指标的采集情况表示指标产生告警时,在检测到用户点击该指标之后,展示告警页面,所述告警页面中显示指标产生告警的原因。
可选地,所述显示单元,用于以分为上下两部分的弹出框的形式显示所述节点的节点信息以及所述节点下指标的采集情况,其中,上部分显示所述节点的节点信息,下部分以表格形式显示,各表格行对应所述节点下各指标的采集情况,产生告警的指标对应的表格行的颜色区别于未产生告警的指标对应的表格行。
可选地,所述***还包括:
刷新单元,用于每隔预定时间,对节点下所有的指标信息进行查询,当有指标产生告警时,将所述节点的颜色进行刷新,以提示用户。
可选地,所述***还包括:
设置单元,用于根据用户的请求,对各节点下产生告警的指标对应的表格行的颜色以及未产生告警的指标对应的表格行的颜色进行设置,使得不同节点下显示的颜色不同。
可选地,所述***还包括:
配置单元,用于根据用户的请求,对节点类型和指标属性进行配置。
本发明实施例提供的集群指标告警的实现方法及集群指标告警***,做到了一次加载便将数据集中展示,既可以查看集群中节点的指标的采集情况,又可以显示该采集的指标是否产生告警。***操作人员还可以通过切换相应的资源和指标的方式查看自己所需要的信息。通过配置操作,***操作人员可以自由的选择要显示的数据信息,支持对指标信息的多选操作,这样集群指标***中显示的数据就是***操作人员所需要的,从而减轻数据访问量,也方便了用户的操作,增强了软件运行的效率。
附图说明
图1为本发明一实施例集群指标告警的实现方法的流程图;
图2为本发明一实施例集群指标告警***的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种集群指标告警的实现方法,如图1所示,所述方法包括:
S11、加载资源类型信息、各资源类型下所有的节点信息以及各节点的指标信息,并加载告警数据。
S12、当检测到用户点击节点的操作时,显示所述节点的节点信息以及所述节点下指标的采集情况。
具体地,可以以分为上下两部分的弹出框的形式显示所述节点的节点信息以及所述节点下指标的采集情况,其中,上部分显示所述节点的节点信息,下部分以表格形式显示,各表格行对应所述节点下各指标的采集情况,产生告警的指标对应的表格行的颜色区别于未产生告警的指标对应的表格行。
S13、当指标的采集情况表示指标产生告警时,在检测到用户点击该指标之后,展示告警页面,所述告警页面中显示指标产生告警的原因。
进一步地,还可以每隔预定时间,对节点下所有的指标信息进行查询,当有指标产生告警时,将所述节点的颜色进行刷新,以提示用户。
进一步地,还可以对各节点下产生告警的指标对应的表格行的颜色以及未产生告警的指标对应的表格行的颜色进行设置,使得不同节点下显示的颜色不同。
进一步地,还可以根据用户的请求,对节点类型和指标属性进行配置。
下面对本发明集群指标告警的实现方法进行详细说明。
本发明实施例采用XML方式进行数据存储,使用dom4j和XPath进行数据解析。使用json作为数据格式的返回。
首先,先加载页面的主体信息,加载对低频数据的展示。
框架中资源类型、节点信息、指标为低频数据。页面提供便签操作,每一个便签代表一个资源类型信息,其中,资源包括服务器、刀片机箱、交换机箱等。点击每一个便签页面,框架主体内加载的是该类型下所有的节点信息。若该节点下有异常的指标信息,就会以红色突出显示,红色代表告警,提示用户该节点下有指标出现异常。如果该节点显示的是绿色,就代表该节点下所有的指标信息都采集正常。当鼠标悬浮到某一个节点上时,会提示当前节点的节点名称以及当前节点的指标告警总数。其中框架底部默认隐藏显示节点内的指标信息,点击隐藏图标,可以快速的查看当前节点下有哪些指标,为添加修改指标提供了便利的参考。
其次,是对高频数据的展示,高频数据即对所有已选择(框架底部左右的指标)的指标的告警情况。
告警是衡量一个节点信息正常与否的重要参考信息。如果节点内指标产生了告警,可以快速地通知***维护人员对节点进行处理操作。为了保证告警信息的实时性与可靠性,框架内进行定时刷新的操作。每隔一段时间就定时的对所有的指标信息进行一次查询。此时,用户只需要关心框架内节点的颜色即可。若节点内部发生告警,该节点颜色会迅速变红,用于提示用户。
再次,框架中支持秒级别的修改查询操作。
当用户想要更改框架内节点的显示颜色时,只需要将模板文件的一个样式属性,修改为用户自己满意的颜色之后,只需要在页面上手动刷新一下,结果就会马上生效。如果不满意,可以随时进行更换。同时为了满足用户不同需求,该操作支持多种配置,即每一个页签下的节点可以配置不同的颜色,如服务器页签下,告警和正常可以用红色和绿色显示,刀片机箱下可以用其他颜色来代替。这种实时修改,秒级别生效的方式已经成为当下一种主流的配置方式。
然后,当用户想要查看当前页面下节点的详细信息时,只需要点击该节点即可。
点击节点,会弹出一个分为上下两部分的弹出框。上部分展示对节点的基本信息的介绍。主要包括节点的名称、管理IP、节点的类型、告警的数量和节点的位置信息。其中,位置信息可以对当前节点进行快速定位,如该节点位于哪个机柜下或者位于哪个刀片机箱下,为***运维工程师快速的定位机器提供了便利。弹出框的下半部分是一个表格,展示是指标采集的一些基本信息。表格内显示的是当前节点下的指标的采集情况,是否产生告警。如果该指标产生告警,当前表格行会以红颜色显示,点击该表格行会快速跳转到告警页面,可以查看该指标产生告警的原因。为***运维人员快速定位问题并修复问题提供了依据。
此外,在框架中支持对节点和指标的可配置操作。
点击可配置按钮就可以跳转到可配置页面,可配置页面主体分为两部分,节点类型可配置和指标属性可配置。其中,节点类型可配置针对节点大类的即框架中页签的显示,用户通过自由的勾选操作来确认该节点是否在框架中显示。如果该节点类型没有被选中,那么该节点下将会没有指标,框架主体内部将不会显示任何信息。指标类型可配置,主要是对某一个节点类型下的指标进行控制,其中,每一个节点类型对应一个节点部件,部件下对应指标。用户既可以通过一键勾选部件进行指标的全选操作,也可以单个的勾选指标信息。该指标已经被勾选,就会在下方的表格列中显示出来,为了方便用户查看,表格中的每一个指标都会对应所属的部件信息,这样可以快速的定位到这个指标的所属关系。表格中显示的就是用户想要查看的所有指标信息。这些指标会在加载页面框架的时候进行查询及展示。除此之外,配置页面还支持删除、上下移动的一些个性化的操作,方便用户自由的控制指标信息在框架中的显示。
本发明实施例提供的集群指标告警的实现方法,做到了一次加载便将数据集中展示,既可以查看集群中节点的指标的采集情况,又可以显示该采集的指标是否产生告警。若指标中产生告警,该节点会以红色突出显示出来。***操作人员还可以通过切换相应的资源和指标的方式查看自己所需要的信息。通过配置操作,***操作人员可以自由的选择要显示的数据信息,支持对指标信息的多选操作,这样集群指标***中显示的数据就是***操作人员所需要的,从而减轻数据访问量,也方便了用户的操作,增强了软件运行的效率。
本发明实施例还提供一种集群指标告警***,如图2所示,所述***包括:
加载单元11,用于加载资源类型信息、各资源类型下所有的节点信息以及各节点的指标信息,并加载告警数据;
显示单元12,用于当检测到用户点击节点的操作时,显示所述节点的节点信息以及所述节点下指标的采集情况;
展示单元13,用于当指标的采集情况表示指标产生告警时,在检测到用户点击该指标之后,展示告警页面,所述告警页面中显示指标产生告警的原因。
可选地,所述显示单元12,用于以分为上下两部分的弹出框的形式显示所述节点的节点信息以及所述节点下指标的采集情况,其中,上部分显示所述节点的节点信息,下部分以表格形式显示,各表格行对应所述节点下各指标的采集情况,产生告警的指标对应的表格行的颜色区别于未产生告警的指标对应的表格行。
可选地,所述***还包括:
刷新单元,用于每隔预定时间,对节点下所有的指标信息进行查询,当有指标产生告警时,将所述节点的颜色进行刷新,以提示用户。
可选地,所述***还包括:
设置单元,用于根据用户的请求,对各节点下产生告警的指标对应的表格行的颜色以及未产生告警的指标对应的表格行的颜色进行设置,使得不同节点下显示的颜色不同。
可选地,所述***还包括:
配置单元,用于根据用户的请求,对节点类型和指标属性进行配置。
本发明实施例提供的集群指标告警***,做到了一次加载便将数据集中展示,既可以查看集群中节点的指标的采集情况,又可以显示该采集的指标是否产生告警。***操作人员还可以通过切换相应的资源和指标的方式查看自己所需要的信息。通过配置操作,***操作人员可以自由的选择要显示的数据信息,支持对指标信息的多选操作,这样集群指标***中显示的数据就是***操作人员所需要的,从而减轻数据访问量,也方便了用户的操作,增强了软件运行的效率。
本实施例的***,可以用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (10)
1.一种集群指标告警的实现方法,其特征在于,包括:
加载资源类型信息、各资源类型下所有的节点信息以及各节点的指标信息,并加载告警数据;
当检测到用户点击节点的操作时,显示所述节点的节点信息以及所述节点下指标的采集情况;
当指标的采集情况表示指标产生告警时,在检测到用户点击该指标之后,展示告警页面,所述告警页面中显示指标产生告警的原因。
2.根据权利要求1所述的方法,其特征在于,所述显示所述节点的节点信息以及所述节点下指标的采集情况包括:以分为上下两部分的弹出框的形式显示所述节点的节点信息以及所述节点下指标的采集情况,其中,上部分显示所述节点的节点信息,下部分以表格形式显示,各表格行对应所述节点下各指标的采集情况,产生告警的指标对应的表格行的颜色区别于未产生告警的指标对应的表格行。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:每隔预定时间,对节点下所有的指标信息进行查询,当有指标产生告警时,将所述节点的颜色进行刷新,以提示用户。
4.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:对各节点下产生告警的指标对应的表格行的颜色以及未产生告警的指标对应的表格行的颜色进行设置,使得不同节点下显示的颜色不同。
5.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:根据用户的请求,对节点类型和指标属性进行配置。
6.一种集群指标告警***,其特征在于,包括:
加载单元,用于加载资源类型信息、各资源类型下所有的节点信息以及各节点的指标信息,并加载告警数据;
显示单元,用于当检测到用户点击节点的操作时,显示所述节点的节点信息以及所述节点下指标的采集情况;
展示单元,用于当指标的采集情况表示指标产生告警时,在检测到用户点击该指标之后,展示告警页面,所述告警页面中显示指标产生告警的原因。
7.根据权利要求6所述的***,其特征在于,所述显示单元,用于以分为上下两部分的弹出框的形式显示所述节点的节点信息以及所述节点下指标的采集情况,其中,上部分显示所述节点的节点信息,下部分以表格形式显示,各表格行对应所述节点下各指标的采集情况,产生告警的指标对应的表格行的颜色区别于未产生告警的指标对应的表格行。
8.根据权利要求6或7所述的***,其特征在于,所述***还包括:
刷新单元,用于每隔预定时间,对节点下所有的指标信息进行查询,当有指标产生告警时,将所述节点的颜色进行刷新,以提示用户。
9.根据权利要求6或7所述的***,其特征在于,所述***还包括:
设置单元,用于根据用户的请求,对各节点下产生告警的指标对应的表格行的颜色以及未产生告警的指标对应的表格行的颜色进行设置,使得不同节点下显示的颜色不同。
10.根据权利要求6或7所述的***,其特征在于,所述***还包括:
配置单元,用于根据用户的请求,对节点类型和指标属性进行配置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810776204.2A CN109062772A (zh) | 2018-07-16 | 2018-07-16 | 集群指标告警的实现方法及集群指标告警*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810776204.2A CN109062772A (zh) | 2018-07-16 | 2018-07-16 | 集群指标告警的实现方法及集群指标告警*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109062772A true CN109062772A (zh) | 2018-12-21 |
Family
ID=64816547
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810776204.2A Pending CN109062772A (zh) | 2018-07-16 | 2018-07-16 | 集群指标告警的实现方法及集群指标告警*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109062772A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110955577A (zh) * | 2019-11-24 | 2020-04-03 | 苏州浪潮智能科技有限公司 | 一种页面展示方法、装置、设备及可读存储介质 |
CN111614483A (zh) * | 2020-04-08 | 2020-09-01 | 拉扎斯网络科技(上海)有限公司 | 链路监控方法、装置、存储介质及计算机设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100077250A1 (en) * | 2006-12-04 | 2010-03-25 | Electronics And Telecommunications Research Instit Ute | Virtualization based high availability cluster system and method for managing failure in virtualization based high availability cluster system |
CN102129468A (zh) * | 2011-03-22 | 2011-07-20 | 曙光信息产业股份有限公司 | 一种可定制集群状态展现的架构 |
CN102571413A (zh) * | 2011-12-02 | 2012-07-11 | 曙光信息产业(北京)有限公司 | 一种集群环境下资源管理的方法 |
CN103618644A (zh) * | 2013-11-26 | 2014-03-05 | 曙光信息产业股份有限公司 | 一种基于hadoop集群的分布式监控***及其方法 |
CN108280013A (zh) * | 2018-02-05 | 2018-07-13 | 中国银行股份有限公司 | 一种环境资源监测页面的展示方法及装置 |
-
2018
- 2018-07-16 CN CN201810776204.2A patent/CN109062772A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100077250A1 (en) * | 2006-12-04 | 2010-03-25 | Electronics And Telecommunications Research Instit Ute | Virtualization based high availability cluster system and method for managing failure in virtualization based high availability cluster system |
CN102129468A (zh) * | 2011-03-22 | 2011-07-20 | 曙光信息产业股份有限公司 | 一种可定制集群状态展现的架构 |
CN102571413A (zh) * | 2011-12-02 | 2012-07-11 | 曙光信息产业(北京)有限公司 | 一种集群环境下资源管理的方法 |
CN103618644A (zh) * | 2013-11-26 | 2014-03-05 | 曙光信息产业股份有限公司 | 一种基于hadoop集群的分布式监控***及其方法 |
CN108280013A (zh) * | 2018-02-05 | 2018-07-13 | 中国银行股份有限公司 | 一种环境资源监测页面的展示方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110955577A (zh) * | 2019-11-24 | 2020-04-03 | 苏州浪潮智能科技有限公司 | 一种页面展示方法、装置、设备及可读存储介质 |
CN111614483A (zh) * | 2020-04-08 | 2020-09-01 | 拉扎斯网络科技(上海)有限公司 | 链路监控方法、装置、存储介质及计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11741160B1 (en) | Determining states of key performance indicators derived from machine data | |
JP5747982B2 (ja) | プロセスグラフィックビューの優先ライブサムネイルを表示する方法およびシステム | |
US20170154026A1 (en) | Interaction relationship building and explorer for dashboard | |
US20070079243A1 (en) | Monitoring performance of a computer system | |
CN114791846B (zh) | 一种针对云原生混沌工程实验实现可观测性的方法 | |
JPWO2014064819A1 (ja) | システム構築支援ツール及びシステム | |
CN109002334B (zh) | 一种运维平台及其数据处理方法 | |
US20070135944A1 (en) | Method, apparatus and computer program product for providing status of a process | |
CN109062772A (zh) | 集群指标告警的实现方法及集群指标告警*** | |
WO2012073860A1 (ja) | 医用画像診断装置及び操作情報記録装置 | |
JP2016206914A (ja) | 意思決定支援システム、及び意志決定支援方法 | |
CN114297370A (zh) | 知识图谱的展示方法及其装置、计算机存储介质、电子设备 | |
KR100934270B1 (ko) | 객체 지향적 프로그램을 이용하여 보고서가 작성되도록하는 방법 및 시스템 | |
US10981586B2 (en) | Railway diagnostic systems and methods | |
US11831521B1 (en) | Entity lifecycle management in service monitoring system | |
CN107341197B (zh) | 一种电力***多版本图形差异可视化展示方法 | |
JP2019197405A (ja) | プロジェクト状況管理装置、プロジェクト状況管理プログラム及びプロジェクト状況管理方法 | |
CN102129468A (zh) | 一种可定制集群状态展现的架构 | |
US12021698B1 (en) | Entity retirement in service monitoring system | |
Mandreoli et al. | SUNRISE: exploring PDMS networks with semantic routing indexes | |
JPH0666607A (ja) | プラント運転情報提供方法及び装置 | |
Dong | Design of User Interface for Sewer Management Web Application | |
CN117806610A (zh) | 基于组件特性动态配置编排流程的方法、装置及存储介质 | |
JP2012018588A (ja) | ジョブ制御システム | |
CN111090819A (zh) | 热力图生成方法、装置、终端以及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181221 |
|
RJ01 | Rejection of invention patent application after publication |