CN109032890A - 一种混合云数据中心大屏监控方法 - Google Patents

一种混合云数据中心大屏监控方法 Download PDF

Info

Publication number
CN109032890A
CN109032890A CN201810809585.XA CN201810809585A CN109032890A CN 109032890 A CN109032890 A CN 109032890A CN 201810809585 A CN201810809585 A CN 201810809585A CN 109032890 A CN109032890 A CN 109032890A
Authority
CN
China
Prior art keywords
host
virtual machine
monitoring
data
load
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201810809585.XA
Other languages
English (en)
Inventor
马桂成
季统凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
G Cloud Technology Co Ltd
Original Assignee
G Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by G Cloud Technology Co Ltd filed Critical G Cloud Technology Co Ltd
Priority to CN201810809585.XA priority Critical patent/CN109032890A/zh
Publication of CN109032890A publication Critical patent/CN109032890A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及混合云监控技术领域,特别是一种混合云数据中心大屏监控方法。本发明的方法是收集监控数据,然后生成负载拓扑图、进行告警统计和告警通知、负载排行前五统计、统计并获取周期性的整个数据中心所有主机的各项平均实时数据、清除过期的时序数据库数据。本发明解决了无法在一个大屏查看全局实时监控情况、大量数据存储和查询问题、无法提供负载拓扑图、无法及时预防***奔溃等问题;可应用于混合云监控技术领域。

Description

一种混合云数据中心大屏监控方法
技术领域
本发明涉及混合云监控技术领域,特别是一种混合云数据中心大屏监控方法。
背景技术
现在一些大型企业或政府单位,为了自身需要,在生产环境部署一到多套私有云平台,每个私有云平台都需要监控***,由于云平台的技术复杂,通常私有云平台的监控***都是非常简陋功能。这样会存在以下隐患:
一是用户无法在一个大屏上查看整个数据中心即整个云平台全局的实时监控情况。
二是随着时间的推移,原来通过传统数据库存放数据占用大量的存储空间,并且当数据量到达千万级以上查询请求就会变得非常缓慢。
三是无法提供负载拓扑图,从而不能及时预防***崩溃。
发明内容
本发明解决的技术问题在于提供一种混合云数据中心大屏监控方法;解决无法在一个大屏查看全局实时监控情况、大量数据存储和查询问题、无法提供负载拓扑图、无法及时预防***奔溃等问题。
本发明解决上述技术问题的技术方案是:
所述的方法是收集监控数据,然后生成负载拓扑图、进行告警统计和告警通知、负载排行前五统计、统计并获取周期性的整个数据中心所有主机的各项平均实时数据、清除过期的时序数据库数据。
由混合云平台监控服务统一收集监控数据;
所述的混合云平台监控服务,是指能够独立运行的监控服务,在每个数据中心都有一个监控服务;所述的监控服务能够提供API接口,不需要依赖混合云平台。
所述的负载拓扑图是一种描述主机负载状态和连接状态的拓扑图;
所述的连接状态,是监控服务检查与各个宿主机的连接状态;当监控服务控制中心发送心跳给各个监控代理的时候,监控代理能够及时返回则认为主机是正常状态并停止检查其连接状态;否则主机处于心跳包不正常状态;当主机处于心跳包不正常状态,检查监控代理TCP监听端口的连接状态,若能正常建立TCP连接则认为主机是心跳不正常且监控端口正常的状态并停止检查其连接状态,否则主机处于监听端口异常状态;当主机处于监听端口异常状态,则Ping主机的IP地址,若能Ping通则认为主机是监控代理异常的状态,否则认为主机是网络异常连接状态;
所述的主机是指宿主机或虚拟机;
所述的描述主机负载状态,是指根据主机最近一次收集的监控数据,判断主机的CPU使用率或内存使用率是否大于等于阈值上限,若是则设定主机状态为高负载;判断主机的CPU使用率或内存使用率是否大于等于阈值下限并且小于阈值上限,若是则设定主机状态为较高负载;判断主机的CPU使用率和内存使用率是否都小于阈值下限,若是则设定主机为负载正常状态;
所述的阈值上限默认是80%,阈值下限默认是60%;用户可以修改其默认值,一旦修改,则立刻生效。
所述的告警统计是指统计最近7日产生告警;统计最近7日内各个告警等级的数量统计、问题宿主机统计、正常宿主机统计、问题虚拟机统计、正常虚拟机统计;
所述的告警等级,是指严重告警、重要告警、一般告警三个等级;
所述的问题宿主机,是指最近7日内有生成过告警的宿主机;
所述的问题虚拟机,是指最近7日内有生成过告警的虚拟机;
告警通知是指判断各个告警策略下各个规则能否满足告警条件,若其中一个规则满足则告警通知联系人。
所述的负载排行前五统计是统计主机负载前五排行;
是指最近一次收集的CPU利用率或内存利用率排在前五名,包含四种排行:宿主机CPU利用率前五排行、宿主机内存利用率前五排行、虚拟机CPU利用率前五排行、虚拟机内存利用率前五排行;
所述的排行,是指采用分组Top函数方法,是一种以单个主机为组对象,可以在所有租户中返回最大值的5个组对象,从而选出了前五排行的主机。
所述的主机的各项平均实时数据,是指最近60分钟,每分钟的所有宿主机总平均CPU利用率或内存利用率,包含:所有宿主机总平均CPU利用率、所有宿主机总平均内存利用率、所有虚拟机总平均CPU利用率、所有虚拟机总平均内存利用率;
所述的宿主机总平均CPU利用率,是指所有宿主机CPU利用率总和再除以宿主机个数;
所述的宿主机总平均内存利用率,是指所有宿主机内存利用率总和再除以宿主机个数;
所述的虚拟机总平均CPU利用率,是指所有虚拟机CPU利用率总和再除以虚拟机个数;
所述的虚拟机总平均内存利用率,是指所有虚拟机内存利用率总和再除以虚拟机个数。
所述的时序数据库,是指处理带时间标签的数据,所有数据记录统一以时间排序存放。
所述的清理是指采用数据保留策略;
所述的数据保留策略,是数据存放的策略,可以设置数据持续保留时间、副本个数以及是否为生效策略;可以同时有多个数据保留策略,有且只有一个策略生效;策略生效的时候,根据持续保留时间,自动清理过期的数据。
本发明通过以负载拓扑图、全局实时数据、告警统计、负载前五排行的大屏监控方式,能够解决了无法在一个大屏查看全局实时监控情况、大量数据存储和查询问题、无法提供负载拓扑图、无法及时预防***奔溃等问题。本发明基于Centos操作***,不需要依赖其他云平台***,可以独立运行,可以为各个平台提供接口服务,区别于一般的方法。本发明提供方法是基于时序数据库,能够有效降低存储空间,区别于一般的方法。本发明提供方法采用数据保留策略来自动清理数据,清理十分及时和高效,区别于一般基于传统数据库清理慢并且大量占用连接请求的方法;本发明提供方法是采用负载拓扑图,不但可以实时显示连接状态还能实时显示主机负载状态,区别于一般的方法。
附图说明
下面结合附图对本发明进一步说明:
图1为本发明流程图。
具体实施方式
本发明的实施方式有多种,这里以云平台为例说明其中一种实现方法,流程图如图1所示,具体实施过程如下:
1、收集监控数据。通过监控代理收集虚拟机的监控数据、通过监控中心收集各个宿主机的连接状态、监控数据。
2、生成负载拓扑图,其流程如下:
1)获取所有物理主机;
2)所有宿主机围绕监控中心呈现星星分布,并根据各个宿主机的连接状态显示连接线条颜色,并在焦点在线上的时候显示连接状态值;
3)各个宿主机的颜色根据负载状态,并在焦点在线上的时候显示负载状态值;
4)当用户双击宿主机的时候,进入虚拟机层;
5)虚拟机围绕宿主机呈现星星分布,并根据各个宿主机的连接状态显示连接线条颜色,并在焦点在线上的时候显示连接状态值。
负载拓扑图是一种描述主机负载状态和连接状态的拓扑图;
连接状态是监控服务检查与各个宿主机的连接状态;当监控服务控制中心发送心跳给各个监控代理的时候,监控代理能够及时返回则认为主机是正常状态并停止检查其连接状态;否则主机处于心跳包不正常状态;当主机处于心跳包不正常状态,检查监控代理TCP监听端口的连接状态,若能正常建立TCP连接则认为主机是心跳不正常且监控端口正常的状态并停止检查其连接状态,否则主机处于监听端口异常状态;当主机处于监听端口异常状态,则Ping主机的IP地址,若能Ping通则认为主机是监控代理异常的状态,否则认为主机是网络异常连接状态;
描述主机负载状态,是指根据主机最近一次收集的监控数据,判断主机的CPU使用率或内存使用率是否大于等于阈值上限,若是则设定主机状态为高负载;判断主机的CPU使用率或内存使用率是否大于等于阈值下限并且小于阈值上限,若是则设定主机状态为较高负载;判断主机的CPU使用率和内存使用率是否都小于阈值下限,若是则设定主机为负载正常状态;
所述的阈值上限默认是80%,阈值下限默认是60%;用户可以修改其默认值,一旦修改,则立刻生效。
3、告警统计和告警通知,其流程如下:
1)获取所有已经生效的告警策略列表;
2)获取告警策略列表下每个策略的告警规则列表;
3)获取每个规则对应的统计方法;
4)进行统计,判断是否满足告警条件;
5)若满足告警条件则触发告警;
6)查询告警对应的联系方式和联系人,根据联系方式通知联系人。
告警统计是指统计最近7日产生告警;统计最近7日内各个告警等级的数量统计、问题宿主机统计、正常宿主机统计、问题虚拟机统计、正常虚拟机统计;
告警等级,是指严重告警、重要告警、一般告警三个等级;
问题宿主机,是指最近7日内有生成过告警的宿主机;
问题虚拟机,是指最近7日内有生成过告警的虚拟机;
告警通知是指判断各个告警策略下各个规则能否满足告警条件,若其中一个规则满足则告警通知联系人。
4、负载排行前五统计,其流程如下:
1)以每个宿主机或虚拟机为组;
2)获取每个组最近60秒的CPU或内存监控数据;
3)对所有组排序,获取最大值的5个组;
4)显示5个组及监控项,监控项包括四种:宿主机CPU利用率、宿主机内存利用率、虚拟机CPU利用率、虚拟机内存利用率。
5、全局实时数据,其流程如下:
1)统计最近60分钟,每分钟的宿主机总平均CPU利用率、宿主机总平均内存利用率、虚拟机总平均CPU利用率、虚拟机总平均内存利用率。
6、清理历史数据,其流程如下:
1)查询最新的数据保留策略,获取正在应用的数据保留策略;
2)根据数据保留策略的持续保留时间,自动清理过期的数据。
整个流程结束。

Claims (10)

1.一种混合云数据中心大屏监控方法,其特征在于:所述的方法是收集监控数据,然后生成负载拓扑图、进行告警统计和告警通知、负载排行前五统计、统计并获取周期性的整个数据中心所有主机的各项平均实时数据、清除过期的时序数据库数据。
2.根据权利要求1所述的方法,其特征在于:由混合云平台监控服务统一收集监控数据;
所述的混合云平台监控服务,是指能够独立运行的监控服务,在每个数据中心都有一个监控服务;所述的监控服务能够提供API接口,不需要依赖混合云平台。
3.根据权利要求1所述的方法,其特征在于:所述的负载拓扑图是一种描述主机负载状态和连接状态的拓扑图;
所述的连接状态,是监控服务检查与各个宿主机的连接状态;当监控服务控制中心发送心跳给各个监控代理的时候,监控代理能够及时返回则认为主机是正常状态并停止检查其连接状态;否则主机处于心跳包不正常状态;当主机处于心跳包不正常状态,检查监控代理TCP监听端口的连接状态,若能正常建立TCP连接则认为主机是心跳不正常且监控端口正常的状态并停止检查其连接状态,否则主机处于监听端口异常状态;当主机处于监听端口异常状态,则Ping主机的IP地址,若能Ping通则认为主机是监控代理异常的状态,否则认为主机是网络异常连接状态;
所述的主机是指宿主机或虚拟机;
所述的描述主机负载状态,是指根据主机最近一次收集的监控数据,判断主机的CPU使用率或内存使用率是否大于等于阈值上限,若是则设定主机状态为高负载;判断主机的CPU使用率或内存使用率是否大于等于阈值下限并且小于阈值上限,若是则设定主机状态为较高负载;判断主机的CPU使用率和内存使用率是否都小于阈值下限,若是则设定主机为负载正常状态;
所述的阈值上限默认是80%,阈值下限默认是60%;用户可以修改其默认值,一旦修改,则立刻生效。
4.根据权利要求1所述的方法,其特征在于:所述的负载拓扑图是一种描述主机负载状态和连接状态的拓扑图;
所述的连接状态,是监控服务检查与各个宿主机的连接状态;当监控服务控制中心发送心跳给各个监控代理的时候,监控代理能够及时返回则认为主机是正常状态并停止检查其连接状态;否则主机处于心跳包不正常状态;当主机处于心跳包不正常状态,检查监控代理TCP监听端口的连接状态,若能正常建立TCP连接则认为主机是心跳不正常且监控端口正常的状态并停止检查其连接状态,否则主机处于监听端口异常状态;当主机处于监听端口异常状态,则Ping主机的IP地址,若能Ping通则认为主机是监控代理异常的状态,否则认为主机是网络异常连接状态;
所述的主机是指宿主机或虚拟机;
所述的描述主机负载状态,是指根据主机最近一次收集的监控数据,判断主机的CPU使用率或内存使用率是否大于等于阈值上限,若是则设定主机状态为高负载;判断主机的CPU使用率或内存使用率是否大于等于阈值下限并且小于阈值上限,若是则设定主机状态为较高负载;判断主机的CPU使用率和内存使用率是否都小于阈值下限,若是则设定主机为负载正常状态;
所述的阈值上限默认是80%,阈值下限默认是60%;用户可以修改其默认值,一旦修改,则立刻生效。
5.根据权利要求1至4任一项所述的方法,其特征在于:所述的告警统计是指统计最近7日产生告警;统计最近7日内各个告警等级的数量统计、问题宿主机统计、正常宿主机统计、问题虚拟机统计、正常虚拟机统计;
所述的告警等级,是指严重告警、重要告警、一般告警三个等级;
所述的问题宿主机,是指最近7日内有生成过告警的宿主机;
所述的问题虚拟机,是指最近7日内有生成过告警的虚拟机;
告警通知是指判断各个告警策略下各个规则能否满足告警条件,若其中一个规则满足则告警通知联系人。
6.根据权利要求1至4任一项所述的方法,其特征在于:所述的负载排行前五统计是统计主机负载前五排行;
是指最近一次收集的CPU利用率或内存利用率排在前五名,包含四种排行:宿主机CPU利用率前五排行、宿主机内存利用率前五排行、虚拟机CPU利用率前五排行、虚拟机内存利用率前五排行;
所述的排行,是指采用分组Top函数方法,是一种以单个主机为组对象,可以在所有租户中返回最大值的5个组对象,从而选出了前五排行的主机。
7.根据权利要求5所述的方法,其特征在于:所述的负载排行前五统计是统计主机负载前五排行;
是指最近一次收集的CPU利用率或内存利用率排在前五名,包含四种排行:宿主机CPU利用率前五排行、宿主机内存利用率前五排行、虚拟机CPU利用率前五排行、虚拟机内存利用率前五排行;
所述的排行,是指采用分组Top函数方法,是一种以单个主机为组对象,可以在所有租户中返回最大值的5个组对象,从而选出了前五排行的主机。
8.根据权利要求1至4任一项所述的方法,其特征在于:
所述的主机的各项平均实时数据,是指最近60分钟,每分钟的所有宿主机总平均CPU利用率或内存利用率,包含:所有宿主机总平均CPU利用率、所有宿主机总平均内存利用率、所有虚拟机总平均CPU利用率、所有虚拟机总平均内存利用率;
所述的宿主机总平均CPU利用率,是指所有宿主机CPU利用率总和再除以宿主机个数;
所述的宿主机总平均内存利用率,是指所有宿主机内存利用率总和再除以宿主机个数;
所述的虚拟机总平均CPU利用率,是指所有虚拟机CPU利用率总和再除以虚拟机个数;
所述的虚拟机总平均内存利用率,是指所有虚拟机内存利用率总和再除以虚拟机个数。
9.根据权利要求7所述的方法,其特征在于:
所述的主机的各项平均实时数据,是指最近60分钟,每分钟的所有宿主机总平均CPU利用率或内存利用率,包含:所有宿主机总平均CPU利用率、所有宿主机总平均内存利用率、所有虚拟机总平均CPU利用率、所有虚拟机总平均内存利用率;
所述的宿主机总平均CPU利用率,是指所有宿主机CPU利用率总和再除以宿主机个数;
所述的宿主机总平均内存利用率,是指所有宿主机内存利用率总和再除以宿主机个数;
所述的虚拟机总平均CPU利用率,是指所有虚拟机CPU利用率总和再除以虚拟机个数;
所述的虚拟机总平均内存利用率,是指所有虚拟机内存利用率总和再除以虚拟机个数。
10.根据权利要求9所述的方法,其特征在于:
所述的时序数据库,是指处理带时间标签的数据,所有数据记录统一以时间排序存放。
所述的清理是指采用数据保留策略;
所述的数据保留策略,是数据存放的策略,可以设置数据持续保留时间、副本个数以及是否为生效策略;可以同时有多个数据保留策略,有且只有一个策略生效;策略生效的时候,根据持续保留时间,自动清理过期的数据。
CN201810809585.XA 2018-07-23 2018-07-23 一种混合云数据中心大屏监控方法 Withdrawn CN109032890A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810809585.XA CN109032890A (zh) 2018-07-23 2018-07-23 一种混合云数据中心大屏监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810809585.XA CN109032890A (zh) 2018-07-23 2018-07-23 一种混合云数据中心大屏监控方法

Publications (1)

Publication Number Publication Date
CN109032890A true CN109032890A (zh) 2018-12-18

Family

ID=64645032

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810809585.XA Withdrawn CN109032890A (zh) 2018-07-23 2018-07-23 一种混合云数据中心大屏监控方法

Country Status (1)

Country Link
CN (1) CN109032890A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102647452A (zh) * 2012-03-20 2012-08-22 广东电子工业研究院有限公司 基于大规模云计算平台的自适应资源监控***及其方法
CN104657250A (zh) * 2014-12-16 2015-05-27 无锡华云数据技术服务有限公司 一种对云主机进行性能监控的监控方法
CN105024880A (zh) * 2015-07-17 2015-11-04 哈尔滨工程大学 一种面向关键任务计算机集群的弹性监控方法
US20170272507A1 (en) * 2016-03-18 2017-09-21 Plume Design, Inc. Claiming network devices for a home network in a distributed wi-fi network
CN107370625A (zh) * 2017-07-24 2017-11-21 北京哈工大计算机网络与信息安全技术研究中心 一种云平台运行状态监控方法及监控平台

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102647452A (zh) * 2012-03-20 2012-08-22 广东电子工业研究院有限公司 基于大规模云计算平台的自适应资源监控***及其方法
CN104657250A (zh) * 2014-12-16 2015-05-27 无锡华云数据技术服务有限公司 一种对云主机进行性能监控的监控方法
CN105024880A (zh) * 2015-07-17 2015-11-04 哈尔滨工程大学 一种面向关键任务计算机集群的弹性监控方法
US20170272507A1 (en) * 2016-03-18 2017-09-21 Plume Design, Inc. Claiming network devices for a home network in a distributed wi-fi network
CN107370625A (zh) * 2017-07-24 2017-11-21 北京哈工大计算机网络与信息安全技术研究中心 一种云平台运行状态监控方法及监控平台

Similar Documents

Publication Publication Date Title
WO2021008031A1 (zh) 基于微服务实现监控智能化的处理方法及电子装置
US7398302B2 (en) Remote copy with path selection and prioritization
JP4304535B2 (ja) 情報処理装置及びこのプログラムと、モジュラー型システムの運用管理システムと、コンポーネント選択方法
CN106656682B (zh) 集群心跳检测方法、***及装置
US20020143999A1 (en) Path selection methods for storage based remote copy
US20120197822A1 (en) System and method for using cluster level quorum to prevent split brain scenario in a data grid cluster
CN104753994A (zh) 基于集群服务器***的数据同步方法及其装置
TWI701916B (zh) 用於在分布式系統中使管理能力自恢復的方法和裝置
US20150019724A1 (en) Adaptive Analysis of Diagnostic Messages
CA3157501A1 (en) Latency-based routing and load balancing in a network
US20150215394A1 (en) Load distribution method taking into account each node in multi-level hierarchy
CN103581276A (zh) 集群管理装置、***、业务客户端及相应方法
CN105812161B (zh) 一种控制器故障备份方法和***
US20230198860A1 (en) Systems and methods for the temporal monitoring and visualization of network health of direct interconnect networks
CN112491700A (zh) 网络路径调整方法、***、装置、电子设备及存储介质
FR3025384A1 (fr) Procede de surveillance et d'alerte de configuration de routage dans un cluster comprenant des liens de communication statiques et programme d'ordinateur mettant en oeuvre ce procede
CN108429656A (zh) 一种监控物理机网卡连接状态的方法
CN109032890A (zh) 一种混合云数据中心大屏监控方法
CN106899659B (zh) 分布式***及其管理方法和管理装置
JP2000250833A (ja) 複数サーバ運用管理における稼働情報取得方法およびそのプログラムを記録した記録媒体
CN105991305B (zh) 一种识别链路异常的方法及装置
US20040015746A1 (en) Fault diagnosis in a network
CN112187919B (zh) 一种存储节点管理方法及相关装置
CN105550094B (zh) 一种高可用***状态自动监控方法
JP2003271557A (ja) 障害情報分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20181218

WW01 Invention patent application withdrawn after publication