CN104683446A - 一种云存储集群节点服务状态实时监控方法和*** - Google Patents

一种云存储集群节点服务状态实时监控方法和*** Download PDF

Info

Publication number
CN104683446A
CN104683446A CN201510047586.1A CN201510047586A CN104683446A CN 104683446 A CN104683446 A CN 104683446A CN 201510047586 A CN201510047586 A CN 201510047586A CN 104683446 A CN104683446 A CN 104683446A
Authority
CN
China
Prior art keywords
service
monitoring processor
cloud storage
status information
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510047586.1A
Other languages
English (en)
Inventor
高俊萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GCI Science and Technology Co Ltd
Original Assignee
GCI Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GCI Science and Technology Co Ltd filed Critical GCI Science and Technology Co Ltd
Priority to CN201510047586.1A priority Critical patent/CN104683446A/zh
Publication of CN104683446A publication Critical patent/CN104683446A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种云存储集群节点服务状态实时监控方法和***,每个集群节点均部署有服务状态采集器;所述方法包括:所述服务状态采集器采集所在集群节点内的服务状态信息,并将所述服务状态信息处理成统一格式后,上报给服务监控处理器;所述服务状态信息包括服务运行状态信息和服务可用性状态信息;所述服务监控处理器收集所有服务状态采集器上报的服务状态信息,对所述服务状态信息进行数据封装,形成监控信息,并通过相应的API接口将所述监控信息对外发布。通过服务状态采集器,同时对服务运行状态和服务可用性进行监控,提高***监控性能,保证云服务的高可用性。并将监控信息通过相应的API接口实时对外发布,增强***的可扩展性。

Description

一种云存储集群节点服务状态实时监控方法和***
技术领域
本发明涉及云存储技术领域,尤其涉及一种云存储集群节点服务状态实时监控方法和***。
背景技术
现有的云存储产品大多采用Ceph技术,Ceph是一个PB级分布式文件***,通过相应接口支持对象存储(Object Storage),块存储(Block Storage)和文件存储(File Storage)三种存储服务。既是统一存储***也是分布式存储***,具有高扩展,高可靠,高性能的特点。由于其开源性,目前Ceph已作为统一存储的解决方案,被广泛应用于私有云、公有云和生产环境中。
在实际应用当中,Ceph存储集群内除了安装Ceph提供的相应存储服务外,常常还会部署安装许多其他服务,如HTTP(Hypertext transfer protocol,超文本传送协议)和数据库服务,所有的服务组成一个完整的云存储产品。因而,集群节点内服务的可用性直接决定了整个云存储产品的可用性,故实现对集群节点内所有相关服务的运行状态及可用性的实时监控是云存储产品必不可少的一项重要功能。
现有的监控方法一般为针对特定服务制定相应的监控策略,通过服务器端轮询查看所有服务运行状态(即服务进程是否运行),然而,现有的监控方法并未对相关服务的可用性进行监控。大量的实践证明,即使服务进程正在运行不一定就能保证该服务可用,以存储服务为例,存储服务的进程还在运行,却可能会出现无法写入数据的情况。同时,在采用单一监视器情况下,单一监视器的损坏将导致整个***监控功能的失效,为了防止上述单点故障的发生,现有的监控方法采用多监视器并行运行的策略,一般预先选出三个以上的监视器,其中一个作为主监视器,其他监视器作为从监视器。当主监视器发生故障时,使用从监视器替代主监视器;然而该方案在正常工作时,从监视器处于闲置状态,造成***资源的浪费。
发明内容
本发明的目的在于提供一种云存储集群节点服务状态实时监控方法和***,在对服务运行状态进行监控的同时,对集群节点的服务可用性进行监控,提高云存储产品的整体监控性能。
一方面,本发明实施例提供了一种云存储集群节点服务状态实时监控方法,每个集群节点均部署有服务状态采集器;所述方法包括:
所述服务状态采集器采集所在集群节点内的服务状态信息,并将所述服务状态信息处理成统一格式后,上报给服务监控处理器;所述服务状态信息包括服务运行状态信息和服务可用性状态信息;
所述服务监控处理器收集所有服务状态采集器上报的服务状态信息,对所述服务状态信息进行数据封装,形成监控信息,并通过相应的API接口将所述监控信息对外发布。
优选地,所述方法还包括:
若所述服务监控处理器成功接收所述服务状态信息,则所述服务监控处理器向所述服务状态采集器返回确认信息;
若所述服务状态采集器未收到所述服务监控处理器返回的确认信息,则向集群内其他服务状态采集器发出上报失败的广播信息;并且,当发出所述广播信息的服务状态采集器的数量超过指定值时,则判定当前服务监控处理器出现故障。
优选地,所述方法还包括:
若当前服务监控处理器发生故障时,利用Paxos算法,在所有集群节点中决策产生新的服务监控处理器,以替换发生故障的当前服务监控处理器。
优选地,所述替换发生故障的当前服务监控处理器具体包括:
将所述新的服务监控处理器的地址信息发送给所述服务状态采集器;
所述服务状态采集器根据所述地址信息,将采集到的所述服务状态信息上报给所述新的服务监控处理器。
优选地,所述方法还包括:
通过故障处理单元对发生故障的服务监控处理器进行修复或故障告警。
优选地,所述方法还包括:
所述服务监控处理器通过所述API接口,将所述监控信息发送至上层云存储管理子***,以对所述监控信息进行实时动态展示。
另一方面,本发明实施例提供了一种云存储集群节点服务状态实时监控***,包括底层云存储服务子***;
所述底层云存储服务子***包括服务监控处理器、集群节点;
每个集群节点均部署有服务状态采集器;
所述服务状态采集器,用于采集所在集群节点内的服务状态信息,并将所述服务状态信息处理成统一格式后,上报给服务监控处理器;所述服务状态信息包括服务运行信息和服务可用性信息;
所述服务监控处理器,用于收集所有服务状态采集器上报的服务状态信息,对所述服务状态信息进行数据封装,形成监控信息,并通过相应的API接口将所述监控信息对外发布。
优选地,所述底层云存储服务子***还包括选举单元;
所述选举单元,用于在当前服务监控处理器发生故障时,利用Paxos算法,在所有集群节点中决策产生新的服务监控处理器,以替换发生故障的当前服务监控处理器。
优选地,所述底层云存储服务子***还包括故障处理单元;
所述故障处理单元,用于对发生故障的服务监控处理器进行修复或故障告警。
优选地,还包括上层云存储管理子***;
所述上层云存储管理子***,用于通过调用所述API接口,获取所述监控信息,并对所述监控信息进行实时动态展示。
与现有技术相比,本发明实施例具有如下有益效果:
本发明实施例提供的云存储集群节点服务状态实时监控方法和***,通过在集群节点中设置服务状态采集器,同时对服务运行状态和服务可用性进行监控,提高云存储产品的整体监控性能,保证云存储服务的高可用性。并将监控信息通过相应的API接口实时对外发布,增强了***监控功能的可扩展性。
进一步地,本发明实施例提供的云存储集群节点服务状态实时监控方法和***,当服务监控处理器发生故障时,还通过Paxos算法动态决策生成新的服务监控处理器,有效防止了单点故障的发生,同时无需预先设置多个监视器,***资源得到充分利用,避免了从监视器闲置造成的资源浪费。
附图说明
图1是本发明提供的云存储集群节点服务状态实时监控方法一个实施例的流程图;
图2是本发明提供的云存储集群节点服务状态实时监控方法另一个实施例的流程图;
图3是本发明提供的云存储集群节点服务状态实时监控***一个实施例的***结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,是本发明提供的云存储集群节点服务状态实时监控方法一个实施例的流程图。
本发明实施例提供的云存储集群节点服务状态实时监控方法,每个集群节点均部署有服务状态采集器。所述方法包括:
步骤S1,所述服务状态采集器采集所在集群节点内的服务状态信息,并将所述服务状态信息处理成统一格式后,上报给服务监控处理器。所述服务状态信息包括服务运行状态信息和服务可用性状态信息。
所述集群节点中设置有服务状态采集器和存储器,云存储***的服务部署安装于集群的存储器中,所述服务状态采集器不断采集所在集群节点内(即存储器)的所有服务的运行状态信息及可用性状态信息,将采集到的信息处理成统一格式后主动上报给服务监控处理器。
步骤S2,所述服务监控处理器收集所有服务状态采集器上报的服务状态信息,对所述服务状态信息进行数据封装,形成监控信息,并通过相应的API接口将所述监控信息对外发布。其中所述API接口为应用程序编程接口,英文全称为Application Programming Interface。
优选地,所述API接口为RESTful架构样式的API接口,云存储产品的上层云存储管理子***和第三方应用可通过调用所述API接口,获取所述服务监控处理器发布的监控信息,以对监控信息进行进一步的处理和展示。
本实施例提供的云存储集群节点服务状态实时监控方法,通过在集群节点中部署服务状态采集器,同时对服务运行状态和服务可用性进行监控,提高云存储产品的整体监控性能,保证云存储服务的高可用性。并将监控信息通过相应的API接口实时对外发布,增强了***监控功能的可扩展性。
参见图2,是本发明提供的云存储集群节点服务状态实时监控方法另一个实施例的流程图。
如图2所示,本实施例中的步骤S1和步骤S2与图1所示实施例相同,可参见图1所示实施例中的描述,在此不再详述。
在具体实施当中所述方法还包括:
步骤S3,若所述服务监控处理器成功接收所述服务状态信息,则所述服务监控处理器向所述服务状态采集器返回确认信息。
步骤S4,若所述服务状态采集器未收到所述服务监控处理器返回的确认信息,则向集群内其他服务状态采集器发出上报失败的广播信息。并且,当发出所述广播信息的服务状态采集器的数量超过指定值时,则判定当前服务监控处理器出现故障。
步骤S5,若当前服务监控处理器发生故障时,利用Paxos算法,在所有集群节点中决策产生新的服务监控处理器,以替换发生故障的当前服务监控处理器。
当前服务监控处理器发生故障时,底层云存储服务子***中的选举单元将被触发,通过Paxos算法,从所有集群节点中选举决策出新的服务监控处理器,避免了服务监控处理器故障造成整个监控功能失效,有效防止了单点故障的发生。同时,所述Paxos算法被认为是目前最有效的分布式共识算法,通过Paxos算法可快速一致地选举产生新的服务监控处理器,大大降低了服务监控处理器故障所带来的影响,有助于保障监控功能,提高用户体验。
其中,所述替换发生故障的当前服务监控处理器具体包括:
将所述新的服务监控处理器的地址信息发送给所述服务状态采集器。
所述服务状态采集器根据所述地址信息,将采集到的所述服务状态信息上报给所述新的服务监控处理器。
在具体实施中,选举单元在决策产生新的服务监控处理器后,选举单元还将新的服务监控处理器的信息发送给集群内的每一个服务状态采集器,服务状态采集器收到新的服务监控处理器的信息后,启动目标地址更改程序,将服务状态信息的上报地址更改为所述新的服务监控处理器的地址。
更进一步地,所述方法还包括:
步骤S6,通过故障处理单元对发生故障的服务监控处理器进行修复或故障告警。通过所述故障告警对需要进行人工处理的故障进行告警提示,以对故障进行及时修复。
在具体实施当中,所述方法还包括:
步骤S7,所述服务监控处理器通过所述API接口,将所述监控信息发送至上层云存储管理子***,以对所述监控信息进行实时动态展示。
上层云存储管理子***通过调用所述API接口,获取所述监控信息,并对所述监控信息进行实时动态展示,调用所述API接口的方式包括但不限于轮询和AJAX(Asynchronous Javascript And XML,异步JavaScript和XML)。
本实施例提供的云存储集群节点服务状态实时监控方法,当服务监控处理器发生故障时,还通过Paxos算法动态决策生成新的服务监控处理器,有效防止了单点故障的发生,同时无需预先设置多个监视器,***资源得到充分利用,避免了从监视器闲置造成的资源浪费。
参见图3,是本发明提供的云存储集群节点服务状态实时监控***一个实施例的***结构图。图3所示实施例的基本原理与上述实施例中的基本原理一致,本实施例中未详述之处可参见上述实施例中的相应描述。
如图3所示,所述云存储集群节点服务状态实时监控***,包括底层云存储服务子***11。
所述底层云存储服务子***11包括服务监控处理器120、集群节点110。
每个集群节点110均部署有服务状态采集器112。
所述服务状态采集器112,用于采集所在集群节点110内的服务状态信息,并将所述服务状态信息处理成统一格式后,上报给服务监控处理器120。所述服务状态信息包括服务运行信息和服务可用性信息。
所述服务监控处理器120,用于收集所有服务状态采集器112上报的服务状态信息,对所述服务状态信息进行数据封装,形成监控信息,并通过相应的API接口将所述监控信息对外发布。
在具体实施当中,所述集群节点110中还设置有存储器111,所述存储器111用于部署安装云存储***的服务。所述服务状态采集器不断采集存储器111中的所有服务的运行状态信息及可用性状态信息,将采集到的信息处理成统一格式后主动上报给服务监控处理器120。
所述服务监控处理器120,还用于在成功接收所述服务状态信息后,向所述服务状态采集器112返回确认信息。
所述服务状态采集器112,还用于在未收到所述服务监控处理器120返回的确认信息时,向集群内其他服务状态采集器112发出上报失败的广播信息。并且,当发出所述广播信息的服务状态采集器112的数量超过指定值时,判定当前服务监控处理器120出现故障。
进一步地,所述底层云存储服务子***11还包括选举单元130。
所述选举单元130,用于在当前服务监控处理器120发生故障时,利用Paxos算法,在所有集群节点110中决策产生新的服务监控处理器,以替换发生故障的当前服务监控处理器120。
所述选举单元130,还用于将所述新的服务监控处理器的地址信息发送给所述服务状态采集器112。
所述服务状态采集器112根据所述地址信息,将采集到的所述服务状态信息上报给所述新的服务监控处理器。
在具体实施当中,所述底层云存储服务子***11还包括故障处理单元(图3中未画出)。
所述故障处理单元,用于对发生故障的服务监控处理器120进行修复或故障告警。
更进一步地,还包括上层云存储管理子***12。
所述上层云存储管理子***12,用于通过调用所述API接口,获取所述监控信息,并对所述监控信息进行实时动态展示。调用所述API接口的方式包括但不限于轮询和AJAX(Asynchronous Javascript And XML,异步JavaScript和XML)。
综上所述,本发明实施例提供的云存储集群节点服务状态实时监控***,通过在集群节点110中部署服务状态采集器112,同时对服务运行状态和服务可用性进行监控,提高云存储产品的整体监控性能,保证云存储服务的高可用性。并将监控信息通过相应的API接口实时对外发布,增强了***监控功能的可扩展性。
进一步地,本发明实施例提供的云存储集群节点服务状态实时监控***,当服务监控处理器120发生故障时,还通过Paxos算法动态决策生成新的服务监控处理器,有效防止了单点故障的发生,同时无需预先设置多个监视器,***资源得到充分利用,避免了从监视器闲置造成的资源浪费。
本领域普通技术人员可以理解实现上述实施例方法的全部或部分步骤可以通过程序来指令相关的硬件来完成,所述的程序是可以存储于一计算机可读存储介质中,所述的存储介质如ROM/RAM、磁碟、光盘等。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和变形,这些改进和变形也视为本发明的保护范围。

Claims (10)

1.一种云存储集群节点服务状态实时监控方法,其特征在于,每个集群节点均部署有服务状态采集器;所述方法包括:
所述服务状态采集器采集所在集群节点内的服务状态信息,并将所述服务状态信息处理成统一格式后,上报给服务监控处理器;所述服务状态信息包括服务运行状态信息和服务可用性状态信息;
所述服务监控处理器收集所有服务状态采集器上报的服务状态信息,对所述服务状态信息进行数据封装,形成监控信息,并通过相应的API接口将所述监控信息对外发布。
2.如权利要求1所述的云存储集群节点服务状态实时监控方法,其特征在于,所述方法还包括:
若所述服务监控处理器成功接收所述服务状态信息,则所述服务监控处理器向所述服务状态采集器返回确认信息;
若所述服务状态采集器未收到所述服务监控处理器返回的确认信息,则向集群内其他服务状态采集器发出上报失败的广播信息;并且,当发出所述广播信息的服务状态采集器的数量超过指定值时,则判定当前服务监控处理器出现故障。
3.如权利要求1所述的云存储集群节点服务状态实时监控方法,其特征在于,所述方法还包括:
若当前服务监控处理器发生故障时,利用Paxos算法,在所有集群节点中决策产生新的服务监控处理器,以替换发生故障的当前服务监控处理器。
4.如权利要求3所述的云存储集群节点服务状态实时监控方法,其特征在于,所述替换发生故障的当前服务监控处理器具体包括:
将所述新的服务监控处理器的地址信息发送给所述服务状态采集器;
所述服务状态采集器根据所述地址信息,将采集到的所述服务状态信息上报给所述新的服务监控处理器。
5.如权利要求4所述的云存储集群节点服务状态实时监控方法,其特征在于,所述方法还包括:
通过故障处理单元对发生故障的服务监控处理器进行修复或故障告警。
6.如权利要求1所述的云存储集群节点服务状态实时监控方法,其特征在于,所述方法还包括:
所述服务监控处理器通过所述API接口,将所述监控信息发送至上层云存储管理子***,以对所述监控信息进行实时动态展示。
7.一种云存储集群节点服务状态实时监控***,其特征在于,包括底层云存储服务子***;
所述底层云存储服务子***包括服务监控处理器、集群节点;
每个集群节点均部署有服务状态采集器;
所述服务状态采集器,用于采集所在集群节点内的服务状态信息,并将所述服务状态信息处理成统一格式后,上报给服务监控处理器;所述服务状态信息包括服务运行信息和服务可用性信息;
所述服务监控处理器,用于收集所有服务状态采集器上报的服务状态信息,对所述服务状态信息进行数据封装,形成监控信息,并通过相应的API接口将所述监控信息对外发布。
8.如权利要求7所述的云存储集群节点服务状态实时监控***,其特征在于,所述底层云存储服务子***还包括选举单元;
所述选举单元,用于在当前服务监控处理器发生故障时,利用Paxos算法,在所有集群节点中决策产生新的服务监控处理器,以替换发生故障的当前服务监控处理器。
9.如权利要求8所述的云存储集群节点服务状态实时监控***,其特征在于,所述底层云存储服务子***还包括故障处理单元;
所述故障处理单元,用于对发生故障的服务监控处理器进行修复或故障告警。
10.如权利要求7所述的云存储集群节点服务状态实时监控***,其特征在于,还包括上层云存储管理子***;
所述上层云存储管理子***,用于通过调用所述API接口,获取所述监控信息,并对所述监控信息进行实时动态展示。
CN201510047586.1A 2015-01-29 2015-01-29 一种云存储集群节点服务状态实时监控方法和*** Pending CN104683446A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510047586.1A CN104683446A (zh) 2015-01-29 2015-01-29 一种云存储集群节点服务状态实时监控方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510047586.1A CN104683446A (zh) 2015-01-29 2015-01-29 一种云存储集群节点服务状态实时监控方法和***

Publications (1)

Publication Number Publication Date
CN104683446A true CN104683446A (zh) 2015-06-03

Family

ID=53318015

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510047586.1A Pending CN104683446A (zh) 2015-01-29 2015-01-29 一种云存储集群节点服务状态实时监控方法和***

Country Status (1)

Country Link
CN (1) CN104683446A (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105119737A (zh) * 2015-07-16 2015-12-02 浪潮软件股份有限公司 一种通过Zabbix监控Ceph集群的方法
CN105721304A (zh) * 2016-04-05 2016-06-29 网宿科技股份有限公司 一种自适应路由调整方法、***及服务设备
CN105791028A (zh) * 2016-04-26 2016-07-20 浪潮(北京)电子信息产业有限公司 一种服务器集群的监控方法、服务器及***
CN106161090A (zh) * 2016-07-12 2016-11-23 许继集团有限公司 一种分区集群***的监测方法及装置
CN106330598A (zh) * 2016-08-11 2017-01-11 浪潮软件股份有限公司 一种通过zabbix监控hadoop的方法
CN106339297A (zh) * 2016-09-14 2017-01-18 郑州云海信息技术有限公司 一种存储***故障实时告警的方法及***
CN106533819A (zh) * 2015-09-11 2017-03-22 北京奇虎科技有限公司 线上服务的错误监控方法、装置和***
CN106603329A (zh) * 2016-12-02 2017-04-26 曙光信息产业(北京)有限公司 一种服务器集群的监控方法和***
CN106708693A (zh) * 2015-11-16 2017-05-24 亿阳信通股份有限公司 一种告警数据处理方法及装置
CN106844092A (zh) * 2016-12-09 2017-06-13 武汉烽火信息集成技术有限公司 一种自动恢复掉电的MariaDB Galera Cluster的方法
CN106933693A (zh) * 2017-03-15 2017-07-07 郑州云海信息技术有限公司 一种数据库集群节点故障自动修复方法及***
CN107257384A (zh) * 2017-07-24 2017-10-17 北京小米移动软件有限公司 服务状态监控方法及装置
CN107888444A (zh) * 2017-09-29 2018-04-06 深圳市牛鼎丰科技有限公司 服务监控方法、服务监控装置、计算机设备和存储介质
CN108681492A (zh) * 2018-05-22 2018-10-19 阿里巴巴集团控股有限公司 数据处理方法及装置
CN108845865A (zh) * 2018-06-28 2018-11-20 郑州云海信息技术有限公司 一种监控服务部署方法、***和存储介质
CN108874623A (zh) * 2018-05-31 2018-11-23 郑州云海信息技术有限公司 分布式集群性能监控方法、装置、设备、***及存储介质
CN108900386A (zh) * 2018-08-10 2018-11-27 北京金山云网络技术有限公司 告警信息的产生方法、装置及电子设备
CN109634787A (zh) * 2018-12-17 2019-04-16 浪潮电子信息产业股份有限公司 分布式文件***监控器切换方法、装置、设备及存储介质
CN110187838A (zh) * 2019-05-30 2019-08-30 北京百度网讯科技有限公司 数据io信息处理方法、分析方法、装置和相关设备
CN111008026A (zh) * 2018-10-08 2020-04-14 阿里巴巴集团控股有限公司 集群管理方法、装置及***
CN111026574A (zh) * 2019-11-25 2020-04-17 中盈优创资讯科技有限公司 诊断Elasticsearch集群问题的方法及装置
CN114726862A (zh) * 2022-05-17 2022-07-08 中诚华隆计算机技术有限公司 基于状态监控芯片确定计算节点运行状态的方法及***
CN116204388A (zh) * 2023-04-27 2023-06-02 北京合力金智科技发展有限公司 一种***服务状态的智能监控***及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007018668A1 (en) * 2005-07-21 2007-02-15 Caterpillar Inc. System and method for monitoring the status of a work machine
CN101702721A (zh) * 2009-10-26 2010-05-05 北京航空航天大学 一种多集群***的可重组方法
CN102118274A (zh) * 2009-12-30 2011-07-06 ***通信集团公司 一种状态监控方法、装置和***
CN102412988A (zh) * 2011-11-14 2012-04-11 浪潮(北京)电子信息产业有限公司 一种业务信息***及其实现持续运营的方法
CN104202389A (zh) * 2014-08-28 2014-12-10 深圳市银翔科技有限公司 云环境下的存储空间和运行状态的监测方法及云存储***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007018668A1 (en) * 2005-07-21 2007-02-15 Caterpillar Inc. System and method for monitoring the status of a work machine
CN101702721A (zh) * 2009-10-26 2010-05-05 北京航空航天大学 一种多集群***的可重组方法
CN102118274A (zh) * 2009-12-30 2011-07-06 ***通信集团公司 一种状态监控方法、装置和***
CN102412988A (zh) * 2011-11-14 2012-04-11 浪潮(北京)电子信息产业有限公司 一种业务信息***及其实现持续运营的方法
CN104202389A (zh) * 2014-08-28 2014-12-10 深圳市银翔科技有限公司 云环境下的存储空间和运行状态的监测方法及云存储***

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105119737A (zh) * 2015-07-16 2015-12-02 浪潮软件股份有限公司 一种通过Zabbix监控Ceph集群的方法
CN106533819A (zh) * 2015-09-11 2017-03-22 北京奇虎科技有限公司 线上服务的错误监控方法、装置和***
CN106708693A (zh) * 2015-11-16 2017-05-24 亿阳信通股份有限公司 一种告警数据处理方法及装置
CN105721304A (zh) * 2016-04-05 2016-06-29 网宿科技股份有限公司 一种自适应路由调整方法、***及服务设备
CN105791028A (zh) * 2016-04-26 2016-07-20 浪潮(北京)电子信息产业有限公司 一种服务器集群的监控方法、服务器及***
CN106161090A (zh) * 2016-07-12 2016-11-23 许继集团有限公司 一种分区集群***的监测方法及装置
CN106330598A (zh) * 2016-08-11 2017-01-11 浪潮软件股份有限公司 一种通过zabbix监控hadoop的方法
CN106339297B (zh) * 2016-09-14 2020-10-02 郑州云海信息技术有限公司 一种存储***故障实时告警的方法及***
CN106339297A (zh) * 2016-09-14 2017-01-18 郑州云海信息技术有限公司 一种存储***故障实时告警的方法及***
CN106603329A (zh) * 2016-12-02 2017-04-26 曙光信息产业(北京)有限公司 一种服务器集群的监控方法和***
CN106844092A (zh) * 2016-12-09 2017-06-13 武汉烽火信息集成技术有限公司 一种自动恢复掉电的MariaDB Galera Cluster的方法
CN106933693A (zh) * 2017-03-15 2017-07-07 郑州云海信息技术有限公司 一种数据库集群节点故障自动修复方法及***
CN107257384A (zh) * 2017-07-24 2017-10-17 北京小米移动软件有限公司 服务状态监控方法及装置
CN107257384B (zh) * 2017-07-24 2021-08-17 北京小米移动软件有限公司 服务状态监控方法及装置
CN107888444A (zh) * 2017-09-29 2018-04-06 深圳市牛鼎丰科技有限公司 服务监控方法、服务监控装置、计算机设备和存储介质
CN108681492A (zh) * 2018-05-22 2018-10-19 阿里巴巴集团控股有限公司 数据处理方法及装置
CN108874623A (zh) * 2018-05-31 2018-11-23 郑州云海信息技术有限公司 分布式集群性能监控方法、装置、设备、***及存储介质
CN108845865A (zh) * 2018-06-28 2018-11-20 郑州云海信息技术有限公司 一种监控服务部署方法、***和存储介质
CN108900386A (zh) * 2018-08-10 2018-11-27 北京金山云网络技术有限公司 告警信息的产生方法、装置及电子设备
CN111008026A (zh) * 2018-10-08 2020-04-14 阿里巴巴集团控股有限公司 集群管理方法、装置及***
CN111008026B (zh) * 2018-10-08 2024-03-26 阿里巴巴集团控股有限公司 集群管理方法、装置及***
CN109634787A (zh) * 2018-12-17 2019-04-16 浪潮电子信息产业股份有限公司 分布式文件***监控器切换方法、装置、设备及存储介质
CN110187838A (zh) * 2019-05-30 2019-08-30 北京百度网讯科技有限公司 数据io信息处理方法、分析方法、装置和相关设备
CN111026574A (zh) * 2019-11-25 2020-04-17 中盈优创资讯科技有限公司 诊断Elasticsearch集群问题的方法及装置
CN111026574B (zh) * 2019-11-25 2024-03-12 中盈优创资讯科技有限公司 诊断Elasticsearch集群问题的方法及装置
CN114726862A (zh) * 2022-05-17 2022-07-08 中诚华隆计算机技术有限公司 基于状态监控芯片确定计算节点运行状态的方法及***
CN114726862B (zh) * 2022-05-17 2022-08-23 中诚华隆计算机技术有限公司 基于状态监控芯片确定计算节点运行状态的方法及***
CN116204388A (zh) * 2023-04-27 2023-06-02 北京合力金智科技发展有限公司 一种***服务状态的智能监控***及方法

Similar Documents

Publication Publication Date Title
CN104683446A (zh) 一种云存储集群节点服务状态实时监控方法和***
CN110794800B (zh) 一种智慧工厂信息管理的监控***
CN103163841B (zh) 自动化设备远程监控***及方法
CN103163842B (zh) 自动化设备远程监控***及方法
CN102546256B (zh) 用于对云计算服务进行监控的***及方法
CN104486445A (zh) 一种基于云平台的分布式可扩展资源监控***及方法
CN106161090A (zh) 一种分区集群***的监测方法及装置
CN108737574A (zh) 一种节点离线判断方法、装置、设备及可读存储介质
CN109558301A (zh) 一种分布式***数据监测方法、装置及相关设备
CN101789890A (zh) 可自动更新的基于配置的代理监控***及其监控方法
CN105357061A (zh) 一种基于大数据流处理技术的运维监控分析***
CN107070753A (zh) 一种分布式集群***的数据监控方法、装置及***
CN102902615A (zh) 一种Lustre并行文件***错误报警方法及其***
CN105516293A (zh) 一种智能变电站云资源监控***
CN105760459A (zh) 一种分布式数据处理***及方法
CN114745606A (zh) 基于规则调度的弹性伸缩工业数据采集***及方法
CN104734895A (zh) 业务监控***及业务监控方法
CN112149975B (zh) 一种基于人工智能的apm监控***及监控方法
CN111628903B (zh) 交易***运行状态的监控方法及监控***
CN104243292A (zh) 一种邮件管理***及邮箱动态扩容方法
CN203289491U (zh) 一种故障节点可自动修复的集群存储***
CN117632897A (zh) 动态扩缩容方法及装置
CN103973811A (zh) 一种可动态迁移的高可用集群管理方法
CN103825752B (zh) 用于监控***运行状态的装置及方法
CN113190583A (zh) 一种数据采集***、方法、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150603

RJ01 Rejection of invention patent application after publication