CN105357042A - 一种高可用集群***及其主节点和从节点 - Google Patents

一种高可用集群***及其主节点和从节点 Download PDF

Info

Publication number
CN105357042A
CN105357042A CN201510729575.1A CN201510729575A CN105357042A CN 105357042 A CN105357042 A CN 105357042A CN 201510729575 A CN201510729575 A CN 201510729575A CN 105357042 A CN105357042 A CN 105357042A
Authority
CN
China
Prior art keywords
information
node
resource
main
subprocess
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510729575.1A
Other languages
English (en)
Other versions
CN105357042B (zh
Inventor
李延彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201510729575.1A priority Critical patent/CN105357042B/zh
Publication of CN105357042A publication Critical patent/CN105357042A/zh
Application granted granted Critical
Publication of CN105357042B publication Critical patent/CN105357042B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 
    • H04L67/1051Group master selection mechanisms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1074Peer-to-peer [P2P] networks for supporting data block transmission mechanisms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Multi Processors (AREA)

Abstract

本发明实施例提供一种高可用集群***及其主节点和从节点,主节点包括主资源分配层、主信息层和主资源代理层,从节点包括从资源分配层、从信息层和从资源代理层。将主节点和从节点均分为三层,一层用于信息的交互,一层用于集群资源的分配管理,一层用于集群资源的启动和停用,简单化主节点和从节点的工作机制,更加便于对主节点和从节点的管理和理解学习其中的工作原理,无论是主节点还是从节点,当其发生故障时,可根据其故障后的故障表现,迅速得知其为哪一层发生故障,进而只对该层进行故障检查,缩小了故障查错的范围,便于故障查询。

Description

一种高可用集群***及其主节点和从节点
技术领域
本发明涉及集群技术领域,特别是涉及一种高可用集群***及其主节点和从节点。
背景技术
随着企业信息***的广泛应用和深入发展,用户的核心应用数量越来越多,在这种分布式多应用***构架下,高可用集群***日益被用户接受和广泛使用。在高可用集群需要中,需要节点间相互间传递信息,并由节点统计各节点的资源利用情况,分配给各节点不同的集群资源,各节点在得知资源分配结果后启动或停用相关的集群资源,各节点的工作机制复杂,并不便于管理和理解学习其中的工作原理,当某节点出现故障时,也并不方便对该节点进行故障查询。
发明内容
有鉴于此,本发明实施例提供一种高可用集群***及其主节点和从节点,以解决现有技术中各节点的工作机制复杂,并不便于管理和理解学习其中的工作原理,当某节点出现故障时,也并不方便对该节点进行故障查询的问题。
为实现上述目的,本发明实施例提供如下技术方案:
一种用于高可用集群***的主节点,用于高可用集群***,所述高可用集群***包括一主节点和至少一从节点,所述主节点包括:主资源分配层、主信息层和主资源代理层;其中,
所述主资源分配层,用于收集所述高可用集群中所有节点的流动信息,根据所述流动信息得到资源分配策略,将所述资源分配策略发送给所述主信息层,并执行所述资源分配策略,向所述主资源分配层发送资源启动指令和/或资源停止指令;
所述主信息层,用于接收所有所述从节点发送的信息,并向所有所述从节点发送信息,其中,所述从节点发送的信息包括心跳消息,向所有所述从节点发送的信息包括:心跳消息、配置信息和/或所述资源分配策略;
所述主资源代理层,用于在接收到资源启动指令后启动所述资源启动指令相对应的集群资源,在接收到资源停止指令后停止启动所述资源调用指令相对应的集群资源。
其中,所述主信息层包括:主先入先出子进程、主心跳主进程、主写入子进程和主读取子进程;其中,
所述主先入先出子进程,用于接收客户端发送的信息,并将所述客户端发送的信息发送给所述主心跳主进程;
所述主读取子进程,用于接收从节点发送的信息,并将所述从节点发送的信息发送给所述主心跳主进程;
所述主心跳主进程,用于接收所述主先入先出子进程和所述主读取子进程发送的信息,确定接收的信息的存储位置,将所述接收的信息进行存储,或将所述接收的信息发送给所述主写入子进程,或将所述接收的信息发送给相应的客户端,且将需要发送给从节点的信息发送给所述主写入子进程;
所述主写入子进程,用于接收所述主心跳主进程发送的信息,并将所述主心跳主进程发送的信息发送给相应的从节点。
其中,所述主先入先出子进程与所述客户端之间通过先入先出通道进行信息传输;
所述主先入先出子进程与所述主心跳主进程之间、所述主心跳主进程与主写入子进程之间、所述主心跳主进程与主读取子进程之间和所述主心跳主进程与所述客户端之间均通过进程间通信进行信息传输;
所述主写入子进程与所述从节点之间,和所述主读取子进程与所述从节点之间均通过心跳通信插件进行信息传输。
其中,所述主资源分配层包括:主集群资源管理器、主本地资源管理器和主集群信息库;其中,
所述主集群资源管理器,用于收集所述高可用集群中所有节点的流动信息,根据所述流动信息得到资源分配策略,将所述资源分配策略发送给所述主信息层,并在得到所述资源分配策略后,向所述主本地资源管理器发送主调用指令,调用所述主本地资源管理器;
所述主本地资源管理器,用于接收所述主调用指令后启动,并根据所述主调用指令向所述主资源分配层发送资源启动指令和/或资源停止指令;
所述主集群信息库,用于存储所述主节点的配置信息,其中,所述主节点的配置信息为可编辑信息。
一种用于高可用集群***的从节点,用于高可用集群***,所述高可用集群***包括一主节点和至少一从节点,每个所述从节点包括:从资源分配层、从信息层和从资源代理层;其中,
所述从资源分配层,用于执行所述主节点发送的资源分配策略,向所述从资源分配层发送资源启动指令和/或资源停止指令;
所述从信息层,用于接收所述主节点和其他从节点的信息层发送的信息,并向所述主节点和其他从节点的信息层发送信息,其中,所述主节点和其他从节点的信息层发送的信息包括:心跳消息、配置信息和/或所述资源分配策略,向所述主节点和其他从节点的信息层发送的信息包括:心跳消息;
所述从资源代理层,用于在接收到资源启动指令后启动所述资源启动指令相对应的集群资源,在接收到资源停止指令后停止启动所述资源调用指令相对应的集群资源。
其中,所述从信息层包括:从先入先出子进程、从心跳主进程、从写入子进程和从读取子进程;
所述从先入先出子进程,用于接收客户端发送的信息,并将所述客户端发送的信息发送给所述从心跳主进程;
所述从读取子进程,用于接收主节点和其他从节点的信息层发送的信息,并将所述主节点和其他从节点的信息层发送给所述从心跳主进程;
所述从心跳主进程,用于接收所述从先入先出子进程和所述从读取子进程发送的信息,确定接收的信息的存储位置,将所述接收的信息进行存储,或将所述接收的信息发送给所述从写入子进程,或将所述接收的信息发送给相应的客户端,且将需要发送给主节点和/或其他从节点的信息层的信息发送给所述从写入子进程;
所述从写入子进程,用于接收所述从心跳主进程发送的信息,并将所述从心跳主进程发送的信息发送给主节点和/或相应的从节点。
其中,所述从先入先出子进程与所述客户端之间通过先入先出通道进行信息传输;
所述从先入先出子进程与所述从心跳主进程之间、所述从心跳主进程与从写入子进程之间、所述从心跳主进程与从读取子进程之间和所述从心跳主进程与所述客户端之间均通过进程间通信进行信息传输;
所述从写入子进程与所述主节点和其他从节点之间,和所述从读取子进程与所述主节点和其他从节点之间均通过心跳通信插件进行信息传输。
其中,所述从资源分配层包括:从集群资源管理器、从本地资源管理器和从集群信息库;其中,
所述从集群资源管理器,用于在得到主节点发送的资源分配策略后,执行所述资源分配策略,并向所述从本地资源管理器发送从调用指令,调用所述从本地资源管理器;
所述从本地资源管理器,用于接收所述从调用指令后启动,并根据所述从调用指令向所述从资源分配层发送资源启动指令和/或资源停止指令;
所述从集群信息库,用于存储自身的配置信息,其中,所述配置信息为只读信息。
一种高可用集群***,包括一上述的主节点,和至少一上述的从节点。
其中,所述高可用集群***,还包括:备用主节点和/或备用从节点;其中,
所述备用主节点包括:备用主资源分配层、备用主信息层和备用主资源代理层;其中,
当所述主节点故障时;
所述备用主资源分配层,用于收集所述高可用集群中所有节点的流动信息,根据所述流动信息得到资源分配策略,将所述资源分配策略发送给所述信息层,并执行所述资源分配策略,向所述备用主资源分配层发送资源启动指令和/或资源停止指令;
所述备用主信息层,用于接收所有所述从节点发送的信息,并向所有所述从节点发送信息,其中,所述从节点发送的信息包括心跳消息,向所有所述从节点发送的信息包括:心跳消息、配置信息和/或所述资源分配策略;
所述备用主资源代理层,用于在接收到资源启动指令后启动所述资源启动指令相对应的集群资源,在接收到资源停止指令后停止启动所述资源调用指令相对应的集群资源;
所述备用从节点包括:备用从资源分配层、备用从信息层和备用从资源代理层;其中,
当所述高可用集群***中出现故障的从节点时;
所述备用从资源分配层,用于执行主节点发送的资源分配策略,向所述备用从资源分配层发送资源启动指令和/或资源停止指令;
所述备用从信息层,用于接收主节点和其他从节点的信息层发送的信息,并向主节点和其他从节点的信息层发送信息,其中,所述主节点和其他从节点的信息层发送的信息包括:心跳消息、配置信息和/或所述资源分配策略,向所述主节点和其他从节点的信息层发送的信息包括:心跳消息;
所述备用从资源代理层,用于在接收到资源启动指令后启动所述资源启动指令相对应的集群资源,在接收到资源停止指令后停止启动所述资源调用指令相对应的集群资源。
基于上述技术方案,本发明实施例提供的高可用集群***及其主节点和从节点,高可用集群***包括一主节点和至少一从节点,将主节点分为主资源分配层、主信息层和主资源代理层,由主信息层发送和接收信息,与其他节点进行信息传递,由主资源分配层收集各节点的流动信息,统计各节点的资源利用情况,得到资源分配策略,分配各节点不同的集群资源,并执行该资源分配策略,由主资源代理层在主资源分配层执行该资源分配策略后启动或停止相应的集群资源;将从节点分为从资源分配层、从信息层和从资源代理层,由从信息层发送和接收信息,与其他节点进行信息传递,由从资源分配层在得到主节点发送的资源分配策略后,执行该资源分配策略,由从资源代理层在从资源分配层执行该资源分配策略后启动或停止相应的集群资源。将主节点和从节点均分为三层,一层用于信息的交互,一层用于集群资源的分配管理,一层用于集群资源的启动和停用,简单化主节点和从节点的工作机制,更加便于对主节点和从节点的管理和理解学习其中的工作原理,无论是主节点还是从节点,当其发生故障时,可根据其故障后的故障表现,迅速得知其为哪一层发生故障,进而只对该层进行故障检查,缩小了故障查错的范围,便于故障查询。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的用于高可用集群***的主节点的结构框图;
图2为本发明实施例提供的用于高可用集群***的主节点中主信息层的结构框图;
图3为本发明实施例提供的用于高可用集群***的主节点中主资源分配层的结构框图;
图4为本发明实施例提供的用于高可用集群***的从节点的结构框图;
图5为本发明实施例提供的用于高可用集群***的从节点中从信息层的结构框图;
图6为本发明实施例提供的用于高可用集群***的从节点中从资源分配层的结构框图;
图7为本发明实施例提供的高可用集群***的***框图;
图8为本发明实施例提供的高可用集群***的另一***框图;
图9为本发明实施例提供的高可用集群***的中主信息层和从信息层间进行信息交互的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的用于高可用集群***的主节点的结构框图,将主节点分为三层,一层用于信息的交互,一层用于集群资源的分配管理,一层用于集群资源的启动和停用,简单化主节点的工作机制,更加便于对主节点的管理和理解学习其中的工作原理,当主节点发生故障时,可根据该主节点故障后的故障表现,迅速得知为该主节点的哪一层发生故障,进而只对该层进行故障检查,缩小了故障查错的范围,便于故障查询;参照图1,该用于高可用集群***的主节点可以包括:主资源分配层110、主信息层120和主资源代理层130;其中,
主资源分配层110,用于集群资源的分配管理,收集高可用集群中所有节点的流动信息,根据收集的流动信息得到资源分配策略,将该资源分配策略发送给主信息层120,由主信息层120发送给其他节点,同时,主资源分配层110在得到资源分配策略后,执行该资源分配策略,根据该资源分配策略向主资源分配层130发送资源启动指令和/或资源停止指令。
可选的,主资源分配层110可以包括主集群资源管理器、主本地资源管理器和主集群信息库,通过主集群资源管理器收集所有节点的流动信息,根据所述流动信息,得到资源分配策略,将资源分配策略发送给主信息层120,并在得到资源分配策略后,向主本地资源管理器发送主调用指令,调用该主本地资源管理器,通过本地资源管理器根据主集群资源管理器发送的主调用指令向主资源分配层130发送资源启动指令和/或资源停止指令,通过集群信息库存储主节点的配置信息,其中,主节点的配置信息为可编辑信息。
主信息层120,用于信息的交互,接收所有从节点发送的信息,并向所有从节点发送信息,其中,从节点发送的信息可以包括心跳消息,向所有所节点发送的信息可以包括:心跳消息、配置信息和/或主资源分配层110得到的资源分配策略。
可选的,主信息层120可以包括主先入先出子进程、主心跳主进程、主写入子进程和主读取子进程,通过主先入先出子进程接收客户端发送的信息,并将客户端发送的信息发送给主心跳主进程,通过主读取子进程接收从节点发送的信息,并将从节点发送的信息发送给主心跳主进程,通过主心跳主进程接收主先入先出子进程和主读取子进程发送的信息,确定接收的信息的存储位置,将该接收的信息进行存储,或将该接收的信息发送给主写入子进程,或将该接收的信息发送给相应的客户端,且将需要发送给从节点的信息发送给主写入子进程,通过主写入子进程接收主心跳主进程发送的信息,并将主心跳主进程发送的信息发送给相应的从节点,从而完成节点间的信息传递和主节点与客户端间的信息传递。
可选的,主先入先出子进程与客户端之间可以通过先入先出通道进行信息传输;主先入先出子进程与主心跳主进程之间、主心跳主进程与主写入子进程之间、主心跳主进程与主读取子进程之间和、主心跳主进程与客户端之间均可以通过进程间通信进行信息传输;主写入子进程与从节点之间,和主读取子进程与从节点之间均可以通过心跳通信插件进行信息传输。
主资源代理层130,用于集群资源的启动和停用,在接收到主资源分配层110发送的资源启动指令后,启动该资源启动指令相对应的集群资源,在接收到主资源分配层110发送资源停止指令后,停止启动该资源调用指令相对应的集群资源。
基于上述技术方案,本发明实施例提供的用于高可用集群***的主节点,分为主资源分配层、主信息层和主资源代理层,由主信息层发送和接收信息,与其他节点进行信息传递,由主资源分配层收集各节点的流动信息,统计各节点的资源利用情况,得到资源分配策略,分配各节点不同的集群资源,并执行该资源分配策略,由主资源代理层在主资源分配层执行该资源分配策略后启动或停止相应的集群资源。将主节点分为三层结构,一层用于信息的交互,一层用于集群资源的分配管理,一层用于集群资源的启动和停用,简单化主节点的工作机制,更加便于对主节点的管理和理解学习其中的工作原理,当主节点发生故障时,可根据该主节点故障后的故障表现,迅速得知为该主节点的哪一层发生故障,进而只对该层进行故障检查,缩小了故障查错的范围,便于故障查询。
可选的,图2示出了本发明实施例提供的用于高可用集群***的主节点中主信息层120的结构框图,参照图2,该主信息层120可以包括:主先入先出子进程121、主心跳主进程122、主写入子进程123和主读取子进程124;其中,
主先入先出子进程121,用于接收客户端发送的信息,并将所述客户端发送的信息发送给所述主心跳主进程;
主读取子进程122,用于接收从节点发送的信息,并将所述从节点发送的信息发送给所述主心跳主进程;
主心跳主进程123,用于接收所述主先入先出子进程和所述主读取子进程发送的信息,确定接收的信息的存储位置,将所述接收的信息进行存储,或将所述接收的信息发送给所述主写入子进程,或将所述接收的信息发送给相应的客户端,且将需要发送给从节点的信息发送给所述主写入子进程;
主写入子进程124,用于接收所述主心跳主进程发送的信息,并将所述主心跳主进程发送的信息发送给相应的从节点。
当主信息层120接收到某从节点发送的节点数据信息时,主读取子进程120接收所述该节点数据信息,并将该节点数据信息发送给主心跳主进程123;主心跳主进程123接收该节点数据信息后,确定该节点数据信息的存储位置,若确定该节点数据信息的存储位置为主节点,则将该节点数据信息进行存储,若确定该节点数据信息的存储位置为某客户端,则将该节点数据信息发送该客户端。
当主信息层120向从节点发送节点数据信息时,主心跳主进程123在确定该节点数据信息的存储位置后,即确定该节点数据信息的存储节点后,将该节点数据信息发送给主写入子进程124,主写入子进程124接收到该节点数据信息后,将该节点数据信息发送给该存储节点进行存储。
当主信息层120接收到客户端发送的客户端数据信息时,由主先入先出子进程121接收该客户端数据信息,将该客户端数据信息发送给主心跳主进程123,主心跳主进程123在到该客户端数据信息后,确定该客户端数据信息相对应的存储位置,若确定该客户端数据信息的存储位置为主节点,则对该客户端数据信息进行存储,若确定该节点数据信息的存储位置为某从节点,则将该客户端数据信息发送给主写入子进程124,由主写入子进程124将该客户端数据信息发送给该从节点进行存储。
可选的,图3示出了本发明实施例提供的用于高可用集群***的主节点中主资源分配层110的结构框图,参照图3,该主资源分配层110可以包括:主集群资源管理器111、主本地资源管理器112和主集群信息库113;其中,
主集群资源管理器111,用于收集所述高可用集群中所有节点的流动信息,根据所述流动信息得到资源分配策略,将所述资源分配策略发送给所述主信息层,并在得到所述资源分配策略后,向所述主本地资源管理器发送主调用指令,调用所述主本地资源管理器;
可选的,主集群资源管理器111可以包括:策略引擎、传输引擎和主执行引擎,其中,策略引擎用于收集高可用集群中所有节点的流动信息,根据该流动信息得到资源分配策略,传输引擎用于将该资源分配策略发送给主信息层120,通过该主信息层120将该资源分配策略发送给所有从节点,主执行引擎用于执行该资源分配策略,向主本地资源管理器112发送主调用指令,调用主本地资源管理器112。
主本地资源管理器112,用于接收主调用指令后启动,并根据该主调用指令向主资源分配层130发送资源启动指令和/或资源停止指令;
主集群信息库113,用于存储主节点的配置信息,即存储自身的配置信息,其中,主节点的配置信息为可编辑信息。
其中,主节点的配置信息为可编辑信息,可进行修改,从节点的配置信息为只读信息,不可进行修改,若需要修改个节点的配置,则需要先修改主节点的配置信息,然后有主节点的主信息层120,将该修改后的配置信息发送给各从节点进行替换。
本发明实施例提供的用于高可用集群***的主节点,将主节点分为三层,一层用于信息的交互,一层用于集群资源的分配管理,一层用于集群资源的启动和停用,简单化主节点的工作机制,更加便于对主节点的管理和理解学习其中的工作原理,当主节点发生故障时,可根据该主节点故障后的故障表现,迅速得知为该主节点的哪一层发生故障,进而只对该层进行故障检查,缩小了故障查错的范围,便于故障查询。
下面对本发明实施例提供的用于高可用集群***的从节点进行介绍,下文描述的用于高可用集群***的从节点与上文描述的用于高可用集群***的主节点可相互配合用于同一高可用集群***。
图4为本发明实施例提供的用于高可用集群***的从节点的结构框图,将从节点分为三层,一层用于信息的交互,一层用于集群资源的分配管理,一层用于集群资源的启动和停用,简单化从节点的工作机制,更加便于对从节点的管理和理解学习其中的工作原理,当从节点发生故障时,可根据该从节点故障后的故障表现,迅速得知为该从节点的哪一层发生故障,进而只对该层进行故障检查,缩小了故障查错的范围,便于故障查询;参照图4,该用于高可用集群***的从节点可以包括:从资源分配层210、从信息层220和从资源代理层230;其中,
从资源分配层210,用于集群资源的分配管理,执行主节点发送的资源分配策略,向从资源分配层230发送资源启动指令和/或资源停止指令。
可选的,从资源分配层210可以包括从集群资源管理器、从本地资源管理器和从集群信息库,通过从集群资源管理器210在得到主节点发送的资源分配策略后,执行该资源分配策略,并向从本地资源管理器发送从调用指令,调用该从本地资源管理器,通过从本地资源管理器在接收从调用指令后启动,并根据该从调用指令向从资源分配层发送资源启动指令和/或资源停止指令,通过从集群信息库存储自身的配置信息,其中,该配置信息为只读信息。
从信息层220,用于信息的交互,接收主节点和其他从节点的信息层发送的信息,并向主节点和其他从节点的信息层发送信息,其中,主节点和其他从节点的信息层发送的信息可以包括:心跳消息、配置信息和/或所述资源分配策略,向主节点和其他从节点的信息层发送的信息可以包括:心跳消息。
可选的,从信息层220可以包括从先入先出子进程、从心跳主进程、从写入子进程和从读取子进程,通过从先入先出子进程接收客户端发送的信息,并将该客户端发送的信息发送给所述从心跳主进程,通过从读取子进程接收主节点和其他从节点的信息层发送的信息,并将主节点和其他从节点的信息层发送给从心跳主进程,通过从心跳主进程接收从先入先出子进程和从读取子进程发送的信息,确定接收的信息的存储位置,将该接收的信息进行存储,或将该接收的信息发送给从写入子进程,或将该接收的信息发送给相应的客户端,且将需要发送给主节点和/或其他从节点的信息层的信息发送给从写入子进程,通过从写入子进程接收从心跳主进程发送的信息,并将从心跳主进程发送的信息发送给主节点和/或相应的从节点,从而完成节点间的信息传递和与客户端间的信息传递。
可选的,从先入先出子进程与客户端之间可以通过先入先出通道进行信息传输;从先入先出子进程与从心跳从进程之间、从心跳从进程与从写入子进程之间、从心跳从进程与从读取子进程之间和、从心跳从进程与客户端之间均可以通过进程间通信进行信息传输;从写入子进程与主节点和其他从节点之间,和从读取子进程与主节点和其他从节点之间均通过心跳通信插件进行信息传输。
从资源代理层230,用于集群资源的启动和停用,在接收到资源启动指令后,启动该资源启动指令相对应的集群资源,在接收到资源停止指令后,停止启动该资源调用指令相对应的集群资源。
基于上述技术方案,本发明实施例提供的高可用集群***的从节点,分为从资源分配层、从信息层和从资源代理层,由从信息层发送和接收信息,与其他节点进行信息传递,由从资源分配层在得到主节点发送的资源分配策略后,执行该资源分配策略,由从资源代理层在从资源分配层执行该资源分配策略后启动或停止相应的集群资源。将从节点分为三层结构,一层用于信息的交互,一层用于集群资源的分配管理,一层用于集群资源的启动和停用,简单化从节点的工作机制,更加便于对从节点的管理和理解学习其中的工作原理,当其发生故障时,可根据其故障后的故障表现,迅速得知为其哪一层发生故障,进而只对该层进行故障检查,缩小了故障查错的范围,便于故障查询。
可选的,图5示出了本发明实施例提供的用于高可用集群***的从节点中从信息层220的结构框图,参照图5,该从信息层220可以包括:从先入先出子进程221、从心跳从进程222、从写入子进程223和从读取子进程224;其中,
从先入先出子进程221,用于接收客户端发送的信息,并将所述客户端发送的信息发送给所述从心跳主进程;
从读取子进程222,用于接收主节点和其他从节点的信息层发送的信息,并将所述主节点和其他从节点的信息层发送给所述从心跳主进程;
从心跳主进程223,用于接收所述从先入先出子进程和所述从读取子进程发送的信息,确定接收的信息的存储位置,将所述接收的信息进行存储,或将所述接收的信息发送给所述从写入子进程,或将所述接收的信息发送给相应的客户端,且将需要发送给主节点和/或其他从节点的信息层的信息发送给所述从写入子进程;
从写入子进程224,用于接收所述从心跳主进程发送的信息,并将所述从心跳主进程发送的信息发送给主节点和/或相应的从节点。
当从信息层220接收到主节点或某从节点发送的节点数据信息时,从读取子进程220接收所述该节点数据信息,并将该节点数据信息发送给从心跳从进程223;从心跳从进程223接收该节点数据信息后,确定该节点数据信息的存储位置,若确定该节点数据信息的存储位置为本身,则将该节点数据信息进行存储,若确定该节点数据信息的存储位置为某客户端,或将该节点数据信息发送该客户端。
当从信息层220向主节点或其他从节点发送节点数据信息时,从心跳从进程223在确定该节点数据信息的存储位置后,即确定该节点数据信息的存储节点后,将该节点数据信息发送给从写入子进程224,从写入子进程224接收到该节点数据信息后,将该节点数据信息发送给该存储节点进行存储。
当从信息层220接收到客户端发送的客户端数据信息时,由从先入先出子进程222接收该客户端数据信息,将该客户端数据信息发送给从心跳从进程223,从心跳从进程223在到该客户端数据信息后,确定该客户端数据信息相对应的存储位置,若确定该客户端数据信息的存储位置为本身,则将该客户端数据信息进行存储,若确定该节点数据信息的存储位置为主节点或其他从节点,则将该客户端数据信息发送给从写入子进程224,由从写入子进程224将该客户端数据信息发送给主节点或其他从节点进行存储。
可选的,图6示出了本发明实施例提供的用于高可用集群***的从节点中从资源分配层210的结构框图,参照图6,该从资源分配层210可以包括:从集群资源管理器211、从本地资源管理器212和从集群信息库213;其中,
从集群资源管理器211,用于在得到主节点发送的资源分配策略后,执行该资源分配策略,并向从本地资源管理器212发送从调用指令,调用从本地资源管理器212;
可选的,从集群资源管理器211可以包括:从执行引擎,通过该从执行引擎执行资源分配策略,向主本地资源管理器112发送主调用指令,调用主本地资源管理器112。
从本地资源管理器212,用于接收从调用指令后启动,并根据该从调用指令向从资源分配层230发送资源启动指令和/或资源停止指令;
从集群信息库213,用于存储自身的配置信息,其中,该配置信息为只读信息。
本发明实施例提供的用于高可用集群***的从节点,将从节点分为三层结构,一层用于信息的交互,一层用于集群资源的分配管理,一层用于集群资源的启动和停用,简单化从节点的工作机制,更加便于对从节点的管理和理解学习其中的工作原理,当其发生故障时,可根据其故障后的故障表现,迅速得知为其哪一层发生故障,进而只对该层进行故障检查,缩小了故障查错的范围,便于故障查询。
下面对本发明实施例提供的高可用集群***进行介绍,下文描述的高可用集群***基于上文描述的用于高可用集群***的主节点,和用于高可用集群***的从节点。
图7为本发明实施例提供的高可用集群***的***框图,参照图7,该高可用集群***可以包括:包括一主节点100和至少一从节点200。
其中,主节点100为上文所描述的用于高可用集群的主节点,从节点200为上文所描述的用于高可用集群的主节点。
主节点100和从节点200之间通过主信息层120和从信息层220进行信息交互,各从节点200之间均通过彼此从信息层220进行信息交互。
可选的,图8示出了本发明实施例提供的高可用集群***的另一***框图,参照图8,该高可用集群***还可以包括:包括备用主节点300和/或备用从节点400;其中,
备用主节点包括备用主资源分配层310、备用主信息层320和备用主资源代理层330。
当主节点100故障时,备用主资源分配层310,用于收集高可用集群中所有节点的流动信息,根据收集的流动信息得到资源分配策略,将该资源分配策略发送给备用主信息层320,由备用主信息层320发送给其他节点,同时,备用主资源分配层330在得到资源分配策略后,执行该资源分配策略,根据该资源分配策略向备用主资源分配层330发送资源启动指令和/或资源停止指令;
备用主信息层320,用于接收所有从节点发送的信息,并向所有从节点发送信息,其中,从节点发送的信息可以包括心跳消息,向所有所节点发送的信息可以包括:心跳消息、配置信息和/或主资源分配层110得到的资源分配策略;
备用主资源代理层330,用于在接收到备用主资源分配层310发送的资源启动指令后,启动该资源启动指令相对应的集群资源,在接收到备用主资源分配层330发送资源停止指令后,停止启动该资源调用指令相对应的集群资源。
即,当主节点100故障时,由备用主节点300来代替主节点100继续工作,使高可用集群节点可持续正常运行。
备用从节点400包括:备用从资源分配层410、备用从信息层420和备用从资源代理层430;其中,
当高可用集群***中出现故障的从节点时,备用从资源分配层410,用于执行主节点发送的资源分配策略,向备用从资源分配层430发送资源启动指令和/或资源停止指令;
备用从信息层420,用于接收主节点和其他从节点的信息层发送的信息,并向主节点和其他从节点的信息层发送信息,其中,主节点和其他从节点的信息层发送的信息可以包括:心跳消息、配置信息和/或所述资源分配策略,向主节点和其他从节点的信息层发送的信息可以包括:心跳消息;
备用从资源代理层430,用于在接收到资源启动指令后,启动该资源启动指令相对应的集群资源,在接收到资源停止指令后,停止启动该资源调用指令相对应的集群资源。
即,当高可用集群***中出现故障的从节点时,由备用从节点400来代替该故障的从节点继续工作,使高可用集群节点可持续正常运行。
可选的,图9示出了本发明实施例提供的高可用集群***的中主信息层110和从信息层120间进行信息交互的示意图。
当第一客户端将客户端数据信息发送给主节点100时,由主节点100的主信息层110的主先入先出子进程121接收,然后发送给主心跳主进程123,主心跳主进程123接收到该客户端数据信息后,确定该客户端数据信息的存储位置是否为主节点,若是,则将该客户端数据信息进行存储,若不是,则将该客户端数据信息发送给主写入子进程124,由主写入子进程124发送给存储该客户端数据信息的从节点,由该从节点的从信息层220的从读取子进程222接收该客户端数据信息,将该客户端数据信息发送给从心跳主进程223,从心跳主进程223接收到该客户端数据信息后,确定该客户端数据信息的存储位置是否为自身,若是,则将该客户端数据信息进行存储,若不是,则将该客户端数据信息发送给相应的第二客户端。
各节点的从信息层间进行信息交互时,与主信息层和从信息层间进行信息交互同理,不再赘述。
本发明实施例提供的高可用集群***,主节点和从节点均分为三层结构,一层用于信息的交互,一层用于集群资源的分配管理,一层用于集群资源的启动和停用,简单化主节点和从节点的工作机制,更加便于对主节点和从节点的管理和理解学习其中的工作原理,无论是主节点还是从节点,当其发生故障时,可根据其故障后的故障表现,迅速得知为其哪一层发生故障,进而只对该层进行故障检查,缩小了故障查错的范围,便于故障查询。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种用于高可用集群***的主节点,其特征在于,用于高可用集群***,所述高可用集群***包括一主节点和至少一从节点,所述主节点包括:主资源分配层、主信息层和主资源代理层;其中,
所述主资源分配层,用于收集所述高可用集群中所有节点的流动信息,根据所述流动信息得到资源分配策略,将所述资源分配策略发送给所述主信息层,并执行所述资源分配策略,向所述主资源分配层发送资源启动指令和/或资源停止指令;
所述主信息层,用于接收所有所述从节点发送的信息,并向所有所述从节点发送信息,其中,所述从节点发送的信息包括心跳消息,向所有所述从节点发送的信息包括:心跳消息、配置信息和/或所述资源分配策略;
所述主资源代理层,用于在接收到资源启动指令后启动所述资源启动指令相对应的集群资源,在接收到资源停止指令后停止启动所述资源调用指令相对应的集群资源。
2.根据权利要求1所述的主节点,其特征在于,所述主信息层包括:主先入先出子进程、主心跳主进程、主写入子进程和主读取子进程;其中,
所述主先入先出子进程,用于接收客户端发送的信息,并将所述客户端发送的信息发送给所述主心跳主进程;
所述主读取子进程,用于接收从节点发送的信息,并将所述从节点发送的信息发送给所述主心跳主进程;
所述主心跳主进程,用于接收所述主先入先出子进程和所述主读取子进程发送的信息,确定接收的信息的存储位置,将所述接收的信息进行存储,或将所述接收的信息发送给所述主写入子进程,或将所述接收的信息发送给相应的客户端,且将需要发送给从节点的信息发送给所述主写入子进程;
所述主写入子进程,用于接收所述主心跳主进程发送的信息,并将所述主心跳主进程发送的信息发送给相应的从节点。
3.根据权利要求2所述的主节点,其特征在于,
所述主先入先出子进程与所述客户端之间通过先入先出通道进行信息传输;
所述主先入先出子进程与所述主心跳主进程之间、所述主心跳主进程与主写入子进程之间、所述主心跳主进程与主读取子进程之间和所述主心跳主进程与所述客户端之间均通过进程间通信进行信息传输;
所述主写入子进程与所述从节点之间,和所述主读取子进程与所述从节点之间均通过心跳通信插件进行信息传输。
4.根据权利要求1所述的主节点,其特征在于,所述主资源分配层包括:主集群资源管理器、主本地资源管理器和主集群信息库;其中,
所述主集群资源管理器,用于收集所述高可用集群中所有节点的流动信息,根据所述流动信息得到资源分配策略,将所述资源分配策略发送给所述主信息层,并在得到所述资源分配策略后,向所述主本地资源管理器发送主调用指令,调用所述主本地资源管理器;
所述主本地资源管理器,用于接收所述主调用指令后启动,并根据所述主调用指令向所述主资源分配层发送资源启动指令和/或资源停止指令;
所述主集群信息库,用于存储所述主节点的配置信息,其中,所述主节点的配置信息为可编辑信息。
5.一种用于高可用集群***的从节点,其特征在于,用于高可用集群***,所述高可用集群***包括一主节点和至少一从节点,每个所述从节点包括:从资源分配层、从信息层和从资源代理层;其中,
所述从资源分配层,用于执行所述主节点发送的资源分配策略,向所述从资源分配层发送资源启动指令和/或资源停止指令;
所述从信息层,用于接收所述主节点和其他从节点的信息层发送的信息,并向所述主节点和其他从节点的信息层发送信息,其中,所述主节点和其他从节点的信息层发送的信息包括:心跳消息、配置信息和/或所述资源分配策略,向所述主节点和其他从节点的信息层发送的信息包括:心跳消息;
所述从资源代理层,用于在接收到资源启动指令后启动所述资源启动指令相对应的集群资源,在接收到资源停止指令后停止启动所述资源调用指令相对应的集群资源。
6.根据权利要求5所述的从节点,其特征在于,所述从信息层包括:从先入先出子进程、从心跳主进程、从写入子进程和从读取子进程;
所述从先入先出子进程,用于接收客户端发送的信息,并将所述客户端发送的信息发送给所述从心跳主进程;
所述从读取子进程,用于接收主节点和其他从节点的信息层发送的信息,并将所述主节点和其他从节点的信息层发送给所述从心跳主进程;
所述从心跳主进程,用于接收所述从先入先出子进程和所述从读取子进程发送的信息,确定接收的信息的存储位置,将所述接收的信息进行存储,或将所述接收的信息发送给所述从写入子进程,或将所述接收的信息发送给相应的客户端,且将需要发送给主节点和/或其他从节点的信息层的信息发送给所述从写入子进程;
所述从写入子进程,用于接收所述从心跳主进程发送的信息,并将所述从心跳主进程发送的信息发送给主节点和/或相应的从节点。
7.根据权利要求6所述的从节点,其特征在于,
所述从先入先出子进程与所述客户端之间通过先入先出通道进行信息传输;
所述从先入先出子进程与所述从心跳主进程之间、所述从心跳主进程与从写入子进程之间、所述从心跳主进程与从读取子进程之间和所述从心跳主进程与所述客户端之间均通过进程间通信进行信息传输;
所述从写入子进程与所述主节点和其他从节点之间,和所述从读取子进程与所述主节点和其他从节点之间均通过心跳通信插件进行信息传输。
8.根据权利要求5所述的从节点,其特征在于,所述从资源分配层包括:从集群资源管理器、从本地资源管理器和从集群信息库;其中,
所述从集群资源管理器,用于在得到主节点发送的资源分配策略后,执行所述资源分配策略,并向所述从本地资源管理器发送从调用指令,调用所述从本地资源管理器;
所述从本地资源管理器,用于接收所述从调用指令后启动,并根据所述从调用指令向所述从资源分配层发送资源启动指令和/或资源停止指令;
所述从集群信息库,用于存储自身的配置信息,其中,所述配置信息为只读信息。
9.一种高可用集群***,其特征在于,包括一权利要求1-4中任一项所述的主节点,和至少一权利要求5-8中任一项所述的从节点。
10.根据权利要求9所述的高可用集群***,其特征在于,还包括:备用主节点和/或备用从节点;其中,
所述备用主节点包括:备用主资源分配层、备用主信息层和备用主资源代理层;其中,
当所述主节点故障时;
所述备用主资源分配层,用于收集所述高可用集群中所有节点的流动信息,根据所述流动信息得到资源分配策略,将所述资源分配策略发送给所述信息层,并执行所述资源分配策略,向所述备用主资源分配层发送资源启动指令和/或资源停止指令;
所述备用主信息层,用于接收所有所述从节点发送的信息,并向所有所述从节点发送信息,其中,所述从节点发送的信息包括心跳消息,向所有所述从节点发送的信息包括:心跳消息、配置信息和/或所述资源分配策略;
所述备用主资源代理层,用于在接收到资源启动指令后启动所述资源启动指令相对应的集群资源,在接收到资源停止指令后停止启动所述资源调用指令相对应的集群资源;
所述备用从节点包括:备用从资源分配层、备用从信息层和备用从资源代理层;其中,
当所述高可用集群***中出现故障的从节点时;
所述备用从资源分配层,用于执行主节点发送的资源分配策略,向所述备用从资源分配层发送资源启动指令和/或资源停止指令;
所述备用从信息层,用于接收主节点和其他从节点的信息层发送的信息,并向主节点和其他从节点的信息层发送信息,其中,所述主节点和其他从节点的信息层发送的信息包括:心跳消息、配置信息和/或所述资源分配策略,向所述主节点和其他从节点的信息层发送的信息包括:心跳消息;
所述备用从资源代理层,用于在接收到资源启动指令后启动所述资源启动指令相对应的集群资源,在接收到资源停止指令后停止启动所述资源调用指令相对应的集群资源。
CN201510729575.1A 2015-10-30 2015-10-30 一种高可用集群***及其主节点和从节点 Active CN105357042B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510729575.1A CN105357042B (zh) 2015-10-30 2015-10-30 一种高可用集群***及其主节点和从节点

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510729575.1A CN105357042B (zh) 2015-10-30 2015-10-30 一种高可用集群***及其主节点和从节点

Publications (2)

Publication Number Publication Date
CN105357042A true CN105357042A (zh) 2016-02-24
CN105357042B CN105357042B (zh) 2018-09-07

Family

ID=55332918

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510729575.1A Active CN105357042B (zh) 2015-10-30 2015-10-30 一种高可用集群***及其主节点和从节点

Country Status (1)

Country Link
CN (1) CN105357042B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106911524A (zh) * 2017-04-27 2017-06-30 紫光华山信息技术有限公司 一种ha实现方法及装置
CN107533324A (zh) * 2016-02-04 2018-01-02 株式会社Kmc 生产信息收集***
CN107689889A (zh) * 2017-08-28 2018-02-13 长沙曙通信息科技有限公司 一种集群多节点状态信息维护实现方法
CN109977161A (zh) * 2019-03-28 2019-07-05 上海中通吉网络技术有限公司 presto集群的监控***
CN110431806A (zh) * 2017-04-19 2019-11-08 华为技术有限公司 分布式资源管理中低时延节点本地调度的***和方法
CN112612851A (zh) * 2020-12-24 2021-04-06 南京三眼精灵信息技术有限公司 多中心数据同步方法及装置
CN112685498A (zh) * 2020-12-28 2021-04-20 紫光云技术有限公司 一种云平台上Redis数据持久化的方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070016822A1 (en) * 2005-07-15 2007-01-18 Rao Sudhir G Policy-based, cluster-application-defined quorum with generic support interface for cluster managers in a shared storage environment
CN102033777A (zh) * 2010-09-17 2011-04-27 中国资源卫星应用中心 基于ice的分布式作业调度引擎
CN103259832A (zh) * 2012-12-24 2013-08-21 中国科学院沈阳自动化研究所 实现动态负载平衡、故障诊断与转移的群集资源控制方法
CN103491165A (zh) * 2013-09-22 2014-01-01 复旦大学 自动检测屏蔽的通用分布式爬虫***
CN103944769A (zh) * 2014-05-05 2014-07-23 江苏物联网研究发展中心 基于rpc协议的集群资源统一管理***
CN104317650A (zh) * 2014-10-10 2015-01-28 北京工业大学 一种面向Map/Reduce型海量数据处理平台的作业调度方法
CN104461752A (zh) * 2014-11-21 2015-03-25 浙江宇视科技有限公司 一种两级故障容错的多媒体分布式任务处理方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070016822A1 (en) * 2005-07-15 2007-01-18 Rao Sudhir G Policy-based, cluster-application-defined quorum with generic support interface for cluster managers in a shared storage environment
CN102033777A (zh) * 2010-09-17 2011-04-27 中国资源卫星应用中心 基于ice的分布式作业调度引擎
CN103259832A (zh) * 2012-12-24 2013-08-21 中国科学院沈阳自动化研究所 实现动态负载平衡、故障诊断与转移的群集资源控制方法
CN103491165A (zh) * 2013-09-22 2014-01-01 复旦大学 自动检测屏蔽的通用分布式爬虫***
CN103944769A (zh) * 2014-05-05 2014-07-23 江苏物联网研究发展中心 基于rpc协议的集群资源统一管理***
CN104317650A (zh) * 2014-10-10 2015-01-28 北京工业大学 一种面向Map/Reduce型海量数据处理平台的作业调度方法
CN104461752A (zh) * 2014-11-21 2015-03-25 浙江宇视科技有限公司 一种两级故障容错的多媒体分布式任务处理方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107533324A (zh) * 2016-02-04 2018-01-02 株式会社Kmc 生产信息收集***
CN107533324B (zh) * 2016-02-04 2020-06-23 株式会社Kmc 生产信息收集***
CN110431806A (zh) * 2017-04-19 2019-11-08 华为技术有限公司 分布式资源管理中低时延节点本地调度的***和方法
CN110431806B (zh) * 2017-04-19 2021-02-05 华为技术有限公司 分布式资源管理中低时延节点本地调度的***和方法
US11561830B2 (en) 2017-04-19 2023-01-24 Huawei Technologies Co., Ltd. System and method for low latency node local scheduling in distributed resource management
CN106911524A (zh) * 2017-04-27 2017-06-30 紫光华山信息技术有限公司 一种ha实现方法及装置
CN107689889A (zh) * 2017-08-28 2018-02-13 长沙曙通信息科技有限公司 一种集群多节点状态信息维护实现方法
CN109977161A (zh) * 2019-03-28 2019-07-05 上海中通吉网络技术有限公司 presto集群的监控***
CN112612851A (zh) * 2020-12-24 2021-04-06 南京三眼精灵信息技术有限公司 多中心数据同步方法及装置
CN112612851B (zh) * 2020-12-24 2024-03-08 南京三眼精灵信息技术有限公司 多中心数据同步方法及装置
CN112685498A (zh) * 2020-12-28 2021-04-20 紫光云技术有限公司 一种云平台上Redis数据持久化的方法

Also Published As

Publication number Publication date
CN105357042B (zh) 2018-09-07

Similar Documents

Publication Publication Date Title
CN105357042A (zh) 一种高可用集群***及其主节点和从节点
US9635097B2 (en) Cloud computing system and method for managing storage resources therein
US10169167B2 (en) Reduced recovery time in disaster recovery/replication setup with multitier backend storage
US10817386B2 (en) Virtual machine recovery method and virtual machine management device
US9444678B2 (en) Automatic cloud-based disaster recovery system including modifying a copy command based on a copy time threshold
JP5510556B2 (ja) 仮想マシンのストレージスペースおよび物理ホストを管理するための方法およびシステム
US20150234674A1 (en) Method, System and Apparatus for Creating Virtual Machine
CN105187464B (zh) 一种分布式存储***中的数据同步方法、装置及***
EP2954424B1 (en) Method, device, and system for peer-to-peer data replication and method, device, and system for master node switching
CN103412822A (zh) 操作非易失性内存和数据操作的方法和相关装置
CN105635311A (zh) 一种云管理平台中资源池信息同步的方法
CN107577578A (zh) 统计nfs操作字时延的方法、装置、设备以及存储介质
CN109582459A (zh) 应用的托管进程进行迁移的方法及装置
CN111897666A (zh) 用于多进程之间通信的方法、设备及***
CN104793981B (zh) 一种虚拟机集群的在线快照管理方法及装置
CN109271376A (zh) 数据库升级方法、装置、设备及存储介质
CN112685499A (zh) 一种工作业务流的流程数据同步方法、装置及设备
CN114565502A (zh) Gpu资源管理方法、调度方法、装置、电子设备及存储介质
CN104536852B (zh) 数据恢复方法及装置
CN104461779A (zh) 一种分布式数据的存储方法、装置及***
CN116881012A (zh) 一种容器应用垂直扩容方法、装置、设备及可读存储介质
CN111465920B (zh) 远程复制操作期间通过总线接口被写入存储控制器的数据的管理
CN104657240B (zh) 多内核操作***的失效控制方法及装置
CN105988871A (zh) 一种远端内存分配方法、装置和***
CN110309224A (zh) 一种数据复制方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant