CN112527567A - ***容灾方法、装置、设备以及存储介质 - Google Patents

***容灾方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN112527567A
CN112527567A CN202011552051.7A CN202011552051A CN112527567A CN 112527567 A CN112527567 A CN 112527567A CN 202011552051 A CN202011552051 A CN 202011552051A CN 112527567 A CN112527567 A CN 112527567A
Authority
CN
China
Prior art keywords
cluster
backup
configuration information
determining
response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011552051.7A
Other languages
English (en)
Inventor
顾春辉
曹雷
葛又嘉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202011552051.7A priority Critical patent/CN112527567A/zh
Publication of CN112527567A publication Critical patent/CN112527567A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本申请公开了***容灾方法、装置、设备以及存储介质,涉及云计算、小程序技术领域。具体实现方案为:响应于确定***中的主集群故障,确定***中的备份集群是否可用;响应于确定备份集群可用,修改集群配置信息;将修改后的集群配置信息输出给主集群的使用方,以供使用方根据修改后的集群配置信息使用备份集群。本实现方式可以提高***的高可用性。

Description

***容灾方法、装置、设备以及存储介质
技术领域
本申请涉及计算机技术领域,具体涉及云计算、小程序技术领域,尤其涉及***容灾方法、装置、设备以及存储介质。
背景技术
实际应用中,任何一个***在使用过程中,出现机房掉电、网络中断或者软件错误(Bug)现象时,都会存在***不可用的情况。对于分布式存储***,往往两个集群间构建贮备复制关系,即通过一个复制链路将主集群上的数据复制到备份集群上,以应对单一集群出现故障时导致***无法提供服务的问题,保障***的高可用性。
发明内容
提供了一种***容灾方法、装置、设备以及存储介质。
根据第一方面,提供了一种***容灾方法,包括:响应于确定***中的主集群故障,确定所述***中的备份集群是否可用;响应于确定所述备份集群可用,修改集群配置信息;将修改后的集群配置信息输出给所述主集群的使用方,以供所述使用方根据修改后的集群配置信息使用所述备份集群。
根据第二方面,提供了一种***容灾装置,包括:状态确定单元,被配置成响应于确定***中的主集群故障,确定所述***中的备份集群是否可用;信息修改单元,被配置成响应于确定所述备份集群可用,修改集群配置信息;信息输出单元,被配置成将修改后的集群配置信息输出给所述主集群的使用方,以供所述使用方根据修改后的集群配置信息使用所述备份集群。
根据第三方面,提供了一种***容灾电子设备,包括:至少一个计算单元;以及与上述至少一个计算单元通信连接的存储单元;其中,存储单元存储有可被至少一个计算单元执行的指令,上述指令被至少一个计算单元执行,以使至少一个计算单元能够执行如第一方面所描述的方法。
根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,上述计算机指令用于使计算机执行如第一方面所描述的方法。
根据第五方面,一种计算机程序产品,包括计算机程序,上述计算机程序在被计算单元执行时实现如第一方面所描述的方法。
根据本申请的技术,提供了一种***容灾方法,可以在主集群故障时修改***配置信息,并输出给调用主集群的使用方,以供使用方根据***配置信息修改配置,从而切换到可用的备份集群,提高***的高可用性。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请的一个实施例可以应用于其中的示例性***架构图;
图2是根据本申请的***容灾方法的一个实施例的流程图;
图3是根据本申请的***容灾方法的一个应用场景的示意图;
图4是根据本申请的***容灾方法的另一个实施例的流程图;
图5是根据本申请的***容灾装置的一个实施例的结构示意图;
图6是用来实现本申请实施例的***容灾方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的***容灾方法或***容灾装置的实施例的示例性***架构100。
如图1所示,***架构100可以包括***101和调用***提供的服务的调用方102。其中,***101可以包括控制器1011、集群1012和集群1013。控制器1011可以向集群1012和集群1013发送控制指令,以控制集群1012和集群1013执行各种操作,例如进行数据同步等等。集群1012和集群1013中的一者可以为主集群,另一者为备份集群。主集群和备份集群在一定情况下可以进行转换,例如在集群故障时,备份集群可以变为主集群,故障的集群在恢复时可以成为备份集群。为了保证服务的正常提供,集群间可以实时同步数据,或者按照预先设定的规则备份数据。
调用方102可以是各种调用***101提供的服务的电子设备,其通过调用服务可以实现对数据的各种处理。
需要说明的是,控制器1011、集群1012、集群1013以及调用方102可以是硬件,也可以是软件。为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
需要说明的是,本申请实施例所提供的***容灾方法一般由控制器1011执行。相应地,***容灾装置一般设置于控制器1011中。
应该理解,图1中的控制器、集群以及调用方中电子设备的数目仅仅是示意性的。根据实现需要,可以具有任意数目的控制器、集群以及调用方中电子设备。
继续参考图2,示出了根据本申请的***容灾方法的一个实施例的流程200。本实施例的***容灾方法,包括以下步骤:
步骤201,响应于确定***中的主集群故障,确定***中的备份集群是否可用。
本实施例中,***容灾方法的执行主体(例如图1所示的控制器1011)可以实时监测***中主集群的状态。如果检测到主集群故障,可以检测***中的备份集群是否可用。主集群和备份集群可以是配置相同的两个集群,备份集群可以实时从主集群处同步数据,以保证能随时提供服务。
执行主体可以通过各种方式来检测主集群和备份集群的状态,例如通过发送心跳包的方式来检测。具体的,执行主体可以向集群中的各个节点发送心跳包,如果在预设时长内接收到回应消息,则认为该节点可用。如果可用节点的数量大于集群中节点数量的二分之一,则认为集群可用。同理,如果可用节点的数量小于或等于集群中节点数量的二分之一,则认为集群故障。
步骤202,响应于确定备份集群可用,修改集群配置信息。
如果执行主体确定备份集群可用,则可以修改集群配置信息。这里,集群配置信息中可以包括调用集群提供的各种服务的接口、提供各服务的节点的地址等信息。执行主体可以根据备份集群能够提供的服务以及上述服务所需的接口,修改集群配置信息。
步骤203,将修改后的集群配置信息输出给主集群的使用方,以供使用方根据修改后的集群配置信息使用备份集群。
执行主体可以将修改后的集群配置信息输出给主集群的使用方。各使用方在接收到修改后的集群配置信息后,可以修改请求的地址信息或接口信息,以使用备份集群处理请求。
继续参见图3,其示出了根据本申请的***容灾方法的一个应用场景的示意图。在图3的应用场景中,控制器301在检测到主集群302故障后,确定备份集群303可用,则可以修改集群配置信息,并将修改后的集群配置信息发送给主集群302的使用方304。使用方304在接收到修改后的集群配置信息后,修改请求的地址,从而将请求发送至备份集群303。备份集群303在接收到请求后,对请求进行处理。
本申请的上述实施例提供的***容灾方法,可以在主集群故障时修改***配置信息,并输出给调用主集群的使用方,以供使用方根据***配置信息修改配置,从而切换到可用的备份集群,保障了***服务的高可用性。
继续参见图4,其示出了根据本申请的***容灾方法的另一个实施例的流程400。如图4所示,本实施例的方法可以包括以下步骤:
步骤401,控制备份集群实时从主集群处同步数据。
本实施例中,执行主体可以向备份集群发送同步指令。备份集群在接收到上述同步指令后,可以实时地从主集群处同步数据。这样,可以保证数据的一致性。
步骤402,根据主集群中可用节点的数量、主集群中节点的数量以及预设的比例阈值,确定主集群是否故障。
执行主体可以首先确定主集群中的各节点是否可用,统计出可用节点的数量。根据主集群中可用节点的数量、主集群中节点的数量以及预设的比例阈值,确定主集群是否故障。具体的,执行主体可以计算可用节点的数量和主集群中节点的数量的比值。如果上述比例阈值大于预设的比例阈值,则可以认定主集群可用。相反,则认定主集群故障。
可以理解的是,执行主体可以利用同样的方式来检测备份集群是否可用。
步骤403,响应于确定主集群故障,输出第一告警信息;控制备份集群停止从主集群处同步数据;确定备份集群是否可用。
执行主体在确定主集群故障后,可以进行以下操作:输出第一告警信息;控制备份集群停止从主集群处同步数据;确定备份集群是否可用。这里,第一告警信息用于提示技术人员主集群不可用,可以对主集群进行故障诊断或其它处理。在主集群故障后,主集群不会产生正确的数据,则执行主体可以控制备份集群停止从主集群处同步数据。同时执行主体还可以进一步确认备份集群是否可用。
步骤404,响应于确定备份集群可用,获取备份集群的地址信息;根据备份集群的地址信息,修改集群配置信息。
如果备份集群可用,则获取备份集群的地址信息。然后,根据备份集群的地址信息,修改集群配置信息。具体的,上述集群配置信息中包括集群的地址信息,执行主体可以利用备份集群的地址信息替换集群配置信息中的地址信息,实现集群配置信息的修改。
在本实施例的一些可选的实现方式中,执行主体可以将各集群的使用方所需要的地址信息存储在一起(例如存放在固定的电子设备处,该电子设备成为配置中心)。在修改集群配置信息时,执行主体可以从配置中心处获取各使用方所需要的地址信息进行修改。举例来说,使用方A需要主集群中节点a1的地址信息,使用方B需要主集群中节点b1的地址信息。主集群中的节点a1与备份集群中的节点a2对应,主集群中的节点b1与备份集群中的节点b2对应。在修改时,可以将使用方A的集群配置信息中的地址信息修改为备份集群中的节点a2的地址信息,将使用方B的集群配置信息中的地址信息修改为备份集群中的节点b2的地址信息。
步骤405,通过预设的接口将修改后的集群配置信息输出给主集群的使用方,以供使用方根据修改后的集群配置信息使用备份集群。
在修改完集群配置信息后,执行主体可以通过预设的接口将修改后的集群配置信息输出给主集群的使用方。本实施例中,配置中心还可以设置有与各使用方交互的接口。执行主体可以直接调用上述接口将修改后的集群配置信息输出给各使用方,以供使用方根据修改后的集群配置信息使用备份集群。
可以理解的是,在切换到备份集群后,备份集群可以作为新的主集群进行使用,故障的主集群恢复后,可以作为新的主集群的备份集群。
步骤406,响应于确定主集群故障恢复,控制主集群从备份集群处同步数据。
本实施例中,如果主集群故障恢复,执行主体可以向主集群发送控制指令,以使主集群从备份集群处同步数据,这里的同步可以是增量备份,以保证两个集群数据的一致性。
本申请的上述实施例提供的***容灾方法,可以保持主集群和备份集群的一致性,还可以通过预设的接口直接与主集群的各使用方进行交互,提高集群配置信息送达的效率。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种***容灾装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的用于输出信息装置500包括:状态确定单元501、信息修改单元502和信息输出单元503。
状态确定单元501,被配置成响应于确定***中的主集群故障,确定***中的备份集群是否可用。
信息修改单元502,被配置成响应于确定备份集群可用,修改集群配置信息。
信息输出单元503,被配置成将修改后的集群配置信息输出给主集群的使用方,以供使用方根据修改后的集群配置信息使用备份集群。
在本实施例的一些可选的实现方式中,信息修改单元502可以进一步被配置成:获取备份集群的地址信息;根据备份集群的地址信息,修改集群配置信息。
在本实施例的一些可选的实现方式中,信息输出单元503可以进一步被配置成:通过预设的接口将修改后的集群配置信息输出给主集群的使用方。
在本实施例的一些可选的实现方式中,装置500还可以进一步包括图5中未示出的状态检测单元,被配置成:根据主集群中可用节点的数量、主集群中节点的数量以及预设的比例阈值,确定主集群是否故障。
在本实施例的一些可选的实现方式中,装置500还可以进一步包括图5中未示出的告警信息输出单元,被配置成:响应于确定主集群故障,输出第一告警信息;响应于确定备份集群故障,输出第二告警信息。
在本实施例的一些可选的实现方式中,装置500还可以进一步包括图5中未示出的同步控制单元,被配置成:控制备份集群实时从主集群处同步数据;响应于确定主集群故障,控制备份集群停止从主集群处同步数据。
在本实施例的一些可选的实现方式中,同步控制单元可以进一步被配置成:响应于确定主集群故障恢复,控制主集群从备份集群处同步数据。
应当理解,***容灾装置500中记载的单元501至单元503分别与参考图2中描述的方法中的各个步骤相对应。由此,上文针对***容灾方法描述的操作和特征同样适用于装置500及其中包含的单元,在此不再赘述。
根据本申请的实施例,本申请还提供了还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图6示出了根据本申请实施例的执行***容灾方法的电子设备600的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图6所示,设备600包括计算单元601,其可以根据存储在只读存储单元(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储单元(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。I/O接口(输入/输出接口)605也连接至总线604。
设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号计算单元(DSP)、以及任何适当的计算单元、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如***容灾方法。例如,在一些实施例中,***容灾方法可被实现为计算机软件程序,其被有形地包含于机器可读存储介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到电子设备600上。当计算机程序加载到RAM 603并由计算单元601执行时,可以执行上文描述的***容灾方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行***容灾方法。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程计算单元的可编程***上执行和/或解释,该可编程计算单元可以是专用或者通用可编程计算单元,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。上述程序代码可以封装成计算机程序产品。这些程序代码或计算机程序产品可以提供给通用计算机、专用计算机或其他可编程数据处理装置的计算单元或控制器,使得程序代码当由计算单元601执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本申请的上下文中,机器可读存储介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读存储介质可以是机器可读信号存储介质或机器可读存储介质。机器可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储单元(RAM)、只读存储单元(ROM)、可擦除可编程只读存储单元(EPROM或快闪存储单元)、光纤、便捷式紧凑盘只读存储单元(CD-ROM)、光学存储设备、磁存储设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务(“Virtual Private Server”,或简称“VPS”)中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请的保护范围之内。

Claims (17)

1.一种***容灾方法,包括:
响应于确定***中的主集群故障,确定所述***中的备份集群是否可用;
响应于确定所述备份集群可用,修改集群配置信息;
将修改后的集群配置信息输出给所述主集群的使用方,以供所述使用方根据修改后的集群配置信息使用所述备份集群。
2.根据权利要求1所述的方法,其中,所述修改集群配置信息,包括:
获取所述备份集群的地址信息;
根据所述备份集群的地址信息,修改所述集群配置信息。
3.根据权利要求1所述的方法,其中,所述将修改后的集群配置信息输出给所述主集群的使用方,包括:
通过预设的接口将修改后的集群配置信息输出给所述主集群的使用方。
4.根据权利要求1所述的方法,其中,所述方法还包括:
根据所述主集群中可用节点的数量、所述主集群中节点的数量以及预设的比例阈值,确定所述主集群是否故障。
5.根据权利要求1所述的方法,其中,所述方法还包括:
响应于确定所述主集群故障,输出第一告警信息;
响应于确定所述备份集群故障,输出第二告警信息。
6.根据权利要求1所述的方法,其中,所述方法还包括:
控制所述备份集群实时从所述主集群处同步数据;
响应于确定所述主集群故障,控制所述备份集群停止从所述主集群处同步数据。
7.根据权利要求6所述的方法,其中,所述方法还包括:
响应于确定所述主集群故障恢复,控制所述主集群从所述备份集群处同步数据。
8.一种***容灾装置,包括:
状态确定单元,被配置成响应于确定***中的主集群故障,确定所述***中的备份集群是否可用;
信息修改单元,被配置成响应于确定所述备份集群可用,修改集群配置信息;
信息输出单元,被配置成将修改后的集群配置信息输出给所述主集群的使用方,以供所述使用方根据修改后的集群配置信息使用所述备份集群。
9.根据权利要求8所述的装置,其中,所述信息修改单元进一步被配置成:
获取所述备份集群的地址信息;
根据所述备份集群的地址信息,修改所述集群配置信息。
10.根据权利要求8所述的装置,其中,所述信息输出单元进一步被配置成:
通过预设的接口将修改后的集群配置信息输出给所述主集群的使用方。
11.根据权利要求8所述的装置,其中,所述装置还包括状态检测单元,被配置成:
根据所述主集群中可用节点的数量、所述主集群中节点的数量以及预设的比例阈值,确定所述主集群是否故障。
12.根据权利要求8所述的装置,其中,所述装置还包括告警信息输出单元,被配置成:
响应于确定所述主集群故障,输出第一告警信息;
响应于确定所述备份集群故障,输出第二告警信息。
13.根据权利要求8所述的装置,其中,所述装置还包括同步控制单元,被配置成:
控制所述备份集群实时从所述主集群处同步数据;
响应于确定所述主集群故障,控制所述备份集群停止从所述主集群处同步数据。
14.根据权利要求13所述的装置,其中,所述同步控制单元进一步被配置成:
响应于确定所述主集群故障恢复,控制所述主集群从所述备份集群处同步数据。
15.一种***容灾电子设备,包括:
至少一个计算单元;以及
与所述至少一个计算单元通信连接的存储单元;其中,
所述存储单元存储有可被所述至少一个计算单元执行的指令,所述指令被所述至少一个计算单元执行,以使所述至少一个计算单元能够执行权利要求1-7中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的方法。
17.一种计算机程序产品,包括计算机程序,所述计算机程序在被计算单元执行时实现根据权利要求1-7中任一项所述的方法。
CN202011552051.7A 2020-12-24 2020-12-24 ***容灾方法、装置、设备以及存储介质 Pending CN112527567A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011552051.7A CN112527567A (zh) 2020-12-24 2020-12-24 ***容灾方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011552051.7A CN112527567A (zh) 2020-12-24 2020-12-24 ***容灾方法、装置、设备以及存储介质

Publications (1)

Publication Number Publication Date
CN112527567A true CN112527567A (zh) 2021-03-19

Family

ID=74976294

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011552051.7A Pending CN112527567A (zh) 2020-12-24 2020-12-24 ***容灾方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN112527567A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254274A (zh) * 2021-04-21 2021-08-13 北京大米科技有限公司 消息处理方法、装置、存储介质以及服务器
CN114598594A (zh) * 2022-03-14 2022-06-07 上海道客网络科技有限公司 一种多集群下应用故障的处理方法、***、介质和设备
CN114780293A (zh) * 2022-04-26 2022-07-22 北京科杰科技有限公司 基于hadoop的异地双活容灾方法、装置、设备和可读存储介质
WO2022227719A1 (zh) * 2021-04-26 2022-11-03 华为云计算技术有限公司 数据备份方法、***及相关设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106570007A (zh) * 2015-10-09 2017-04-19 阿里巴巴集团控股有限公司 用于分布式缓存***数据同步的方法和设备
CN109828863A (zh) * 2019-01-10 2019-05-31 网联清算有限公司 数据容灾方法、装置、存储介质及计算机设备
CN111176888A (zh) * 2018-11-13 2020-05-19 浙江宇视科技有限公司 云存储的容灾方法、装置及***
CN111949444A (zh) * 2020-06-24 2020-11-17 武汉烽火众智数字技术有限责任公司 一种基于分布式服务集群的数据备份与恢复***及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106570007A (zh) * 2015-10-09 2017-04-19 阿里巴巴集团控股有限公司 用于分布式缓存***数据同步的方法和设备
CN111176888A (zh) * 2018-11-13 2020-05-19 浙江宇视科技有限公司 云存储的容灾方法、装置及***
CN109828863A (zh) * 2019-01-10 2019-05-31 网联清算有限公司 数据容灾方法、装置、存储介质及计算机设备
CN111949444A (zh) * 2020-06-24 2020-11-17 武汉烽火众智数字技术有限责任公司 一种基于分布式服务集群的数据备份与恢复***及方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254274A (zh) * 2021-04-21 2021-08-13 北京大米科技有限公司 消息处理方法、装置、存储介质以及服务器
WO2022227719A1 (zh) * 2021-04-26 2022-11-03 华为云计算技术有限公司 数据备份方法、***及相关设备
CN114598594A (zh) * 2022-03-14 2022-06-07 上海道客网络科技有限公司 一种多集群下应用故障的处理方法、***、介质和设备
CN114598594B (zh) * 2022-03-14 2023-08-11 上海道客网络科技有限公司 一种多集群下应用故障的处理方法、***、介质和设备
CN114780293A (zh) * 2022-04-26 2022-07-22 北京科杰科技有限公司 基于hadoop的异地双活容灾方法、装置、设备和可读存储介质

Similar Documents

Publication Publication Date Title
CN112527567A (zh) ***容灾方法、装置、设备以及存储介质
CN106330475B (zh) 一种通信***中管理主备节点的方法和装置及高可用集群
CN111385107B (zh) 一种服务器的主备切换处理方法及装置
CN109286529B (zh) 一种恢复RabbitMQ网络分区的方法及***
CN104579791A (zh) 一种实现k-db主备自动切换容灾集群的方法
CN113254205B (zh) 负载均衡***、方法、装置、电子设备及存储介质
CN109245926B (zh) 智能网卡、智能网卡***及控制方法
CN106874142B (zh) 一种实时数据容错处理方法及***
JP2017536624A (ja) スナップショット処理方法および関係付けられたデバイス
CN113535480A (zh) 数据灾备***、方法
CN111813605A (zh) 容灾方法、平台、电子设备以及介质
CN111049690B (zh) 设备故障监测处理方法、装置、设备及存储介质
CN115396296A (zh) 业务处理方法、装置、电子设备及计算机可读存储介质
CN112965847B (zh) 微服务架构的故障处理方法、装置、设备以及存储介质
CN110377487A (zh) 一种处理高可用集群脑裂的方法及装置
CN102487332B (zh) 故障处理方法、装置和***
CN113438111A (zh) 基于Raft分布式恢复RabbitMQ网络分区的方法及应用
CN115563028B (zh) 一种数据缓存方法、装置、设备和存储介质
CN109219105B (zh) 路由切换方法以及路由切换***
JP2010231257A (ja) 高可用性システム、高可用性システムの対障害対策方法
JP2015114952A (ja) ネットワークシステム、監視制御装置およびソフトウェア検証方法
CN110413686B (zh) 一种数据写入方法、装置、设备及存储介质
CN107590032A (zh) 存储集群故障转移的方法及存储集群***
CN114301763A (zh) 分布式集群故障的处理方法及***、电子设备及存储介质
CN109240608B (zh) 一种配置信息同步方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination