CN112948484A - 分布式数据库***和数据灾备演练方法 - Google Patents

分布式数据库***和数据灾备演练方法 Download PDF

Info

Publication number
CN112948484A
CN112948484A CN201911267233.7A CN201911267233A CN112948484A CN 112948484 A CN112948484 A CN 112948484A CN 201911267233 A CN201911267233 A CN 201911267233A CN 112948484 A CN112948484 A CN 112948484A
Authority
CN
China
Prior art keywords
remote
drilling
database cluster
management node
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911267233.7A
Other languages
English (en)
Inventor
张鹏
闫珂
丁岩
刘志文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinzhuan Xinke Co Ltd
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201911267233.7A priority Critical patent/CN112948484A/zh
Priority to EP20897975.7A priority patent/EP4060514A4/en
Priority to US17/783,826 priority patent/US20230004465A1/en
Priority to JP2022535701A priority patent/JP2023505879A/ja
Priority to PCT/CN2020/129428 priority patent/WO2021115043A1/zh
Publication of CN112948484A publication Critical patent/CN112948484A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/275Synchronous replication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1435Saving, restoring, recovering or retrying at system level using file system or storage system metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2097Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3664Environments for testing or debugging software
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3688Test management for test execution, e.g. scheduling of test suites
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/80Database-specific techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/82Solving problems relating to consistency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/84Using snapshots, i.e. a logical point-in-time copy of the data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Hardware Redundancy (AREA)

Abstract

本申请公开了一种分布式数据库和数据灾备演练方法,所述分布式数据库包括本地管理节点、本地数据库集群、异地管理节点、异地演练数据库集群和异地同步数据库集群;其中,所述本地数据库集群、所述异地同步数据库集群均与所述本地管理节点连接;所述异地演练数据库集群用于:与所述异地管理节点建立第一连接;接收业务层发送的测试业务。本申请实施例的技术方案,可应用到所有多地多中心环境中,实现对异地机房在模拟的灾备环境下的运行能力、业务处理能力进行测试,达到数据灾备模拟演练目的。

Description

分布式数据库***和数据灾备演练方法
技术领域
本申请涉及数据库技术领域,特别是涉及一种分布式数据库***以及数据灾备演练方法。
背景技术
长期以来,金融级分布式数据库采用多地多中心组网架构来保证其服务的稳定可靠性以及各组件的高可用性。当本地机房和同城机房同时发生故障或异常时,业务会被要求迁移到异地进行。例如某银行金融机构的主机房在A地,备用机房在B地,正常情况下B地机房同步A地机房的业务数据,以对主机房的业务数据进行备份。当A地机房发生故障或异常时,要求B地机房能顺利接管A地主机房的业务。灾备环境下,异地机房的运作能力和业务处理能力是保证数据库稳定服务的必要因素。而对异地机房进行模拟演练便是为了验证异地机房在灾备环境下的运作能力和业务处理能力。在灾备演练方面,目前业界缺少***的、普适的、便捷的灾备演练方案。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
一方面,本申请实施例提供了分布式数据库、数据灾备演练方法、装置和计算机可读存储介质,可实现对异地机房在模拟的灾备环境下的运行能力、业务处理能力进行测试,达到数据灾备模拟演练目的。
另一方面,本申请实施例提供了一种分布式数据库***,包括本地管理节点、本地数据库集群、异地管理节点、异地演练数据库集群和异地同步数据库集群;其中,
所述本地数据库集群、所述异地同步数据库集群均与所述本地管理节点连接;
所述异地演练数据库集群用于:
与所述异地管理节点建立第一连接;
接收业务层发送的测试业务,所述测试业务用于对所述异地管理节点和所述异地演练数据库集群进行模拟演练。
另一方面,本申请实施例提供了一种数据灾备演练方法,包括:
异地管理节点与异地演练数据库集群建立第一连接,以通过所述异地演练数据库集群接收业务层发送的测试业务进行模拟演练。
另一方面,本申请实施例提供了一种数据灾备演练方法,包括:
异地演练数据库集群与异地管理节点建立第一连接;
所述异地演练数据库集群接收业务层发送的测试业务,所述测试业务用于对所述异地管理节点和所述异地演练数据库集群进行模拟演练。
另一方面,本申请实施例提供了一种装置,包括:
存储器,用于存储程序;
处理器,用于执行所述存储器存储的程序,当所述处理器执行所述存储器存储的程序时,所述处理器用于执行如上所述的任一种数据灾备演练方法。
再一方面,本申请实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行上述的任一种数据灾备演练方法。
基于本申请实施例的技术方案,在异地机房部署异地演练数据库集群和异地同步数据库集群,异地演练数据库集群用于在模拟的灾备环境下,接收业务层发送的测试业务。通过该测试业务能够对异地管理节点、异地演练数据库集群进行模拟演练,以测试异地机房在模拟灾备环境下的运作能力和业务处理能力。模拟演练过程中,异地同步数据库集群仍正常同步本地机房数据,以确保数据的安全。本申请所提出的演练方案具有普适性,可应用到所有多地多中心环境中,采用此演练方案可以***评估异地机房的可靠性和高可用性。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本申请技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
图1是本申请实施例提供的一种分布式数据库***的架构示意图;
图2是本申请实施例提供的另一种分布式数据库***的架构示意图;
图3是本申请实施例提供的一种数据灾备演练方法的流程图;
图4是本申请实施例提供的另一种数据灾备演练方法的流程图;
图5是本申请实施例提供的一种装置的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
应了解,在本申请实施例的描述中,多个(或多项)的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到“第一”、“第二”等只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
本申请实施例提供了分布式数据库、数据灾备演练方法、装置和计算机可读存储介质,可实现对异地机房在模拟的灾备环境下的运行能力、业务处理能力进行测试,达到数据灾备模拟演练目的。
图1示出了本申请实施例提供的一种分布式数据库***的架构示意图。如图1所示,该分布式数据库***100包括本地管理节点111、本地数据库集群112、异地管理节点121、异地演练数据库集群123和异地同步数据库集群122。其中,本地管理节点111和本地数据库集群112位于本地机房110,异地管理节点121、异地演练数据库集群123和异地同步数据库集群122位于异地机房120。
应理解,本申请实施例的分布式数据库***100可以在本地机房110和异地机房120分别设置多个数据库集群。示例性的,如图1所示,本地机房110和异地机房120均采用一主两备的架构,即本地机房110和异地机房120分别包括三个数据库集群,其中一个数据库集群作为主库处理来自业务层的业务,另外两个数据库集群作为从库对业务数据进行同步备份,以确保数据安全性。
还应理解,每个数据库集群包括多个数据库。在实际应用时,每个数据库可以用于并发执行一个事务分解的不同进程,从而提高整个***的计算效率或者存储能力。
本地管理节点111、异地管理节点121负责对各自所属的数据库集群进行管理,这里的管理主要包括元数据管理、事务管理和运维管理。
在本申请实施例中,本地数据库集群112、异地同步数据库集群122均与本地管理节点111连接,异地同步数据库集群122在本地管理节点111的管理流程下,复制本地数据库集群112的业务数据,实现异地同步数据库集群122对本地数据库集群112的数据进行同步。
本申请实施例的异地演练数据库集群123在演练情况下,与异地管理节点121建立第一连接,接收业务层发送的测试业务,该测试业务可用于对异地管理节点和异地演练数据库集群进行模拟演练;在非演练情况下,与本地管理节点111建立第二连接,在本地管理节点111的管理流程下,复制本地数据库集群112的业务数据,实现与异地同步数据库集群122一并对本地数据库集群112的数据进行同步。
示例性的,正常情况下,异地演练数据库集群123和异地同步数据库集群122均与本地管理节点111连接,同步本地数据库集群112的数据。当演练任务被触发后,异地演练数据库集群123与本地管理节点111之间的第二连接断开,形成与本地机房110的网络隔离,构建出孤岛环境,从而达到模拟灾备环境的目的。异地演练数据库集群123与本地管理节点111之间的第二连接断开后,异地演练数据库集群123与异地管理节点121建立第一连接,以接收业务层发送的测试业务进行模拟演练。
可选的,在图2所示的另一种分布式数据库***100的架构示意图中,本地管理节点111配置有本地MDS(Meta Data Service,元数据管理器)组件113、本地CM(ClouderaManager,集群管理器)组件114和本地GTM(Global Transaction Manager,全局事务管理器)组件115;异地管理节点121配置有异地MDS组件124、异地CM组件125和异地GTM组件126。本地数据库集群112配置有本地DB Agent(Data Base Agent,数据库代理)116,异地同步数据库集群122和异地演练数据库集群123分别配置有异地DB Agent组件127。
其中,MDS组件负责存储数据库中的一系列元数据。CM组件用于对所属的数据库集群进行管理,包括数据库的主从切换操作。GTM组件负责对数据库集群的事务进行管理,确保分布式数据一致性。DB Agent组件为数据库监控代理,与管理节点连接,负责执行管理节点的集群管理流程。
本申请实施例的技术方案,在异地机房120部署异地演练数据库集群123和异地同步数据库集群122。异地演练数据库集群123用于在模拟的灾备环境下,接收业务层发送的测试业务。通过该测试业务对异地管理节点121、异地演练数据库集群123进行模拟演练,以测试异地机房120在模拟环境下的运作能力和业务处理能力。模拟演练过程中,异地同步数据库集群122仍正常同步本地机房110的数据,以确保数据的安全。本申请实施例所提出的演练方案具有普适性,可应用到所有多地多中心环境中,采用此演练方案可以***评估异地机房的可靠性和高可用性。
图3示出了本申请实施例提供的一种数据灾备演练方法的流程图。该方法可应用于图1、图2所示的分布式数据库100中实施。如图3所示,该方法包括但不限于如下步骤。
步骤S201,异地管理节点与异地演练数据库集群建立第一连接。
示例性的,本申请实施例中,当演练任务被触发后,异地管理节点与异地演练数据库集群相互建立第一连接,达到模拟灾备环境的目的。
步骤S202,异地演练数据库集群接收业务层发送的测试业务。
示例性的,测试业务可以由管理员人工触发,通过业务层将测试业务发送给异地演练数据库集群,异地演练数据库集群在异地管理节点的管理流程下执行该测试业务,由此实现对异地管理节点和异地演练数据库集群的模拟演练。
模拟演练的结果可以通过查看演练过程中任意时刻的快照是否满足强一致性,来对异地机房的运作能力和业务处理能力进行评估。
图4示出了本申请实施例提供的另一种数据灾备演练方法的流程图。如图4所示,该方法包括但不限于如下步骤。
步骤S301,异地管理节点与异地演练数据库集群建立第一连接。
本申请实施例中,在非演练情况下,异地演练数据库集群与本地管理节点建立第二连接,在本地管理节点的管理流程下,复制本地数据库集群的业务数据,与异地同步数据库集群一并对本地数据库集群的数据进行同步。
当演练任务被触发后,异地演练数据库集群与本地管理节点之间的第二连接断开,形成与本地机房的网络隔离。此时异地管理节点与异地演练数据库集群相互建立第一连接,构建出孤岛环境,达到模拟灾备环境的目的。
示例性的,在所述异地演练数据库集群与本地管理节点之间的第二连接断开的情况下,异地管理节点可以通过修改DNS配置,与异地演练数据库集群建立第一连接。
应了解,通过异地演练数据库集群进行演练时,应当确保异地机房的主库不存在于异地演练数据库集群中,以免影响正常业务的处理。
在主库不存在于异地演练数据库集群的情况下可以直接执行步骤S301,,异地管理节点与异地演练数据库集群建立第一连接。
如果主库存在于异地演练数据库集群,则应从异地同步数据库集群中选择新的主库,对存在于异地演练数据库集群的主库和从异地同步数据库集群中选出新的主库进行主从切换操作,切换成功后,再执行步骤S301,异地管理节点与异地演练数据库集群建立第一连接。
以下为对主从切换操作进行示例性的说明。
异地MDS组件将切换主库消息解析并透明传输给异地CM组件进行处理。异地CM组件接收到异地MDS组件透明传输的切换主库消息后,为了防止原来的主库或其他地方的从库连到新主库会产生回滚操作,此时应通过查看binlog(二进制日志)信息,确保被选中的新主库的GTID(Global Transaction ID,全局事务ID)值与原来的主库的GTID值一致才可切换,切换成功后,异地CM组件返回切换成功消息至异地MDS组件,以通知异地MDS组件修改元数据。
步骤S302,异地管理节点对异地元数据进行备份。
异地管理节点对异地元数据进行备份处理,以便演练完成后对备份的异地元数据进行还原,恢复至演练前的环境。
在一些实施例中,异地管理节点对异地元数据进行备份,可以通过异地MDS组件实施,将异地管理节点的元数据备份至异地MDS组件中。
步骤S303,异地管理节点清除非异地演练数据库集群的元数据,并更新异地演练数据库集群的元数据。
示例性的,可以通过调用元数据清除脚本将非异地演练数据库集群的元数据进行删除,并修改异地演练数据库集群元数据的主从信息。在一些示例中,步骤S303可以由异地管理节点下的异地MDS组件实施。
步骤S304,异地管理节点向异地演练数据库集群发送备份通知信息。
第一连接建立后,异地管理节点向异地演练数据库集群发送备份通知信息,通知异地演练数据库集群对业务数据进行备份。
步骤S305,异地演练数据库集群接收异地管理节点发送的备份通知信息,并响应于备份通知信息,进行数据备份。
异地演练数据库集群接收到异地管理节点发送的备份通知信息后,响应于该备份通知信息,对存储在异地演练数据库集群中的数据进行备份。
在一些示例中,步骤S305中的对存储在异地演练数据库集群中的业务数据进行备份,可以由异地DB Agent组件实施。
步骤S306,异地管理节点向异地演练数据库集群发送一致性回滚指令,以使异地演练数据库集群的数据库执行回滚操作。
根据分布式数据事务处理的特点,将一个完整的事务分割成多个操作,并分派给多个数据库处理。以甲转账给乙这一事务为例,可以由数据库A执行扣减甲的账户余额,由数据库B执行增加乙的账户余额的操作。数据库A、数据库B处理该事务的结果可能为操作成功、操作失败或者不确定,假如数据库A、数据库B在处理该事务的过程中收到演练任务,此时,其中一个数据库已经成功处理该事务,另一个数据库操作失败,或者还在处理中而不确定操作是否成功,如果此时马上进行演练,可能会因数据不一致导致演练结果出现偏差。
可选的,为了确保演练过程中,异地演练数据库集群中数据的一致性,可以在演练前,由异地管理节点向异地演练数据库集群发送一致性回滚指令,以使异地演练数据库集群的数据库执行回滚操作,使异地演练数据库集群的数据库满足数据一致性。
步骤S307,异地演练数据库集群接收异地管理节点发送的一致性回滚指令;响应于一致性回滚指令,异地演练数据库集群的数据库执行回滚操作。
示例性的,在分布式数据库***中,每个事务均有由GTM组件分配的GTID,由此可以通过查看各数据库日志所记录的已执行事务的GTID,来获取各个数据库的一致性时刻。当获取到一致性时刻,异地演练数据库集群的数据库响应于一致性回滚指令,一起执行回滚至一致性时刻的操作,由此达到保证演练时数据库的数据一致的目的。
步骤S308,异地演练数据库集群接收业务层发送的测试业务。
测试业务可以由管理员人工触发,通过业务层将测试业务发送给异地演练数据库集群,异地演练数据库集群在异地管理节点的管理流程下执行该测试业务,由此实现对异地管理节点和异地演练数据库集群的模拟演练。
模拟演练的结果可以通过查看演练过程中任意时刻的快照是否满足强一致性,来对异地机房的运作能力和业务处理能力进行评估。
示例性的,异地演练数据库集群接收到异地管理节点发送的测试业务,对测试业务进行处理,达到模拟演练目的。模拟演练的结果可以通过查看演练过程中任意时刻的快照是否满足强一致性,来对异地机房的运作能力和业务处理能力进行评估。
步骤S309,演练完成后,异地管理节点对备份的异地元数据进行还原。
异地管理节点对备份的异地元数据进行还原,使异地管理节点的数据恢复到演练开始前最后一次备份的时刻。
步骤S310,异地管理节点发送还原通知信息至异地演练数据库集群。
异地管理节点发送还原通知信息至异地演练数据库集群,以通知异地演练数据库集群恢复至演练前的环境。
步骤S311,异地演练数据库集群接收异地管理节点发送的还原通知信息;响应于还原通知信息,还原备份的数据,以及重新与本地管理节点建立第二连接。
异地演练数据库集群接收到异地管理节点发送的还原通知信息后,还原演练前备份的数据,重新与本地管理节点的第二连接,并与异地同步数据库集群恢复主备数据库关系,由此恢复至演练前的环境。
应了解,本申请实施例提供的方法的各种实施方式可以任意进行组合,以实现不同的技术效果。
基于本申请实施例提供的技术方案,能够便捷地模拟灾备环境,构建灾备环境和恢复演练前环境均可通过脚本一键完成。还可直观地评估灾备环境中异地机房的业务处理能力以及组件运行的状态,同时在模拟演练过程中异地同步数据集群的正常业务和异地演练数据集群的模拟业务并行,互不影响。本申请研究所提出的演练方案具有普适性,可应用到所有多地多中心环境中,采用此演练方案可以***验证分布式数据库的可靠性和高可用性。
图5示出了本申请实施例提供的装置400。如图5所示,该装置400包括但不限于:
存储器420,用于存储程序;
处理器410,用于执行存储器420存储的程序,当处理器410执行存储器420存储的程序时,处理器410用于执行上述的数据灾备演练方法。
处理器410和存储器420可以通过总线或者其他方式连接。
存储器420作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序,如本申请实施例描述的数据灾备演练方法。处理器410通过运行存储在存储器420中的非暂态软件程序以及指令,从而实现上述的数据灾备演练方法。
存储器420可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储执行上述的数据灾备演练方法。此外,存储器420可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器420可选包括相对于处理器410远程设置的存储器,这些远程存储器可以通过网络连接至该装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实现上述的数据灾备演练方法所需的非暂态软件程序以及指令存储在存储器420中,当被一个或者多个处理器410执行时,执行上述的数据灾备演练方法,例如,执行图3中描述的方法步骤S201,图3中描述的方法步骤S201和S202,图4中描述的方法步骤S301至S303、S304、S306、S309和S310,图4中描述的方法步骤S301、S305、S307、S308和S311。
本申请实施例还提供了计算机可读存储介质,存储有计算机可执行指令,计算机可执行指令用于执行上述的数据灾备演练方法。
在一实施例中,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个控制处理器410执行,例如,被上述装置400中的一个处理器410执行,可使得上述一个或多个处理器410执行上述的数据灾备演练方法,例如,执行图3中描述的方法步骤S201,图3中描述的方法步骤S201和S202,图4中描述的方法步骤S301至S303、S304、S306、S309和S310,图4中描述的方法步骤S301、S305、S307、S308和S311。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、***可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包括计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
以上是对本申请的较佳实施进行了具体说明,但本申请并不局限于上述实施方式,熟悉本领域的技术人员在不违背本申请精神的共享条件下还可作出种种等同的变形或替换,这些等同的变形或替换均包括在本申请权利要求所限定的范围内。

Claims (19)

1.一种分布式数据库***,其特征在于,包括本地管理节点、本地数据库集群、异地管理节点、异地演练数据库集群和异地同步数据库集群;其中,
所述本地数据库集群、所述异地同步数据库集群均与所述本地管理节点连接;
所述异地演练数据库集群用于:
与所述异地管理节点建立第一连接;
接收业务层发送的测试业务,所述测试业务用于对所述异地管理节点和所述异地演练数据库集群进行模拟演练。
2.根据权利要求1所述的***,其特征在于,所述异地演练数据库集群还用于:
非演练情况下,与所述本地管理节点建立第二连接。
3.根据权利要求1所述的***,其特征在于,所述异地演练数据库集群还用于:
当与所述异地管理节点建立第一连接,接收所述异地管理节点发送的备份通知信息;
响应于所述备份通知信息,对异地演练数据库集群数据进行备份。
4.根据权利要求3所述的***,其特征在于,所述异地演练数据库集群还用于:
接收所述异地管理节点在演练完成后发送的还原通知信息;
响应于所述还原通知信息,还原备份的异地演练数据库集群数据。
5.根据权利要求1所述的***,其特征在于,所述异地演练数据库集群还用于:
接收所述异地管理节点发送的一致性回滚指令;
响应于所述一致性回滚指令,所述异地演练数据库集群的数据库执行回滚操作。
6.一种数据灾备演练方法,包括:
异地管理节点与异地演练数据库集群建立第一连接,以通过所述异地演练数据库集群接收业务层发送的测试业务进行模拟演练。
7.根据权利要求6所述的方法,其特征在于,所述异地管理节点与所述异地演练数据库集群建立第一连接,包括:
在所述异地演练数据库集群与本地管理节点之间的第二连接断开的情况下,所述异地管理节点与所述异地演练数据库集群建立第一连接。
8.根据权利要求6或7所述的方法,其特征在于,所述异地管理节点与所述异地演练数据库集群建立第一连接,包括如下之一:
在主库存在于所述异地演练数据库集群的情况下,从异地同步数据库集群中选择新的主库,对所述主库和所述新的主库进行切换操作,切换成功后,所述异地管理节点与异地演练数据库集群建立第一连接;
在所述主库不存在于所述异地演练数据库集群的情况下,所述异地管理节点与异地演练数据库集群建立第一连接。
9.根据权利要求6所述的方法,其特征在于,还包括:
当所述异地管理节点与所述异地演练数据库集群建立第一连接,所述异地管理节点还对异地元数据进行备份;
演练完成后,所述异地管理节点对备份的异地元数据进行还原,并发送还原通知信息至所述异地演练数据库集群。
10.根据权利要求9所述的方法,其特征在于,还包括:
在所述异地管理节点对异地元数据完成备份的情况下,所述管理节点清除非异地演练数据库集群的元数据,并更新所述异地演练数据库集群的元数据。
11.根据权利要求6所述的方法,其特征在于,还包括:
当所述异地管理节点与所述异地演练数据库集群建立第一连接,所述异地管理节点向所述异地演练数据库集群发送备份通知信息。
12.根据权利要求6所述的方法,其特征在于,还包括:
当所述异地管理节点与所述异地演练数据库集群建立第一连接,所述异地管理节点向所述异地演练数据库集群发送一致性回滚指令,以使所述异地演练数据库集群的数据库执行回滚操作。
13.一种数据灾备演练方法,包括:
异地演练数据库集群与异地管理节点建立第一连接;
所述异地演练数据库集群接收业务层发送的测试业务,所述测试业务用于对所述异地管理节点和所述异地演练数据库集群进行模拟演练。
14.根据权利要求13所述的方法,其特征在于,还包括:
非演练情况下,所述异地演练数据库集群与所述本地管理节点建立第二连接。
15.根据权利要求13所述的方法,其特征在于,还包括:
当所述异地演练数据库集群与所述异地管理节点建立第一连接,所述异地演练数据库集群接收所述异地管理节点发送的备份通知信息;
响应于所述备份通知信息,所述异地演练数据库集群对异地演练数据库集群数据进行备份。
16.根据权利要求15所述的***,其特征在于,还包括:
所述异地演练数据库集群接收所述异地管理节点在演练完成后发送的还原通知信息;
响应于所述还原通知信息,所述异地演练数据库集群还原备份的异地演练数据库集群数据。
17.根据权利要求13所述的***,其特征在于,还包括:
所述异地演练数据库集群接收所述异地管理节点发送的一致性回滚指令;
响应于所述一致性回滚指令,所述异地演练数据库集群的数据库执行回滚操作。
18.一种装置,其特征在于,包括:
存储器,用于存储程序;
处理器,用于执行所述存储器存储的程序,当所述处理器执行所述存储器存储的程序时,所述处理器用于执行:
如权利要求6至12中任一项所述的方法;或者
如权利要求13至17中任一项所述的方法。
19.一种计算机可读存储介质,其特征在于,存储有计算机可执行指令,所述计算机可执行指令用于执行:
如权利要求6至12中任一项所述的方法;或者
如权利要求13至17中任一项所述的方法。
CN201911267233.7A 2019-12-11 2019-12-11 分布式数据库***和数据灾备演练方法 Pending CN112948484A (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201911267233.7A CN112948484A (zh) 2019-12-11 2019-12-11 分布式数据库***和数据灾备演练方法
EP20897975.7A EP4060514A4 (en) 2019-12-11 2020-11-17 DISTRIBUTED DATABASE SYSTEM AND BACKUP DRILL METHODS IN DATA DISASTERS
US17/783,826 US20230004465A1 (en) 2019-12-11 2020-11-17 Distributed database system and data disaster backup drilling method
JP2022535701A JP2023505879A (ja) 2019-12-11 2020-11-17 分散型データベースシステム及びデータ災害バックアップ訓練方法
PCT/CN2020/129428 WO2021115043A1 (zh) 2019-12-11 2020-11-17 分布式数据库***和数据灾备演练方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911267233.7A CN112948484A (zh) 2019-12-11 2019-12-11 分布式数据库***和数据灾备演练方法

Publications (1)

Publication Number Publication Date
CN112948484A true CN112948484A (zh) 2021-06-11

Family

ID=76233985

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911267233.7A Pending CN112948484A (zh) 2019-12-11 2019-12-11 分布式数据库***和数据灾备演练方法

Country Status (5)

Country Link
US (1) US20230004465A1 (zh)
EP (1) EP4060514A4 (zh)
JP (1) JP2023505879A (zh)
CN (1) CN112948484A (zh)
WO (1) WO2021115043A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114205210A (zh) * 2021-12-14 2022-03-18 北京字节跳动网络技术有限公司 一种故障演练方法、装置、电子设备及储存介质
WO2023231185A1 (zh) * 2022-05-31 2023-12-07 ***数智科技有限公司 一种基于人工智能的分布式灾备演练数据预警方法及***

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101262370A (zh) * 2008-04-17 2008-09-10 华为技术有限公司 容灾演练的方法、装置和服务器
CN101957783A (zh) * 2009-07-13 2011-01-26 升东网络科技发展(上海)有限公司 数据库异地备份***及方法
CN107203440A (zh) * 2017-05-27 2017-09-26 郑州云海信息技术有限公司 一种一体化实时备份容灾***及搭建方法
CN107766502A (zh) * 2017-10-20 2018-03-06 上海新炬网络信息技术股份有限公司 一种Oracle RAC数据库容灾切换演练方法
CN109471755A (zh) * 2018-11-14 2019-03-15 江苏鸿信***集成有限公司 一种基于云计算的同城异地灾备的方法及其***
CN110209556A (zh) * 2018-04-04 2019-09-06 腾讯科技(深圳)有限公司 容灾测试方法、支付方法、装置、介质及服务设备

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7668880B1 (en) * 2007-05-15 2010-02-23 Jim Carroll Offsite computer file backup system providing rapid recovery and method thereof
CN102142998A (zh) * 2011-03-22 2011-08-03 辽宁国兴科技有限公司 一种基于异地在线数据容灾的备份交互方法及执行该方法的***
CN103095569B (zh) * 2013-01-10 2016-03-09 中国农业银行股份有限公司上海市分行 一种高冗余低成本的热容灾广域网架构及其实现方法
CN103984309B (zh) * 2014-05-09 2017-02-15 浙江中烟工业有限责任公司 一种具有容灾功能的卷烟生产***及其容灾演练方法
US10146636B1 (en) * 2015-01-15 2018-12-04 Veritas Technologies Llc Disaster recovery rehearsals
US10402275B2 (en) * 2015-01-28 2019-09-03 DataStax Backup to and restore from an offsite backup location
US10402276B2 (en) * 2015-01-28 2019-09-03 DataStax Backup to and clone from an offsite backup location
CN106254100B (zh) * 2016-07-27 2019-04-16 腾讯科技(深圳)有限公司 一种数据容灾方法、装置和***
CN109726046B (zh) * 2018-11-23 2021-01-08 网联清算有限公司 机房切换方法及切换装置
US11537959B2 (en) * 2020-06-16 2022-12-27 Commvault Systems, Inc. Dynamic computing progress tracker
US11936757B1 (en) * 2022-04-29 2024-03-19 Rafay Systems, Inc. Pull-based on-demand application deployment to edge node

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101262370A (zh) * 2008-04-17 2008-09-10 华为技术有限公司 容灾演练的方法、装置和服务器
CN101957783A (zh) * 2009-07-13 2011-01-26 升东网络科技发展(上海)有限公司 数据库异地备份***及方法
CN107203440A (zh) * 2017-05-27 2017-09-26 郑州云海信息技术有限公司 一种一体化实时备份容灾***及搭建方法
CN107766502A (zh) * 2017-10-20 2018-03-06 上海新炬网络信息技术股份有限公司 一种Oracle RAC数据库容灾切换演练方法
CN110209556A (zh) * 2018-04-04 2019-09-06 腾讯科技(深圳)有限公司 容灾测试方法、支付方法、装置、介质及服务设备
CN109471755A (zh) * 2018-11-14 2019-03-15 江苏鸿信***集成有限公司 一种基于云计算的同城异地灾备的方法及其***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114205210A (zh) * 2021-12-14 2022-03-18 北京字节跳动网络技术有限公司 一种故障演练方法、装置、电子设备及储存介质
WO2023231185A1 (zh) * 2022-05-31 2023-12-07 ***数智科技有限公司 一种基于人工智能的分布式灾备演练数据预警方法及***

Also Published As

Publication number Publication date
US20230004465A1 (en) 2023-01-05
JP2023505879A (ja) 2023-02-13
EP4060514A4 (en) 2023-01-25
WO2021115043A1 (zh) 2021-06-17
EP4060514A1 (en) 2022-09-21

Similar Documents

Publication Publication Date Title
US7428657B2 (en) Method for rolling back from snapshot with log
US7594138B2 (en) System and method of error recovery for backup applications
US8615578B2 (en) Using a standby data storage system to detect the health of a cluster of data storage servers
CN111327467A (zh) 一种服务器***及其容灾备份方法和相关设备
US20120109919A1 (en) High availability database management system and database management method using same
KR20110044858A (ko) 데이터 센터들에 걸쳐 데이터 서버들내 데이터 무결정의 유지
US20170308446A1 (en) System and method for disaster recovery of cloud applications
CN101741536A (zh) 数据级容灾方法、***和生产中心节点
CN106484565A (zh) 多数据中心间的数据同步方法及相关设备
CN106603279A (zh) 一种容灾方法和容灾***
CN112380062A (zh) 一种基于***备份点多次快速恢复***的方法及***
WO2021115043A1 (zh) 分布式数据库***和数据灾备演练方法
CN115658390A (zh) 容器容灾方法、***、装置、设备及计算机可读存储介质
CN102457400B (zh) 一种防止磁盘镜像资源发生脑裂的方法
CN112929438B (zh) 一种双站点分布式数据库的业务处理方法及装置
CN114356650A (zh) 数据备份方法、装置、设备、***及存储介质
CN116185697B (zh) 容器集群管理方法、装置、***、电子设备及存储介质
CN112052127B (zh) 一种用于双机热备环境的数据同步方法及装置
CN105323271B (zh) 一种云计算***以及云计算***的处理方法和装置
CN109117317A (zh) 一种集群故障恢复方法和相关装置
WO2018076696A1 (zh) 一种数据同步方法及带外管理设备
CN107526652B (zh) 一种数据同步方法及存储设备
CN113297134B (zh) 数据处理***及数据处理方法、装置、电子设备
CN105630626A (zh) 事务备份处理方法及装置
CN105159794A (zh) 镜像实现***和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220124

Address after: 100176 floor 18, building 8, courtyard 10, KEGU 1st Street, Beijing Economic and Technological Development Zone, Daxing District, Beijing (Yizhuang group, high-end industrial area of Beijing Pilot Free Trade Zone)

Applicant after: Jinzhuan Xinke Co.,Ltd.

Address before: 518057 Zhongxing building, science and technology south road, Nanshan District hi tech Industrial Park, Guangdong, Shenzhen

Applicant before: ZTE Corp.

REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40054531

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210611