CN111209140A - 一种主备双节点数据库崩溃的恢复方法及装置 - Google Patents

一种主备双节点数据库崩溃的恢复方法及装置 Download PDF

Info

Publication number
CN111209140A
CN111209140A CN201911391020.5A CN201911391020A CN111209140A CN 111209140 A CN111209140 A CN 111209140A CN 201911391020 A CN201911391020 A CN 201911391020A CN 111209140 A CN111209140 A CN 111209140A
Authority
CN
China
Prior art keywords
database
service
backup
data
crash
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911391020.5A
Other languages
English (en)
Other versions
CN111209140B (zh
Inventor
潘景基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN201911391020.5A priority Critical patent/CN111209140B/zh
Publication of CN111209140A publication Critical patent/CN111209140A/zh
Application granted granted Critical
Publication of CN111209140B publication Critical patent/CN111209140B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种主备双节点数据库崩溃的恢复方法及装置,包括对数据库备份路径配置参数进行预处理;将ics‑manager服务从主备切换中分离出来;根据数据库服务mariadb的状态以及数据库完整性备份的情况,进行数据库的恢复操作。本发明根据数据库服务及数据库完整性备份的情况,分别进行数据库的恢复操作。在***及数据磁盘正常情况下数据恢复,解决了虚拟化***用户的持续可用性。保证了HCI虚拟化***数据的完整性,增强了***运行的高可维护性。

Description

一种主备双节点数据库崩溃的恢复方法及装置
技术领域
本发明涉及虚拟化技术领域,具体地说是一种主备双节点数据库崩溃的恢复方法及装置。
背景技术
云计算是继互联网、计算机后在信息时代有一种新的革新,具有很强的扩展性和需要性,可以为用户提供一种全新的体验,云计算的核心是可以将很多的计算机资源协调在一起,使用户通过网络就可以获取到无限的资源,同时获取的资源不受时间和空间的限制。
云计算技术中的虚拟化技术,目前发展尤为快速,面对此发展机遇,浪潮推出的浪潮超融合一体机部署InCloud Rail虚拟化***即HCI***,它是一种企业级服务器虚拟化解决方案,通过对底层物理资源的融合、分配与管理,将静态、复杂的IT环境转变为更动态、易于管理的虚拟数据中心,提高了资源交付的敏捷性、灵活性和资源的使用效率,帮助企业创建高性能、可扩展、可管理、灵活的服务器虚拟化基础架构,提供优质的虚拟数据中心服务。
针对浪潮InCloud Rail超融合架构***即HCI***,对于有些用户在未按照使用手册人为误操作或由于突发异常状况情况下,可能会触发***异常,从而导致环境崩溃。尤其是只针对HCI***主备双节点环境的iCenter在***及数据磁盘正常情况下的数据恢复,即数据库或数据库文件因特殊原因损坏,需要得到恢复。
发明内容
本发明实施例中提供了一种主备双节点数据库崩溃的恢复方法及装置,以解决现有技术中针对主备双节点HCI***异常崩溃时的数据恢复的问题。
为了解决上述技术问题,本发明实施例公开了如下技术方案:
本发明第一方面提供了一种主备双节点数据库崩溃的恢复方法,所述方法包括以下步骤:
对数据库备份路径配置参数进行预处理;
将ics-manager服务从主备切换中分离出来;
根据数据库服务mariadb的状态以及数据库完整性备份的情况,进行数据库的恢复操作。
进一步地,所述根据数据库服务mariadb的状态以及数据库完整性备份的情况,进行数据库的恢复操作具体为:
判断数据库服务mariadb的状态是否正常;
若是,则判断数据库是否存在完整性备份,若存在完整性备份,则直接启用数据恢复操作,若不存在完整性备份,则根据当前环境进行数据恢复操作;
若否,则服务崩溃,对崩溃服务进行排查分析。
进一步地,所述直接启用数据恢复操作的具体为:
删除数据库;
进入数据库备份目录,解压备份数据库文件;
将备份数据导入数据库,带数据库恢复正常后重启ics-manager服务;
将ics-manager服务添加至heartbeat集群。
进一步地,所述删除数据库包括删除数据库名称,删除数据库neutron以及删除mysql.proc表。
进一步地,所述对崩溃服务进行排查分析的具体过程为:
对数据库数据目录和数据库日志进行备份;
通过数据库配置文件获取配置信息,并查看服务日志;
根据服务日志,调用问题解决库,进行问题配对并恢复。
本发明第二方面提供了一种主备双节点数据库崩溃的恢复装置,所述装置包括:
数据预处理模块,对数据库备份路径配置参数进行预处理;
服务分离模块,将ics-manager服务从主备切换中分离出来;
数据恢复模块,根据数据库服务mariadb的状态以及数据库完整性备份的情况,进行数据库的恢复操作。
进一步地,所述数据恢复模块包括:
状态判断单元,用于判断数据库服务mariadb的状态是否正常;
备份完整性判断单元,用于判断数据库是否存在完整性备份;
第一数据恢复单元,用于在数据库服务状态正常,且备份完整时,进行数据恢复操作;
第二数据恢复单元,用于在数据库服务状态正常,且备份不完整时,根据当前环境,进行数据恢复操作;
分析排查单元,用于在数据库服务状态不正常时,对崩溃服务进行排查分析。
进一步地,所述分析排查单元包括:
数据备份子单元,对数据库数据目录和数据库日志进行备份;
信息获取子单元,通过数据库配置文件获取配置信息,并查看服务日志;
数据恢复子单元,根据服务日志,调用问题解决库,进行问题配对并恢复。
进一步地,所述第一数据恢复单元包括:
第一数据处理子单元,用于删除数据库;
第二数据处理子单元,进入数据库备份目录,解压备份数据库文件;
服务恢复子单元,将备份数据导入数据库,带数据库恢复正常后重启ics-manager服务;
服务配置子单元,将ics-manager服务添加至heartbeat集群。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
根据数据库服务及数据库完整性备份的情况,分别进行数据库的恢复操作。在***及数据磁盘正常情况下数据恢复,解决了虚拟化***用户的持续可用性。保证了HCI虚拟化***数据的完整性,增强了***运行的高可维护性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明所述方法的流程示意图;
图2是本发明所述方法实施例的流程示意图;
图3是本发明所述装置的结构示意图。
具体实施方式
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
如图1所示,本发明主备双节点数据库崩溃的恢复方法,包括以下步骤:
S1,对数据库备份路径配置参数进行预处理;
S2,将ics-manager服务从主备切换中分离出来;
S3,根据数据库服务mariadb的状态以及数据库完整性备份的情况,进行数据库的恢复操作。
步骤S1中,保留iCenter***数据库备份路径配置参数,路径为/var/backup/。
步骤S2中执行heartbeatsrv-disable ics-manager命令,将ics-manager服务从主备切换中分离出来。
如图2所示,步骤S3中的实现过程为:执行systemctl status mariadb,根据状态结果判断数据库服务mariadb的状态是否正常;为active(running)则说明mariadb服务正常,反之,mariadb服务不正常。若服务状态正常,则查看/var/backup备份文件,判断数据库是否存在完整性备份,若存在完整性备份,则直接启用数据恢复操作,若不存在完整性备份,则根据当前环境进行数据恢复操作;若服务状态不正常,则服务崩溃,对崩溃服务进行排查分析。
直接启用数据恢复操作的具体为:分别执行删除数据库名称(drop databasedatabasename),删除数据库neutron(drop database neutron)以及删除mysql.proc表(delete from mysql.proc)进行删除数据库操作;进入/var/backup数据库备份目录,采用gunzip命令gunzip xxx.sql.gz解压备份数据库文件;通过执行mysql–uroot–ppasswordmysql<xxx.sql,将备份数据导入数据库,带数据库恢复正常后,通过执行systemtctlrestartics-manager,重启ics-manager服务;通过heartbeatsrv–enableics-manager,将ics-manager服务添加至heartbeat集群。
对崩溃服务进行排查分析的具体过程为:对数据库数据目录datadir=/var/mysql、log-bin=/var/mysql/xxx.log和数据库日志进行备份;通过数据库配置文件获取配置信息,并查看/var/log/mariadb/mariadb.log服务日志;根据服务日志,调用问题解决库,进行问题配对并恢复。
如图3所示,本发明主备双节点数据库崩溃的恢复装置包括数据预处理模块1、服务分离模块2和数据恢复模块3。数据预处理模块1对数据库备份路径配置参数进行预处理;服务分离模块2将ics-manager服务从主备切换中分离出来;数据恢复模块3根据数据库服务mariadb的状态以及数据库完整性备份的情况,进行数据库的恢复操作。
数据恢复模块3包括状态判断单元31、备份完整性判断单元32、第一数据恢复单元33、第二数据恢复单元34和分析排查单元35。状态判断单元31用于判断数据库服务mariadb的状态是否正常;备份完整性判断单元32用于判断数据库是否存在完整性备份;第一数据恢复单元33用于在数据库服务状态正常,且备份完整时,进行数据恢复操作;第二数据恢复单元33用于在数据库服务状态正常,且备份不完整时,根据当前环境,进行数据恢复操作;分析排查单元34用于在数据库服务状态不正常时,对崩溃服务进行排查分析。
分析排查单元35包括数据备份子单元351、信息获取子单元352和数据恢复子单元353。数据备份子单元351对数据库数据目录和数据库日志进行备份;信息获取子单元352通过数据库配置文件获取配置信息,并查看服务日志;数据恢复子单元353根据服务日志,调用问题解决库,进行问题配对并恢复。
第一数据恢复单元33包括第一数据处理子单元331、第二数据处理子单元332、服务恢复子单元333和服务配置子单元334。第一数据处理子单元331用于删除数据库;第二数据处理子单元332进入数据库备份目录,解压备份数据库文件;服务恢复子单元333将备份数据导入数据库,带数据库恢复正常后重启ics-manager服务;服务配置子单元334将ics-manager服务添加至heartbeat集群。
以上所述只是本发明的优选实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也被视为本发明的保护范围。

Claims (9)

1.一种主备双节点数据库崩溃的恢复方法,其特征是,所述方法包括以下步骤:
对数据库备份路径配置参数进行预处理;
将ics-manager服务从主备切换中分离出来;
根据数据库服务mariadb的状态以及数据库完整性备份的情况,进行数据库的恢复操作。
2.根据权利要求1所述的主备双节点数据库崩溃的恢复方法,其特征是,所述根据数据库服务mariadb的状态以及数据库完整性备份的情况,进行数据库的恢复操作具体为:
判断数据库服务mariadb的状态是否正常;
若是,则判断数据库是否存在完整性备份,若存在完整性备份,则直接启用数据恢复操作,若不存在完整性备份,则根据当前环境进行数据恢复操作;
若否,则服务崩溃,对崩溃服务进行排查分析。
3.根据权利要求2所述的主备双节点数据库崩溃的恢复方法,其特征是,所述直接启用数据恢复操作的具体为:
删除数据库;
进入数据库备份目录,解压备份数据库文件;
将备份数据导入数据库,带数据库恢复正常后重启ics-manager服务;
将ics-manager服务添加至heartbeat集群。
4.根据权利要求3所述的主备双节点数据库崩溃的恢复方法,其特征是,所述删除数据库包括删除数据库名称,删除数据库neutron以及删除mysql.proc表。
5.根据权利要求2所述的主备双节点数据库崩溃的恢复方法,其特征是,所述对崩溃服务进行排查分析的具体过程为:
对数据库数据目录和数据库日志进行备份;
通过数据库配置文件获取配置信息,并查看服务日志;
根据服务日志,调用问题解决库,进行问题配对并恢复。
6.一种主备双节点数据库崩溃的恢复装置,其特征是,所述装置包括:
数据预处理模块,对数据库备份路径配置参数进行预处理;
服务分离模块,将ics-manager服务从主备切换中分离出来;
数据恢复模块,根据数据库服务mariadb的状态以及数据库完整性备份的情况,进行数据库的恢复操作。
7.根据权利要求6所述的主备双节点数据库崩溃的恢复装置,其特征是,所述数据恢复模块包括:
状态判断单元,用于判断数据库服务mariadb的状态是否正常;
备份完整性判断单元,用于判断数据库是否存在完整性备份;
第一数据恢复单元,用于在数据库服务状态正常,且备份完整时,进行数据恢复操作;
第二数据恢复单元,用于在数据库服务状态正常,且备份不完整时,根据当前环境,进行数据恢复操作;
分析排查单元,用于在数据库服务状态不正常时,对崩溃服务进行排查分析。
8.根据权利要求7所述的主备双节点数据库崩溃的恢复装置,其特征是,所述分析排查单元包括:
数据备份子单元,对数据库数据目录和数据库日志进行备份;
信息获取子单元,通过数据库配置文件获取配置信息,并查看服务日志;
数据恢复子单元,根据服务日志,调用问题解决库,进行问题配对并恢复。
9.根据权利要求7所述的主备双节点数据库崩溃的恢复装置,其特征是,所述第一数据恢复单元包括:
第一数据处理子单元,用于删除数据库;
第二数据处理子单元,进入数据库备份目录,解压备份数据库文件;
服务恢复子单元,将备份数据导入数据库,带数据库恢复正常后重启ics-manager服务;
服务配置子单元,将ics-manager服务添加至heartbeat集群。
CN201911391020.5A 2019-12-30 2019-12-30 一种主备双节点数据库崩溃的恢复方法及装置 Active CN111209140B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911391020.5A CN111209140B (zh) 2019-12-30 2019-12-30 一种主备双节点数据库崩溃的恢复方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911391020.5A CN111209140B (zh) 2019-12-30 2019-12-30 一种主备双节点数据库崩溃的恢复方法及装置

Publications (2)

Publication Number Publication Date
CN111209140A true CN111209140A (zh) 2020-05-29
CN111209140B CN111209140B (zh) 2023-01-06

Family

ID=70787744

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911391020.5A Active CN111209140B (zh) 2019-12-30 2019-12-30 一种主备双节点数据库崩溃的恢复方法及装置

Country Status (1)

Country Link
CN (1) CN111209140B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407045A (zh) * 2016-09-29 2017-02-15 郑州云海信息技术有限公司 一种数据灾难恢复方法、***及服务器虚拟化***
CN107291787A (zh) * 2016-04-13 2017-10-24 中兴通讯股份有限公司 主备数据库切换方法和装置
US10282256B1 (en) * 2013-06-15 2019-05-07 Veritas Technologies Llc System and method to enable deduplication engine to sustain operational continuity

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10282256B1 (en) * 2013-06-15 2019-05-07 Veritas Technologies Llc System and method to enable deduplication engine to sustain operational continuity
CN107291787A (zh) * 2016-04-13 2017-10-24 中兴通讯股份有限公司 主备数据库切换方法和装置
CN106407045A (zh) * 2016-09-29 2017-02-15 郑州云海信息技术有限公司 一种数据灾难恢复方法、***及服务器虚拟化***

Also Published As

Publication number Publication date
CN111209140B (zh) 2023-01-06

Similar Documents

Publication Publication Date Title
US8688642B2 (en) Systems and methods for managing application availability
US20220114067A1 (en) Systems and methods for instantiation of virtual machines from backups
US10152382B2 (en) Method and system for monitoring virtual machine cluster
EP3754514B1 (en) Distributed database cluster system, data synchronization method and storage medium
US9052935B1 (en) Systems and methods for managing affinity rules in virtual-machine environments
US20190163580A1 (en) In-Place Cloud Instance Restore
US9170888B2 (en) Methods and apparatus for virtual machine recovery
CN111090699A (zh) 业务数据的同步方法和装置、存储介质、电子装置
US9098439B2 (en) Providing a fault tolerant system in a loosely-coupled cluster environment using application checkpoints and logs
US20130042139A1 (en) Systems and methods for fault recovery in multi-tier applications
US9275060B1 (en) Method and system for using high availability attributes to define data protection plans
US9342390B2 (en) Cluster management in a shared nothing cluster
US8984325B2 (en) Systems and methods for disaster recovery of multi-tier applications
US9002798B1 (en) Systems and methods for remedying corrupt backup images of host devices
US20130117231A1 (en) Application protection through a combined functionality failure manager
CN105183591A (zh) 一种高可用集群的实现方法及***
US10318385B2 (en) Service recovery using snapshots and interservice messages
US8650160B1 (en) Systems and methods for restoring multi-tier applications
CN111209140B (zh) 一种主备双节点数据库崩溃的恢复方法及装置
CN109117317A (zh) 一种集群故障恢复方法和相关装置
CN106445746A (zh) 一种面向应急接替的容灾备份方法及装置
CN112506682A (zh) 业务服务器异常救济方法、装置和计算机可读存储介质
CN108959547A (zh) 一种pv快照分布式数据库集群恢复方法
CN103197992B (zh) GlusterFS脑裂的自动化恢复方法
US9146868B1 (en) Systems and methods for eliminating inconsistencies between backing stores and caches

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant