CN111367711A - 一种基于超融合数据安全容灾方法 - Google Patents

一种基于超融合数据安全容灾方法 Download PDF

Info

Publication number
CN111367711A
CN111367711A CN201811601627.7A CN201811601627A CN111367711A CN 111367711 A CN111367711 A CN 111367711A CN 201811601627 A CN201811601627 A CN 201811601627A CN 111367711 A CN111367711 A CN 111367711A
Authority
CN
China
Prior art keywords
super
data
fusion
disaster recovery
cloud
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811601627.7A
Other languages
English (en)
Inventor
陈建锋
封文祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Cai Jie Information Technology Co ltd
Original Assignee
Guangzhou Cai Jie Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Cai Jie Information Technology Co ltd filed Critical Guangzhou Cai Jie Information Technology Co ltd
Priority to CN201811601627.7A priority Critical patent/CN111367711A/zh
Publication of CN111367711A publication Critical patent/CN111367711A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供了一种基于超融合数据安全容灾方法,包括业务***、超融合一体机、云存储、计算机;包括以下步骤:S1、将业务***设置于云存储上;S2、采用虚拟化和分布式存储架构,通过超融合一体机与计算机构建资源池;S3、至少配置一台计算机设置同等运行环境;S4、通过虚拟化网络对业务***与各个对应的分层模块,进行连接和安全隔离;S5、业务***的任一分层模块当前操作***或数据出现异常故障时,数据经加密传输方式在云存储备份,同时自动切换备用计算机继续运作。本发明所公开的一个方面,综合本地超融合、云端数据加密容灾模式进行构建关键业务运行环境,提供安全、可靠、稳定的关键业务保障与数据异地上云容灾综合解决方案。

Description

一种基于超融合数据安全容灾方法
技术领域
本发明涉及硬件扩展技术领域,具体涉及一种基于超融合数据安全容灾方法。
背景技术
统的物理设备服务,存在管理分散,可扩展性不高,IO性能不足,业务可靠性无法更大程度上保障,超融合是通过软件定义基础架构整合计算、存储、网络和虚拟化资源。超融合基础架构的目标是提供更为简易的方式,它通过软件定义存储和服务器虚拟化的整合,以替代传统SAN存储的方式来建设数据中心。超融合更注重基于低成本的X86 服务器来达到数据的管理和控制。从而更大程度上保障关键业务与数据的高可用无故障运行。
然而,目前市面上关键业务的安全保障与数据存储具有以下缺点:
1)对应硬件环境老化、性能低下,IO性能严重不足
2)单一性物理设备的稳定性不足,传统的双机备份方式存在业务短暂性中断的问题
3)管理分散,可扩展性不高、数据安全与可靠性不强
4)后续业务***数据量和业务访问人数的增加,很快会面临性能瓶颈的问题
5)日常运维工作量大,且需要较专业的技术人员做日常维护。
不难看出,现有技术还存在一定的缺陷。
发明内容
本发明所公开的一个方面,通过综合本地超融合(可利旧)、云端数据加密容灾模式进行构建关键业务运行环境,提供安全、可靠、稳定的关键业务保障与数据异地上云容灾综合解决方案,并且,对旧硬件资源重新加以利用,提高企业效率、节省经营成本。
为达到上述目的,本发明提供如下的技术方案:
一种基于超融合数据安全容灾方法,包括业务***、一台以上超融合一体机、云存储、及两台以上计算机;包括以下步骤:
S1、将业务***设置于云存储上;
S2、采用虚拟化和分布式存储架构,通过超融合一体机与计算机构建资源池;
S3、至少配置一台计算机设置同等运行环境,作为备用;
S4、通过虚拟化网络对业务***与各个对应的分层模块,进行连接和安全隔离;
S5、业务***的任一分层模块当前操作***或数据出现异常故障时,数据经加密传输方式在云存储备份,同时自动切换备用计算机继续运作。
进一步地,步骤S1与S2并行进行。
进一步地,其特征在于,两台以上计算机可异地设置。
进一步地,还包括利旧存储网关、及若干存储设备,通过利旧存储网关将若干存储设备与资源池连接。
本发明所公开的一个方面,通过综合本地超融合(可利旧)、云端数据加密容灾模式进行构建关键业务运行环境,提供安全、可靠、稳定的关键业务保障与数据异地上云容灾综合解决方案,并且,对旧硬件资源重新加以利用,提高企业效率、节省经营成本。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述。需要说明的是,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
1、一种基于超融合数据安全容灾方法,包括业务***、一台以上超融合一体机、云存储、及两台以上计算机;包括以下步骤:
S1、将业务***设置于云存储上;
S2、采用虚拟化和分布式存储架构,通过超融合一体机与计算机构建资源池;
S3、至少配置一台计算机设置同等运行环境,作为备用;
S4、通过虚拟化网络对业务***与各个对应的分层模块,进行连接和安全隔离;
S5、业务***的任一分层模块当前操作***或数据出现异常故障时,数据经加密传输方式在云存储备份,同时自动切换备用计算机继续运作。
上述步骤S2在本地超融合环境设计为关键业务服务提供稳定、可靠、可扩展、安全高效的数据容灾存储服务。为上层应用提供去中心化且可弹的基础架构支撑,在软件层面基于软件定义一切则准则,使用虚拟化和分布式存储等技术,实现分布式的资源调度,分布式架构将所有的资源池化,从而实现单点性能瓶颈的消除、去中心化、无上限扩展。
S5使业务***在当前操作***或数据出现异常故障时,无感知自动切换,数据同时经加密传输方式在异地云上做备份容灾,确保业务不中断与数据不掉失。
以本地超融合(可利旧)+云端数据加密容灾模式进行构建关键业务运行环境。构建安全、可靠、稳定的关键业务保障与数据异地上云容灾综合解决方案,即采用超融合一体机X台(视业务需求配置数量),将业务***进行虚拟化,迁移至云平台中,通过虚拟化网络对业务***,各个对应的分层模块,进行连接和安全隔离。通过虚拟存储组件,可以无需借助外置存储,借助每台一体机自带的磁盘,构建统一的虚拟存储资源池,满足业务***改造对数据容量和高IO性能的需求,并能实现业务的增长和平台性能的扩展实现线性对应,并可以结合实际情况,对现有的存储设备进行利旧处理。
具体的控制节点部署如下:
install命令实现控制节点的部署,join命令实现容器节点的部署。
部署主控节点
#bash-c"$(docker run--rm daocloud.io/daocloud/CJY install)"
部署副控节点
#bash-c"$(docker run--rm daocloud.io/daocloud/CJY install--force-pull--replica--replica-controller MASTER_CONTROLLER_IP)"
部署容器节点
#bash-c"$(docker run--rm daocloud.io/daocloud/CJY join --force-pullMASTER_CONTROLLER_IP)"
三种类型的节点对象使用三条命令部署即可,同样的节点类型命令可复用。需要注意的是MASTER_CONTROLLER_IP为主控节点的IP地址。
常见的故障有网络中断、掉电、服务器宕机、硬盘故障等,Ceph 能够容忍这些故障,并进行自动修复,保证数据的可靠性和***可用性。
Monitors是Ceph管家,维护着Ceph的全局状态。Monitors的功能和zookeeper类似,它们使用Quorum和Paxos算法去建立全局状态的共识。
OSDs可以进行自动修复,而且是并行修复。
OSD之间有心跳检测,当OSD A检测到OSD B没有回应时,会报告给Monitors说OSDB无法连接,则Monitors给OSD B标记为down 状态,并更新OSD Map。当过了M秒之后还是无法连接到OSD B,则 Monitors给OSD B标记为out状态(表明OSD B不能工作),并更新OSDMap。
当某个PG对应的OSD set中有一个OSD被标记为down时(假如是 Primary被标记为down,则某个Replica会成为新的Primary,并处理所有读写object请求),则该PG处于active+degraded状态,也就是当前PG有效的副本数是N-1。
过了M秒之后,假如还是无法连接该OSD,则它被标记为out,Ceph 会重新计算PG到OSD set的映射(当有新的OSD加入到集群时,也会重新计算所有PG到OSD set的映射),以此保证PG的有效副本数是N。
新OSD set的Primary先从旧的OSD set中收集PG log,得到一份AuthoritativeHistory(完整的、全序的操作序列),并让其他 Replicas同意这份Authoritative History(也就是其他Replicas对 PG的所有objects的状态达成一致),这个过程叫做Peering。
当Peering过程完成之后,PG进入active+recoverying状态, Primary会迁移和同步那些降级的objects到所有的replicas上,保证这些objects的副本数为N。
把Object分成组,这降低了需要追踪和处理metadata的数量(在全局的层面上,我们不需要追踪和处理每个object的metadata和 placement,只需要管理PG的metadata就可以了。PG的数量级远远低于object的数量级)。
增加PG的数量可以均衡每个OSD的负载,提高并行度。
分隔故障域,提高数据的可靠性。
当Primary收到Object的写请求时,它负责把数据发送给其他 Replicas,只要这个数据被保存在所有的OSD上时,Primary才应答 Object的写请求,这保证了副本的一致性。
数据多副本。可配置的per-pool副本策略和故障域布局,支持强一致性。
没有单点故障。可以忍受许多种故障场景;防止脑裂;单个组件可以滚动升级并在线替换。
所有故障的检测和自动恢复。恢复不需要人工介入,在恢复期间,可以保持正常的数据访问。
并行恢复。并行的恢复机制极大的降低了数据恢复时间,提高数据的可靠性。
自管理。容易扩展、升级、替换。当组件发生故障时,自动进行数据的重新复制。当组件发生变化时(添加/删除),自动进行数据的重分布。
作为上述实施例的另一种变形,步骤S1与S2并行进行。
作为上述实施例的另一种变形,两台以上计算机可异地设置。
作为上述实施例的另一种变形,还包括利旧存储网关、及若干存储设备,通过利旧存储网关将若干存储设备与资源池连接。
本发明所公开的一个方面,通过综合本地超融合(可利旧)、云端数据加密容灾模式进行构建关键业务运行环境,提供安全、可靠、稳定的关键业务保障与数据异地上云容灾综合解决方案,并且,对旧硬件资源重新加以利用,提高企业效率、节省经营成本。
以上所述实施例仅表达了本发明的一种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (4)

1.一种基于超融合数据安全容灾方法,包括业务***、一台以上超融合一体机、云存储、及两台以上计算机;其特征在于,包括以下步骤:
S1、将业务***设置于云存储上;
S2、采用虚拟化和分布式存储架构,通过超融合一体机与计算机构建资源池;
S3、至少配置一台计算机设置同等运行环境,作为备用;
S4、通过虚拟化网络对业务***与各个对应的分层模块,进行连接和安全隔离;
S5、业务***的任一分层模块当前操作***或数据出现异常故障时,数据经加密传输方式在云存储备份,同时自动切换备用计算机继续运作。
2.根据权利要求1所述的基于超融合数据安全容灾方法,其特征在于,步骤S1与S2并行进行。
3.根据权利要求1或2任一权利要求所述的基于超融合数据安全容灾方法,其特征在于,两台以上计算机可异地设置。
4.根据权利要求3所述的基于超融合数据安全容灾方法,其特征在于,还包括利旧存储网关、及若干存储设备,通过利旧存储网关将若干存储设备与资源池连接。
CN201811601627.7A 2018-12-26 2018-12-26 一种基于超融合数据安全容灾方法 Pending CN111367711A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811601627.7A CN111367711A (zh) 2018-12-26 2018-12-26 一种基于超融合数据安全容灾方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811601627.7A CN111367711A (zh) 2018-12-26 2018-12-26 一种基于超融合数据安全容灾方法

Publications (1)

Publication Number Publication Date
CN111367711A true CN111367711A (zh) 2020-07-03

Family

ID=71208480

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811601627.7A Pending CN111367711A (zh) 2018-12-26 2018-12-26 一种基于超融合数据安全容灾方法

Country Status (1)

Country Link
CN (1) CN111367711A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112131185A (zh) * 2020-09-22 2020-12-25 江苏安超云软件有限公司 一种超融合分布式存储节点内服务高可用方法及装置
CN112995335A (zh) * 2021-04-07 2021-06-18 上海道客网络科技有限公司 一种位置感知的容器调度优化***及方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112131185A (zh) * 2020-09-22 2020-12-25 江苏安超云软件有限公司 一种超融合分布式存储节点内服务高可用方法及装置
CN112131185B (zh) * 2020-09-22 2022-08-02 江苏安超云软件有限公司 一种超融合分布式存储节点内服务高可用方法及装置
CN112995335A (zh) * 2021-04-07 2021-06-18 上海道客网络科技有限公司 一种位置感知的容器调度优化***及方法
CN112995335B (zh) * 2021-04-07 2022-09-23 上海道客网络科技有限公司 一种位置感知的容器调度优化***及方法

Similar Documents

Publication Publication Date Title
US9785691B2 (en) Method and apparatus for sequencing transactions globally in a distributed database cluster
CN102640108B (zh) 已复制数据的监控
US7318095B2 (en) Data fail-over for a multi-computer system
CN102656565B (zh) 已复制数据的故障切换和恢复的方法和***
US8856091B2 (en) Method and apparatus for sequencing transactions globally in distributed database cluster
US9280428B2 (en) Method for designing a hyper-visor cluster that does not require a shared storage device
US8688773B2 (en) System and method for dynamically enabling an application for business continuity
US11953999B2 (en) Technique for efficient data failover in a multi-site data replication environment
US8539087B2 (en) System and method to define, visualize and manage a composite service group in a high-availability disaster recovery environment
US20070078982A1 (en) Application of virtual servers to high availability and disaster recovery soultions
US20030204772A1 (en) System and method for concurrent logical device swapping
KR20110044858A (ko) 데이터 센터들에 걸쳐 데이터 서버들내 데이터 무결정의 유지
CN110912991A (zh) 一种基于超融合双节点高可用的实现方法
CN111327467A (zh) 一种服务器***及其容灾备份方法和相关设备
US11768724B2 (en) Data availability in a constrained deployment of a high-availability system in the presence of pending faults
JP2020021277A (ja) 情報処理システム、情報処理システムの管理方法及びプログラム
US8015432B1 (en) Method and apparatus for providing computer failover to a virtualized environment
Glider et al. The software architecture of a san storage control system
CN111367711A (zh) 一种基于超融合数据安全容灾方法
US7120821B1 (en) Method to revive and reconstitute majority node set clusters
Salapura et al. Resilient cloud computing
CN103793296A (zh) 一种在集群中用于辅助备份复制计算机***的方法
CN104052799B (zh) 一种利用资源环实现高可用存储的方法
CN105487946A (zh) 一种故障计算机自动切换方法及装置
US11544162B2 (en) Computer cluster using expiring recovery rules

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200703