CN110519112A

CN110519112A - 一种实现集群存储***中动态连续高可用的方法

Info

Publication number: CN110519112A
Application number: CN201810491763.9A
Authority: CN
Inventors: 李元骅; 朱云; 樊笑冰
Original assignee: Shandong Shudun Information Technology Co Ltd
Current assignee: Shandong Shudun Information Technology Co Ltd
Priority date: 2018-05-22
Filing date: 2018-05-22
Publication date: 2019-11-29

Abstract

本发明公开了一种实现集群存储***中动态连续高可用的方法，通过定期发送心跳包检测集群服务器状态，当服务器出现故障切换破坏高可用时，触发高可用重构***从集群剩余可用服务器节点中自动重构出一个新的高可用***，同时同步高可用服务器间的数据状，保持高可用服务器间状态同步，使集群达到一个稳定的高可用新态。本发明在集群出现故障高可用破坏时，自动重构出一个高可用新态，使高可用一直持续下去。

Description

一种实现集群存储***中动态连续高可用的方法

技术领域

本发明涉及一种存储***，具体是一种实现集群存储***中动态连续高可用的方法。

背景技术

随着数据的快速增长，以及云技术，大数据的广泛应用，服务器需要处理的数据越来越多，用于数据存储和计算所需的服务器成直线性增长。集群技术保证了可以统一提供高性能服务，但是随着集群中服务器节点越来越多，且需要处理的数据快速增长，集群及服务器出现故障的概率也越来越高，如何保证集群连续的高可用性并且持续不断稳定的对外提供服务，成为急需解决的问题。尤其是提供重要信息资料存储的集群***，能否提供持久连续不断的高可用性成为影响集群稳定性和安全性的重要因素。可以说高可用影响着一个集群的成败。

目前主要的高可用包括主备模式，多主一备。无论哪种模式都存在需要人工部署，一旦破坏高可用环境便不可逆或者无法多次提供高可用的缺陷。

针对目前市场上已有集群高可用单一，不可逆问题，集群只能实施已经部署好的高可用或者只可以自动构建一次高可用。集群高可用出现故障切换后无法连续多次自动重构出新的高可用***保证集群的安全，一旦集群遭到二次以上破坏，集群***也面临着无法正常运行或者数据丢失的巨大风险。通过本方法在集群出现故障高可用破坏时，自动重构出一个高可用新态，使高可用一直持续下去。

发明内容

本发明的目的在于提供一种实现集群存储***中动态连续高可用的方法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：

一种实现集群存储***中动态连续高可用的方法，通过定期发送心跳包检测集群服务器状态，当服务器出现故障切换破坏高可用时，触发高可用重构***从集群剩余可用服务器节点中自动重构出一个新的高可用***，同时同步高可用服务器间的数据状，保持高可用服务器间状态同步，使集群达到一个稳定的高可用新态。

作为本发明进一步的方案：采用监控模块负责使用心跳检测高可用服务器是否处于正常状态，如果心跳不能正常通信表明当前高可用出现故障，服务会被切换到备用服务器继续提供服务。

作为本发明进一步的方案：服务器切换后会给触发模块一个信号，触发模块在收到信号后，开始准备重构高可用所需要的环境，包括调用策略模块选择重构高可用所包含服务器，调用同步模块同步主服务器与备用服务器之间的数据，保持数据的一致性。

作为本发明进一步的方案：采用策略模块负责从集群中无故障的服务器中按照预定的策略选出需要组建新高可用所需服务器，并关闭所有出现故障服务器的高可用服务，确定之后不再被选中为高可用服务器。

作为本发明再进一步的方案：采用同步模块负责在选出新的服务器后，同步服务器之间的数据库数据，配置文件。

与现有技术相比，本发明的有益效果是：本发明在集群出现故障高可用破坏时，自动重构出一个高可用新态，使高可用一直持续下去。

具体实施方式

下面对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例中，一种实现集群存储***中动态连续高可用的方法，通过定期发送心跳包检测集群服务器状态，当服务器出现故障切换破坏高可用时，会触发高可用重构***从集群剩余可用服务器节点中自动重构出一个新的高可用***，同时同步高可用服务器间的数据状，保持高可用服务器间状态同步，使集群达到一个稳定的高可用新态。确保集群时刻处于高可用的状态。

本发明可以在不影响提供对外业务的前提下，每次在高可用遭到破坏时，会触发从剩余服务器中选择一台服务器与备用服务器自动重构新的高可用态，并且同步服务器之间的数据，保持高可用服务器间的数据状态时刻同步，全过程不需要人工进行干预。即使高可用遭到多次破坏也能保证连续的高可用状态，直到集群中没有可用服务器。

本发明实现集群提供可靠稳定的高可用，尽最大努力为用户提供稳定服务，保护用户数据安全。

一、组成模块：

本发明组成：监控模块，触发模块，同步模块，重构模块

1.监控模块

监控模块负责使用心跳检测高可用服务器是否处于正常状态。如果心跳不能正常通信表明当前高可用出现故障，服务会被切换到备用服务器继续提供服务。

2.触发模块

服务器切换后会给触发模块一个信号。触发模块在收到信号后，开始准备重构高可用所需要的环境。包括调用策略模块选择重构高可用所包含服务器，调用同步模块同步主服务器与备用服务器之间的数据，保持数据的一致性。

3.策略模块

策略模块负责从集群中无故障的服务器中按照预定的策略选出需要组建新高可用所需服务器。并关闭所有出现故障服务器的高可用服务。确定之后不再被选中为高可用。

4.同步模块

同步模块负责在选出新的服务器后，同步服务器之间的数据库数据，配置文件等，确保服务器间保持一致性。使构建高可用的服务器处于同一状态。防止服务器间的差异导致高可用异常。

5.重构模块

在之前的所有环境都准备好后，重构模块负责使用选择好的服务器构建新的高可用状态。重构高可用后对外提供所有服务不变。对用户不产生任何影响。

二、实现原理：

动态连续高可用构建是在通用高可用基础上做的改进及优化。并完全实现自动化，不需要人工干预配置。高可用服务器间会有心跳进行通信检测，心跳无法正常通信，***认为此时服务器出现故障，高可用遭到破坏，所有服务便会切换到备用服务器上，***发现服务器切换后会从现有正常服务器中选择一台IP地址与备用服务器相近的服务器构建新的高可用。构建过程需要通过远程通信控制修改新服务器高可用配置，将现有提供服务器作为主服务器，新选择的服务器作为备用服务器。并同步数据到新备用服务器上。将出现故障服务器高可用服务器关闭，并将其标识为不可作为高可用使用。再次重构高可用时此服务器不在选择中。多次重构高可用采用相同的机制，直到所有服务器标识为不可作高可用使用为止。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

Claims

1.一种实现集群存储***中动态连续高可用的方法，其特征在于，通过定期发送心跳包检测集群服务器状态，当服务器出现故障切换破坏高可用时，触发高可用重构***从集群剩余可用服务器节点中自动重构出一个新的高可用***，同时同步高可用服务器间的数据状，保持高可用服务器间状态同步，使集群达到一个稳定的高可用新态。

2.根据权利要求1所述的实现集群存储***中动态连续高可用的方法，其特征在于，采用监控模块负责使用心跳检测高可用服务器是否处于正常状态，如果心跳不能正常通信表明当前高可用出现故障，服务会被切换到备用服务器继续提供服务。

3.根据权利要求1或2所述的实现集群存储***中动态连续高可用的方法，其特征在于，服务器切换后会给触发模块一个信号，触发模块在收到信号后，开始准备重构高可用所需要的环境，包括调用策略模块选择重构高可用所包含服务器，调用同步模块同步主服务器与备用服务器之间的数据，保持数据的一致性。

4.根据权利要求1或2所述的实现集群存储***中动态连续高可用的方法，其特征在于，采用策略模块负责从集群中无故障的服务器中按照预定的策略选出需要组建新高可用所需服务器，并关闭所有出现故障服务器的高可用服务，确定之后不再被选中为高可用服务器。

5.根据权利要求4所述的实现集群存储***中动态连续高可用的方法，其特征在于，采用同步模块负责在选出新的服务器后，同步服务器之间的数据库数据，配置文件。