WO2024051577A1

WO2024051577A1 - 分布式部署方法、配置方法、、设备及介质

Info

Publication number: WO2024051577A1
Application number: PCT/CN2023/116224
Authority: WO
Inventors: 赖相旭
Original assignee: 中兴通讯股份有限公司
Priority date: 2022-09-06
Filing date: 2023-08-31
Publication date: 2024-03-14
Also published as: CN117714386A

Abstract

本申请实施例提供了一种分布式***部署方法、配置方法、***、设备及介质，该方法包括：在第一服务器中部署第一节点和第一负载均衡器(S1000)；在第二服务器中部署第二节点和第二负载均衡器(S2000)；其中，第一节点与第二节点之间通信连接，第一节点和第二节点通过分布式一致性Raft协议确认节点身份，第一节点分别与第一负载均衡器和第二负载均衡器通信连接；第二节点分别与第一负载均衡器和第二负载均衡器通信连接；第一负载均衡器和第二均衡负载器均被设置为根据负载情况分发服务请求。

Description

分布式***部署方法、配置方法、***、设备及介质

相关申请的交叉引用

本申请基于申请号为202211084128.1、申请日为2022年09月06日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本申请涉及分布式***技术领域，尤其是一种分布式***部署方法、配置方法、***、设备及介质。

背景技术

在双机热备***中，通常将其中一台服务器设置为主服务器，用于提供服务；将另一台服务器设置为从服务器，仅用于负责数据备份。

相关技术中，双机热备***的部署方式在业务量请求较大时，可能会频繁切换主从服务器，影响***的性能；另外数据在备份时容易出现丢失的情况，无法保证主从服务器中数据的一致性。因此，如何在面临大量业务请求时，保证***性能与数据一致性，是当下亟待讨论的问题。

发明内容

本申请实施例提供一种分布式***部署方法、配置方法、***、设备及介质。

第一方面，本申请实施例提供一种分布式***部署方法，所述分布式***包括第一服务器和第二服务器，所述方法包括：在所述第一服务器中部署第一节点和第一负载均衡器；在所述第二服务器中部署第二节点和第二负载均衡器；其中，所述第一节点与所述第二节点之间通信连接，所述第一节点和所述第二节点通过分布式一致性Raft协议确认节点身份，所述第一节点分别与所述第一负载均衡器和所述第二负载均衡器通信连接；所述第二节点分别与所述第一负载均衡器和所述第二负载均衡器通信连接；所述第一负载均衡器和所述第二均衡负载器均被设置为根据负载情况分发服务请求。

第二方面，本申请实施例提供一种分布式***配置方法，应用于根据如第一方面所述的分布式***部署方法得到的分布式***，所述方法包括：将所述第三节点和所述四节点的初始状态设置为未启动状态。

第三方面，本申请实施例提供一种分布式***，包括：第一服务器，所述第一服务器设置有第一负载均衡器以及第一节点；第二服务器，所述第二服务器设置有第二负载均衡器以及第二节点；其中，所述第一节点与所述第二节点之间通信连接，所述第一节点和所述第二节点通过分布式一致性Raft协议确认节点身份，所述第一节点分别与所述第一负载均衡器和所述第二负载均衡器通信连接；所述第二节点分别与所述第一负载均衡器和所述第二负载均衡器通信连接；所述第一负载均衡器和所述第二均衡负载器均被设置为根据负载情况分发服务请求。

第四方面，本申请实施例提供一种电子设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面中的分布式***部署方法或如第二方面中的分布式***配置方法。

第五方面，本申请实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行所述计算机程序时实现如第一方面中的分布式***部署方法或如第二方面中的分布式***配置方法。

附图说明

图1为本申请一实施例提供的分布式***架构图；

图2为本申请另一实施例提供的分布式***架构图；

图3为本申请一实施例提供的主调节器的工作流程图；

图4为本申请一实施例提供的Raft集群节点运行态的示意图；

图5为本申请一实施例提供的分布式***部署方法的流程图；

图6为本申请一实施例提供的统一网管平台的***架构图；

图7为本申请一实施例提供的分布式数据库的***架构图；

图8为本申请一实施例提供的业务支撑***的***架构图；

图9为本申请一实施例提供的一种电子设备结构示意图。

具体实施方式

为了使本申请的目的、技术方法及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的实施例仅用以解释本申请，并不用于限定本申请。

需要说明的是，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

本申请实施例的描述中，除非另有明确的限定，设置、安装、连接等词语应做广义理解，所属技术领域技术人员可以结合技术方案的内容合理确定上述词语在本申请实施例中的含义。本申请实施例中，“进一步地”、“示例性地”或者“可选地”等词用于表示作为例子、例证或说明，不应被解释为比其它实施例或设计方案更优选或更具有优势。使用“进一步地”、“示例性地”或者“可选地”等词旨在呈现相关概念。

本申请实施例可以应用于服务器等设备上。本申请实施例并不具体限定。

在双机服务器架构的场景中，为提高软件的可用性，常规做法是采用双机热备方式进行***部署，该部署方式利用其中的一台机器用于对外提供服务，即作为主机，另外一台机器仅用于做数据备份，即作为从机。这种部署方式在业务请求量较大时，性能会受到很大的影响，软件的可用性会受到很大限制，更严重的会导致双机频繁进行主从切换；另外数据在备份时可能会出现数据丢失的情况，尤其是当频繁地进行主从机切换时，数据的一致性无法得到有效的保证。

本申请实施例提供了一种分布式***部署方法、配置方法、***、设备及介质，通过在双机***中部署分布式一致性协议(Raft)节点，组成Raft集群，通过Raft协议进行更细粒度的主从节点切换、服务提供和数据备份，从而保证双机数据的一致性；同时通过负载均衡器，根据负载将服务请求分配至不同节点进行处理，提高服务效率。

下面结合附图，对本申请实施例作进一步阐述。

图1是本申请一实施例提供的分布式***架构图。如图1所示，该分布式***架构可以包括但不限于：第一服务器100、第一负载均衡器110、第一节点120、第二服务器200、第二负载均衡器210、第二节点220。

第一服务器100中设置有第一负载均衡器110和第一节点120，其中，第一节点120为Raft节点；第二服务器200中设置有第二负载均衡器210和第二节点220，其中，第二节点220为Raft节点。

第一节点120及第二节点220组成Raft集群，其中，第一节点120与第二节点220之间通信连接，第一节点120与第二节点220之间通过Raft协议确认节点身份，第一节点120分别与第一负载均衡器110和第二负载均衡器210通信连接；第二节点220分别与第一负载均衡器110和第二负载均衡器210通信连接；第一负载均衡器110和第二均衡负载器210均被设置为根据负载情况分发服务请求。其中，第一节点120绑定I P1地址，第二节点220绑定I P2地址，第一负载均衡器110和第二负载均衡器210通过同一个服务请求接口接收服务请求。

该分布式***在工作时，第一服务器100和第二服务器200同时运行，基于Raft协议，从第一节点120和第二节点220中选出领导节点，另外的节点作为群众节点；在接收到服务请求时，在正常情况下，由领导节点处理服务请求，群众节点同步备份。在服务请求量较大时，对于服务请求中的写请求，由领导节点处理，群众节点同步备份；由于基于Raft协议的Raft集群中的各节点具有良好的数据一致性，对于服务请求中的读请求，可以由第一负载均衡器110和/或第二负载均衡器210根据各节点的负载情况将读请求分配给负载较低的节点进行处理，从而提高服务器负载利用率，提升服务请求处理效率。

在一些实施方式中，如第一节点120为领导节点，第二节点220为群众节点，第一负载均衡器110将服务请求分配给第一节点120处理，第二节点220同步备份；当服务请求量较多，第一节点120负载超过设定阈值时，第二负载均衡器210将服务请求中的读请求分配给第二节点220进行处理，第一节点120主要处理服务请求中的写请求。通过Raft协议与负载均衡器结合，可以同时在不同节点处理不同的服务请求，提升各节点的负载利用率，提高了服务请求处理效率。

在一些实施方式中，当***收到服务请求时，可以优先由第一负载均衡器110处理，第一负载均衡器110根据第一节点120和第二节点220的负载情况，分配服务请求；当第一负载均衡器110的服务请求处理量达到阈值时，可以将服务请求分发至第二负载均衡器210处理，第二负载均衡器210根据第一节点120和第二节点220的负载情况，分配服务请求；可以想到的是，也可以优先由第二负载均衡器210进行服务请求的分发。

在一些实施方式中，当***收到服务请求时，可以平均分发给第一负载均衡器110和第二负载均衡器210进行分配。

在一些实施方式中，第一负载均衡器110和第二负载均衡器210为同一个负载均衡器分别部署在第一服务器100和第二服务器200中。

本实施例方案，通过在双机服务器***的技术上，在两个服务器中分别部署Raft节点和负载均衡器，组成Raft集群，使得处理服务请求、主从切换和数据备份等操作在两个服务器均保持工作的情况下以更细粒度的节点继续处理，避免了传统双机热备***以服务器为单位进行主从切换的情况，提升***稳定性和双机的数据一致性；同时通过负载均衡器将服务请求根据各节点负载情况分配至不同节点进行处理，提高了节点负载利用率，提升了服务请求处理效率。

图2是本申请另一实施例提供的分布式***架构图。如图2所示，该分布式***架构可以包括但不限于：第一服务器300、第一负载均衡器310、第一节点320、第三节点330、第一调节器340、第二服务器400、第二负载均衡器410、第二节点420、第四节点430、第二调节器440。

第一服务器300中部署有第一负载均衡器310、第一节点320、第三节点330以及第一调节器340，其中，第一节点320和第三节点330均为Raft节点，第一调节器340被设置为控制第三节点330。

第二服务器400中部署有第二负载均衡器410、第二节点420、第四节点430以及第二调节器440，其中，第二节点420和第四节点430均为Raft节点，第二调节器440被设置为控制第四节点430。

第一节点320、第三节点330、第二节点420、第四节点430组成Raft集群。其中，第一节点320、第三节点330、第二节点420以及第四节点430通信连接，第一节点320分别与第三节点330、第二节点420以及第四节点430通过Raft协议确认节点身份，第一节点320分别与第一负载均衡器310、第二负载均衡器410通信连接；第二节点420分别与第三节点330以及第四节点430通信连接，第二节点420分别与第一负载均衡器310、第二负载均衡器410通信连接；第三节点330分别与第一节点320、第二节点420通信连接，第三节点330与第一调节器340通信连接；第四节点430分别与第一节点320、第二节点420通信连接，第四节点430与第二调节器440通信连接。

其中，第一节点320绑定IP1地址，第二节点420绑定IP2地址，第一负载均衡器310和第二负载均衡器410通过同一个服务请求接口接收服务请求，第三节点330和第四节点430绑定同一个IP3地址。可以理解的是，第三节点330和第四节点430为相同的节点。

在一些实施方式中，该分布式***在工作时，第一服务器300和第二服务器400同时运行，将第三节点330和第四节点430设置为静默节点，即第三节点330和第四节点430默认关闭；基于Raft协议，从第一节点320和第二节点420中选出领导节点，另外的节点作为群众节点；在接收到服务请求时，在正常情况下，由领导节点处理服务请求，群众节点同步备份。在服务请求量较大时，对于服务请求中的写请求，由领导节点处理，群众节点同步备份；对于服务请求中的读请求，由第一负载均衡器310和/或第二负载均衡器410根据各节点的负载情况将读请求分配给负载较低的节点进行处理。

从第一调节器340和第二调节器440中，确定其中一个调节器为主调节器，另外一个为从调节器，同一时刻只有主调节器运作，从调节器仅监听主调节器发送的心跳信息；在一些实施方式中，第一调节器340为主调节器、第二调节器440为从调节器，则在同一时刻中，只有第一调节器340运作，第二调节器440仅监听第一调节器340发送的心跳信息；当从调节器在预设时间内没有收到主调节器的心跳信息，则自动做主从切换，在一些实施方式中，当第二调节器440在预设时间内没有收到第一调节器340的心跳信息时，则第二调节器440切换为主调节器，第一调节器340切换为从调节器。在一些实施方式中，主调节器负责绑定或激活IP3地址，因此当调节器进行主从切换时，IP3地址也会随着主调节器做切换，即原主调节器切换为新的从调节器，原从调节器切换为新的主调节器，IP3地址重新与新的主调节器进行绑定。

如图3所示，在分布式***处理服务请求的过程中，主调节器负责监听Raft集群的健康状态，当主调节器监听到某一节点发生故障时，尝试修复该故障节点；若无法修复，主调节器激活未故障节点所在服务器的静默节点，使得未故障节点和被激活的静默节点以及故障节点组成2/3Raft集群，保证Raft集群中的Raft节点超半数，维持***正常可用。

在一些实施方式中，第一调节器340为主调节器，第二调节器440为从调节器，当第一调节器340检测到第二节点420发生故障且无法修复时，第一调节器340激活第三节点330，第三节点330作为群众节点，以使第一节点320(未故障节点)、第二节点420(故障节点)和第三节点330(被激活的静默节点)组成2/3Raft集群，如图4所示，保证Raft集群中的Raft节点超半数，维持***正常可用。

在一些实施方式中，第一调节器340为主调节器，第二调节器440为从调节器，当第一调节器340检测到第一节点320发生故障且无法修复时，第一调节器340切换为从调节器，第二调节器440切换为主调节器；第二调节器440激活第四节点430，以使第一节点320(故障节点)、第二节点420(未故障节点)和第四节点430(被激活的静默节点)组成2/3Raft集群，如图4所示，保证Raft集群中的Raft节点超半数，维持***正常可用。可以理解的是，第一调节器340和第二调节器440之间通过心跳监测进行主从切换，目的是为了在其中一侧的服务器或调节器故障后，也能够保证调节器正常工作对Raft集群进行监控；因此，若在第一调节器340检测到第一节点320发生故障且无法修复前，第二调节器440在预设时间内未收到第一调节器340的心跳信息，则第一调节器340和第二调节器440会在进行主从切换后，由第二调节器440作为主调节器检测到第一节点320发生故障且无法修复，并激活第四节点430，第四节点430作为群众节点。

通过第三节点330、第四节点430、第一调节器340和第二调节器440的设置，由第一调节器340或第二调节器440对Raft集群进行监控，在第一节点320或者第二节点420发生故障时，激活对应的第三节点330或第四节点430(其中，第一节点320故障时，对应激活第四节点430；第二节点420故障时，对应激活第三节点330)，从而保证Raft集群的正常运行，快速恢复集群服务。

在一些实施方式中，将第三节点330和第四节点430的其中一个初始状态设置为静默状态，另一个的初始状态设置为激活状态。在一些实施方式中，第三节点330初始状态设置为静默状态，第四节点430的初始状态设置为激活状态，此时，Raft集群为一个3/3集群(第一节点320、第二节点420、第四节点430三个Raft节点)，如图4所示；对应地，第二调节器440为主调节器，第一调节器340为从调节器；当第一节点320发生故障时，第三节点330和第四节点430的状态无需更改，调节器主从关系不进行切换，***仍正常工作；当第二节点420发生故障时，第一调节器340切换为主调节器并激活第三节点330，第二调节器440关闭第四节点430且切换为从调节器，以维持***正常运作。

在一些实施方式中，第三节点330和第四节点430仅支持投票和心跳等基础功能，不进行数据存储，从而节约服务器资源。

在一些实施方式中，第三节点330和第四节点430支持数据存储，此时，第三节点330或第四节点430中被激活的节点与第一负责均衡器和第二负载均衡器410通信连接；被激活的第三节点330或第四节点430同样承担数据同步备份和处理服务请求的读请求的功能。

在一些实施方式中，第三节点330和第四节点430还可以部署多个，但第三节点330和第四节点430需要一一对应。可以理解地，第一调节器340可以部署一个，一个第一调节器 340控制多个第三节点330；第一调节还可以部署多个，第一调节器340和第三节点330一一对应，一个第一调节器340控制一个第三节点330；第二调节器440同理。

在一些实施方式中，主调节器通过以下方法对Raft集群进行监控：

主调节器定期检查Raft进程，检测是否由节点异常。

主调节器定期向Raft集群发送服务请求，向Raft集群写入检测数据，其中，检测数据可以为一个简单的标识码，在此不做具体限定；主调节器再向Raft发送服务请求，从Raft集群的各节点中读取在先写入的检测数据；若无法从某一节点中读取该检测数据，则认为该节点故障。

图5是本申请一实施例提供的分布式***部署方法的流程图。如图5所示，该分布式***部署方法可用于服务器、双机架构***等。在图5的实施例中，该分布式***部署方法应用于分布式***，分布式***包括第一服务器和第二服务器，该分布式***部署方法可以包括但不限于步骤S1000、步骤S2000。

步骤S1000：在第一服务器中部署第一节点和第一负载均衡器。

步骤S2000：在第二服务器中部署第二节点和第二负载均衡器。

其中，第一节点与第二节点之间通信连接，第一节点和第二节点通过分布式一致性Raft协议确认节点身份，第一节点分别与第一负载均衡器和第二负载均衡器通信连接；第二节点分别与第一负载均衡器和第二负载均衡器通信连接；第一负载均衡器和第二均衡负载器均被设置为根据负载情况分发服务请求。

在一些实施方式中，该分布式***部署方法还包括：在第一服务器中部署至少一个第三节点；在第二服务器中部署至少一个与第三节点对应的第四节点；其中，第三节点分别与第一节点、第二节点通信连接，第三节点与第一节点、第二节点之间通过Raft协议确认节点身份；第四节点分别与第一节点、第二节点通信连接，第四节点与第一节点、第二节点之间通过Raft协议确认节点身份；第三节点和第四节点配置有相同的IP地址。

在一些实施方式中，第三节点和第四节点可以部署有多个，在部署多个第三节点和第四节点时，第三节点和第四节点要一一对应，部署数量要以“一对第三节点和第四节点”为单位增加或减少，每对第三节点和第四节点配置一个相同的IP地址，不同的第三节点之间的IP地址不同，不同的第四节点之间的IP地址不同。

在一些实施方式中，在第三节点和第四节点配置有存储功能的情况下，第三节点分别与第一负载均衡器和第二负载均衡器通信连接，使得第三节点能够获取第一负载均衡器和/或第二负载均衡器分发的服务请求；第四节点分别与第一负载均衡器和第二负载均衡器通信连接，使得第四节点能够获取第一负载均衡器和/或第二负载均衡器分发的服务请求。

在一些实施方式中，该分布式***部署方法还包括：在第一服务器中部署至少一个与第三节点对应的第一调节器；在第二服务器中部署至少一个与第四节点对应的第二调节器；其中，第一调节器和第二调节器通信连接，第一调节器被设置为监控分布式***的健康状态以及管理第三节点，第二调节器被设置为监控分布式***的健康状态以及管理第四节点。

在一些实施方式中，可以仅部署一个第一调节器，对应控制多个第三节点；也可以部署多个第一调节器，第一调节器与第三节点一一对应；还可以部署不同数量的第一调节器和第三节点，构建一对一和/或一对多的控制关系，在此不做具体限定；第二调节器的部署同理。

在一些实施方式中，第三节点和第四节点的初始状态默认为未启动状态。

本申请一实施例提供了一种分布式***配置方法，该分布式***配置方法应用于根据上述任一实施例描述的分布式***部署方法得到的分布式***，或上述任一实施例描述的分布式***。该分布式***配置方法至少包括但不限于以下步骤：

将第三节点和四节点的初始状态设置为未启动状态。

在一些实施方式中，第一调节器为默认主调节器，第二调节器为默认从调节器；该分布式***配置方法包括：通过第一调节器定时向第二调节器发送心跳消息；在第二调节器在预设时间内未收到心跳消息的情况下，确认第二调节器为主调节器，第一调节器为从调节器。

在一些实施方式中，该分布式***配置方法还包括：将主调节器与第三节点和/或第四节点的IP地址进行绑定；在主调节器与从调节器进行主从切换的情况下，将IP地址与新的主调节器进行绑定。可以理解的是，当主调节器与从调节器进行主从切换的情况下，主调节器切换为新的从调节器，从调节器切换为新的主调节器，再将上述IP地址与新的主调节器进行绑定；在一些实施方式中，第一调节器为主调节器，第二调节器为从调节器，发生主从切换后，第一调节器切换为从调节器，第二调节器切换为主调节器。可以理解的是，当主调节器为第一调节器，将主调节器与第三节点的IP地址进行绑定；当主调节器为第二调节器，将主调节器与第四节点的IP地址进行绑定。

在一些实施方式中，该分布式***配置方法还包括：通过主调节器监控第一节点和第二节点；在主调节器检测到第一节点出现异常的情况下，主调节器对第一节点进行修复，得到修复结果；在修复结果为修复失败的情况下，通过主调节器激活第四节点，使得第四节点的初始状态从未启动状态变为启动状态。

在一些实施方式中，该分布式***配置方法还包括：通过主调节器监控第一节点和第二节点；在主调节器发现第二节点出现异常的情况下，主调节器对第二节点进行修复，得到修复结果；在修复结果为修复失败的情况下，通过主调节器激活第三节点，使得第三节点的初始状态从未启动状态变为启动状态。

该分布式***配置方法的实现流程在与上述实施例中描述的分布式***中的相关流程相同，在此不做进一步展开描述。

下面以具体的应用场景对本申请的分布式***部署进行进一步描述，以下实施例仅为了进一步清楚地描述本申请方案，并不做具体限定。

图6为本申请一实施例提供的统一网管平台的***架构图。

某运营商在A市有一套采用双机热备部署方式的统一网管平台，随着业务拓展，下接的网元越来越多，在业务高峰期性能和告警上报频繁导致频频发生主备切换，导致网管平台经常不可用。

现对该统一网管平台进行本申请的分布式***部署改造，如图6所示。

实施步骤如下：

将统一网管服务平台根据raft协议进行改造，得到统一网管服务平台A和统一网管服务平台B。

将改造后的统一网管服务平台A部署到第一服务器中，将改造后的统一网管服务平台B部署到第二服务器中，将统一网管服务平台A和统一网管服务平台B组成一个2个raft节点的集群。

设置一个负载均衡器，并部署到两个服务器上，设置服务请求接口，当收到服务请求时，根据两台服务器的负载情况动态分发请求。

图7为本申请一实施例提供的分布式数据库的***架构图。

某运营商希望在A地用两台服务器部署一套轻量级的kubernetes平台(kubernetes是一个全新的基于容器技术的分布式架构解决方案，是一个开源的容器集群管理***)，用于部署网管微服务***。实施环境说明：运营商提供了两台服务器是双网卡，环境部署kubernetes，支持应用容器引擎(Docker)服务。如图7所示。

实施步骤如下：

步骤一：配置两台服务器A和B的网卡，服务器A的网卡1绑定IP1，服务器B的网卡1绑定到IP2，服务器A的网卡2和服务器B的网卡2均绑定到IP3，其中IP3及对应的网卡处于关闭状态。

步骤二：在两台服务器上分别部署两套ETCD微服务，在服务器A中部署ETCD微服务A映射到宿主机的IP1，在服务器A中部署备用ETCD服务映射到宿主机的IP3；在服务器B中部署ETCD微服务B映射到宿主机的IP2，在服务器B中部署备用ETCD服务映射到宿主机的IP3。其中，ETCD是一个高可用的键值存储***，主要用于共享键值仓库和服务发现。

步骤三：在服务器A和服务器B上分别部署调节器，启动后随机一台服务器的调节器设为主调节器(假设服务器A的调节器为主调节器)，主调节器将处于本机的IP3对应的网卡置为启动状态。

步骤四：启动IP1及对应的ETCD微服务A和IP2及对应的ETCD微服务B，形成2/3的raft集群。

步骤五：部署kubelet服务，需要说明的是，kubelet访问ETCD集群的负载均衡器是属于kubelet的内部小组件，因此不需要额外的再部署负载均衡器。其中，kubelet是主要的节点代理，它会监视已分配给节点的pod；其中，Pod是kubernetes***中可以创建和管理的最小单元，是资源对象模型中由用户创建或部署的最小资源对象模型，也是在kubernetes上运行容器化应用的资源对象。

步骤六：当服务器B出现故障时，主调节器将绑定在IP3的备用ETCD微服务启动，此时仍能保持2/3的raft集群正常提供云平台服务。

步骤七：当服务器A出现故障时，主调节器将迁移到服务器B，即服务器B中的调节器切换为主调节器，此时将服务器A的网卡2置为关闭状态，服务器B的网卡2置为启动状态，同时启动服务器B绑定到IP3的备用ETCD微服务，此时提供2/3的正常raft集群服务。

图8为本申请一实施例提供的业务支撑***的***架构图。

某电信运营商在某地用两套服务器部署一套轻量级的业务支撑***(Business Support System，BSS)，在业务办理高峰期，要求***能提供负载均衡提升服务效率，一旦单台服务器发生异常时，能迅速恢复业务并保证数据一致性。实施环境说明：两台服务器均为单网卡，只部署业务支撑平台，提供单一服务。其实施如图8所示。

实施步骤如下：

步骤一：基于raft协议实现业务支撑***BSS。

步骤二：配置两台服务器A和B的网卡，将服务器A的网卡1绑定IP1，服务器B的网卡1绑定到IP2，服务器A和服务器B均预留一个未使用的IP3。

步骤三：在两台服务器上分别部署两套BSS：在服务器A中部署第一BSS并绑定到的IP1，部署备用BSS并绑定到IP3；在服务器B中部署第二BSS并绑定到的IP2，部署备用BSS并绑定到IP3。

步骤四：分别在两台服务器上部署调节器，启动后随机一台服务器的调节器为主服务器(假设服务器A的调节器为主调节器)，主调节器将IP3绑定到同一服务器(服务器A)的网卡1上。

步骤五：在两台服务器中部署负载均衡器，连接BSS集群，并设置服务请求接口，当收到服务请求时，负载均衡器根据两台服务器的负载情况动态分发服务请求。

步骤六：启动IP1及对应的第一BSS服务和启动IP2及对应的第二BSS服务，形成2/3的raft集群。

步骤七：当服务器B出现问题时，主调节器将同服务器(服务器A)IP3的备用BSS服务拉起，此时仍能提供2/3的raft集群，可以提供正常的服务。

步骤八：当服务器A出现问题时，主调节将迁移到服务器B,即服务器B的调节器切换为主调节器，此时将服务器A的网卡1上的IP3解绑，服务器B的网卡1绑定IP3，同时启动服务器B绑定到IP3的备用BSS服务，此时提供2/3的正常raft集群。

图9是本申请一实施例提供的一种电子设备结构示意图。如图9所示，电子设备1000包括存储器1100、处理器1200。存储器1100、处理器1200的数量可以是一个或多个，图9中以一个存储器1100和一个处理器1200为例；设备中的存储器1100和处理器1200可以通过总线或其他方式连接，图9中以通过总线连接为例。

存储器1100作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本申请任一实施例提供的分布式***部署方法或分布式***配置方法对应的程序指令/模块。处理器1200通过运行存储在存储器1110中的软件程序、指令以及模块实现上述分布式***部署方法或分布式***配置方法。

存储器1100可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序。此外，存储器1100可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件或其他非易失性固态存储器件。在一些实例中，存储器1100还可包括相对于处理器1200远程设置的存储器，这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

本申请一实施例还提供了一种计算机可读存储介质，存储有计算机可执行指令，该计算机可执行指令用于执行如本申请任一实施例提供的分布式***部署方法或分布式***配置方法。

本申请实施例方案，通过在两个服务器中分别部署Raft节点和负载均衡器，组成Raft集群，使得处理服务请求、主从切换和数据备份等操作在两个服务器均保持工作的情况下以更细粒度的节点继续处理，避免了传统双机热备***以服务器为单位进行主从切换的情况，提升***稳定性和双机的数据一致性；同时通过负载均衡器将服务请求根据各节点负载情况分配至不同节点进行处理，提高了节点负载利用率，提升了服务请求处理效率。

本申请实施例描述的***架构以及应用场景是为了更加清楚的说明本申请实施例的技术方案，并不构成对于本申请实施例提供的技术方案的限定，本领域技术人员可知，随着***架构的演变和新应用场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、***、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。

在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

在本说明书中使用的术语“部件”、“模块”、“***”等用于表示计算机相关的实体、硬件、固件、硬件和软件的组合、软件、或执行中的软件。例如，部件可以是但不限于，在处理器上运行的进程、处理器、对象、可执行文件、执行线程、程序或计算机。通过图示，在计算设备上运行的应用和计算设备都可以是部件。一个或多个部件可驻留在进程或执行线程中，部件可位于一个计算机上或分布在2个或更多个计算机之间。此外，这些部件可从在上面存储有各种数据结构的各种计算机可读介质执行。部件可例如根据具有一个或多个数据分组(例如来自于自与本地***、分布式***或网络间的另一部件交互的二个部件的数据，例如通过信号与其它***交互的互联网)的信号通过本地或远程进程来通信。

以上参照附图说明了本申请的一些实施例，并非因此局限本申请的权利范围。本领域技术人员不脱离本申请的范围和实质内所作的任何修改、等同替换和改进，均应在本申请的权利范围之内。

Claims

一种分布式***部署方法，其中，所述分布式***包括第一服务器和第二服务器，所述方法包括：

在所述第一服务器中部署第一节点和第一负载均衡器；

在所述第二服务器中部署第二节点和第二负载均衡器；

其中，所述第一节点与所述第二节点之间通信连接，所述第一节点和所述第二节点通过分布式一致性Raft协议确认节点身份，所述第一节点分别与所述第一负载均衡器和所述第二负载均衡器通信连接；所述第二节点分别与所述第一负载均衡器和所述第二负载均衡器通信连接；所述第一负载均衡器和所述第二均衡负载器均被设置为根据负载情况分发服务请求。
根据权利要求1所述的方法，其中，所述方法还包括：

在所述第一服务器中部署至少一个第三节点；

在所述第二服务器中部署至少一个与所述第三节点对应的第四节点；

其中，所述第三节点分别与所述第一节点、所述第二节点通信连接，所述第三节点与所述第一节点、所述第二节点之间通过Raft协议确认节点身份；所述第四节点分别与所述第一节点、所述第二节点通信连接，所述第四节点与所述第一节点、所述第二节点之间通过Raft协议确认节点身份；所述第三节点和所述第四节点配置有相同的I P地址。
根据权利要求2所述的方法，其中，在所述第三节点和所述第四节点配置有存储功能的情况下，所述第三节点分别与所述第一负载均衡器和所述第二负载均衡器通信连接，使得所述第三节点能够获取所述第一负载均衡器和/或所述第二负载均衡器分发的所述服务请求；所述第四节点分别与所述第一负载均衡器和所述第二负载均衡器通信连接，使得所述第四节点能够获取所述第一负载均衡器和/或所述第二负载均衡器分发的所述服务请求。
根据权利要求3所述的方法，其中，所述方法还包括：

在所述第一服务器中部署至少一个与所述第三节点对应的第一调节器；

在所述第二服务器中部署至少一个与所述第四节点对应的第二调节器；

其中，所述第一调节器和所述第二调节器通信连接，所述第一调节器被设置为监控所述分布式***的健康状态以及管理所述第三节点，所述第二调节器被设置为监控所述分布式***的健康状态以及管理所述第四节点。
一种分布式***配置方法，其中，应用于根据如上述权利要求4所述的分布式***部署方法得到的分布式***，所述方法包括：

将所述第三节点和所述四节点的初始状态设置为未启动状态。
根据权利要求5所述的方法，其中，所述第一调节器为默认主调节器，第二调节器为默认从调节器，所述方法包括：

通过所述第一调节器定时向所述第二调节器发送心跳消息；

在所述第二调节器在预设时间内未收到心跳消息的情况下，确认所述第二调节器为主调节器，所述第一调节器为从调节器。
根据权利要求6所述的方法，其中，所述方法包括：

将所述主调节器与所述第三节点和/或所述第四节点的IP地址进行绑定；

在所述主调节器与所述从调节器进行主从切换的情况下，将所述IP地址与新的主调节器进行绑定。
根据权利要求7所述的方法，其中，所述方法还包括：

通过所述主调节器监控所述第一节点和所述第二节点；

在所述主调节器检测到所述第一节点出现异常的情况下，所述主调节器对所述第一节点进行修复，得到修复结果；

在所述修复结果为修复失败的情况下，通过所述主调节器激活所述第四节点，使得所述第四节点的所述初始状态从所述未启动状态变为启动状态。
根据权利要求7所述的方法，其中，所述方法还包括：

通过所述主调节器监控所述第一节点和所述第二节点；

在所述主调节器发现所述第二节点出现异常的情况下，所述主调节器对所述第二节点进行修复，得到修复结果；

在所述修复结果为修复失败的情况下，通过所述主调节器激活所述第三节点，使得所述第三节点的所述初始状态从所述未启动状态变为启动状态。
一种分布式***，包括：

第一服务器，所述第一服务器设置有第一负载均衡器以及第一节点；

第二服务器，所述第二服务器设置有第二负载均衡器以及第二节点；

其中，所述第一节点与所述第二节点之间通信连接，所述第一节点和所述第二节点通过分布式一致性Raft协议确认节点身份，所述第一节点分别与所述第一负载均衡器和所述第二负载均衡器通信连接；所述第二节点分别与所述第一负载均衡器和所述第二负载均衡器通信连接；所述第一负载均衡器和所述第二均衡负载器均被设置为根据负载情况分发服务请求。
根据权利要求10所述的***，其中，所述第一服务器设置有至少一个第三节点，所述第二服务器设置有至少一个与所述第三节点对应的第四节点，其中，所述第三节点分别与所述第一节点、所述第二节点通信连接，所述第三节点与所述第一节点、所述第二节点之间通过Raft协议确认节点身份；所述第四节点分别与所述第一节点、所述第二节点通信连接，所述第四节点与所述第一节点、所述第二节点之间通过Raft协议确认节点身份；所述第三节点和所述第四节点配置有相同的IP地址；

所述第一服务器设置有至少一个与所述第三节点对应的第一调节器，所述第二服务器设置有至少一个与所述第四节点对应的第二调节器，所述第一调节器和所述第二调节器之间通信连接；其中，所述第一调节器被设置为监控所述分布式***的健康状态以及管理所述第三节点，所述第二调节器被设置为监控所述分布式***的健康状态以及管理所述第四节点。
一种电子设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述的分布式***部署方法或如权利要求5至9任一项所述的分布式***配置方法。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行所述计算机程序时实现如权利要求1至4任一项所述的分布式***部署方法或如权利要求5至9任一项所述的分布式***配置方法。