CN114363154A - 节点选举方法、装置、电子设备及存储介质 - Google Patents

节点选举方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114363154A
CN114363154A CN202111681518.2A CN202111681518A CN114363154A CN 114363154 A CN114363154 A CN 114363154A CN 202111681518 A CN202111681518 A CN 202111681518A CN 114363154 A CN114363154 A CN 114363154A
Authority
CN
China
Prior art keywords
node
election
nodes
leader
follower
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111681518.2A
Other languages
English (en)
Inventor
康建伟
马怡安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202111681518.2A priority Critical patent/CN114363154A/zh
Publication of CN114363154A publication Critical patent/CN114363154A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种节点选举方法、装置、电子设备及存储介质,涉及计算机技术领域。该方法包括:当第一Leader节点宕机时,将分布式***中的一Follower节点转换为候选者Candidate节点以接收选举消息,选举消息由剩余Follower节点发送至Candidate节点,选举消息包括剩余Follower节点的任期数和日志索引值;利用Candidate节点进行选举,将Candidate节点和剩余Follower节点中任期数最大的节点选举为第二Leader节点,当任期数最大的节点不唯一时,将任期数最大的节点中日志索引值最大的节点选举为第二Leader节点。本公开能够在不增加服务节点及计算复杂度的前提下,保证异常状况下服务切换前后的强一致性。

Description

节点选举方法、装置、电子设备及存储介质
技术领域
本公开涉及计算机技术领域,尤其涉及一种节点选举方法、装置、电子设备及存储介质。
背景技术
分布式***的优势在于能够充分利用多台机器的算力来构建庞大而复杂的应用,在实现一个分布式***时需要解决很多问题,其中一点就是如何保证不同节点间的数据一致性。Raft是一种更为简单方便易于理解的分布式算法,主要解决了分布式中的一致性问题。相比传统的Paxos算法,Raft将大量的计算问题分解成为了一些简单的相对独立的子问题。
但是Raft算法也有着其缺陷,为了使宕机时Leader节点切换前后保持一致,现有技术在Raft算法的选举过程中加入了控制器模块,但是这种方式增加了服务代销,且降低了执行效率。另一种方式是在Raft算法中增加代理工作节点角色,采用宕机直接切换代理工作节点,跳过选举步骤,以此提升节点切换的效率,但是代理工作节点需要频繁与主节点交互反而增加了服务的负担。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开提供一种节点选举方法、装置、电子设备及存储介质,至少在一定程度上克服了相关技术中宕机后分布式***无法保证强一致性的技术问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供一种节点选举方法,应用于分布式***,所述分布式***包括第一领导者Leader节点和多个与第一Leader节点保持通信的追随者Follower节点,所述方法包括:
当第一Leader节点宕机时,将所述分布式***中的一Follower节点转换为候选者Candidate节点以接收选举消息,所述选举消息由剩余Follower节点发送至所述Candidate节点,所述选举消息包括剩余Follower节点的任期数和日志索引值;
利用所述Candidate节点进行选举,将所述Candidate节点和剩余Follower节点中任期数最大的节点选举为第二Leader节点,当任期数最大的节点不唯一时,将任期数最大的节点中日志索引值最大的节点选举为第二Leader节点。
在本公开的一个实施例中,所述将所述分布式***中一Follower节点转换为候选者Candidate节点具体包括:
随机赋予多个Follower节点选举时长,将选举时长最先结束的Follower节点转换为Candidate节点。
在本公开的一个实施例中,所述方法还包括:
通过所述Candidate节点向其余Follower节点发送选举请求。
在本公开的一个实施例中,所述方法还包括:
当第一Leader节点重新上线时,将第二Leader节点的数据同步至第一Leader节点,同时将第一Leader节点转换为Follower节点。
在本公开的一个实施例中,所述方法还包括:
当任期数最大的节点中日志索引值最大的节点不唯一时,将任一日志索引值最大的节点选举为第二Leader节点。
在本公开的一个实施例中,所述分布式***中的节点总数为奇数。
在本公开的一个实施例中,所述方法还包括:
当所述分布式***中存在Leader节点时,将除Leader节点以外的其他节点转换为Follower节点。
根据本公开的另一个方面,提供一种节点选举装置,应用于分布式***,所述分布式***包括第一领导者Leader节点和多个与第一Leader节点保持通信的追随者Follower节点,包括:
收集模块,当第一Leader节点宕机时,将所述分布式***中的一Follower节点转换为候选者Candidate节点以接收选举消息,所述选举消息由剩余Follower节点发送至所述Candidate节点,所述选举消息包括剩余Follower节点的任期数和日志索引值;
选举模块,用于利用所述Candidate节点进行选举,将所述Candidate节点和剩余Follower节点中任期数最大的节点选举为第二Leader节点,当任期数最大的节点不唯一时,将任期数最大的节点中日志索引值最大的节点选举为第二Leader节点。
根据本公开的再一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述的节点选举方法。
根据本公开的又一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的节点选举方法。
本公开的实施例所提供的节点选举方法、装置、电子设备及存储介质,通过对比各个节点的任期数和日志索引值,将携带数据最新的节点选举为分布式***的领导者Leader节点,使得本公开能够在不增加服务节点及计算复杂度的前提下,保证了异常状况下Leader节点切换前后的强一致性。具体的,本公开将任期数最大的节点选举为Leader节点,当任期数最大的节点不唯一时,将任期数最大的节点中日志索引值最大的节点选举为Leader节点。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本公开实施例中一种节点选举方法的***架构示意图;
图2示出本公开实施例中一种节点选举方法流程图;
图3示出本公开实施例中一种分布式***节点部署方式示意图;
图4示出本公开实施例中一种节点选举过程示意图;
图5示出本公开实施例中领导者节点选举决策流程示意图;
图6示出本公开实施例中一种节点选举装置示意图;
图7示出本公开实施例中又一种节点选举装置示意图;和
图8示出本公开实施例中一种电子设备的结构框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
本公开提供的方案,当Leader节点宕机时,将所述分布式***中的一Follower节点转换为候选者Candidate节点以接收选举消息,所述选举消息由剩余Follower节点发送至所述Candidate节点,所述选举消息包括剩余Follower节点的任期数和日志索引值;利用所述Candidate节点进行选举,将所述Candidate节点和剩余Follower节点中任期数最大的节点选举为第二Leader节点,当任期数最大的节点不唯一时,将任期数最大的节点中日志索引值最大的节点选举为第二Leader节点。。
为了便于理解,下面首先对本公开涉及到的几个名词进行解释如下:
分布式***(Distributed System):分布式***是由一组通过网络进行通信、为了完成共同的任务而协调工作的计算机节点组成的***。分布式***的出现是为了用廉价的、普通的机器完成单个计算机无法完成的计算、存储任务。其目的是利用更多的机器,处理更多的数据。分布式***往往采用分布式储存技术,通过网络使用企业中的每台机器上的磁盘空间,并将这些分散的存储资源构成一个虚拟的存储设备,数据分散的存储在企业的各个角落。基于传统的网络存储***是采用集中的存储服务器存放所有数据,存储服务器成为***性能的瓶颈,也是可靠性和安全性的焦点,不能满足大规模存储应用的需要。分布式网络存储***采用可扩展的***结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了***的可靠性、可用性和存取效率,还易于扩展。可见,分布式***通常通过维护多个副本来进行容错,提高***的可用性。
Raft算法:Raft算法是一种分布式一致性协议,用于在分布式存储***中,维护多个副本的一致性。例如,在一个具有一致性的性质的集群里面,利用Raft算法可以使同一时刻所有的结点对存储在其中的某个值都有相同的结果,即对其共享的存储保持一致。集群具有自动恢复的性质,当少数结点失效的时候不影响集群的正常工作,当大多数集群中的结点失效的时候,集群则会停止服务(不会返回一个错误的结果)。可见,Raft算法是用来保证即使在部分(确切地说是小部分)副本宕机的情况下,***仍然能正常对外提供服务。Raft算法通常基于复制状态机(RSM,Replicated State Machine),即所有结点都从同一个状态(state)出发,都经过同样的一些操作序列(log),最后到达同样的state。
Raft中的工作节点有三种,分别是:
领导者(Leader):负责日志的同步管理,处理来自客户端的请求,与Follower保持心跳(HeartBeat)通信;
追随者(Follower):响应Leader的日志同步请求,响应Candidate的邀票请求,以及把客户端请求到Follower的事务转发(重定向)给Leader;
候选者(Candidate):负责选举投票,集群刚启动或者Leader宕机时,Follower节点将转为Candidate并发起选举,选举胜出(获得超过半数节点的投票)后,从Candidate转为Leader。
在整个***正常运行过程中,只会有一个Leader节点,其他的都是Follower节点。只有在需要重新选举的阶段,节点会尝试将自己转换为Candidate,然后向所有的节点发出投票请求展开选举。
在没有Leader,Followers无法与Leader保持心跳通信,Followers节点启动后在一个选举定时器周期内未收到心跳和投票请求,则转为Candidate,并向集群中所有节点发送投票请求并且重置选举定时器。
其余Followers节点收到投票请求后决定是否接受投票请求(每个Follower刚成为Candidate的时候会将票投给自己):
一轮选举过后,正常情况下,会有一个Candidate收到超过半数节点(N/2+1)的投票,它将胜出并升级为Leader。然后定时发送心跳给其它的节点,其它节点会转为Follower并与Leader保持同步,到此,本轮选举结束。
在进行对本发明的详细内容的具体描述之前,首先对本发明所针对进行改进的节点选举方法进行简单描述,以有助于理解本发明所要解决的技术问题和能够实现的技术效果。
假设某基于Raft算法的分布式***的资源池采用2n+1个节点分布式部署(例如节点S1~S2n+1,n为正整数)。若S1节点作为Leader节点,在接收客户端请求并通知其他极少数非Sm节点(m为正整数,m=2~2n+1)更新日志后宕机,但未被通知更新日志的Sm节点首先发生选举超时成为候选者并向其他节点发送投票申请。
在此前提下,利用上述现有Raft选举方法,可能会将Sm节点选为Leader节点,从而导致各节点的数据无法保持一致,使客户端的最新请求丢失。
图1示出了可以应用于本公开实施例的节点选举方法或节点选举装置的示例性***架构的示意图。
如图1所示,***架构可以包括用户设备101、102、103,控制层104和分布式***,其中分布式***由领导者节点105和追随者节点106、107、108组成。
控制层104用以在用户设备101、102、103和领导者节点105之间提供通信链路的介质,可以是有线控制层,也可以是无线控制层。
可选地,上述的无线控制层或有线控制层使用标准通信技术和/或协议。控制层通常为因特网、但也可以是任何控制层,包括但不限于局域网(Local Area Network,LAN)、城域网(Metropolitan Area Network,MAN)、广域网(Wide Area Network,WAN)、移动、有线或者无线控制层、专用控制层或者虚拟专用控制层的任何组合)。在一些实施例中,使用包括超文本标记语言(Hyper Text Mark-up Language,HTML)、可扩展标记语言(ExtensibleMarkupLanguage,XML)等的技术和/或格式来代表通过控制层交换的数据。此外还可以使用诸如安全套接字层(Secure Socket Layer,SSL)、传输层安全(Transport LayerSecurity,TLS)、虚拟专用控制层(Virtual Private Network,VPN)、网际协议安全(Internet ProtocolSecurity,IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。
用户设备101、102、103可以是各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机、台式计算机、可穿戴设备、增强现实设备、虚拟现实设备等。
可选地,不同的用户设备101、102、103中安装的应用程序的客户端是相同的,或基于不同操作***的同一类型应用程序的客户端。基于终端平台的不同,该应用程序的客户端的具体形态也可以不同,比如,该应用程序客户端可以是手机客户端、PC客户端等。
领导者节点105在收到来自用户设备101、102、103的请求数据时,将请求数据同步至追随者节点106、107、108。
可选地,领导者节点105和追随者节点106、107、108可以是提供各种服务的服务器,例如对用户利用用户设备101、102、103所进行操作的装置提供支持的后台管理服务器。后台管理服务器可以对接收到的请求等数据进行分析等处理,并将处理结果反馈给用户设备。
可选地,领导者节点105和追随者节点106、107、108可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、控制层服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发控制层)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
本领域技术人员可以知晓,图1中的用户设备、控制层、领导者节点和追随者节点的数量仅仅是示意性的,根据实际需要,可以具有任意数目的用户设备、控制层、领导者节点和追随者节点。本公开实施例对此不作限定。
下面结合附图及实施例对本示例实施方式进行详细说明。
首先,本公开实施例中提供了一种节点选举方法,该方法可以由任意具备计算处理能力的电子设备执行。
图2示出本公开实施例中一种节点选举方法流程图,如图2所示,本公开实施例中提供的节点选举方法包括如下步骤:
S202,当第一Leader节点宕机时,将分布式***中的一Follower节点转换为候选者Candidate节点以接收选举消息,选举消息由剩余Follower节点发送至Candidate节点,选举消息包括剩余Follower节点的任期数和日志索引值。
可选地,随机赋予多个Follower节点选举时长,将选举时长最先结束的Follower节点转换为Candidate节点。
需要说明的是,在Leader节点故障的情况下均会发生选举,故障情况包括但不限于宕机、网络延迟、服务异常,本公开对此不做限定。
具体地,每个Follower节点等待Leader节点心跳信息的选举时长是随机的。当***中不存在Leader节点,选举时长越小的节点,会先因为没有等到Leader节点的心跳信息,发生超时。
更具体地,当多个节点的随机选举时长相同时,可重新进行下一次选举过程。
本领域技术人员可以理解,在分布式***初始化时,所有节点都是Follower节点,且初始任期为0。此时启动选举定时器,每个节点的选举定时器超时时间都在一定时长之内(例如,100~500毫秒)且并不一致(避免同时发起选举)。
S204,利用Candidate节点进行选举,将Candidate节点和剩余Follower节点中任期数最大的节点选举为第二Leader节点,当任期数最大的节点不唯一时,将任期数最大的节点中日志索引值最大的节点选举为第二Leader节点。
需要说明的是,Raft算法将时间划分成为任意不同长度的任期(term)。任期用连续的数字进行表示。每一个任期的开始都是一次选举(election),一个或多个Candidate节点会试图成为Leader节点。如果一个Candidate节点赢得了选举,它就会在该任期的剩余时间担任Leader节点。在某些情况下,选票会被瓜分,有可能没有选出Leader节点,那么,将会开始另一个任期,并且立刻开始下一次选举。Raft算法保证在给定的一个任期最多只有一个Leader节点。
本领域技术人员可以理解,节点的任期数在节点当选为Leader节点时自增。
需要说明的是,节点的日志索引值指Raft算法记录的日志下标索引,用于表示信息在日志中位置。
可选地,通过Candidate节点向其余Follower节点发送选举请求。
在本公开的一个实施例中,当第一Leader节点重新上线时,将第二Leader节点的数据同步至第一Leader节点,同时将第一Leader节点转换为Follower节点。
可选地,若旧的Leader节点在选举过程中重新上线,选举过程不中断。
可选地,当任期数最大的节点中日志索引值最大的节点不唯一时,将任一日志索引值最大的节点选举为第二Leader节点。
可选地,分布式***中的节点总数为奇数。
在本公开的一个实施例中,当分布式***中存在Leader节点时,将除Leader节点以外的其他节点转换为Follower节点。
可选地,分布式***中的Leader节点具有唯一性。
具体地,一旦有节点被选举为Leader节点,就立即成为Leader节点。然后它会向其他的服务器节点发送心跳信息来确定自己的地位并阻止新的选举。
可选地,当分布式***中存在多个Leader节点时,比较各个Leader节点的任期数,将任期数低的Leader节点转换为Follower节点。
为便于理解,下面将结合图3和图4举例说明本公开实施例中的节点选举方法。
如图3所示,某分布式***资源池资源池采用2*2+1的方案进行分布式部署,其中S1节点为Leader节点,S2~S5节点为Follower节点。
某时刻S1节点在向S2节点发送了日志更新通知后节点宕机服务下线,随后心跳超时,S2~S5节点开始等待选举时长,此时S3节点选举时长首先结束。
如图4所示,达到选举超时的S3节点向其他节点(S1,S2,S4,S5)发送投票请求,S1节点因宕机无法回复信息,其余节点正常回复信息(回复信息包含本节点的任期数和日志索引值信息);
由S3节点根据接收的数据按照最新优先原则进行决策出新的当选人,即选举S2节点作为新的Leader节点。
具体地,S3节点可首先判定S2、S4、S5节点反馈的任期数中的最大值是否大于S3任期,若是则该节点为新的Leader节点;当出现多个任期数相同且最大的节点时,否则对比索引最大值是否大于当前索引,若是则索引最大者当选,否则该候选人当选新的Leader节点。由此保证了工作节点宕机切换新节点后与客户端的配置数据的一致。
更具体地,图5示出了本公开实施例中Candidate节点的决策逻辑,如图5所示,Candidate节点首先会比较所有存活节点的任期数,并将任期数最大的节点选为Leader节点。
当多个节点的任期数相同且均为最大时,再次比较任期数最大的多个节点的日志索引值,将日志索引值最大的节点选为Leader节点。
基于同一发明构思,本公开实施例中还提供了一种节点选举装置,如下面的实施例所述。由于该装置实施例解决问题的原理与上述方法实施例相似,因此该装置实施例的实施可以参见上述方法实施例的实施,重复之处不再赘述。
图6示出本公开实施例中一种节点选举装置示意图,如图6所示,该装置600包括:
收集模块601,当第一Leader节点宕机时,将所述分布式***中的一Follower节点转换为候选者Candidate节点以接收选举消息,所述选举消息由剩余Follower节点发送至所述Candidate节点,所述选举消息包括剩余Follower节点的任期数和日志索引值;
选举模块602,用于利用所述Candidate节点进行选举,将所述Candidate节点和剩余Follower节点中任期数最大的节点选举为第二Leader节点,当任期数最大的节点不唯一时,将任期数最大的节点中日志索引值最大的节点选举为第二Leader节点。
需要说明的是,上述实施例提供的节点选举装置在节点选举时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的节点选举装置与节点选举方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
可选地,上述收集模块601具体用于:
随机赋予多个Follower节点选举时长,将选举时长最先结束的Follower节点转换为Candidate节点。
可选地,上述收集模块601还可用于:
通过Candidate节点向其余Follower节点发送选举请求。
可选地,上述模块选举模块602还可用于:
当任期数最大的节点中日志索引值最大的节点不唯一时,将任一日志索引值最大的节点选举为第二Leader节点。
可选地,分布式***中的节点总数为奇数。
可选地,上述模块选举模块602还可用于:
当分布式***中存在Leader节点时,将除Leader节点以外的其他节点转换为Follower节点。
基于同一发明构思,本公开实施例中还提供了另一种节点选举装置,如下面的实施例所述。由于该装置实施例解决问题的原理与上述方法实施例相似,因此该装置实施例的实施可以参见上述方法实施例的实施,重复之处不再赘述。
图7示出本公开实施例中一种节点选举装置示意图,如图7所示,该装置700包括:
收集模块701,当第一Leader节点宕机时,将所述分布式***中的一Follower节点转换为候选者Candidate节点以接收选举消息,所述选举消息由剩余Follower节点发送至所述Candidate节点,所述选举消息包括剩余Follower节点的任期数和日志索引值;
选举模块702,用于利用所述Candidate节点进行选举,将所述Candidate节点和剩余Follower节点中任期数最大的节点选举为第二Leader节点,当任期数最大的节点不唯一时,将任期数最大的节点中日志索引值最大的节点选举为第二Leader节点。
同步模块703,用于当第一Leader节点重新上线时,将第二Leader节点的数据同步至第一Leader节点,同时将第一Leader节点转换为Follower节点。
需要说明的是,上述实施例提供的节点选举装置在节点选举时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的节点选举装置与节点选举方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为***、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“***”。
下面参照图8来描述根据本公开的这种实施方式的电子设备800。图8显示的电子设备800仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图8所示,电子设备800以通用计算设备的形式表现。电子设备800的组件可以包括但不限于:上述至少一个处理单元810、上述至少一个存储单元820、连接不同***组件(包括存储单元820和处理单元810)的总线830。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元810执行,使得所述处理单元810执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如,所述处理单元810可以执行上述方法实施例的如下步骤:当第一Leader节点宕机时,将所述分布式***中的一Follower节点转换为候选者Candidate节点以接收选举消息,所述选举消息由剩余Follower节点发送至所述Candidate节点,所述选举消息包括剩余Follower节点的任期数和日志索引值;利用所述Candidate节点进行选举,将所述Candidate节点和剩余Follower节点中任期数最大的节点选举为第二Leader节点,当任期数最大的节点不唯一时,将任期数最大的节点中日志索引值最大的节点选举为第二Leader节点。
可选地,上述处理单元810具体用于执行:
随机赋予多个Follower节点选举时长,将选举时长最先结束的Follower节点转换为Candidate节点。
可选地,上述处理单元810还可执行:
通过Candidate节点向其余Follower节点发送选举请求。
可选地,上述处理单元810还可执行:
当任期数最大的节点中日志索引值最大的节点不唯一时,将任一日志索引值最大的节点选举为第二Leader节点。
可选地,分布式***中的节点总数为奇数。
可选地,上述处理单元810还可执行:
当分布式***中存在Leader节点时,将除Leader节点以外的其他节点转换为Follower节点。
可选地,上述处理单元810还可执行:
当第一Leader节点重新上线时,将第二Leader节点的数据同步至第一Leader节点,同时将第一Leader节点转换为Follower节点。
存储单元820可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)8201和/或高速缓存存储单元8202,还可以进一步包括只读存储单元(ROM)8203。
存储单元820还可以包括具有一组(至少一个)程序模块8205的程序/实用工具8204,这样的程序模块8205包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线830可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、***总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备800也可以与一个或多个外部设备840(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备800交互的设备通信,和/或与使得该电子设备800能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口850进行。并且,电子设备800还可以通过网络适配器860与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器860通过总线830与电子设备800的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备800使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质可以是可读信号介质或者可读存储介质。其上存储有能够实现本公开上述方法的程序产品。在一些可能的实施方式中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。
本公开中的计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
在本公开中,计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
可选地,计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
在具体实施时,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。

Claims (10)

1.一种节点选举方法,其特征在于,应用于分布式***,所述分布式***包括第一领导者Leader节点和多个与第一Leader节点保持通信的追随者Follower节点,所述方法包括:
当第一Leader节点宕机时,将所述分布式***中的一Follower节点转换为候选者Candidate节点以接收选举消息,所述选举消息由剩余Follower节点发送至所述Candidate节点,所述选举消息包括剩余Follower节点的任期数和日志索引值;
利用所述Candidate节点进行选举,将所述Candidate节点和剩余Follower节点中任期数最大的节点选举为第二Leader节点,当任期数最大的节点不唯一时,将任期数最大的节点中日志索引值最大的节点选举为第二Leader节点。
2.根据权利要求1所述的分布式***节点选举方法,其特征在于,所述将所述分布式***中一Follower节点转换为候选者Candidate节点具体包括:
随机赋予多个Follower节点选举时长,将选举时长最先结束的Follower节点转换为Candidate节点。
3.根据权利要求1所述的分布式***节点选举方法,其特征在于,所述方法还包括:
通过所述Candidate节点向其余Follower节点发送选举请求。
4.根据权利要求1所述的分布式***节点选举方法,其特征在于,所述方法还包括:
当第一Leader节点重新上线时,将第二Leader节点的数据同步至第一Leader节点,同时将第一Leader节点转换为Follower节点。
5.根据权利要求1所述的分布式***节点选举方法,其特征在于,所述方法还包括:
当任期数最大的节点中日志索引值最大的节点不唯一时,将任一日志索引值最大的节点选举为第二Leader节点。
6.根据权利要求1所述的分布式***节点选举方法,其特征在于,所述分布式***中的节点总数为奇数。
7.根据权利要求1所述的分布式***节点选举方法,其特征在于,所述方法还包括:
当所述分布式***中存在Leader节点时,将除Leader节点以外的其他节点转换为Follower节点。
8.一种节点选举装置,其特征在于,应用于分布式***,所述分布式***包括第一领导者Leader节点和多个与第一Leader节点保持通信的追随者Follower节点,包括:
收集模块,当第一Leader节点宕机时,将所述分布式***中的一Follower节点转换为候选者Candidate节点以接收选举消息,所述选举消息由剩余Follower节点发送至所述Candidate节点,所述选举消息包括剩余Follower节点的任期数和日志索引值;
选举模块,用于利用所述Candidate节点进行选举,将所述Candidate节点和剩余Follower节点中任期数最大的节点选举为第二Leader节点,当任期数最大的节点不唯一时,将任期数最大的节点中日志索引值最大的节点选举为第二Leader节点。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1~7中任意一项所述的节点选举方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~7中任意一项所述的节点选举方法。
CN202111681518.2A 2021-12-29 2021-12-29 节点选举方法、装置、电子设备及存储介质 Pending CN114363154A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111681518.2A CN114363154A (zh) 2021-12-29 2021-12-29 节点选举方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111681518.2A CN114363154A (zh) 2021-12-29 2021-12-29 节点选举方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114363154A true CN114363154A (zh) 2022-04-15

Family

ID=81105773

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111681518.2A Pending CN114363154A (zh) 2021-12-29 2021-12-29 节点选举方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114363154A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114866554A (zh) * 2022-05-20 2022-08-05 东风商用车有限公司 一种免选举分布式协议的方法、装置、设备及存储介质
CN115002143A (zh) * 2022-08-01 2022-09-02 北京奥星贝斯科技有限公司 一种节点选举的方法、装置、存储介质及电子设备
CN115102967A (zh) * 2022-06-15 2022-09-23 西安工业大学 一种高共识效率的共识方法和分布式***
CN115529217A (zh) * 2022-09-15 2022-12-27 中国电信股份有限公司 控制器选举方法和控制器、存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108616566A (zh) * 2018-03-14 2018-10-02 华为技术有限公司 raft分布式***选主方法、相关设备及***
US20210185150A1 (en) * 2019-12-11 2021-06-17 Vast Data Ltd. System and method for leader election in distributed storage systems

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108616566A (zh) * 2018-03-14 2018-10-02 华为技术有限公司 raft分布式***选主方法、相关设备及***
US20210185150A1 (en) * 2019-12-11 2021-06-17 Vast Data Ltd. System and method for leader election in distributed storage systems

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114866554A (zh) * 2022-05-20 2022-08-05 东风商用车有限公司 一种免选举分布式协议的方法、装置、设备及存储介质
CN115102967A (zh) * 2022-06-15 2022-09-23 西安工业大学 一种高共识效率的共识方法和分布式***
CN115002143A (zh) * 2022-08-01 2022-09-02 北京奥星贝斯科技有限公司 一种节点选举的方法、装置、存储介质及电子设备
CN115002143B (zh) * 2022-08-01 2023-01-20 北京奥星贝斯科技有限公司 一种节点选举的方法、装置、存储介质及电子设备
CN115529217A (zh) * 2022-09-15 2022-12-27 中国电信股份有限公司 控制器选举方法和控制器、存储介质

Similar Documents

Publication Publication Date Title
CN114363154A (zh) 节点选举方法、装置、电子设备及存储介质
CA2957749C (en) Systems and methods for fault tolerant communications
CN107832138B (zh) 一种扁平化的高可用namenode模型的实现方法
US10826812B2 (en) Multiple quorum witness
US10193951B2 (en) Binding CRUD-type protocols in distributed agreement protocols
US7937716B2 (en) Managing collections of appliances
CN111090699A (zh) 业务数据的同步方法和装置、存储介质、电子装置
CN112448858B (zh) 网络通信控制方法及装置、电子设备和可读存储介质
US20090063650A1 (en) Managing Collections of Appliances
US11934670B2 (en) Performing various operations at the granularity of a consistency group within a cross-site storage solution
CN110795503A (zh) 分布式存储***的多集群数据同步方法及相关装置
US10819641B2 (en) Highly available servers
CN107666493B (zh) 一种数据库配置方法及其设备
US10048983B2 (en) Systems and methods for enlisting single phase commit resources in a two phase commit transaction
US10721335B2 (en) Remote procedure call using quorum state store
US9614716B2 (en) Controller maintenance in a network-attached storage system
CN1988477A (zh) 具有高可用性特征的网络管理***
Mechaoui et al. Mica: Lightweight and mobile collaboration across a collaborative editing service in the cloud
CN113472638B (zh) 边缘网关控制方法及***、装置、电子设备、存储介质
CN115238006A (zh) 检索数据同步方法、装置、设备及计算机存储介质
US11327785B2 (en) Computing system including enhanced application performance based on last completed operation sequence value
US20180041382A1 (en) Providing unit of work continuity in the event initiating client fails over
US11188522B2 (en) Streamlined database commit for synchronized nodes
EP3387533B1 (en) Disaster recovery of cloud resources
RU2802373C1 (ru) Системы и способы получения информации сети радиодоступа

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination