CN102916825A - 一种双机热备***的管理设备、管理方法及双机热备*** - Google Patents

一种双机热备***的管理设备、管理方法及双机热备*** Download PDF

Info

Publication number
CN102916825A
CN102916825A CN2011102167388A CN201110216738A CN102916825A CN 102916825 A CN102916825 A CN 102916825A CN 2011102167388 A CN2011102167388 A CN 2011102167388A CN 201110216738 A CN201110216738 A CN 201110216738A CN 102916825 A CN102916825 A CN 102916825A
Authority
CN
China
Prior art keywords
server
management
management equipment
master server
dual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011102167388A
Other languages
English (en)
Inventor
叶成旭
常二鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN2011102167388A priority Critical patent/CN102916825A/zh
Publication of CN102916825A publication Critical patent/CN102916825A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种双机热备***的管理设备、管理方法及双机热备***。所述管理设备用于分别与所述主服务器和所述从服务器连接,以对应实现与所述主服务器之间以及与所述从服务器之间的信息交互;所述管理设备还用于判断所述主服务器能否正常工作,以及在判断所述主服务器不能正常工作时,通过发送控制命令的方式来控制所述主服务器与所述从服务器之间的自动切换。应用本发明的技术方案,通过分别与主、从服务器之间进行信息交互,从而实现了对主、从服务器的监督。并且,通过发送控制命令的方式来控制主、从服务器之间的运行状态,从而实现了主、从服务器的自动切换,避免了现有双机热备***中出现的脑裂问题,增强了双机热备***的稳定性。

Description

一种双机热备***的管理设备、管理方法及双机热备***
技术领域
本发明涉及通信领域,具体而言,尤其涉及一种双机热备***的管理设备、管理方法及双机热备***。
背景技术
双机热备方案,就是对于重要的服务,使用两台服务器,互相备份,共同执行同一服务。当一台服务器出现故障时,可以由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证***能持续提供服务。
按照双机热备方案在工作中的切换方式,分为主-备方式(Active-Standby方式)和双主机方式(Active-Active方式)。具体地,主-备方式指的是一台服务器处于某种业务的激活状态(即Active状态),另一台服务器则处于该业务的备用状态(即Standby状态);而双主机方式即指的是两种不同业务分别在两台服务器上互为主备状态(即Active-Standby和Standby-Active状态)。在分布式数据库应用中,为了在提高***可靠性的同时也能够充分利用服务器的计算能力,一般采用双主机方式来进行备份。
图1所示的是现有技术中的双机热备***示意图。该双机热备***是由安装在两台服务器上的双机软件控制其状态的。每台服务器分配一个固定的IP地址,同时还指定一个独立的IP地址作为集群IP地址。该集群IP地址是双机热备***对外提供服务的接口。两台服务器中,一台为主服务器(Primary Server),另一台为从服务器(Standby Server)。主、从服务器之间保持固定时间间隔的心跳消息,两个服务器通过心跳消息来互相监测对方的运行状态。在正常运行时,主服务器占用***资源并对外提供服务,从服务器通过心跳消息监视主服务器的运行情况。一旦主服务器发生故障,从服务器就会自动接管主服务器的资源和服务,继续支持对外提供服务。
现有双机热备***在运行过程中,会存在这样的问题:如果发生网络故障,或者是主服务器或从服务器自身出现问题,致使主、从服务器之间出现通讯故障,那么主、从服务器则不能继续相互监测对方的运行状态。此时双机热备***为保证对外提供服务的连续性,会将两台服务器均设为主服务器,同时对外提供服务。如此,则会导致双机热备***中两台服务器的数据不一致。在网络故障消除后,则无法确定该以哪台服务器的数据为准,出现脑裂问题。由此可见,现有双机热备***还有待改进。
发明内容
本发明要解决的主要技术问题是,提供一种双机热备***的管理设备、管理方法及双机热备***,能够实现双机热备***中主、从服务器的自动切换,进而避免了由于双机热备***中的两个服务器均向外提供服务而导致的脑裂问题。
为解决上述技术问题,本发明采用了以下技术方案:
一种双机热备***的管理设备,所述双机热备***包括一个主服务器和一个从服务器;
所述管理设备用于分别与所述主服务器和所述从服务器连接,以对应实现与所述主服务器之间以及与所述从服务器之间的信息交互;
所述管理设备还用于判断所述主服务器能否正常工作,以及在判断所述主服务器不能正常工作时,通过发送控制命令的方式来控制所述主服务器与所述从服务器之间的自动切换。
在本发明实施例中,所述管理设备还用于在未接收到所述主服务器发来的交互信息时,判断所述主服务器不能正常工作;以及还用于在接收到所述主服务器发来的交互信息且判断所述交互信息异常时,判断所述主服务器不能正常工作。
在本发明实施例中,所述管理设备包括:一个主管理服务器和至少两个从管理服务器;
所述主管理服务器用于分别与所述主服务器和所述从服务器连接,以对应实现与所述主服务器之间以及与所述从服务器之间的信息交互;
所述主管理服务器还用于判断所述主服务器能否正常工作,以及在判断所述主服务器不能正常工作时,通过发送控制命令的方式来控制所述主服务器与所述从服务器之间的自动切换;
所述从管理服务器用于判断所述主管理服务器能否正常工作,并在所述主管理服务器不能正常工作时,从所述从管理服务器中选举出一个从管理服务器并切换为主管理服务器。
在本发明实施例中,所述主管理服务器还用于在未接收到所述主服务器发来的交互信息时,判断所述主服务器不能正常工作;以及还用于在接收到所述主服务器发来的交互信息且判断所述交互信息异常时,判断所述主服务器不能正常工作。
在本发明实施例中,所述从管理服务器均设有自选举模块,用于根据paxos算法从所述从管理服务器中选举出一个从管理服务器并切换主管理服务器。
在本发明实施例中,所述主管理服务器包括控制模块,用于接收用户从客户端输入的对双机热备***以及管理设备的控制信息并解析,以及将解析后得到的用户控制命令下发给相应的命令执行对象。
同时,本发明还提供了一种双机热备***的管理方法,所述双机热备***包括一个主服务器和一个从服务器,所述管理方法包括以下步骤:
管理设备分别与所述主服务器以及与所述从服务器进行信息交互;
管理设备判断所述主服务器能否正常工作,以及在所述主服务器不能正常工作时,通过发送控制命令的方式来控制所述主服务器与所述从服务器之间的自动切换。
在本发明实施例中,所述管理设备判断所述主服务器能否正常工作的步骤为:当所述管理设备未接收到所述主服务器发来的交互信息时,判断所述主服务器不能正常工作;或当所述管理设备接收到所述主服务器发来的交互信息且判断所述交互信息异常时,判断所述主服务器不能正常工作。
在本发明实施例中,所述管理设备包括:一个主管理服务器和至少两个从管理服务器,所述管理设备管理所述双机热备***的步骤包括:
所述主管理服务器与所述主服务器以及与所述从服务器进行信息交互;
所述主管理服务器判断所述主服务器能否正常工作,以及在判断所述主服务器不能正常工作时,通过发送控制命令的方式来控制所述主服务器与所述从服务器之间的自动切换;
所述从管理服务器判断所述主管理服务器能否正常工作,并在判断所述主管理服务器不能正常工作时,从所述从管理服务器中选举出一个从管理服务器并切换为主管理服务器。
另外,本发明还提供了一种双机热备***,包括一个主服务器和一个从服务器;
所述主服务器和所述从服务器用于对应与管理设备相连接,分别实现与管理设备之间的信息交互;
所述主服务器用于在未接收到所述管理设备回复的交互信息或接收到所述管理设备回复的切换为从服务器的状态切换命令时,自动切换为从服务器;
所述从服务器用于在接收到所述管理设备发来的切换为主服务器的双机切换命令时,自动切换为主服务器。
本发明的有益效果是:
通过分别与主、从服务器之间进行信息交互,从而实现了对主、从服务器的监督。如此,方便了用户的操作与管理。并且,本发明的管理设备在判断主服务器的运行状态出现问题时,通过发送控制命令的方式来控制主、从服务器之间的运行状态,从而实现了双机热备***中主、从服务器的自动切换,保证了双机热备***中向外提供服务的服务器只有一个,进而避免了由于双机热备***中的两个服务器均向外提供服务而导致的脑裂问题,增强了双机热备***的稳定性。
附图说明
图1为现有的双机热备***的结构示意图;
图2为本发明一种实施例的管理设备与双机热备***的信息交互示意;
图3为本发明一种实施例的管理设备的结构示意图;
图4为本发明一种实施例的管理方法流程图;
图5为本发明一种实施例的选取主管理服务器的流程图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。
现有的双机热备***中,会出现因为网络障碍、或主服务器、或从服务器自身的问题而导致主、从服务器之间通讯故障的问题,进而也会导致服务器的脑裂问题。
为解决现有技术中因双机***中的两个服务器均向外提供服务而导致的脑裂问题,本发明提出了一种双机热备***的管理设备及管理方法。
如图2所示,本发明提出的双机热备***的管理设备1,用于与双机热备***2中的主服务器21连接,以实现与主服务器21之间的信息交互;管理设备1还用于与双机热备***2中的从服务器22连接,以实现与从服务器22之间的信息交互。管理设备还用于判断主服务器是否能正常工作时,以及在判断主服务器无法正常工作时,通过发送控制命令的方式来控制主、从服务器之间的运行状态,从而实现了主服务器与从服务器之间的自动切换。管理设备可以管理一个双机热备***,也可以管理多个双机热备***。
管理设备与主服务器以及与从服务器进行信息交互时,主、从服务器调用自身内部的脚本程序执行状态status查询命令,获取自身的当前状态值,并将该状态值上报给管理设备。管理设备接收上报的状态值并对其进行分析,就可以对主服务器的当前运行状态以及从服务器的当前运行状态进行监督。
管理设备不仅仅可以监督主、从服务器的运行状态,而且管理设备还可以通过发送控制命令的方式对主、从服务器的运行状态进行控制。当管理设备监测到主服务器不能正常工作时,为了保证双机热备***能正常地向外提供服务,管理设备则通过发送控制命令的方式控制主服务器与从服务器之间的自动切换。所以,之前的主服务器则切换为从服务器,之前的从服务器则切换为主服务器。
与现有技术相比,本发明的管理设备通过分别与主、从服务器之间进行信息交互,从而实现了对主、从服务器的监督。如此,一方面可以方便用户的管理与控制;另一方面,也可以简化双机热备***中主、从服务器的内部功能设计,降低主、从服务器运行时的复杂度。并且,本发明的管理设备在判断主服务器的运行状态出现问题时,通过发送控制命令的方式,从而实现了双机热备***中主、从服务器的自动切换,保证了双机热备***中向外提供服务的服务器只有一个,进而避免了由于双机热备***中的两个服务器均向外提供服务而导致的脑裂问题,增强了双机热备***的稳定性。
需要说明的一点是,主服务器、从服务器与管理设备之间可以通过IP地址建立通讯连接。具体地,由于双机热备***中的主、从服务器可能有很多台,因此,可考虑在每台主、从服务器中存储管理设备的IP地址,并通过主、从服务器主动向管理设备发送建立通讯链路的请求来建立连接。管理设备内可以不存储主、从服务器的IP地址。
需要说明的另一点是,由于双机热备***中的主服务器、从服务器之间是可以进行自动切换的,因此上述中所说的主服务器均指的是当前双机热备***中向外提供服务的服务器,从服务器指的是当前双机热备***中没有向外提供服务的服务器。
进一步地,在本发明实施例中,管理设备通过与主服务器之间,以及与从服务器之间相互发送交互信息的方式来监督主、从服务器的运行状态,例如通过相互发送心跳消息的形式来监督主、从服务器的运行状态,并且还根据信息交互结果来判断主服务器能否正常工作。具体地,主服务器A、从服务器B定时向管理设备发送心跳消息。该心跳消息中携带了主、从服务器当前运行状态的状态值。管理设备通过接收该心跳消息,并对该心跳消息进行解析,就可以知道主、从服务器的当前运行状态。其中,管理设备根据信息交互结果判断主服务器能否正常工作的方式有两种。
第一种方式是:若管理设备没有接收到主服务器发来的心跳消息时,此时管理设备则判断主服务器无法正常工作。而管理设备为保证双机热备***的正常工作,则停止回复心跳消息给主服务器A,而原来的主服务器A由于在设定的时间内没有接收到管理设备返回的心跳消息,则自动切换为从服务器。超过设定的时间后,管理设备则向从服务器B发送双机切换命令,命令从服务器B自动切换为主服务器。如此则实现了双机热备***中的主、从服务器的自动切换,保证了双机热备***的正常工作,避免了脑裂问题
而另一种方式是:管理设备接收到主服务器发来的心跳消息,但通过解析该心跳消息后,判断该心跳消息属于异常心跳消息时,管理设备则判断主服务器无法正常工作。管理设备为保证双机热备***的正常工作,则向主服务器A发送切换为从服务器的状态切换命令,命令主服务器A自动切换为从服务器。主服务器A接收到管理设备发来的状态切换命令,并进行解析以及执行切换为从服务器的操作。待主服务器A切换为从服务器后,管理设备则向从服务器B发送切换为主服务器的双机切换命令。从服务器B接收到该双机切换命令并对其解析,以及执行自动切换为主服务器的操作,从而向外提供服务。如此也实现了双机热备***中的主、从服务器的自动切换,保证了双机热备***的正常工作,避免了脑裂问题。
实际上,管理设备与主服务器之间出现通讯故障的原因有多种,例如可能是主服务器与管理设备之间的通讯链路出现了问题,可能是主服务器自身出现了问题,也可能是管理设备自身出现了问题。在本发明中,不管是因为何种原因导致了管理设备与主服务器之间的通讯故障,管理设备均判断主服务器不能正常工作时,既而都会实行主服务器与从服务器的自动切换。
需要说明的是,管理设备与主服务器之间的通讯链路出现问题以及主服务器自身出现问题都是不可预知的。但是,通过合理设计管理设备的内部结构,却可以尽可能地减少管理设备自身出现问题的机率。
例如,如图3所示,在本发明实施例中,管理设备包括一个主管理服务11器和至少两个从管理服务器12,13。
主管理服务器11用于与双机热备***中的主服务器相连,实现与主服务器之间的信息交互;主管理服务器11也用于与双机热备***中的从服务器相连,以实现与从服务器之间的信息交互。
主管理服务器通过与主服务器和从服务器之间的信息交互,从而达到监督主、从服务器的当前运行状态的目的。当然,主管理服务器还用于判断主服务器是否能正常工作,并在判断主服务器无法正常工作时,通过发送控制命令的方式来控制主服务器与从服务器之间的自动切换。
而管理设备还包括至少两个从管理服务器12和13,用于判断主管理服务器11是否能正常工作,并在判断主管理服务器无法正常工作时,从从管理服务器12和13中选举出一个从管理服务器并切换为主管理服务器。
一种实施方式中,主管理服务器与从管理服务器之间可以通过IP地址建立通讯连接。具体地,主管理服务器和从管理服务器上都有一个配置文件,该配置文件中含有管理设备内的所有管理服务器的IP地址的信息。在管理设备启动时,每台管理服务器都需要检测自身存储的IP地址的合法性,然后再与其它的管理服务器建立相互之间的通讯连接。
从管理服务器通过与主管理服务器之间通过信息交互的方式来判断主管理服务器是否正常工作。例如从管理服务器通过与主管理服务器之间可以通过相互发送心跳消息的方式来监督对方的运行状态。若从管理服务器未接收到主管理服务器发来的心跳消息,则判断主管理服务器的运行状态出现故障。为保证管理设备与主、从服务器之间的信息交互,从管理服务器则从众多的从管理服务器中自动选取出一个从管理服务器,并将其切换为主管理服务器,接替之前的主管理服务器的工作。而之前的主管理服务器由于没有接收到从管理服务器返回的心跳消息,则自动切换为从管理服务器。
如图3所示,管理设备可以与多个双机热备***(如双机热备***1至双机热备***N中的一个或多个)中的主、从服务器进行信息交互。例如,与双机热备***1中的主服务器211、从服务器212进行信息交互,或者与双机热备***N中的主服务器221、从服务器222进行信息交互。通过管理设备内的主、从管理服务器的设计,从而能够尽可能地减少了因管理设备自身出问题而导致管理设备与主服务器之间出现通讯故障的问题,减少了双机热备***中主、从设备之间不必要的自动切换,增强了双机热备***的稳定性。
需要说明的一点是,本发明中所说的主管理服务器,均指的是当前与外界的主、从服务器进行信息交互的,并对主、从服务器进行监督与控制的管理服务器。而从管理服务器则指的是当前没有对双机热备***中的主、从服务器进行监督与控制的管理服务器。双机热备***中的主、从服务器均与管理设备中的当前管理服务器进行信息交互,并接受当前管理服务器的管理与控制。本发明中的主管理服务器、从管理服务器之间可以相互切换,也就是说主、从服务器能实现相同的功能。因此,可以理解的是,主、从管理服务器的内部结构设计可以是一样的,相互之间的连接关系也可以是对应的。
由于主管理服务器与从管理服务器之间是通过相互发送心跳信息来监督对方的运行状态的,因此,若从管理服务器的数量设计不恰当,则也可能出现管理设备不能工作的问题。例如,若管理设备只有一个主管理服务器,没有从管理服务器,那么则不能解决尽可能地减少因为管理设备出现故障而引起的主、从服务器的相互切换的问题。若管理设备有一个主管理服务器,一个从管理服务器,但是不能很好保证主、从管理服务器的自动切换,所以会导致管理设备不能正常工作。因此,在本发明中,从管理服务器的数量选择为至少两个。当主管理服务器的运行状态出现故障时,从所有的从管理服务器中自动选举出一个从管理服务器并将其切换为主管理服务器,接替原来的主管理服务器的工作。如此,既解决了尽可能地减少因为管理设备自身出故障而引起的主备切换,增强了双机热备***的稳定性。
具体地,在一种实施例中,每个从管理服务器均设有自选举模块,用于根据paxos算法从所有的从管理服务器中选举出一个从管理服务器并切换主管理服务器。在选举主管理服务器时,paxos算法要求某个从管理服务器只有在拥有超过一半的支持者时才能被选为主管理服务器。可以理解的是,由于主、从管理服务器的内部结构可以是相同的,因此,当前的主管理服务器内也设有自选举模块。当当前的主管理服务器切换为从管理服务器时,其也可以使用自身的自选取模块进行主管理服务器的选取。
在一种实施例中,主管理服务器与主、从服务器之间通过相互发送心跳消息的方式来监督主、从服务器的运行状态,并根据心跳消息的接收结果判断主服务器能否正常工作。主管理服务器判断主服务器能否正常工作的方式有两种。
其中一种方式是:若主管理服务器未接收到主服务器A发来的心跳消息,主管理服务器则判断主服务器A不能正常工作。为保证双机热备***的正常工作,主管理服务器则停止向主服务器回复心跳消息。而主服务器A由于在设定的时间内没有收到主管理服务器发来的心跳消息,则判断自身不能正常工作,自动切换为从服务器。超过设定时间后,主管理服务器则向从服务器B发送切换为主服务器的双机切换命令,从服务器B解析该双机切换命令,并执行切换为主服务器的操作。具体来说,从服务器内的驻留程序接收主管理服务器发来的双机切换命令并解析,得到将从服务器切换为主服务器的命令并执行。最后,驻留程序还将执行结果返回给主管理服务器。
另一种方式是:主管理服务器接收到主服务器A发来的心跳消息,但通过解析该心跳消息后,判断该心跳消息属于异常心跳消息时,主管理服务器则判断主服务器A无法正常工作。主管理服务器为保证双机热备***的正常工作,则向主服务器A发送切换为从服务器的状态切换命令,命令主服务器自动切换为从服务器。主服务器A内的驻留程序接收到主管理服务器发来的状态切换命令,并解析以及执行切换为从服务器的操作。待主服务器A切换为从服务器后,主管理服务器则向从服务器B发送切换为主服务器的双机切换命令。从服务器B的驻留程序接收到该双机切换命令并对其解析,以及执行自动切换为主服务器的操作,从而向外提供服务。
如图3所示,在本发明一种实施例中,当前的主管理服务器11还包括控制模块,用于接收用户从客户端3输入的对双机热备***以及管理设备的控制信息。具体地,主管理服务器11可以与客户端3相连,通过控制模块接收用户从客户端3的输入信息。其中,用户通过客户端3将信息输入并传送给管理设备内的控制模块。控制模块可以接收用户输入的如启动管理设备、停止运行管理设备等输入信息,也可以接收用户输入的查看双机热备***的运行状态、双机切换命令等输入信息。客户端接收用户的输入信息,并将用户的输入信息封装为消息格式并传输给控制模块。控制模块接收客户端传来的用户的输入信息,并对控制信息进行解析,以及将解析后得到的用户控制命令下达给相应的命令执行对象,如主、从服务器内的驻留程序等,从而实现对整个管理设备和其管理的双机热备***的操作和控制。驻留程序执行用户的输入信息对应的操作后,还将操作结果通过管理设备返回给客户端3,并在客户端3上显示出来。
可以理解的是,由于主、从管理服务器可以实现无间隙的切换。因此一方面可以确定的是从管理服务器内也设有控制模块,当从管理服务器被切换为主管理服务器时,该控制模块也可以接收用户的输入信息。另一方面,主、从服务器不但与当前的主管理服务器相连,也与当前的从管理服务器相连,只是此时从管理服务器不能执行监督与控制主、从服务器的操作。
需要说明的是,一般情况下,在管理设备和双机热备***启动后,都是处于自动运行状态,此时用户可以不用输入信息进行控制。但是若管理设备及双机热备***处于调试阶段时,或当管理设备或双机热备***运行出现故障时、或需要增加服务等,则需要通过用户手动输入信息来调试控制管理设备与双机热备***的运行状态。
同时,如图4所示,本发明还提供了一种双机热备***的管理方法,该双机热备***包括一个主服务器和一个从服务器,该管理方法包括以下步骤:
S1、管理设备分别与主服务器以及与从服务器进行信息交互;
S2、管理设备判断主服务器是否能正常工作,并在判断主服务器不能正常工作时,通过发送控制命令的方式来控制主服务器与从服务器之间的自动切换。
通过管理设备分别与主服务器之间进行信息交互,从而实现了对主、从服务器的监督。并且,管理设备在判断主服务器的运行状态出现问题时,可以通过发送控制命令的方式控制主服务器与从服务器之间的自动切换,保证了双机热备***中向外提供服务的服务器只有一个,进而避免了由于双机热备***中的两个服务器均向外提供服务而导致的脑裂问题。
在一种实施例中,管理设备与主、从服务器之间是通过相互发送心跳消息的形式来进行信息交互的。管理设备判断主服务器能否正常工作的方式有:
第一:当管理设备未接收到主服务器A发来的心跳消息时,判断主服务器A的运行状态出现问题。管理设备为保证双机热备***的正常运行,则停止回复心跳消息给主服务器A。此时管理设备与主服务器A之间的连接断开,主服务器A由于在设定时间内没有收到管理设备回复的心跳信息,则判断自身运行状态出现故障,于是自动切换为从服务器。超过设定的时间后,管理设备则向从服务器B发送切换为主服务器的双机切换命令。
第二:管理设备接收到主服务器A发来的心跳消息,但通过解析该心跳消息后,判断该心跳消息属于异常心跳消息时,管理设备则判断主服务器A无法正常工作。管理设备为保证双机热备***的正常工作,则向主服务器A发送切换为从服务器的状态切换命令,命令主服务器A自动切换为从服务器。主服务器A内的驻留程序接收到管理设备发来的状态切换命令,并解析以及执行切换为从服务器的操作。待主服务器A切换为从服务器后,管理设备则向从服务器B发送切换为主服务器的双机切换命令。从服务器B的驻留程序接收到该双机切换命令并对其解析,以及执行自动切换为主服务器的操作,从而向外提供服务。
在一种实施例中,管理设备包括:一个主管理服务器和至少两个从管理服务器,管理设备管理所述双机热备***的步骤包括:
主管理服务器与主服务器以及与从服务器进行信息交互;
主管理服务器判断主服务器能否正常工作,以及在判断主服务器不能正常工作时,通过发送控制命令的方式来控制主服务器与从服务器之间的自动切换;
从管理服务器在判断主管理服务器是否出现故障时,从从管理服务器中选举出一个从管理服务器并切换为主管理服务器。
在上述步骤中,默认管理设备启动时,就已经选出了一个主管理服务器。实际上,在管理设备启动之初,还有一个选择主管理服务器的过程。具体地,如图5所示,启动管理设备,选举主管理服务器的步骤包括:
S3、启动管理设备;
S4、读取配置文件,获取管理设备内所有管理服务器的IP地址;
S5、与其它IP地址建立通讯链路;
S6、使用paxos算法选取出一个主管理服务器;
当选取完成后,被选举出来的主管理服务器则进入监督与控制双机热备***中的主、从服务器的工作模式,而其余的管理服务器则进入从管理服务器的工作模式。主管理服务器通过与主、从服务器进行信息交互的方式来监督与控制主、从服务器。从管理服务器则用于判断主管理服务器的运行状态是否出现故障,并在判断出主管理服务器无法正常工作时,使用paxos算法,从从管理服务器中选取出一个,并切换为主管理服务器,接替之前的主管理服务器的工作。
应用本发明的管理设备和管理方法,通过分别与主、从服务器之间进行信息交互,从而实现了对主、从服务器的监督。如此,则可以间接简化双机热备***中主、从服务器的内部功能设计,降低主、从服务器运行时的复杂度。并且,在判断主服务器的运行状态出现问题时,通过发送控制命令的方式来控制双机热备***中主、从服务器的自动切换,保证了双机热备***中向外提供服务的服务器只有一个,进而避免了由于双机热备***中的两个服务器均向外提供服务而导致的脑裂问题,便于用户的管理与控制,也增强了双机热备***的稳定性。
另外,本发明还提供了一种双机热备***,包括一个主服务器和一个从服务器,主服务器和从服务器用于对应与管理设备相连接,分别实现与管理设备之间的信息交互;主服务器还用于在未接收到管理设备回复的交互信息或接收到所述管理设备回复的切换为从服务器的状态切换命令时,自动切换为从服务器;从服务器则用于在接收到管理设备发来的切换为主服务器的双机切换命令时,自动切换为主服务器。
本发明的双机热备***,不会出现因主、从服务器之间不能通讯而导致的脑裂问题,增强了双机热备***的稳定性与可靠性,可以应用于分布式数据库***的备份领域。
以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种双机热备***的管理设备,其特征在于,所述双机热备***包括一个主服务器和一个从服务器;
所述管理设备用于分别与所述主服务器和所述从服务器连接,以对应实现与所述主服务器之间以及与所述从服务器之间的信息交互;
所述管理设备还用于判断所述主服务器能否正常工作,以及在判断所述主服务器不能正常工作时,通过发送控制命令的方式来控制所述主服务器与所述从服务器之间的自动切换。
2.如权利要求1所述的管理设备,其特征在于,所述管理设备还用于在未接收到所述主服务器发来的交互信息时,判断所述主服务器不能正常工作;以及还用于在接收到所述主服务器发来的交互信息且判断所述交互信息异常时,判断所述主服务器不能正常工作。
3.如权利要求1或2所述的管理设备,其特征在于,所述管理设备包括:一个主管理服务器和至少两个从管理服务器;
所述主管理服务器用于分别与所述主服务器和所述从服务器连接,以对应实现与所述主服务器之间以及与所述从服务器之间的信息交互;
所述主管理服务器还用于判断所述主服务器能否正常工作,以及在判断所述主服务器不能正常工作时,通过发送控制命令的方式来控制所述主服务器与所述从服务器之间的自动切换;
所述从管理服务器用于判断所述主管理服务器能否正常工作,并在所述主管理服务器不能正常工作时,从所述从管理服务器中选举出一个从管理服务器并切换为主管理服务器。
4.如权利要求3所述的管理设备,其特征在于,所述主管理服务器还用于在未接收到所述主服务器发来的交互信息时,判断所述主服务器不能正常工作;以及还用于在接收到所述主服务器发来的交互信息且判断所述交互信息异常时,判断所述主服务器不能正常工作。
5.如权利要求3所述的管理设备,其特征在于,所述从管理服务器均设有自选举模块,用于根据paxos算法从所述从管理服务器中选举出一个从管理服务器并切换主管理服务器。
6.如权利要求5所述的管理设备,其特征在于,所述主管理服务器包括控制模块,用于接收用户从客户端输入的对双机热备***以及管理设备的控制信息并解析,以及将解析后得到的用户控制命令下发给相应的命令执行对象。
7.一种双机热备***的管理方法,其特征在于,所述双机热备***包括一个主服务器和一个从服务器,所述管理方法包括以下步骤:
管理设备分别与所述主服务器以及与所述从服务器进行信息交互;
管理设备判断所述主服务器能否正常工作,以及在所述主服务器不能正常工作时,通过发送控制命令的方式来控制所述主服务器与所述从服务器之间的自动切换。
8.如权利要求7所述的管理方法,其特征在于,所述管理设备判断所述主服务器能否正常工作的步骤为:当所述管理设备未接收到所述主服务器发来的交互信息时,判断所述主服务器不能正常工作;或当所述管理设备接收到所述主服务器发来的交互信息且判断所述交互信息异常时,判断所述主服务器不能正常工作。
9.如权利要求7或8所述的管理方法,其特征在于,所述管理设备包括:一个主管理服务器和至少两个从管理服务器,所述管理设备管理所述双机热备***的步骤包括:
所述主管理服务器与所述主服务器以及与所述从服务器进行信息交互;
所述主管理服务器判断所述主服务器能否正常工作,以及在判断所述主服务器不能正常工作时,通过发送控制命令的方式来控制所述主服务器与所述从服务器之间的自动切换;
所述从管理服务器判断所述主管理服务器能否正常工作,并在判断所述主管理服务器不能正常工作时,从所述从管理服务器中选举出一个从管理服务器并切换为主管理服务器。
10.一种双机热备***,其特征在于,包括一个主服务器和一个从服务器,其中,
所述主服务器和所述从服务器用于对应与管理设备相连接,分别实现与管理设备之间的信息交互;
所述主服务器用于在未接收到所述管理设备回复的交互信息或接收到所述管理设备回复的切换为从服务器的状态切换命令时,自动切换为从服务器;
所述从服务器用于在接收到所述管理设备发来的切换为主服务器的双机切换命令时,自动切换为主服务器。
CN2011102167388A 2011-08-01 2011-08-01 一种双机热备***的管理设备、管理方法及双机热备*** Pending CN102916825A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011102167388A CN102916825A (zh) 2011-08-01 2011-08-01 一种双机热备***的管理设备、管理方法及双机热备***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011102167388A CN102916825A (zh) 2011-08-01 2011-08-01 一种双机热备***的管理设备、管理方法及双机热备***

Publications (1)

Publication Number Publication Date
CN102916825A true CN102916825A (zh) 2013-02-06

Family

ID=47615065

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011102167388A Pending CN102916825A (zh) 2011-08-01 2011-08-01 一种双机热备***的管理设备、管理方法及双机热备***

Country Status (1)

Country Link
CN (1) CN102916825A (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103257908A (zh) * 2013-05-24 2013-08-21 浪潮电子信息产业股份有限公司 一种软硬件协同的多控制器磁盘阵列设计方法
CN103297502A (zh) * 2013-05-08 2013-09-11 青岛海信传媒网络技术有限公司 一种负载均衡***及方法
CN103607310A (zh) * 2013-11-29 2014-02-26 华为技术有限公司 一种异地容灾的仲裁方法
CN103905247A (zh) * 2014-03-10 2014-07-02 北京交通大学 一种基于多客户裁决的双机备份方法及***
CN104935871A (zh) * 2014-03-19 2015-09-23 北京信威通信技术股份有限公司 一种视频调度中的视频回传方法
CN105007293A (zh) * 2015-05-25 2015-10-28 国家计算机网络与信息安全管理中心 双主控网络***及该***中业务请求的双写方法
CN105719414A (zh) * 2014-12-05 2016-06-29 航天信息股份有限公司 Pos终端的开票方法及装置、以及开票服务器端
CN105740106A (zh) * 2016-03-30 2016-07-06 苏州美天网络科技有限公司 具有服务器快速切换功能的服务器***
CN105871522A (zh) * 2016-03-30 2016-08-17 苏州美天网络科技有限公司 用于网络防灾的备份服务***
CN105871608A (zh) * 2016-03-30 2016-08-17 苏州美天网络科技有限公司 用于网络防灾的备份服务器切换***
CN105893176A (zh) * 2016-03-28 2016-08-24 杭州宏杉科技有限公司 一种网络存储***的管理方法和装置
CN105915386A (zh) * 2016-05-31 2016-08-31 努比亚技术有限公司 一种控制方法及控制器、监听设备
CN105915366A (zh) * 2016-03-30 2016-08-31 苏州美天网络科技有限公司 高效率备份服务器***
CN106354589A (zh) * 2016-08-24 2017-01-25 天津天大求实电力新技术股份有限公司 微电网能量管理***服务程序的双机热备方法
CN106452696A (zh) * 2016-10-28 2017-02-22 郑州云海信息技术有限公司 一种服务器集群的控制***
CN106656589A (zh) * 2016-12-13 2017-05-10 武汉船舶通信研究所 一种服务器双机热备份***
CN107203420A (zh) * 2016-03-18 2017-09-26 北京京东尚科信息技术有限公司 任务调度实例的主从切换方法和装置
CN107273169A (zh) * 2017-06-30 2017-10-20 郑州云海信息技术有限公司 一种存储控制器集群的软件在线升级方法及***
CN108040108A (zh) * 2017-12-11 2018-05-15 杭州电魂网络科技股份有限公司 通信切换方法、装置、协调服务器及可读存储介质
CN109086610A (zh) * 2018-06-19 2018-12-25 上海卫星工程研究所 一种星上加解密机双机热备状态一致的处理方法
CN109147229A (zh) * 2018-07-24 2019-01-04 苏州浪潮智能软件有限公司 一种多台组合式自助终端共享方法
CN109194514A (zh) * 2018-09-11 2019-01-11 上海思源弘瑞自动化有限公司 一种双机监测方法、装置、服务器及存储介质
CN110011840A (zh) * 2019-03-26 2019-07-12 新华三技术有限公司 控制器的状态处理方法、装置和控制器
CN110365930A (zh) * 2018-04-11 2019-10-22 北京视联动力国际信息技术有限公司 一种数据处理方法和装置
CN111371680A (zh) * 2020-03-04 2020-07-03 深信服科技股份有限公司 双机热备的路由管理方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101197651A (zh) * 2007-12-19 2008-06-11 华为技术有限公司 板间通信的方法、设备、主控板和接口板
CN101247568A (zh) * 2008-03-12 2008-08-20 中兴通讯股份有限公司 数据容灾***和方法及中间设备
CN101631011A (zh) * 2008-07-16 2010-01-20 中国科学院声学研究所 适于进行ip流媒体实时处理及转发设备的热备方法及***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101197651A (zh) * 2007-12-19 2008-06-11 华为技术有限公司 板间通信的方法、设备、主控板和接口板
CN101247568A (zh) * 2008-03-12 2008-08-20 中兴通讯股份有限公司 数据容灾***和方法及中间设备
CN101631011A (zh) * 2008-07-16 2010-01-20 中国科学院声学研究所 适于进行ip流媒体实时处理及转发设备的热备方法及***

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103297502A (zh) * 2013-05-08 2013-09-11 青岛海信传媒网络技术有限公司 一种负载均衡***及方法
CN103297502B (zh) * 2013-05-08 2016-03-23 青岛海信传媒网络技术有限公司 一种负载均衡***及方法
CN103257908A (zh) * 2013-05-24 2013-08-21 浪潮电子信息产业股份有限公司 一种软硬件协同的多控制器磁盘阵列设计方法
CN103607310A (zh) * 2013-11-29 2014-02-26 华为技术有限公司 一种异地容灾的仲裁方法
CN103905247B (zh) * 2014-03-10 2017-02-01 北京交通大学 一种基于多客户裁决的双机备份方法及***
CN103905247A (zh) * 2014-03-10 2014-07-02 北京交通大学 一种基于多客户裁决的双机备份方法及***
CN104935871A (zh) * 2014-03-19 2015-09-23 北京信威通信技术股份有限公司 一种视频调度中的视频回传方法
CN105719414A (zh) * 2014-12-05 2016-06-29 航天信息股份有限公司 Pos终端的开票方法及装置、以及开票服务器端
CN105007293A (zh) * 2015-05-25 2015-10-28 国家计算机网络与信息安全管理中心 双主控网络***及该***中业务请求的双写方法
CN107203420A (zh) * 2016-03-18 2017-09-26 北京京东尚科信息技术有限公司 任务调度实例的主从切换方法和装置
CN105893176B (zh) * 2016-03-28 2019-02-26 杭州宏杉科技股份有限公司 一种网络存储***的管理方法和装置
CN105893176A (zh) * 2016-03-28 2016-08-24 杭州宏杉科技有限公司 一种网络存储***的管理方法和装置
CN105740106A (zh) * 2016-03-30 2016-07-06 苏州美天网络科技有限公司 具有服务器快速切换功能的服务器***
CN105871608A (zh) * 2016-03-30 2016-08-17 苏州美天网络科技有限公司 用于网络防灾的备份服务器切换***
CN105915366A (zh) * 2016-03-30 2016-08-31 苏州美天网络科技有限公司 高效率备份服务器***
CN105871522A (zh) * 2016-03-30 2016-08-17 苏州美天网络科技有限公司 用于网络防灾的备份服务***
CN105915386A (zh) * 2016-05-31 2016-08-31 努比亚技术有限公司 一种控制方法及控制器、监听设备
CN106354589A (zh) * 2016-08-24 2017-01-25 天津天大求实电力新技术股份有限公司 微电网能量管理***服务程序的双机热备方法
CN106452696A (zh) * 2016-10-28 2017-02-22 郑州云海信息技术有限公司 一种服务器集群的控制***
CN106656589B (zh) * 2016-12-13 2019-08-23 武汉船舶通信研究所 一种服务器双机热备份***
CN106656589A (zh) * 2016-12-13 2017-05-10 武汉船舶通信研究所 一种服务器双机热备份***
CN107273169A (zh) * 2017-06-30 2017-10-20 郑州云海信息技术有限公司 一种存储控制器集群的软件在线升级方法及***
CN108040108A (zh) * 2017-12-11 2018-05-15 杭州电魂网络科技股份有限公司 通信切换方法、装置、协调服务器及可读存储介质
CN110365930B (zh) * 2018-04-11 2021-07-30 视联动力信息技术股份有限公司 一种数据处理方法和装置
CN110365930A (zh) * 2018-04-11 2019-10-22 北京视联动力国际信息技术有限公司 一种数据处理方法和装置
CN109086610A (zh) * 2018-06-19 2018-12-25 上海卫星工程研究所 一种星上加解密机双机热备状态一致的处理方法
CN109147229A (zh) * 2018-07-24 2019-01-04 苏州浪潮智能软件有限公司 一种多台组合式自助终端共享方法
CN109194514A (zh) * 2018-09-11 2019-01-11 上海思源弘瑞自动化有限公司 一种双机监测方法、装置、服务器及存储介质
CN109194514B (zh) * 2018-09-11 2021-12-14 上海思源弘瑞自动化有限公司 一种双机监测方法、装置、服务器及存储介质
CN110011840A (zh) * 2019-03-26 2019-07-12 新华三技术有限公司 控制器的状态处理方法、装置和控制器
CN111371680A (zh) * 2020-03-04 2020-07-03 深信服科技股份有限公司 双机热备的路由管理方法、装置、设备及存储介质
CN111371680B (zh) * 2020-03-04 2022-04-29 深信服科技股份有限公司 双机热备的路由管理方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN102916825A (zh) 一种双机热备***的管理设备、管理方法及双机热备***
CN106375342A (zh) 一种基于zookeeper技术的***集群方法及***
CN101217353B (zh) 一种呼叫中心多点双机冗余***的控制方法
CN101594383B (zh) 一种双控制器存储***的服务和控制器状态监控方法
CN102257759B (zh) 主备倒换方法、***控制单元和通信***
CN112181660A (zh) 一种基于服务器集群的高可用方法
CN103019889A (zh) 分布式文件***及其故障处理方法
CN101150430A (zh) 一种通过心跳机制实现网络接口板倒换的方法
US20080307254A1 (en) Information-processing equipment and system therefor
CN102394914A (zh) 集群脑裂处理方法和装置
CN107040403A (zh) 基于dds技术提高分布式***可靠性的方法
CN103532753A (zh) 一种基于内存换页同步的双机热备方法
US20100268687A1 (en) Node system, server switching method, server apparatus, and data takeover method
CN109104325B (zh) 基于CANopen协议的列车网络数据传输方法、***及其装置
US10037253B2 (en) Fault handling methods in a home service system, and associated household appliances and servers
CN112218321B (zh) 主备链路切换方法、装置、通信设备和存储介质
CN112346925A (zh) 一种进程级双机热备冗余***及方法
CN110704250A (zh) 一种分布式***的热备份装置
CN100496030C (zh) 基于高可用性***的综合接入媒体网关设备
CN102932118B (zh) 一种双机主备裁决的方法及***
CN113794765A (zh) 基于文件传输的网闸负载均衡方法及装置
CN102487332B (zh) 故障处理方法、装置和***
CN101944954A (zh) 一种单板实现主备倒换的方法及***
CN110053650B (zh) 一种列车自动运行***、列车自动运行***架构及列车自动运行***的模块管理方法
CN110399254A (zh) 一种服务器cmc双机热活方法、***、终端及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130206