CN105959145A - 一种适用高可用性集群的并行管理服务器的方法及*** - Google Patents

一种适用高可用性集群的并行管理服务器的方法及*** Download PDF

Info

Publication number
CN105959145A
CN105959145A CN201610395528.2A CN201610395528A CN105959145A CN 105959145 A CN105959145 A CN 105959145A CN 201610395528 A CN201610395528 A CN 201610395528A CN 105959145 A CN105959145 A CN 105959145A
Authority
CN
China
Prior art keywords
server
real
virtual
business
real server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610395528.2A
Other languages
English (en)
Other versions
CN105959145B (zh
Inventor
沈星宇
莫庆良
吴崇峰
吴健
余世清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Zhongxing Newstart Technology Co Ltd
Original Assignee
Guangdong Zhongxing Newstart Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Zhongxing Newstart Technology Co Ltd filed Critical Guangdong Zhongxing Newstart Technology Co Ltd
Priority to CN201610395528.2A priority Critical patent/CN105959145B/zh
Publication of CN105959145A publication Critical patent/CN105959145A/zh
Application granted granted Critical
Publication of CN105959145B publication Critical patent/CN105959145B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明实施例公开了一种适用高可用性集群的并行管理服务器的方法及***,其方法包括:基于高可用性集群软件检测位于高可用性集群***下的运行服务器是否存在故障;判断所述运行服务器类型,在判断出所述运行服务器类型为第一虚拟服务器时,则将第一虚拟服务器上承载的Linux虚拟服务器LVS业务切换到第二虚拟服务器,由第二虚拟服务器运行所述LVS业务;在判断出所述运行服务器类型为第一真实服务器时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务。实施本发明实施例,使每台真实服务器和虚拟服务器上的业务都不间断地提供服务,最大的满足用户的需求。

Description

一种适用高可用性集群的并行管理服务器的方法及***
技术领域
本发明涉及计算机集群技术领域,尤其涉及一种适用高可用性集群的并行管理服务器的方法及***。
背景技术
高可用集群,英文原文为High Availability Cluster,简称HACluster,集群(cluster)是由一组计算机构成,它们作为一个整体向用户提供一组网络资源。这些单个的计算机***就是集群的节点(node)。高可用集群的出现是为了使集群的整体服务尽可能可用,从而减少由计算机硬件和软件易错性所带来的损失。如果某个节点失效,它的备援节点将在几秒钟的时间内接管它的职责。因此,对于用户而言,集群永远不会停机。高可用集群软件的主要作用就是实现故障检查和业务切换的自动化。只有两个节点的高可用集群又称为双机热备,即使用两台服务器互相备份。当一台服务器出现故障时,可由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证***能持续对外提供服务。双机热备只是高可用集群的一种,高可用集群***更可以支持两个以上的节点,提供比双机热备更多、更高级的功能,更能满足用户不断出现的需求变化。
目前的高可用性集群引入了linux虚拟服务器(Linux Virtual Server,LVS),其采用LVS+Keepalived或LVS+heartbeat实现了虚拟服务器(Virtualserver)高可用(High Availability),保证了LVS业务不间断提供负载均衡的能力,现行架构中的LVS和真实服务器属于不同模式下管理,现有服务架构满足不了并行处理LVS和真实服务器的能力,缺乏同时并行对真实服务器和LVS的有效管理,缺乏对每台真实服务器(Real server)上的业务以及LVS上业务不间断持续提供服务能力的保障。
发明内容
本发明的目的在于克服现有技术的不足,本发明提供了一种适用高可用性集群的并行管理服务器的方法及***,使每台真实服务器和虚拟服务器上的业务都不间断地提供服务,最大的满足用户的需求。
为了解决上述问题,本发明提出了一种适用高可用性集群的并行管理服务器的方法,包括如下步骤:
基于高可用性集群软件检测位于高可用性集群***下的运行服务器是否存在故障;
判断所述运行服务器类型,在判断出所述运行服务器类型为第一虚拟服务器时,则将第一虚拟服务器上承载的Linux虚拟服务器LVS业务切换到第二虚拟服务器,由第二虚拟服务器运行所述LVS业务,所述第一虚拟服务器和第二虚拟服务器由高可用性集群***下的不同的真实服务器所承载;
在判断出所述运行服务器类型为第一真实服务器时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务。
所述在判断出所述运行服务器类型为第一真实服务器时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务包括;
判断所述第一真实服务器是否承载有第一虚拟服务器,若判断所述第一真实服务器承载有第一虚拟服务器,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务,将第一虚拟服务器上承载的LVS业务切换到第二虚拟服务器,由第二虚拟服务器运行所述LVS业务;
若判断所述第一真实服务器没有承载第一虚拟服务器时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务。
所述将第一真实服务器所承载的真实业务切换到第二真实服务器中还包括:
在判断出第一真实服务器发生故障时,在真实业务切换过程中,高可用性集群软件检测到第一真实服务器上的业务不存在,从虚拟服务器的LVS路由表中删除第一真实服务器的真实IP路由,在完成真实业务切换后,恢复第二真实服务器真实IP路由到虚拟服务器的LVS路由表中。
所述在判断出所述运行服务器类型为第一真实服务器时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务包括:
判断所述第一真实服务器的故障类型,若所述故障类型为关联LVS业务的真实业务应用时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务;或者触发第一真实服务器自动重启;
若所述故障类型为非关联LVS的故障类型时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务。
所述方法还包括:
基于高可用性集群软件检测有故障的服务器是否已恢复,所述服务器包括虚拟服务器和真实服务器;
当判断所述有故障的服务器恢复之后,根据高可用性集群软件中的配置文件进行业务故障恢复,将之前切换的LVS业务自动回切到第一虚拟服务器或者将之前切换的真实业务自动回切到恢复后的第一真实服务器;或者
当判断所述有故障的服务器恢复之后,根据高可用性集群软件中的配置文件进行备机登记处理,将恢复后的第一真实服务器或者第一虚拟服务器作为后续故障处理机制中的备机。
相应的,本发明还提出了一种适用高可用性集群的并行管理服务器的***,所述***包括:
故障检测模块,用于基于高可用性集群软件检测位于高可用性集群***下的运行服务器是否存在故障;
服务器类型判断模块,用于判断所述运行服务器类型;
业务切换模块,用于根据服务器类型判断模块中所判断的运行服务器类型进行业务切换,包括:
虚拟业务切换单元,用于在判断出所述运行服务器类型为第一虚拟服务器时,则将第一虚拟服务器上承载的Linux虚拟服务器LVS业务切换到第二虚拟服务器,由第二虚拟服务器运行所述LVS业务,所述第一虚拟服务器和第二虚拟服务器由高可用性集群***下的不同的真实服务器所承载;
真实业务切换单元,用于在判断出所述运行服务器类型为第一真实服务器时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务。
所述服务器类型判断模块还用于判断所述第一真实服务器是否承载有第一虚拟服务器;
所述业务切换模块在判断所述第一真实服务器承载有第一虚拟服务器,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务,将第一虚拟服务器上承载的LVS业务切换到第二虚拟服务器,由第二虚拟服务器运行所述LVS业务;在判断所述第一真实服务器没有承载第一虚拟服务器时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务。
所述***还包括:
集群LVS路由模块,用于在判断出第一真实服务器发生故障时,在真实业务切换过程中,高可用性集群软件检测到第一真实服务器上的业务不存在,从虚拟服务器的LVS路由表中删除第一真实服务器的真实IP路由,在完成真实业务切换后,恢复第二真实服务器真实IP路由到虚拟服务器的LVS路由表中。
所述***还包括:
故障类型模块,用于在判断出所述运行服务器类型为第一真实服务器时,判断所述第一真实服务器的故障类型,在故障类型模块判断出所述故障类型为关联LVS业务的真实业务应用时,则由业务切换模块将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务;或者触发第一真实服务器自动重启;
在故障类型模块判断所述故障类型为非关联LVS的故障类型时,则由业务切换模块将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务。
所述***还包括:
故障恢复检测模块,用于基于高可用性集群软件检测有故障的服务器是否已恢复,所述服务器包括虚拟服务器和真实服务器;
故障恢复自动切换模块,用于在故障恢复检测模块判断所述有故障的服务器恢复之后,根据高可用性集群软件中的配置文件进行业务故障恢复,将之前切换的LVS业务自动切换到第一虚拟服务器或者将之前切换的真实业务自动回切到恢复后的第一真实服务器;
备机登记模块,用于在故障恢复检测模块判断所述有故障的服务器恢复之后,根据高可用性集群软件中的配置文件进行备机登记处理,将恢复后的第一真实服务器或者第一虚拟服务器作为后续故障处理机制中的备机。
在本发明实施例中,通过在高可用性集群***中检测虚拟服务器和真实服务器上的状态,可以保障到虚拟服务器和真实服务器在故障模式下的业务切换。由于本发明实施例中通过高可用性集群***中的真实服务器来承载虚拟服务器,虚拟服务器有两个或以上,其分布在不同的真实服务器上,在整个高可用性集群***中监控所有的服务器,在检测到相关服务器出现故障之后,首先判断出运行服务器的类型,再根据运行服务器的类型来实现主备切换,保障相应的业务不会冲断。本实施方案使每台真实服务器和虚拟服务器上的业务都不间断地提供服务,最大的满足用户的需求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例的适用高可用性集群的并行管理服务器的方法流程图;
图2是本发明实施例的适用高可用性集群的并行管理服务器的***结构示意图;
图3是本发明实施例的适用高可用性集群的并行管理服务器的***另一结构示意图;
图4是本发明实施例的高可用性集群***具体应用示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中所涉及的适用高可用性集群的并行管理服务器的方法,其通过基于高可用性集群软件检测位于高可用性集群***下的运行服务器是否存在故障;判断运行服务器类型,在判断出所述运行服务器类型为第一虚拟服务器时,则将第一虚拟服务器上承载的Linux虚拟服务器LVS业务切换到第二虚拟服务器,由第二虚拟服务器运行所述LVS业务,该第一虚拟服务器和第二虚拟服务器由高可用性集群***下的不同的真实服务器所承载;在判断出所述运行服务器类型为第一真实服务器时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务。
相应的,图1示出了本发明实施例中的适用高可用性集群的并行管理服务器的方法流程图,该流程图包括如下步骤:
S101、基于高可用性集群软件检测位于高可用性集群***下的运行服务器;
在高可用性集群***下,涉及至少两个以上的虚拟服务器,两个以上的真实服务器,该真实服务器数量大于虚拟服务器数量,该这些虚拟服务器分别由不同的真实服务器所承载,比如虚拟服务器1存在真实服务器1上,虚拟服务器2存在真实服务器2上,虚拟服务器1与虚拟服务器2存在主备关系,一般存在一个虚拟服务器在运行中,运行所涉及的LVS业务。涉及到高可用性集群***下的真实服务器可以是多个真实服务器来支持业务的运行,涉及到一个备份的真实服务器,该备份的真实服务器可以是与备份的虚拟服务器所涉及的真实服务器相同,也可以不同。
S102、判断运行服务器是否存在故障,如果运行服务器存在故障则进入S103,否则继续步骤S101;
由于该高可用性集群***下涉及有真实服务器和虚拟服务器,每种类型的服务器都可能存在故障,需要判断出现故障的服务器是虚拟服务器还是真实服务器。
具体实施过程中,可以通过检查业务的各个资源是否运行正常,如果有某个资源不正常,则切换。而这些资源具体体现在:业务自身故障(如业务应用程序故障停止)、操作***故障,或者硬件故障等等,都会导致业务无法正常运行,此时业务只有切换或自动重启了。针对业务故障可以选择切换或者业务自身重启,如果是服务器故障(如断电或者服务器重启),则业务必须切换。总体而言,这个故障可能涉及软件故障或者硬件故障等等。如果运行的是LVS业务,则是虚拟服务器,否则是真实服务器。当然也可以通过在配置文件中指定服务器类型为虚拟服务器、真实服务器、混合服务器(虚拟服务器和真实服务器共用)。
S103、判断运行服务器的类型,若运行服务器的类型为虚拟服务器,则进入到S104,若运行服务器的类型为真实服务器,则进入到S105;
S104、将第一虚拟服务器上承载的LVS业务切换到第二虚拟服务器,由第二虚拟服务器运行LVS业务;
在判断出运行服务器类型为第一虚拟服务器时,则将第一虚拟服务器上承载的Linux虚拟服务器LVS业务切换到第二虚拟服务器,由第二虚拟服务器运行所述LVS业务,这里的第一虚拟服务器和第二虚拟服务器由高可用性集群***下的不同的真实服务器所承载。
S105、将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行真实业务。
在具体实施过程中,步骤S105中可以进一步判断出现故障的真实服务器是否承载有虚拟服务器,若判断出现故障的真实服务器承载有运行的虚拟服务器,则将出现故障的真实服务器所承载的真实业务切换到备份的真实服务器上,由备份的真实服务器运行该真实业务,并将虚拟服务器上承载的LVS业务切换到备份的虚拟服务器上,由备份的虚拟服务器运行所述LVS业务;若判断出现故障的真实服务器没有承载虚拟服务器时,则将出现故障的真实服务器所承载的真实业务切换到备份的真实服务器上,由备份的真实服务器运行真实业务。需要说明的是,这里备份的虚拟服务器和备份的真实服务器可以是由备份的真实服务器所承载,也可以是不同的真实服务器所承载。
在具体实施过程中,步骤S105中在判断出第一真实服务器发生故障时,在真实业务切换过程中,高可用性集群软件检测到第一真实服务器上的业务不存在,从虚拟服务器的LVS路由表中删除第一真实服务器的真实IP路由,在完成真实业务切换后,恢复第二真实服务器真实IP路由到虚拟服务器的LVS路由表中。
在具体实施过程中,可以进一步判断该第一真实服务器的故障类型,若该故障类型为关联LVS业务的真实业务应用时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行真实业务,或者触发第一真实服务器自动重启,该重启过程一般是软启动过程;若所述故障类型为非关联LVS的故障类型时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务。
在具体实施过程中,出现故障的服务器可以实现自愈或者人工恢复等功能,基于高可用性集群软件检测有故障的服务器是否已恢复,这里的服务器包括虚拟服务器和真实服务器;
当判断所述有故障的服务器恢复之后,根据高可用性集群软件中的配置文件进行业务故障恢复,将之前切换的LVS业务自动回切到第一虚拟服务器或者将之前切换的真实业务自动回切到恢复后的第一真实服务器;或者当判断有故障的服务器恢复之后,根据高可用性集群软件中的配置文件进行备机登记处理,将恢复后的第一真实服务器或者第一虚拟服务器作为后续故障处理机制中的备机。
相应的,图2还示了本实施例中的适用高可用性集群的并行管理服务器的***结构示意图,该***包括:
故障检测模块,用于基于高可用性集群软件检测位于高可用性集群***下的运行服务器是否存在故障;
服务器类型判断模块,用于判断所述运行服务器类型;
业务切换模块,用于根据服务器类型判断模块中所判断的运行服务器类型进行业务切换,包括:
虚拟业务切换单元,用于在判断出所述运行服务器类型为第一虚拟服务器时,则将第一虚拟服务器上承载的Linux虚拟服务器LVS业务切换到第二虚拟服务器,由第二虚拟服务器运行所述LVS业务,所述第一虚拟服务器和第二虚拟服务器由高可用性集群***下的不同的真实服务器所承载;
真实业务切换单元,用于在判断出所述运行服务器类型为第一真实服务器时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务。
具体实施过程中,该服务器类型判断模块还用于判断所述第一真实服务器是否承载有第一虚拟服务器;该业务切换模块在判断所述第一真实服务器承载有第一虚拟服务器,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务,将第一虚拟服务器上承载的LVS业务切换到第二虚拟服务器,由第二虚拟服务器运行所述LVS业务;在判断所述第一真实服务器没有承载第一虚拟服务器时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务。
具体实施过程中,可以通过检查业务的各个资源是否运行正常,如果有某个资源不正常,则切换。而这些资源具体体现在:业务自身故障(如业务应用程序故障停止)、操作***故障,或者硬件故障等等,都会导致业务无法正常运行,此时业务只有切换或者自动重启了。针对业务故障可以选择切换或者业务自身重启,如果是服务器故障(如断电或者服务器重启),则业务必须切换。总体而言,这个故障可能涉及软件故障或者硬件故障等等。如果运行的是LVS业务,则是虚拟服务器,否则是真实服务器。当然也可以通过在配置文件中指定服务器类型为虚拟服务器、真实服务器、混合服务器(虚拟服务器和真实服务器共用)。
进一步的,图3示出了本实施例中的适用高可用性集群的并行管理服务器的***另一结构示意图,该***包括:
故障检测模块,用于基于高可用性集群软件检测位于高可用性集群***下的运行服务器是否存在故障;
服务器类型判断模块,用于判断所述运行服务器类型;
业务切换模块,用于根据服务器类型判断模块中所判断的运行服务器类型进行业务切换,包括:
虚拟业务切换单元,用于在判断出所述运行服务器类型为第一虚拟服务器时,则将第一虚拟服务器上承载的Linux虚拟服务器LVS业务切换到第二虚拟服务器,由第二虚拟服务器运行所述LVS业务,所述第一虚拟服务器和第二虚拟服务器由高可用性集群***下的不同的真实服务器所承载;
真实业务切换单元,用于在判断出所述运行服务器类型为第一真实服务器时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务。
具体实施过程中,该服务器类型判断模块还用于判断所述第一真实服务器是否承载有第一虚拟服务器;该业务切换模块在判断所述第一真实服务器承载有第一虚拟服务器,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务,将第一虚拟服务器上承载的LVS业务切换到第二虚拟服务器,由第二虚拟服务器运行所述LVS业务;在判断所述第一真实服务器没有承载第一虚拟服务器时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务。
具体实施过程中,该***还包括一集群LVS路由模块,用于在判断出第一真实服务器发生故障时,在真实业务切换过程中,高可用性集群软件检测到第一真实服务器上的业务不存在,从虚拟服务器的LVS路由表中删除第一真实服务器的真实IP路由,在完成真实业务切换后,恢复第二真实服务器真实IP路由到虚拟服务器的LVS路由表中。
具体实施过程中,该***还包括:
故障类型模块,用于在判断出所述运行服务器类型为第一真实服务器时,判断所述第一真实服务器的故障类型,在故障类型模块判断出所述故障类型为关联LVS业务的真实业务应用时,则由业务切换模块将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务;或者触发第一真实服务器自动重启,该重启过程一般是软启动过程;
在故障类型模块判断所述故障类型为非关联LVS的故障类型时,则由业务切换模块将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务。
具体实施过程中,该***还包括:
故障恢复检测模块,用于基于高可用性集群软件检测有故障的服务器是否已恢复,所述服务器包括虚拟服务器和真实服务器;
故障恢复自动回切模块,用于在故障恢复检测模块判断所述有故障的服务器恢复之后,根据高可用性集群软件中的配置文件进行业务故障恢复,将之前切换的LVS业务自动回切到第一虚拟服务器或者将之前切换的真实业务自动回切到恢复后的第一真实服务器;
备机登记模块,用于在故障恢复检测模块判断所述有故障的服务器恢复之后,根据高可用性集群软件中的配置文件进行备机登记处理,将恢复后的第一真实服务器或者第一虚拟服务器作为后续故障处理机制中的备机。
相应的,图4示出了本发明实施例中的高可用性集群***具体应用示意图,首先在部署的时候,在虚拟服务器和真实服务器上安装特制的集群软件,所有节点作为一个集群cluster,选择其中两台服务器既是虚拟服务器,也是真实服务器,虚拟服务器运行LVS业务,真实服务器运行用户所需要的业务。
其次配置的时候,将虚拟服务器上的backup节点作为和真实服务器共用的backup节点。真实服务器上运行的对外提供的业务置于集群软件管控下,虚拟服务器上运行的LVS业务也在集群软件管控下。
在配置完成之后,启动集群软件***。经过上述配置之后,LVS业务和真实服务器上的业务都在该集群软件***的监控下运行,提供相应的服务。master虚拟服务器如果发生故障,LVS业务自动切换到backup虚拟服务器;某台真实服务器发生故障,该真实服务器的相关业务也自动切换到相应的backup真实服务器。用户通过访问VIP(Virtual IP),由LVS根据负载均衡调度算法将用户的请求分配给真实服务器。
以上所有步骤由LVS和集群软件***共同协助完成,这种并发管理虚拟服务器和真实服务器的方法,不仅为每台真实服务器提供了负载均衡,而且保证业务持续不断的对外提供服务,为业务不冲断提供了更高的可靠性。
基于图4中的具体实施方案,将虚拟服务器和真实服务器纳入到特制的高可用集群***(High Availability cluster)管理中,作为一个集群管理。
选择两台服务器(主机和备机)作为虚拟服务器,管控LVS业务,此双机是虚拟服务器和真实服务器共用的,并且备机既作为虚拟服务器的备机,也作为所有真实服务器的备机,即集群N+M模式的一个特例,对于虚拟服务器来说是1+1模式,对于真实服务器来说是N+1模式。
每台真实服务器上的运行的业务浮动IP作为LVS配置上的RIP(RealIP)。
在cluster中的某一台真实服务器上出现问题,可以分两种情况:1、这台真实服务器的业务应用或者业务IP(浮动IP)等业务资源出现问题;2、这台真实服务器本身出现问题,比如断电、***重启等等。当真实服务器出现第1种问题时,业务自动切换到备机或者自动选择重启,这个选择由用户在***配置文件中设置。当真实服务器出现第2种问题时,业务自动切换到备机(真实服务器和虚拟服务器共用)。
以上两种情况业务的切换或者重启,从LVS虚拟服务器上看,每台真实服务器是一直在运行的,从用户的角度,更是看不到业务的冲断。真正保证了业务7*24小时持续不间断地运行。
同理,当主虚拟服务器(Master virtual server)出现故障,LVS业务就会自动切换到备虚拟服务器(Backup virtual server)。具体实施过程中,这里的两台虚拟服务器是和真实服务器共用的。
当有故障的服务器(包括真实服务器和虚拟服务器)恢复之后,业务自动回切或者不回切,由用户在***配置文件中设置。如果选择不回切,则恢复的服务器作为备机。
在整个具体实施过程中,通过在高可用性集群***中检测虚拟服务器和真实服务器上的状态,可以保障到虚拟服务器和真实服务器在故障模式下的业务切换。由于本发明实施例中通过高可用性集群***中的真实服务器来承载虚拟服务器,虚拟服务器有两个或以上,其分布在不同的真实服务器上,在整个高可用性集群***中监控所有的服务器,在检测到相关服务器出现故障之后,首先判断出运行服务器的类型,再根据运行服务器的类型来实现主备切换,保障相应的业务不会冲断。本实施方案使每台真实服务器和虚拟服务器上的业务都不间断地提供服务,最大的满足用户的需求。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁盘或光盘等。
另外,以上对本发明实施例所提供的适用高可用性集群的并行管理服务器的方法及***进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种适用高可用性集群的并行管理服务器的方法,其特征在于,包括如下步骤:
基于高可用性集群软件检测位于高可用性集群***下的运行服务器是否存在故障;
判断所述运行服务器类型,在判断出所述运行服务器类型为第一虚拟服务器时,则将第一虚拟服务器上承载的Linux虚拟服务器LVS业务切换到第二虚拟服务器,由第二虚拟服务器运行所述LVS业务,所述第一虚拟服务器和第二虚拟服务器由高可用性集群***下的不同的真实服务器所承载;
在判断出所述运行服务器类型为第一真实服务器时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务。
2.如权利要求1所述的适用高可用性集群的并行管理服务器的方法,其特征在于,所述在判断出所述运行服务器类型为第一真实服务器时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务包括;
判断所述第一真实服务器是否承载有第一虚拟服务器,若判断所述第一真实服务器承载有第一虚拟服务器,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务,将第一虚拟服务器上承载的LVS业务切换到第二虚拟服务器,由第二虚拟服务器运行所述LVS业务;
若判断所述第一真实服务器没有承载第一虚拟服务器时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务。
3.如权利要求1所述的适用高可用性集群的并行管理服务器的方法,其特征在于,所述将第一真实服务器所承载的真实业务切换到第二真实服务器中还包括:
在判断出第一真实服务器发生故障时,在真实业务切换过程中,高可用性集群软件检测到第一真实服务器上的业务不存在,从虚拟服务器的LVS路由表中删除第一真实服务器的真实IP路由,在完成真实业务切换后,恢复第二真实服务器真实IP路由到虚拟服务器的LVS路由表中。
4.如权利要求1至3任一项所述的适用高可用性集群的并行管理服务器的方法,其特征在于,所述在判断出所述运行服务器类型为第一真实服务器时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务包括:
判断所述第一真实服务器的故障类型,若所述故障类型为关联LVS业务的真实业务应用时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务;或者触发第一真实服务器自动重启;
若所述故障类型为非关联LVS的故障类型时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务。
5.如权利要求4所述的适用高可用性集群的并行管理服务器的方法,其特征在于,所述方法还包括:
基于高可用性集群软件检测有故障的服务器是否已恢复,所述服务器包括虚拟服务器和真实服务器;
当判断所述有故障的服务器恢复之后,根据高可用性集群软件中的配置文件进行业务故障恢复,将之前切换的LVS业务自动回切到第一虚拟服务器或者将之前切换的真实业务自动回切到恢复后的第一真实服务器;或者
当判断所述有故障的服务器恢复之后,根据高可用性集群软件中的配置文件进行备机登记处理,将恢复后的第一真实服务器或者第一虚拟服务器作为后续故障处理机制中的备机。
6.一种适用高可用性集群的并行管理服务器的***,其特征在于,所述***包括:
故障检测模块,用于基于高可用性集群软件检测位于高可用性集群***下的运行服务器是否存在故障;
服务器类型判断模块,用于判断所述运行服务器类型;
业务切换模块,用于根据服务器类型判断模块中所判断的运行服务器类型进行业务切换,包括:
虚拟业务切换单元,用于在判断出所述运行服务器类型为第一虚拟服务器时,则将第一虚拟服务器上承载的Linux虚拟服务器LVS业务切换到第二虚拟服务器,由第二虚拟服务器运行所述LVS业务,所述第一虚拟服务器和第二虚拟服务器由高可用性集群***下的不同的真实服务器所承载;
真实业务切换单元,用于在判断出所述运行服务器类型为第一真实服务器时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务。
7.如权利要求6所述的适用高可用性集群的并行管理服务器的***,其特征在于,所述服务器类型判断模块还用于判断所述第一真实服务器是否承载有第一虚拟服务器;
所述业务切换模块在判断所述第一真实服务器承载有第一虚拟服务器,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务,将第一虚拟服务器上承载的LVS业务切换到第二虚拟服务器,由第二虚拟服务器运行所述LVS业务;在判断所述第一真实服务器没有承载第一虚拟服务器时,则将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务。
8.如权利要求6所述的适用高可用性集群的并行管理服务器的***,其特征在于,所述***还包括:
集群LVS路由模块,用于在判断出第一真实服务器发生故障时,在真实业务切换过程中,高可用性集群软件检测到第一真实服务器上的业务不存在,从虚拟服务器的LVS路由表中删除第一真实服务器的真实IP路由,在完成真实业务切换后,恢复第二真实服务器真实IP路由到虚拟服务器的LVS路由表中。
9.如权利要求6至8任一项所述的适用高可用性集群的并行管理服务器的***,其特征在于,所述***还包括:
故障类型模块,用于在判断出所述运行服务器类型为第一真实服务器时,判断所述第一真实服务器的故障类型,在故障类型模块判断出所述故障类型为关联LVS业务的真实业务应用时,则由业务切换模块将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务;或者触发第一真实服务器自动重启;
在故障类型模块判断所述故障类型为非关联LVS的故障类型时,则由业务切换模块将第一真实服务器所承载的真实业务切换到第二真实服务器,由第二真实服务器运行所述真实业务。
10.如权利要求9所述的适用高可用性集群的并行管理服务器的***,其特征在于,所述***还包括:
故障恢复检测模块,用于基于高可用性集群软件检测有故障的服务器是否已恢复,所述服务器包括虚拟服务器和真实服务器;
故障恢复自动回切模块,用于在故障恢复检测模块判断所述有故障的服务器恢复之后,根据高可用性集群软件中的配置文件进行业务故障恢复,将之前切换的LVS业务自动回切到第一虚拟服务器或者将之前切换的真实业务自动回切到恢复后的第一真实服务器;
备机登记模块,用于在故障恢复检测模块判断所述有故障的服务器恢复之后,根据高可用性集群软件中的配置文件进行备机登记处理,将恢复后的第一真实服务器或者第一虚拟服务器作为后续故障处理机制中的备机。
CN201610395528.2A 2016-06-04 2016-06-04 一种适用高可用性集群的并行管理服务器的方法及*** Active CN105959145B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610395528.2A CN105959145B (zh) 2016-06-04 2016-06-04 一种适用高可用性集群的并行管理服务器的方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610395528.2A CN105959145B (zh) 2016-06-04 2016-06-04 一种适用高可用性集群的并行管理服务器的方法及***

Publications (2)

Publication Number Publication Date
CN105959145A true CN105959145A (zh) 2016-09-21
CN105959145B CN105959145B (zh) 2019-05-17

Family

ID=56907752

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610395528.2A Active CN105959145B (zh) 2016-06-04 2016-06-04 一种适用高可用性集群的并行管理服务器的方法及***

Country Status (1)

Country Link
CN (1) CN105959145B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106850759A (zh) * 2016-12-31 2017-06-13 广州勤加缘科技实业有限公司 MySQL数据库集群处理方法及其处理***
CN108243030A (zh) * 2016-12-23 2018-07-03 航天星图科技(北京)有限公司 一种备份服务器选择管理方法
CN108965152A (zh) * 2017-05-19 2018-12-07 贵州白山云科技有限公司 一种云资源混合调度方法及装置
CN109873759A (zh) * 2017-12-01 2019-06-11 北京京穗蓝盾信息安全技术有限公司 一种基于单导设备的智能双机热备技术

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819465A (zh) * 2012-06-29 2012-12-12 华中科技大学 一种虚拟化环境中故障恢复的方法
CN103152419A (zh) * 2013-03-08 2013-06-12 中标软件有限公司 一种云计算平台的高可用集群管理方法
CN103559108A (zh) * 2013-11-11 2014-02-05 中国科学院信息工程研究所 一种基于虚拟化实现主备故障自动恢复的方法及***
CN103701627A (zh) * 2012-09-27 2014-04-02 北京搜狐新媒体信息技术有限公司 一种云计算平台故障检测方法、装置及解决方法、装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819465A (zh) * 2012-06-29 2012-12-12 华中科技大学 一种虚拟化环境中故障恢复的方法
CN103701627A (zh) * 2012-09-27 2014-04-02 北京搜狐新媒体信息技术有限公司 一种云计算平台故障检测方法、装置及解决方法、装置
CN103152419A (zh) * 2013-03-08 2013-06-12 中标软件有限公司 一种云计算平台的高可用集群管理方法
CN103559108A (zh) * 2013-11-11 2014-02-05 中国科学院信息工程研究所 一种基于虚拟化实现主备故障自动恢复的方法及***

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108243030A (zh) * 2016-12-23 2018-07-03 航天星图科技(北京)有限公司 一种备份服务器选择管理方法
CN106850759A (zh) * 2016-12-31 2017-06-13 广州勤加缘科技实业有限公司 MySQL数据库集群处理方法及其处理***
CN108965152A (zh) * 2017-05-19 2018-12-07 贵州白山云科技有限公司 一种云资源混合调度方法及装置
CN109873759A (zh) * 2017-12-01 2019-06-11 北京京穗蓝盾信息安全技术有限公司 一种基于单导设备的智能双机热备技术

Also Published As

Publication number Publication date
CN105959145B (zh) 2019-05-17

Similar Documents

Publication Publication Date Title
CN103152419B (zh) 一种云计算平台的高可用集群管理方法
CN103176831B (zh) 一种虚拟机***及其管理方法
CN105933407B (zh) 一种实现Redis集群高可用的方法及***
CN109474465A (zh) 一种基于服务器集群的可动态流转的高可用性的实现方法和***
US8032786B2 (en) Information-processing equipment and system therefor with switching control for switchover operation
CN105959145A (zh) 一种适用高可用性集群的并行管理服务器的方法及***
CN101179432A (zh) 一种多机环境中实现***高可用的方法
CN102394914A (zh) 集群脑裂处理方法和装置
CN106911802B (zh) 分布式块存储***的管理平台的部署方法和装置
CN116561096A (zh) 一种基于容器平台的数据库管理方法及***
CN105554130A (zh) 基于分布式存储***的NameNode切换方法和切换装置
CN110971662A (zh) 一种基于Ceph的两节点高可用实现方法及装置
US7373542B2 (en) Automatic startup of a cluster system after occurrence of a recoverable error
CN113127270A (zh) 一种基于云计算的3取2安全计算机平台
US8015432B1 (en) Method and apparatus for providing computer failover to a virtualized environment
CN114116912A (zh) 一种基于Keepalived实现数据库高可用的方法
WO2006005251A1 (fr) Procede et systeme de realisation de la fonction de commutation dans un systeme de communication
CN105740049A (zh) 一种控制方法及装置
JP5285044B2 (ja) クラスタシステム復旧方法及びサーバ及びプログラム
CN117240694A (zh) 一种基于keepalived的双机热备主备切换方法、装置及***
CN115878361A (zh) 数据库集群的节点管理方法、装置及电子设备
CN108984602B (zh) 一种数据库控制方法和数据库***
CN107122228B (zh) 超融合***的管理平台的部署方法和装置
CN115964142A (zh) 应用服务的管理方法、设备及存储介质
CN115694748A (zh) 一种基于分层***实时数据同步的冗余框架设计方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant