CN112187523A - 一种网络高可用实现方法及超融合*** - Google Patents

一种网络高可用实现方法及超融合*** Download PDF

Info

Publication number
CN112187523A
CN112187523A CN202010946006.3A CN202010946006A CN112187523A CN 112187523 A CN112187523 A CN 112187523A CN 202010946006 A CN202010946006 A CN 202010946006A CN 112187523 A CN112187523 A CN 112187523A
Authority
CN
China
Prior art keywords
flow table
local flow
server
network
server nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010946006.3A
Other languages
English (en)
Inventor
黄茂峰
杨帅麒
雷准富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huayun Data Holding Group Co Ltd
Original Assignee
Huayun Data Holding Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huayun Data Holding Group Co Ltd filed Critical Huayun Data Holding Group Co Ltd
Priority to CN202010946006.3A priority Critical patent/CN112187523A/zh
Publication of CN112187523A publication Critical patent/CN112187523A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/54Organization of routing tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes

Abstract

本发明提供了一种网络高可用实现方法及超融合***,该网络高可用实现方法包括以下步骤:为至少两个服务器节点的虚拟网络交换机配置本地流表;对服务器节点之间的本地流表进行即时同步,以将本地流表复制至对端的服务器节点中以形成对端流表;对未发生故障的服务器节点中由已经发生故障的对端节点所传入所对端流表与对未发生故障的服务器节点既有的本地流表进行整合,以形成新的本地流表。本发明所揭示的网络高可用实现方法及超融合***实现了对整个超融合***中的所有服务器节点执行快速的虚拟网络恢复,并显著地降低了在虚拟化网络恢复过程中所消耗的***资源。

Description

一种网络高可用实现方法及超融合***
技术领域
本发明涉及云计算技术领域,尤其涉及一种网络高可用实现方法及超融合***。
背景技术
超融合***基于超融合架构(Hyper Converged Infrastructure,HCI),是指在同一套单元设备中不仅仅具备计算、网络、存储和服务器虚拟化等资源和技术,而且还包括备份软件、快照技术、重复数据删除、在线数据压缩等元素,而多套单元设备可以通过网络聚合起来,实现模块化的无缝横向扩展(scale-out),形成统一的资源池。超融合一体机中通常设置至少三个物理态的宿主机(即“超融合节点”或者“节点”),并在宿主机中定义出控制节点、存储节点、网络节点及计算节点。
超融合***通常包含多个超融合节点(即服务器节点),并使用软件定义网络(SDN)实现虚拟网络交换机、分布式虚拟路由功能,实现虚拟机之间、虚拟机与外部网络的互联与高效数据交换。同时通过云管平台对网络交换机、浮动IP、分布式虚拟路由器进行统一管理,包括创建、删除、查询、更改等操作。当其中一个超融合节点发生网络故障时,需要立刻恢复虚拟化网络,以实现网络高可用。
申请人经过检索发现公开号为CN107257295A的中国发明专利公开了一种分布式架构软件定义网络控制器的调度方法。该现有技术涉及云计算***上各计算节点之间的网络信息同步,其根据计算节点中的软件定义网络控制器(SDN控制器)根据接入或者断开的虚拟交换机的端口信息更新本地拓扑信息表,并将更新后的拓扑信息同步至其他计算节点的SDN控制器。申请人指出该现有技术涉及云计算***的计算节点间因网络信息变化执行网络信息同步,因此并不适合超融合***。同时,该有技术无法解决超融合***中的某个超融合节点在发生故障时如何进行网络故障的恢复提出对应的解决方案。
有鉴于此,有必要对现有技术中的类似于超融合***中的网络高可用实现方法及超融合***予以改进,以解决上述问题。
发明内容
本发明的目的在于揭示一种网络高可用实现方法及超融合***,用以实现在超融合***中某个服务器节点在发生故障时实现快速恢复虚拟化网络,以实现网络高可用,并降低在虚拟化网络恢复过程中所消耗的***资源。
为实现上述第一个目的,本发明提供了一种网络高可用实现方法,包括以下步骤:
S1、为至少两个服务器节点的虚拟网络交换机配置本地流表;
S2、对服务器节点之间的本地流表进行即时同步,以将本地流表复制至对端的服务器节点中以形成对端流表;
S3、对未发生故障的服务器节点中由已经发生故障的对端节点所传入所对端流表与对未发生故障的服务器节点既有的本地流表进行整合,以形成新的本地流表。
作为本发明的进一步改进,所述步骤S3中对未发生故障的服务器节点中由已经发生故障的对端节点所传入所对端流表与对未发生故障的服务器节点既有的本地流表所执行的整合操作具体为:对所述对端流表与本地流表进行修改与排序。
作为本发明的进一步改进,所述步骤S2对服务器节点预先配置的本地流表进行即时同步的前提为相互复制本地流表的两个服务器节点均未发生故障。
作为本发明的进一步改进,所述新的本地流表包含所有服务器节点的全部本地流表,所述故障包括服务器节点发生宕机、断电或者网络中断的故障。
作为本发明的进一步改进,所述网络高可用实现方法应用于包含三个或者三个以上的服务器节点所构成的超融合***中。
作为本发明的进一步改进,所述步骤S2具体为:从多个服务器节点中选取未发生故障的一个服务器节点,并将未被选取的其他服务器节点中的本地流表进行即时同步,以将未被选取的其他服务器节点中的本地流表逐一复制至选定的服务器节点中以形成对端流表。
作为本发明的进一步改进,所述步骤S2还包括:将逐一复制至选定的服务器节点中所形成的对端流表与未发生故障的一个服务器节点既有的本地流表进行整合,以形成新的本地流表,并将所述新的本地流表同步复制到其他服务器节点。
作为本发明的进一步改进,所述步骤S3执行完毕后,还包括:根据新的本地流表将发生故障的服务器节点中的虚拟机迁移至形成新的本地流表所在的服务器节点中。
作为本发明的进一步改进,服务器节点之间通过彼此配置的网卡共同连接至交换机。
基于相同发明思想,本申请还揭示了一种超融合***,包括:两个或者两个以上的服务器节点,所述服务器节点配置连接交换机的网卡;
其特征在于,所述超融合***运行如上述任一项发明创造所述的网络高可用实现方法。
与现有技术相比,本发明的有益效果是:
在本申请中,当所有服务器节点在没有发生故障时将彼此所配置的本地流表同步至对端服务器节点,并与选定的没有发生故障的服务器节点中的本地流表进行整合,以形成新的本地流表,从而通过该新的本地流表对整个超融合***中的所有服务器节点执行快速的虚拟网络恢复,并且能够根据新的本地流表使得迁移至形成新的本地流表的服务器节点中的虚拟机的网络服务不受影响;最后,由于仅需要对本地流表即时同步至对端服务器节点以形成对端流表,从而显著地降低了在虚拟化网络恢复过程中所消耗的***资源。
附图说明
图1为本发明一种网络高可用实现方法的整体流程图;
图2为本发明一种超融合***所配置的两个服务器节点未发生故障时对服务器节点之间的本地流表进行即时同步的示意图;
图3为本发明一种超融合***所配置的两个服务器节点中的一个服务器节点发生故障时将已经即时复制到对端节点中的对端流表与未发生故障的服务器节点中的本地流表进行整合以形成新的本地流表的示意图;
图4为包含三个服务器节点的超融合***中运行一种网络高可用实现方法在变形例中的示意图,其中,服务器节点1为所述预先被选取的未发生故障的服务器节点,服务器节点1~3均配置本地流表;
图5为当图4中的服务器节点2发生故障时,将未被选取的其他服务器节点(即服务器节点2与服务器节点5)中的本地流表进行即时同步,以将未被选取的其他服务器节点中的本地流表逐一复制至选定的服务器节点(服务器节点1)中以形成对端流表的示意图;
图6为将服务器节点1中的本地流表与对端流表合进行整合以形成新的本地流表的示意图;
图7为在执行网络恢复过程将服务器节点1中所形成的新的本地流表同步复制到其他服务器节点,并重新启动部署在服务器节点2与服务器节点3中的虚拟机的示意图。
具体实施方式
下面结合附图所示的各实施方式对本发明进行详细说明,但应当说明的是,这些实施方式并非对本发明的限制,本领域普通技术人员根据这些实施方式所作的功能、方法、或者结构上的等效变换或替代,均属于本发明的保护范围之内。
在详细阐述本申请各个实施例之前,对各实施例中的技术术语予以必要阐述与定义。
术语“流表”(Flow Table):流表是Open Flow对网络设备的数据转发功能的一种抽象。在传统网络设备中,交换机和路由器的数据转发需要依赖设备中保存的二层MAC地址转发表或者三层IP地址路由表,而Open Flow交换机中使用的流表也是如此,不过在它的表项中整合了网络中各个层次的网络配置信息,从而在进行数据转发时可以使用更丰富的规则,并具体体现为虚拟网络交换机在虚拟网路执行数据转发过程中需要的数据表项。参图2至图7所示,在本申请各个实施例中,流表简化表示为“Flow”。
术语“vSwitch”:虚拟网络交换机,“vSwitch”仅仅是虚拟网络交换机的一种下位概念或者具体概念。
术语“VM”:虚拟机,构成响应于用户发起的访问请求的服务主体,并为用户提供云计算服务并具有完整功能并呈虚拟态的计算机***。
术语“Local Flows”:本地流表,即虚拟网络交换机为本地节点的虚拟机提供网络服务所需要的路由和转发规则。
术语“Peer Flows”:对端流表,即对端节点即时同步并复制到本地节点的本地流表。
术语“本地节点”与术语“对端节点”在计算机集群服务器或者超融合***中的角色相同,通常可被理解为物理节点或者由物理态服务器所组成的服务器节点。同时,术语“节点”与术语“服务器节点”或者“超融合节点”具等同技术含义。参图2所示,在服务器节点A与服务器节点B均处于正常运行时,如果将服务器节点A中包含Flow01与Flow02的本地流表即时同步至服务器节点B中以形成包含Flow01与Flow02的对端流表。在此即时复制过程中服务器节点A称之为本地节点,服务器节点B称之为对端节点;反之,如果将服务器节点B中包含Flow03与Flow04的本地流表即时同步至服务器节点A中以形成包含Flow03与Flow04的对端流表。在此即时复制过程中服务器节点B称之为本地节点,服务器节点A称之为对端节点。因此,本地节点与对端节点只是相对而言,彼此的配置可保持一致或者不一致,并仅因为发起本地流表的即时复制过程的逻辑方向予以确定。
实施例一:
参图1至图3所示出的本发明一种网络高可用实现方法的一种具体实施方式。
本地流表与对端流表均由基本字段、条件字段和动作字段组成。vSwitch23与vSwitch33基于本地流表与对端流表或者整合后的新的本地节点,执行对数据包的转发操作。基本字段包括:生效时间duration_sec、所属表项table_id、优先级priority、处理的数据包数n_packets,空闲超时时间idle_timeout等。条件字段包括:输入端口号in_port、输出端口号out_port、源目的mac地址dl_src/dl_dst、源目的ip地址nw_src/nw_dst、数据包类型dl_type、网络层协议类型nw_proto等,可以为这些字段的任意组合,但在网络分层结构中底层的字段未给出确定值时上层的字段不允许给确定值,即一条流规则中允许底层协议字段指定为确定值,高层协议字段指定为通配符(不指定即为匹配任何值),而不允许高层协议字段指定为确定值,而底层协议字段却为通配符(不指定即为匹配任何值);否则,ovs-vswitchd中的流规则将全部丢失,网络无法连接。动作字段包括:正常转发normal、定向到某交换机端口output:port、丢弃drop、更改源目的mac地址mod_dl_src/mod_dl_dst等,一条流规则可有多个动作,动作执行按指定的先后顺序依次完成。
参图1所示,本实施例所揭示的一种网络高可用实现方法包括:为至少两个服务器节点的虚拟网络交换机配置本地流表;对服务器节点之间的本地流表进行即时同步,以将本地流表复制至对端的服务器节点中以形成对端流表;对未发生故障的服务器节点中由已经发生故障的对端节点所传入所对端流表与对未发生故障的服务器节点既有的本地流表进行整合,以形成新的本地流表。该网络高可用实现方法,可应用于超融***中,包括以下步骤。
首先,执行步骤S1、为至少两个服务器节点的虚拟网络交换机配置本地流表。
结合图2所示,该超融合***包括服务器节点1与服务器节点2。服务器节点1配置连接交换机10的网卡20,服务器节点2配置连接交换机10的网卡30。服务器节点1中配置与网卡20连接的虚拟网络交换机23(vSwitch),虚拟网络交换机23连接VM21与VM22。服务器节点2中配置与网卡20连接的虚拟网络交换机33(vSwitch),虚拟网络交换机23连接VM31与VM32。vSwitch23为服务器节点1中的VM21、VM22提供虚拟化网络服务,vSwitch33为服务器节点2中的VM31、VM32提供虚拟化网络服务。服务器节点1配置包含Flow01与Flow02的本地流表(Local Flows),Flow01对应于VM21,Flow02对应于VM22;服务器节点2配置包含Flow03与Flow04的本地流表(Local Flows),Flow03对应于VM31,Flow04对应于VM32。服务器节点之间通过彼此配置的网卡20与网卡30共同连接至交换机10。该交换机10为二层物理交换机。
然后,执行步骤S2、对服务器节点之间的本地流表进行即时同步(sync),以将本地流表复制至对端的服务器节点中以形成对端流表。步骤S2对服务器节点预先配置的本地流表进行即时同步的前提为相互复制本地流表的两个服务器节点均未发生故障。通常的,在超融合***在部署并开始运行时即执行步骤S2,以为后续因某个服务器节点在发生故障时实现网络的高可用。
参图2所示,具体的,即使同步的操作在服务器节点1与服务器节点2均为正常时(OK)执行。服务器节点1中的Local Flows即时同步至服务器节点2中,以形成对端流表(Peer Flows),该对端流表包含Flow01与Flow02。同理所述,服务器节点2中的Local Flows即时同步至服务器节点1中,以形成对端流表(Peer Flows),该对端流表包含Flow03与Flow04。Flow01~Flow04均通过彼此所述的网卡及交换机10进行转发。在本实施例中,当两个服务器均处于正常时(OK),仅需要彼此所配置的本地流表进行即时同步复制,并复制到对端节点以形成对端流表(Peer Flows)。本地流表(Local Flows)的即时复制过程属于文本数据级的数据传输,因此即时同步所消耗的***资源非常小,基本可以忽略不计。
然后,执行步骤S3、对未发生故障的服务器节点中由已经发生故障的对端节点所传入所对端流表与对未发生故障的服务器节点既有的本地流表进行整合,以形成新的本地流表。该新的本地流表包含Flow01、Flow02、Flow03及Flow04四个流表。
结合图3所示,在本实施例中,若服务器节点1发生故障时(NG),会导致VM21与VM22不可用。此时,服务器节点2正常运行。服务器节点2对即时同步至本地节点(即服务器节点2)中并包含Flow01与Flow02的对端流表与服务器节点2中包含Flow03与Flow04的本地流表进行整合,以形成新的本地流表。该新的本地流表包含整个超融合***中的所有服务器节点中在执行步骤S2之前所配置的所有本地流表。
同时,在步骤S3中对未发生故障的服务器节点(即服务器节点2)中由已经发生故障的对端节点(即服务器节点1)所传入所对端流表(Peer Flows)与对未发生故障的服务器节点既有的本地流表(Local Flows)所执行的整合操作具体为:对所述对端流表与本地流表进行修改与排序。
未发生故障服务器节点(即服务器节点2)中Local Flows与Peer Flows的整合操作是:依次按照Peer Flows中每条流表的先后顺序将每条流表经过本地化处理之后按照下面的***逻辑将服务器节点2即时同步至服务器节点1中所形成的Peer Flows***到服务器节点1的Local Flows中。
本地化处理是指:将每条Peer Flow中的若干条件字段进行修改,这些条件字段为服务器节点1上的网络信息,现在要修改为服务器节点2上的网络信息,如条件字段中的输入端口号和输出端口号要修改成服务器节点2上流表进入虚拟网络交换机(vSwitch23)的对应端口号。
***逻辑是指:当一条原本位于服务器节点1中的Peer Flow流表(假设该条PeerFlow流表的表项table_id为table_x,优先级priority为pri_x,x为参数值)准备***到服务器节点2的Local Flows中时,需要经过下面的步骤参入到Local Flows中正确的位置上。
(1)如果服务器节点2的Local Flows中没有该table_x表项,则在Local Flows中新建该表项,并将Peer Flows中table_x表项内容复制到此表项中。
(2)如果服务器节点2的Local Flows中存在table_x表项,但是没pri_x流表,则直接将该Peer Flow流表***到table_x表项任一位置。
(3)如果服务器节点2的Local Flows中存在table_x表项且存在pri_x流表,该Peer Flow流表需要***table_x表项中所有pri_x流表之后。
在本实施例中,通过对端节点所传入所对端流表与对未发生故障的服务器节点既有的本地流表进行整合,以形成新的本地流表,可以让后面迁移过来的虚拟机(即原本部署于服务器节点1中的VM21、VM22)正常地使用虚拟化网络;同时,也不影响服务器节点2上已经部署的虚拟机(VM31、VM32)对虚拟网络的正常使用。
参图3所示,其所示出的新的本地流表包含所有服务器节点的全部本地流表(Flow01、Flow02、Flow03及Flow04)。同时,本实施例中,服务器节点1所揭示的故障包括服务器节点发生宕机、断电或者网络中断的故障。当服务器节点2中的Peer Flows与既有的本地流表整合后,Peer Flows消失。在本实施例中,基于所述新的本地流表(图3中的LocalFlows)对全部服务器节点进行网络恢复。
优选的,所述步骤S3执行完毕后,还包括:根据新的本地流表将发生故障的服务器节点1中的虚拟机(即VM21、VM22)迁移至形成新的本地流表所在的服务器节点2中。此时,服务器节点2中的Flow 01、Flow02、VM21及VM22会沿图3中虚线箭头所示出的恢复路径重新恢复至故障已经被修复的服务器节点1中。从而在服务器节点1恢复时将原本部署于服务器节点1中的VM21、VM22重新经由网卡30、交换机10及网卡20迁移至服务器节点1中。
在本实施例中,即使服务器节点1发生故障而导致VM21与VM22不可用,由于本地流表Flow01与Flow02被迁移至运行正常的服务器节点2中,并将VM21与VM22迁移至服务器节点2中,并连接至vSwitch33中,因此,使得迁移至形成新的本地流表的服务器节点2中的虚拟机(VM21与VM22)的网络服务不受影响。
需要说明的是,本实施例所揭示的网络高可用方法不仅可运用于超融合***中,还可应用于基于分布式分存储架构的数据中心(IDC)、集群服务器、云计算平台中。在本实施例中,当服务器节点1出现了不可恢复的故障或者可以恢复的故障时,即时同步本地流表至对端节点,可以保证服务器节点1的本地流表不会发生遗失或者破坏,确保了整个超融合***所形成的虚拟网络服务的高可用性。同时,通过对迁移至未发生故障的服务器节点所形成的对端流表(Peer Flows)并整合成新的本地流表,也能够确保迁移至未发生服务器的虚拟机(VM31、VM32)的虚拟网络服务不受到影响,并确保了未发生故障的服务器节点,即服务器节点2中所创建的VM31、VM32所形成的虚拟网络服务不受到网络冲击。
实施例二:
配合参照图4至图7所揭示的本发明一种网络高可用实现方法的另一种具体实施方式。
本实施例所揭示的该网络高可用实现方法与实施例一相比,其主要区别在于,在实施例中,该网络高可用实现方法应用于包含三个或者三个以上的服务器节点所构成的超融合***中。在本实施例中,选用三个服务器节点1~服务器节点3为范例,予以示范性阐述。
具体的,服务器节点1配置包含Flow01与Flow02的本地流表,以及与其对应的VM21、VM22,虚拟网络交换机(未示出)连接VM21与VM22,并通过网卡20接入交换机10。服务器节点2配置包含Flow03与Flow04的本地流表,以及与其对应的VM31、VM32,虚拟网络交换机(未示出)连接VM31与VM32,并通过网卡30接入交换机10。服务器节点3配置包含Flow05与Flow06的本地流表,以及与其对应的VM51、VM52,虚拟网络交换机(未示出)连接VM51与VM52,并通过网卡50接入交换机10。
同时,步骤S2具体为:从多个服务器节点中选取未发生故障的一个服务器节点,此种选择并确定服务器节点是随机的,只要该服务器节点运行正常即可。例如,在本实施中选取服务器节点1作为未发生故障的一个服务器节点。将未被选取的其他服务器节点中的本地流表进行即时同步,以将未被选取的其他服务器节点中的本地流表逐一复制至选定的服务器节点中以形成对端流表。此时,服务器节点2中包含Flow03、Flow04的Local Flows,以及服务器节点3中包含Flow05、Flow06的Local Flows均即时同步至服务器节点1中,形成Peer Flows,具体参图4所示。
所述步骤S3执行完毕后,还包括:根据新的本地流表将发生故障的服务器节点中的虚拟机迁移至形成新的本地流表所在的服务器节点中。
参图5所示,若服务器节点2的发生故障时(NG),其配置的VM31、VM32不可用。将逐一复制至选定的服务器节点中所形成的对端流表与未发生故障的一个服务器节点既有的本地流表进行整合,以形成新的本地流表,并将所述新的本地流表同步复制到其他服务器节点。该新的本地流表包含Flow01~Flow06。
具体参图6所示。在本实施例中,在某个服务器节点发生故障前所执行的将本地流表复制到对端节点的同步过程不需要执行双向的即时同步,因此进一步降低了该即时同步过程所消耗的***资源。更有限的,在本实施例中,可将已经整合所形成的新的本地流表(参图6中的Local Flows所示)再执行一次即时同步操作。但在含有数量众多的服务器节点的超融合集群或者含有数量庞大的服务器几点的计算机集群或者数据中心的应用场景中时,可降低多个服务器节点之间由于需要执行数量庞大且繁琐的同步校验操作,使得的多服务器节点之间的即时同步操作更为简便。虽然服务器节点1存在发生故障的可能性,但是可通过使用不间断电源(UPS)、高冗余数据备份、非易失性存储器等多种手段降低服务器节点1发生故障的可能性,由此除去被选取的未发生故障的服务器节点之前的一个或者多个其他服务器节点(例如图5中的服务器节点2和/或服务器节点3)发生故障,也能通过迁移至服务器节点1中的新的本地流表及虚拟机,沿图7中虚线箭头的所示出的恢复方向,重新将Flow03、Flow04、VM31及VM32迁移恢复至故障已经被修复的服务器节点2中;同时,将重新将Flow05、Flow06、VM51及VM52迁移恢复至正常的服务器节点3中,并覆盖服务器节点3中的虚拟机及本地流表。
需要说明的是,在本实施例中,该网络高可用方法还包括:确定未发生故障的服务器节点,并仅根据新的本地流表将发生故障的服务器节点中的虚拟机迁移至形成新的本地流表所在的服务器节点中。例如,若三个服务器节点实例的超融合***中,若仅服务器节点2发生故障,则仅将Flow03、Flow04、VM31及VM32迁移恢复至故障已经被修复的服务器节点2中。
优选的,参图7所示,在本实施例中,还可将在即时同步本地流表以形成新的本地流表,在发生过故障的服务器节点2的故障恢复后,将服务器节点1中包含全部服务器节点流表的本地流表(Flow01~Flow06)同步至对端节点(即服务器节点2、服务器节点3),以提高整个超融合***中各个服务器节点中所配置的虚拟机在上行链路中与外网40相通信,并提高了虚拟网络服务的高可用性与高容灾备份能力。
本实施例所揭示的一种网络高可用实现方法与实施例一中相同部分的技术方案,请参实施例一所示,在此不再赘述。
实施例三:
基于上述实施例一和/或实施例二所揭示的一种网络高可用实现方法,本实施例还揭示了一种超融合***,该超融合***包括:两个或者两个以上的服务器节点,所述服务器节点配置连接交换机的网卡。超融合***运行如实施例一和/或实施例二所述的网络高可用实现方法。需要说明的是,在本申请的说明书附图中的“网卡”即“物理网卡”。
在本实施例中,该超融合***最优选为仅包含服务器节点1与服务器节点2,以追求更加的性价比。多个服务器节点可选用基于X86架构的计算机***以作为物理层设备,服务器节点向上形成软件定义存储(SDS),分布式存储(Ceph)并由云管平台统一纳管多个服务器节点。云管平台可基于Openstack架构或者VMware架构,并利用开源方式方案,为用户提供高效、弹性、可伸缩、可移植的各种应用,为用户提供IaaS的资源管理、服务管理和运营管理。
重点参照图2所示,在本实施例中,该超融合***包括服务器节点1与服务器节点2。服务器节点1配置连接交换机10的网卡20,服务器节点2配置连接交换机10的网卡30。服务器节点1中配置与网卡20连接的虚拟网络交换机23(vSwitch),虚拟网络交换机23连接VM21与VM22。服务器节点2中配置与网卡20连接的虚拟网络交换机33(vSwitch),虚拟网络交换机23连接VM31与VM32。
vSwitch(虚拟网络交换机的下位概念)广泛应用在基于IaaS(Infrastructure asa Service)的互联网服务中。通过运行在虚拟化平台上的虚拟交换机,为本地服务器节点上的VM(Virtual Machine)提供二层网络接入和部分三层网络功能。VM通过vSwitch来连接外网40,vSwitch则通过服务器节点上的网卡20作为上行链路与外网40相通信。用户通过HTTP请求及外网40访问该超融合***,并基于超融合***中所配置的虚拟机对用户发起的请求予以响应。
尤其需要说明的是,在本实施例中,虚拟网络交换机在基于开源架构时选用OpenvSwitch(OvS),商用的有VMware的VSS(vSphere Standard vSwitch,vSphere标准虚拟交换机)和VDS(vSphere Distributed vSwitch,vSphere分布式虚拟交换机)、Cisco的Nexus1000V、微软的Hyper-V虚拟交换机等。
本发明实施例中所描述的各种说明性的逻辑块,或单元都可以通过通用处理器,数字信号处理器,专用集成电路(ASIC),现场可编程门阵列或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。
本实施例所揭示的一超融合***与实施例一和/或实施例二中相同部分的技术方案,请参实施例一和/或实施例二所示,在此不再赘述。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (10)

1.一种网络高可用实现方法,其特征在于,包括以下步骤:
S1、为至少两个服务器节点的虚拟网络交换机配置本地流表;
S2、对服务器节点之间的本地流表进行即时同步,以将本地流表复制至对端的服务器节点中以形成对端流表;
S3、对未发生故障的服务器节点中由已经发生故障的对端节点所传入所对端流表与对未发生故障的服务器节点既有的本地流表进行整合,以形成新的本地流表。
2.根据权利要求1所述的网络高可用实现方法,其特征在于,所述步骤S3中对未发生故障的服务器节点中由已经发生故障的对端节点所传入所对端流表与对未发生故障的服务器节点既有的本地流表所执行的整合操作具体为:对所述对端流表与本地流表进行修改与排序。
3.根据权利要求1所述的网络高可用实现方法,其特征在于,所述步骤S2对服务器节点预先配置的本地流表进行即时同步的前提为相互复制本地流表的两个服务器节点均未发生故障。
4.根据权利要求1所述的网络高可用实现方法,其特征在于,所述新的本地流表包含所有服务器节点的全部本地流表,所述故障包括服务器节点发生宕机、断电或者网络中断的故障。
5.根据权利要求1至4中任一项所述的网络高可用实现方法,其特征在于,所述网络高可用实现方法应用于包含三个或者三个以上的服务器节点所构成的超融合***中。
6.根据权利要求5所述的网络高可用实现方法,其特征在于,所述步骤S2具体为:从多个服务器节点中选取未发生故障的一个服务器节点,并将未被选取的其他服务器节点中的本地流表进行即时同步,以将未被选取的其他服务器节点中的本地流表逐一复制至选定的服务器节点中以形成对端流表。
7.根据权利要求6所述的网络高可用实现方法,其特征在于,所述步骤S2还包括:将逐一复制至选定的服务器节点中所形成的对端流表与未发生故障的一个服务器节点既有的本地流表进行整合,以形成新的本地流表,并将所述新的本地流表同步复制到其他服务器节点。
8.根据权利要求7所述的网络高可用实现方法,其特征在于,所述步骤S3执行完毕后,还包括:根据新的本地流表将发生故障的服务器节点中的虚拟机迁移至形成新的本地流表所在的服务器节点中。
9.根据权利要求5所述的网络高可用实现方法,其特征在于,服务器节点之间通过彼此配置的网卡共同连接至交换机。
10.一种超融合***,包括:两个或者两个以上的服务器节点,所述服务器节点配置连接交换机的网卡;
其特征在于,所述超融合***运行如权利要求1至9中任一项所述的网络高可用实现方法。
CN202010946006.3A 2020-09-10 2020-09-10 一种网络高可用实现方法及超融合*** Pending CN112187523A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010946006.3A CN112187523A (zh) 2020-09-10 2020-09-10 一种网络高可用实现方法及超融合***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010946006.3A CN112187523A (zh) 2020-09-10 2020-09-10 一种网络高可用实现方法及超融合***

Publications (1)

Publication Number Publication Date
CN112187523A true CN112187523A (zh) 2021-01-05

Family

ID=73921754

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010946006.3A Pending CN112187523A (zh) 2020-09-10 2020-09-10 一种网络高可用实现方法及超融合***

Country Status (1)

Country Link
CN (1) CN112187523A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114338225A (zh) * 2021-03-29 2022-04-12 井芯微电子技术(天津)有限公司 策略分发器、拟态交换机及网络***
CN114915602B (zh) * 2021-01-29 2024-01-26 中移(苏州)软件技术有限公司 虚拟交换机中流表的处理方法、处理装置及终端

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102946365A (zh) * 2012-11-09 2013-02-27 清华大学 一种基于软件定义网络的保持流表更新一致性的方法
CN103685250A (zh) * 2013-12-04 2014-03-26 蓝盾信息安全技术股份有限公司 一种基于sdn的虚拟机安全策略迁移的***及方法
US20140269683A1 (en) * 2013-03-14 2014-09-18 International Business Machines Corporation Synchronization of OpenFlow controller devices via OpenFlow switching devices
CN104468397A (zh) * 2014-11-06 2015-03-25 杭州华三通信技术有限公司 一种虚拟机热迁移转发不丢包的方法和装置
CN104506511A (zh) * 2014-12-15 2015-04-08 蓝盾信息安全技术股份有限公司 一种sdn网络动态目标防御***及方法
WO2015180040A1 (zh) * 2014-05-27 2015-12-03 华为技术有限公司 流表管理方法及相关设备和***
CN108365979A (zh) * 2018-01-31 2018-08-03 深信服科技股份有限公司 跨集群的控制器管理方法、sdn控制器及存储介质
CN109905251A (zh) * 2017-12-07 2019-06-18 北京金山云网络技术有限公司 网络管理方法、装置、电子设备和存储介质
CN111221561A (zh) * 2020-01-14 2020-06-02 平安科技(深圳)有限公司 流表更新方法、装置、***、计算机设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102946365A (zh) * 2012-11-09 2013-02-27 清华大学 一种基于软件定义网络的保持流表更新一致性的方法
US20140269683A1 (en) * 2013-03-14 2014-09-18 International Business Machines Corporation Synchronization of OpenFlow controller devices via OpenFlow switching devices
CN103685250A (zh) * 2013-12-04 2014-03-26 蓝盾信息安全技术股份有限公司 一种基于sdn的虚拟机安全策略迁移的***及方法
WO2015081766A1 (zh) * 2013-12-04 2015-06-11 蓝盾信息安全技术有限公司 一种基于sdn的虚拟机安全策略迁移的***及方法
WO2015180040A1 (zh) * 2014-05-27 2015-12-03 华为技术有限公司 流表管理方法及相关设备和***
CN104468397A (zh) * 2014-11-06 2015-03-25 杭州华三通信技术有限公司 一种虚拟机热迁移转发不丢包的方法和装置
CN104506511A (zh) * 2014-12-15 2015-04-08 蓝盾信息安全技术股份有限公司 一种sdn网络动态目标防御***及方法
CN109905251A (zh) * 2017-12-07 2019-06-18 北京金山云网络技术有限公司 网络管理方法、装置、电子设备和存储介质
CN108365979A (zh) * 2018-01-31 2018-08-03 深信服科技股份有限公司 跨集群的控制器管理方法、sdn控制器及存储介质
CN111221561A (zh) * 2020-01-14 2020-06-02 平安科技(深圳)有限公司 流表更新方法、装置、***、计算机设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114915602B (zh) * 2021-01-29 2024-01-26 中移(苏州)软件技术有限公司 虚拟交换机中流表的处理方法、处理装置及终端
CN114338225A (zh) * 2021-03-29 2022-04-12 井芯微电子技术(天津)有限公司 策略分发器、拟态交换机及网络***
CN114338225B (zh) * 2021-03-29 2024-04-12 井芯微电子技术(天津)有限公司 策略分发器、拟态交换机及网络***

Similar Documents

Publication Publication Date Title
CN110912780B (zh) 一种高可用集群检测方法、***及受控终端
Zhang et al. A survey on virtual machine migration: Challenges, techniques, and open issues
CN108234307B (zh) 网络方法、网络装置和非暂时性计算机可读存储介质
US20220217053A1 (en) Organizing execution of distributed operating systems for network devices
CN108234302B (zh) 保持网络装置用的分布式操作***中的一致性
Akella et al. A highly available software defined fabric
US9021459B1 (en) High availability in-service software upgrade using virtual machine instances in dual control units of a network device
Han et al. On the resiliency of virtual network functions
JP6382454B2 (ja) 分散ストレージ及びレプリケーションシステム、並びに方法
KR101099822B1 (ko) 액티브 라우팅 컴포넌트 장애 처리 방법 및 장치
US9141502B2 (en) Method and system for providing high availability to computer applications
US9378005B2 (en) Hitless software upgrades
US7933987B2 (en) Application of virtual servers to high availability and disaster recovery solutions
Rajagopalan et al. SecondSite: disaster tolerance as a service
US20120079090A1 (en) Stateful subnet manager failover in a middleware machine environment
JP2005535241A (ja) マルチコンピュータ・アーキテクチャにおけるアプリケーション・ソフトウェアの移動方法、前記移動方法を用いて作動の連続性を実現するマルチコンピュータ方法および装置
CN103761166A (zh) 一种虚拟化环境下针对网络服务的双机热备份容灾***及其方法
WO2021185169A1 (zh) 一种切换方法、装置、设备和存储介质
CN112187523A (zh) 一种网络高可用实现方法及超融合***
CN111431980B (zh) 分布式存储***及其路径切换方法
Anderson et al. Local recovery for high availability in strongly consistent cloud services
US10305987B2 (en) Method to syncrhonize VSAN node status in VSAN cluster
US11418382B2 (en) Method of cooperative active-standby failover between logical routers based on health of attached services
TWI669605B (zh) 虛擬機器群組的容錯方法及其容錯系統
CN111083074A (zh) 主备双ospf状态机的高可用性方法和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210105