CN104486394A - 不中断业务软件升级方法及装置 - Google Patents

不中断业务软件升级方法及装置 Download PDF

Info

Publication number
CN104486394A
CN104486394A CN201410751501.3A CN201410751501A CN104486394A CN 104486394 A CN104486394 A CN 104486394A CN 201410751501 A CN201410751501 A CN 201410751501A CN 104486394 A CN104486394 A CN 104486394A
Authority
CN
China
Prior art keywords
controller
main leader
leader
service traffics
master
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410751501.3A
Other languages
English (en)
Other versions
CN104486394B (zh
Inventor
王海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou H3C Technologies Co Ltd
Original Assignee
Hangzhou H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou H3C Technologies Co Ltd filed Critical Hangzhou H3C Technologies Co Ltd
Priority to CN201410751501.3A priority Critical patent/CN104486394B/zh
Publication of CN104486394A publication Critical patent/CN104486394A/zh
Application granted granted Critical
Publication of CN104486394B publication Critical patent/CN104486394B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/34Network arrangements or protocols for supporting network services or applications involving the movement of software or configuration parameters 

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种不中断业务软件升级方法及装置。其中,方法包括:控制器集群中的主领导控制器接收新版本文件,将所述新版本文件发送给所述控制器集群中的所有成员控制器;确认所述控制器集群中每个控制器的状态,并根据所确认的控制器状态对所述控制器集群中的所有控制器进行分类;根据对所述控制器的分类结果,控制所述控制器进行逐类别升级。本发明中的技术方案能够提高集群中控制器升级的效率和稳定性。

Description

不中断业务软件升级方法及装置
技术领域
本发明涉及软件升级技术,尤其涉及一种对控制器集群进行不中断业务软件升级(ISSU,In-Service Software Upgrade)的方法及装置。
背景技术
软件定义网络(SDN,Software Defined Network)是一种新型网络架构,其核心思想是分离网络设备的控制层面与转发层面,通过控制器对网络设备的流量进行集中和灵活控制,从而为核心网络及应用的创新提供良好的平台。
应用于SDN网络中的控制器可以为虚拟应用融合架构(VCF,VirtualConverged Framework)控制器,应用于SDN网络中的网络设备可以为物理交换机,也可以是虚拟交换机(vSwitch)。
VCF控制器支持集群和备份组功能,可以为用户提供高可靠的分布式平台。创建集群并配置对应的备份组,可以提高网络的可靠性,避免单台控制器故障导致SDN网络处于非管理状态。当集群中的某台控制器出现故障不能正常工作时,集群内的其它控制器可以接替该故障控制器继续进行工作,从而保证SDN网络的正常运行。同时,集群功能还能提供控制器的集中配置和监控。
在一个控制器集群(Team)中,通常包括一个主领导控制器(主Leader)和多个成员控制器(Member)。此外,也可从这些成员控制器中选出一个备领导控制器(备Leader)作为主领导控制器的备份。一个集群内的控制器可以配置在不同的备份组(Region)内,每个备份组包括一个主控制器(Mastercontroller)和至少一个备控制器(Slave controller)。不同的备份组管理不同的网络设备(如支持OpenFlow的物理交换机,或虚拟交换机(vSwitch)),这样可以将网络设备分担到不同的备份组内,实现控制器管理网络设备的负载分担功能。其中,当存在备领导控制器时,该备领导控制器可以与该主领导控制器构成一个备份组。
当控制器集群需要升级版本的时候,这时候需要用户先在控制器页面上面对一个控制器点击升级准备,然后再去控制器后台卸载原来的版本,上传加载新的版本文件,安装新的版本,再加载许可(license)。然后需要用户确认这个备份组的业务完全恢复之后,才能再对下一台控制器进行升级。这样依次手工操作所有的控制器,直到所有的控制器全部升级完成。
发明内容
本发明中一方面提供一种不中断业务软件升级方法,另一方面提供一种不中断业务软件升级装置,以便提高集群中控制器升级的效率和稳定性。
本发明所提供的不中断业务软件升级方法,包括:
控制器集群中的主领导控制器接收新版本文件,将所述新版本文件发送给所述控制器集群中的所有成员控制器;
所述主领导控制器确认所述控制器集群中每个控制器的状态,并根据所确认的控制器状态对所述控制器集群中的所有控制器进行分类;所述控制器的状态包括所述控制器在控制器集群中担任的角色,所述角色为备控制器、主控制器和主领导控制器中的至少一种;
所述主领导控制器根据对所述控制器的分类结果,按照先升级备控制器、再升级主控制器、最后升级主领导控制器的顺序,控制所述控制器进行逐类别升级。
本发明所提供的不中断业务软件升级装置,应用于控制器集群中的主领导控制器,其包括:
接收模块,用于接收新版本文件;
发送模块,用于将所述接收模块接收的新版本文件发送给所述控制器集群中的所有成员控制器;
状态确认模块,用于确认所述控制器集群中每个控制器的状态;所述控制器的状态包括所述控制器在控制器集群中担任的角色,所述角色为备控制器、主控制器和主领导控制器中的至少一种;
分类模块,用于根据状态确认模块所确认的控制器状态对所述控制器集群中的所有控制器进行分类;
控制模块,用于根据所述分类模块对所述控制器的分类结果,按照先升级备控制器、再升级主控制器的顺序,控制所有成员控制器进行逐类别升级;
业务迁移模块,用于在完成所有成员控制器的升级后,将自身的业务迁移到其它控制器中最高优先级的控制器上,所述最高优先级的控制器为新的主领导控制器;和
升级模块,用于在所述新的主领导控制器的控制下,利用所述新版本文件进行升级。
从上述方案可以看出,本发明中用户只需将新版本文件上传给主领导控制器即可,即只需上传一次版本,之后其它的操作全部由控制器自动完成,即控制器自动确认集群中每个控制器的状态,并根据所确认的控制器状态对集群中的所有控制器进行分类,根据分类结果,控制各控制器进行逐类别批量升级,即使一类控制器同时进行ISSU升级,大大提高了控制器集群ISSU升级的效率和稳定性。
此外,升级过程中控制器自身监控业务的稳定性,使控制器集群在ISSU升级过程中大大提高了可维护性。
附图说明
图1为本发明实施例中一种不中断业务软件升级方法的示例性流程图。
图2为本发明实施例中SDN网络控制器集群的一个组网例图。
图3为本发明实施例中一种不中断业务软件升级***的示例性结构图。
图4为本发明实施例中一种不中断业务软件升级装置的示例性结构图。
图5为本发明实施例中又一种不中断业务软件升级装置的示例性结构图。
图6为本发明实施例中不中断业务软件升级装置的又一示例性结构图。
具体实施方式
从上面的升级过程中可以看出,用户是通过手动方式对控制器进行升级的,不仅升级步骤繁琐,而且还需要对业务很了解,且在升级过程中还需要确认业务的恢复情况。可维护性很差,一旦用户操作步骤搞错就很容易出现升级失败的情况,对***的稳定性造成了很大的威胁。当控制器集群进行大规模部署的时候,全部使用手工进行一个一个的升级,不能实现批量的版本升级,大大影响用户维护的效率。
为了提高集群中控制器升级的效率和稳定性,本发明中提出一种全自动ISSU方案。ISSU是一种能够保证在软件升级过程中业务不中断或者中断时间较短的升级方式。在该全自动ISSU方案中,将新版本文件传送给控制器集群中的主领导控制器,然后该主领导控制器将该新版本文件发送给控制器集群中的所有成员控制器;之后,主领导控制器确认所述控制器集群中每个控制器的状态,并根据所确认的控制器状态对所述控制器集群中的所有控制器进行分类,根据对所述控制器的分类结果,按照先升级成员控制器再升级主领导控制器的顺序,控制所述控制器进行逐类别批量升级。
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明进一步详细说明。
图1为本发明实施例中不中断业务软件升级方法的示例性流程图。本实施例中的ISSU方法可应用于SDN网络的控制器集群中,图2为本发明实施例中SDN网络控制器集群的一个组网例图。如图2所示,该控制器集群中有复数个控制器,所述复数个控制器包括一个主领导控制器和至少一个成员控制器;所述复数个控制器配置在至少一个备份组中,并在所述备份组中担任主控制器或备控制器。该控制器集群提供一个北向统一IP地址,使得上层应用可通过该地址与控制器集群进行通信,数据会在整个控制器集群的控制器上同步。
本实施例中的控制器可以为VCF控制器,其是一款SDN控制器,VCF控制器目前支持标准的OpenFlow、NETCONF和OVSDB。OpenFlow协议作为控制器与转发层之间的通信接口标准,允许控制器直接访问和操作网络设备的转发平面,这些网络设备可以是支持OpenFlow的物理交换机,也可以是虚拟交换机(vSwitch)。NETCONF是一种基于XML的网络管理协议,提供了一种可编程的、对网络设备进行配置和管理的方法。OVSDB是一个OpenFlow的配置协议,用来给虚拟交换机提供配置信息。
如图1所示,该方法可包括如下操作:
步骤101,控制器集群中的主领导控制器接收新版本文件。
步骤102,主领导控制器将所述新版本文件发送给所述控制器集群中的所有成员控制器。
本步骤中,主领导控制器可利用主领导控制器与所有成员控制器之间的HTTPS数据通道,将所述新版本文件发送给所有成员控制器。或者,主领导控制器也可新建与所有成员控制器之间的新版本传输通过,之后通过该新建的传输通道,将所述新版本文件发送给所有成员控制器。当然,还可利用其它通道进行新版本的传送,此处不对具体传送方式进行限定。
对于第一种传输方式,因为HTTPS是按需发起,在传大文件的时候会比分布式数据库(Zookeeper)节省资源。等版本传送好了之后,可断开主领导控制器上面的和成员控制器的HTTPS连接。
步骤103,主领导控制器确认所述控制器集群中每个控制器的状态。所述控制器的状态包括所述控制器在控制器集群中担任的角色,所述角色为备控制器、主控制器和主领导控制器中的至少一种。此外,控制器的状态还可包括是否处于开启的状态,如UP或DOWN等。
步骤104,主领导控制器根据所确认的控制器状态对所述控制器集群中的所有控制器进行分类。
本步骤中,具体分类方法可有多种。
例如,第一种情况:将处于开启(Up)状态且为非主领导控制器所在备份组内担任备控制器的控制器划分为第一类控制器;将处于开启状态且为非主领导控制器所在备份组内担任主控制器的控制器划分为第二类控制器;将处于开启状态且在主领导控制器所在的备份组内的非主领导控制器划分为第三类控制器;将处于开启状态的主领导控制器划分为第四类控制器。
第二种情况:将处于开启状态且为非主领导控制器并且在备份组内担任备控制器的控制器划分为第一类控制器;将处于开启状态且为非主领导控制器并且在备份组内担任主控制器的控制器划分为第二类控制器;将处于开启状态的主领导控制器划分为第三类控制器。
第三种情况:在上述两种分类情况的集成上,将处于宕机(Down)状态的控制器也划分为一类。例如,将处于宕机(Down)状态的控制器划分为第一类控制器,将处于开启(Up)状态且为非主领导控制器所在备份组内担任备控制器的控制器划分为第二类控制器;将处于开启状态且为非主领导控制器所在备份组内担任主控制器的控制器划分为第三类控制器;将处于开启状态且为非主领导控制器并且在主领导控制器所在的备份组内的控制器划分为第四类控制器;将处于开启状态的主领导控制器划分为第五类控制器。
步骤105,所述主领导控制器根据对所述控制器的分类结果,按照先升级备控制器、再升级主控制器、最后升级主领导控制器的顺序,控制所述控制器进行逐类别批量升级。
针对上述第一种分类情况,本步骤105可包括:
A)主领导控制器对所述第一类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到同一备份组内的主控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;本过程中,当监控到流表(如Openflow流表)的计数增加时,可确认业务流量恢复正常。进行升级时,可首先保留许可,然后进行旧版本的卸载和新版本的加载,之后加载保留的许可。
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;本过程中,当配置同步完成后,主领导控制器会收到所述控制器发送的一个配置同步完成的消息,此时主领导控制器便可确认所述控制器的升级完成。
当第一类控制器中的各控制器的配置同步完成消息都收到后,便可确认第一类控制器中的各控制器的升级完成。之后可再对业务流量进行监控,当完成升级的第一类控制器中的各控制器开始接收新的业务流量且可以正常完成的时候,便可确认其对业务流量的控制恢复正常。例如,监控方法可以是看完成升级的控制器对新上送的packet-in报文是否都做了处理并且下发成功流表。如果是,则认为其对业务流量的控制恢复正常。下同。
B)主领导控制器在确认所述第一类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,对所述第二类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到同一备份组内的一个备控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
C)主领导控制器在确认所述第二类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,在所述第三类控制器不为空且第三类控制器中的控制器未被升级时,对所述第三类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到主领导控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
D)主领导控制器在确认所述第三类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,对所述第四类控制器,即主领导控制器自身执行如下操作:
将所述控制器,即主领导控制器自身上的业务迁移到其它控制器中最高优先级的控制器上,并将所述最高优先级的控制器作为新的主领导控制器,此时原主领导控制器需要在新的主领导控制器的控制下进行升级;其中,其它控制器中最高优先级的控制器可以为备领导控制器;
之后由新的主领导控制器对被控制的网络设备的业务流量进行监控,并在所述新的主领导控制器确定所述业务流量恢复正常后,所述控制器,即原主领导控制器在新的主领导控制器的控制下利用所述新版本文件进行升级;
由新的主领导控制器监控所述控制器(原主领导控制器)与新的主领导控制器的配置同步情况,在所述控制器(原主领导控制器)完成与新的主领导控制器的配置同步后,所述控制器(原主领导控制器)升级完成。
针对上述第二种分类情况,本步骤105可包括:
a)主领导控制器对所述第一类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到同一备份组内的主控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
b)主领导控制器在确认所述第一类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,对所述第二类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到同一备份组内的一个备控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
c)主领导控制器在确认所述第二类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,对所述第三类控制器,即主领导控制器自身执行如下操作:
将所述控制器,即主领导控制器自身上的业务迁移到其它控制器中最高优先级的控制器上,并将所述最高优先级的控制器作为新的主领导控制器,此时原主领导控制器需要在新的主领导控制器的控制下进行升级;
之后由新的主领导控制器对被控制的网络设备的业务流量进行监控,并在所述新的主领导控制器确定所述业务流量恢复正常后,所述控制器,即原主领导控制器在新的主领导控制器的控制下利用所述新版本文件进行升级;
由新的主领导控制器监控所述控制器(原主领导控制器)与新的主领导控制器的配置同步情况,在所述控制器(原主领导控制器)完成与新的主领导控制器的配置同步后,所述控制器(原主领导控制器)升级完成。
针对上述第三种分类情况,本步骤105不对处于宕机(Down)状态的控制器进行升级,而只对其它类别的控制器进行升级,具体升级过程同前述。
图3为本发明实施例中不中断业务软件升级***的示例性结构图。如图3所示,该***包括:位于控制器集群中的复数个控制器,所述复数个控制器包括一个主领导控制器和至少一个成员控制器;所述复数个控制器配置在至少一个备份组中,并在所述备份组中担任主控制器或备控制器。其中,
所述主领导控制器用于接收新版本文件,将所述新版本文件发送给所述控制器集群中的所有成员控制器;确认所述控制器集群中每个控制器的状态,并根据所确认的控制器状态对所述控制器集群中的所有控制器进行分类;所述控制器的状态包括所述控制器在控制器集群中担任的角色,所述角色为备控制器、主控制器和主领导控制器中的至少一种;根据对所述控制器的分类结果,按照先升级备控制器、再升级主控制器、最后升级主领导控制器的顺序,控制所述控制器进行逐类别批量升级。
每个成员控制器用于在所述主领导控制器的控制下,完成自身的升级。
具体实现时,所述主领导控制器可利用主领导控制器与所有成员控制器之间的HTTP数据通道,将所述新版本文件发送给所述控制器集群中的所有成员控制器。进一步地,可等版本传送好了之后,断开主领导控制器上面的和成员控制器的HTTPS连接。
此外,与图1所示方法相对应,本实施例中的主领导控制器可将处于开启状态且为非主领导控制器并且在备份组内担任备控制器的控制器划分为第一类控制器;将处于开启状态且为非主领导控制器并且在备份组内担任主控制器的控制器划分为第二类控制器;将处于开启状态且为非主领导控制器并且在主领导控制器所在的备份组内的控制器划分为第三类控制器;将处于开启状态的主领导控制器划分为第四类控制器;或者,将处于开启状态且为非主领导控制器并且在备份组内担任备控制器的控制器划分为第一类控制器;将处于开启状态且为非主领导控制器并且在备份组内担任主控制器的控制器划分为第二类控制器;将处于开启状态的主领导控制器划分为第三类控制器;又或者,在前述分类基础上,将处于宕机状态的控制器也划分为一类控制器。
与图1所示方法相对应,针对第一种分类情况,所述主领导控制器可执行如下操作:
对所述第一类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到同一备份组内的主控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
在确认所述第一类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,对所述第二类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到同一备份组内的一个备控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
在确认所述第二类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,在所述第三类控制器不为空且第三类控制器中的控制器未被升级时,对所述第三类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到主领导控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
在确认所述第三类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,对所述第四类控制器,即主领导控制器自身执行如下操作:
将所述控制器,即主领导控制器自身上的业务迁移到其它控制器中最高优先级的控制器上,并将所述最高优先级的控制器作为新的主领导控制器,此时原主领导控制器需要在新的主领导控制器的控制下进行升级;
之后由新的主领导控制器对被控制的网络设备的业务流量进行监控,并在所述新的主领导控制器确定所述业务流量恢复正常后,所述控制器,即原主领导控制器在新的主领导控制器的控制下利用所述新版本文件进行升级;
由新的主领导控制器监控所述控制器(原主领导控制器)与新的主领导控制器的配置同步情况,在所述控制器(原主领导控制器)完成与新的主领导控制器的配置同步后,所述控制器(原主领导控制器)升级完成。
针对第二种分类情况,所述主领导控制器可执行如下操作:
对所述第一类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到同一备份组内的主控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
在确认所述第一类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,对所述第二类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到同一备份组内的一个备控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
在确认所述第二类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,对所述第三类控制器,即主领导控制器自身执行如下操作:
将所述控制器,即主领导控制器自身上的业务迁移到其它控制器中最高优先级的控制器上,并将所述最高优先级的控制器作为新的主领导控制器,此时原主领导控制器需要在新的主领导控制器的控制下进行升级;
之后由新的主领导控制器对被控制的网络设备的业务流量进行监控,并在所述新的主领导控制器确定所述业务流量恢复正常后,所述控制器,即原主领导控制器在新的主领导控制器的控制下利用所述新版本文件进行升级;
由新的主领导控制器监控所述控制器(原主领导控制器)与新的主领导控制器的配置同步情况,在所述控制器(原主领导控制器)完成与新的主领导控制器的配置同步后,所述控制器(原主领导控制器)升级完成。
针对第三种分类情况,主领导控制器可不对处于宕机状态的控制器进行升级,而只对其它类别的控制器进行升级,具体升级过程同前述。
图4为本发明实施例中不中断业务软件升级装置的示例性结构图,如图4所示,该装置可包括:接收模块401、发送模块402、状态确认模块403、分类模块404、控制模块405、业务迁移模块406和升级模块407。
其中,接收模块401用于接收新版本文件。
发送模块402用于将所述接收模块接收的新版本文件发送给所述控制器集群中的所有成员控制器。
状态确认模块403用于确认所述控制器集群中每个控制器的状态;所述控制器的状态包括所述控制器在控制器集群中担任的角色,所述角色为备控制器、主控制器和主领导控制器中的至少一种。
分类模块404用于根据状态确认模块所确认的控制器状态对所述控制器集群中的所有控制器进行分类。
控制模块405用于根据所述分类模块对所述控制器的分类结果,按照先升级备控制器、再升级主控制器的顺序,控制所有成员控制器进行逐类别批量升级;
业务迁移模块406用于在完成所有成员控制器的升级后,将自身的业务迁移到其它控制器中最高优先级的控制器上,所述最高优先级的控制器为新的主领导控制器;
升级模块407用于在所述主领导控制器的控制下,利用所述新版本文件进行升级。
具体实现时,所述分类模块404可用于将处于开启状态且为非主领导控制器所在备份组内担任备控制器的控制器划分为第一类控制器;将处于开启状态且为非主领导控制器所在备份组内担任主控制器的控制器划分为第二类控制器;将处于开启状态且在主领导控制器所在的备份组内的非主领导控制器划分为第三类控制器;将处于开启状态的主领导控制器划分为第四类控制器;或者,将处于开启状态且为非主领导控制器并且在备份组内担任备控制器的控制器划分为第一类控制器;将处于开启状态且为非主领导控制器并且在备份组内担任主控制器的控制器划分为第二类控制器;将处于开启状态的主领导控制器划分为第三类控制器;又或者,在前述分类基础上,将处于宕机状态的控制器也划分为一类控制器。
相应地,针对第一种分类情况,所述控制模块405可执行如下操作:
对所述第一类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到同一备份组内的主控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
在确认所述第一类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,对所述第二类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到同一备份组内的一个备控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
在确认所述第二类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,在所述第三类控制器不为空且第三类控制器中的控制器未被升级时,对所述第三类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到主领导控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
在确认所述第三类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,通知所述业务迁移模块406进行业务迁移。
针对第二种分类情况,所述控制模块405可执行如下操作:
对所述第一类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到同一备份组内的主控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
在确认所述第一类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,对所述第二类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到同一备份组内的一个备控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
在确认所述第二类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,通知所述业务迁移模块406进行业务迁移。
针对第三种分类情况,控制模块405可不对处于宕机状态的控制器进行升级,而只对其它类别的控制器进行升级,具体升级过程同前述。
图5为本发明实施例中又一种不中断业务软件升级装置的示例性结构图。如图5所示,该装置包括:接收模块501、业务迁移模块502和升级模块503。
文件接收模块501用于接收主领导控制器发送的新版本文件;
业务迁移模块502用于在主领导控制器的控制下,将业务迁移到同一备份组内的控制器上;
升级模块503用于在主领导控制器的控制下,利用所述新版本文件进行升级。
进一步地,该装置还可包括一业务接收模块504,用于接收来自其它控制器上的业务。
此外,当该装置被选为新的主领导控制器时,该装置还可进一步包括一控制模块505,用于对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,控制迁出业务的控制器利用所述新版本文件进行升级;并监控所述迁出业务的控制器与主领导控制器的配置同步情况,在所述迁出业务的控制器完成与主领导控制器的配置同步后,确认所述迁出业务的控制器升级完成。
图6为本发明实施例中不中断业务软件升级装置的又一示例性结构图。如图6所示,该装置包括处理器601和存储器602。其中,存储器602存储有可被处理器601执行的用于实现不中断业务软件升级的计算机可执行指令。这些计算机可执行指令也可理解为对应图4或图5中的各功能模块的计算机可执行指令,当所述指令被执行时完成的操作主要为本实施例方案中主领导控制器或某一成员控制器所完成的功能。
本实施例中的不中断业务软件升级装置可布置在主领导控制器中。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种不中断业务软件升级方法,其特征在于,该方法包括:
控制器集群中的主领导控制器接收新版本文件,将所述新版本文件发送给所述控制器集群中的所有成员控制器;
所述主领导控制器确认所述控制器集群中每个控制器的状态,并根据所确认的控制器状态对所述控制器集群中的所有控制器进行分类;所述控制器的状态包括所述控制器在控制器集群中担任的角色,所述角色为备控制器、主控制器和主领导控制器中的至少一种;
所述主领导控制器根据对所述控制器的分类结果,按照先升级备控制器、再升级主控制器、最后升级主领导控制器的顺序,控制所述控制器进行逐类别升级。
2.根据权利要求1所述的方法,其特征在于,所述对所述控制器集群中的所有控制器进行分类包括:
将处于开启状态且为非主领导控制器所在备份组内担任备控制器的控制器划分为第一类控制器;将处于开启状态且为非主领导控制器所在备份组内担任主控制器的控制器划分为第二类控制器;将处于开启状态且在主领导控制器所在的备份组内的非主领导控制器划分为第三类控制器;将处于开启状态的主领导控制器划分为第四类控制器。
3.根据权利要求2所述的方法,其特征在于,所述控制所述控制器进行逐类别升级包括:
对所述第一类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到同一备份组内的主控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
在确认所述第一类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,对所述第二类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到同一备份组内的一个备控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
在确认所述第二类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,在所述第三类控制器不为空且第三类控制器中的控制器未被升级时,对所述第三类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到主领导控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
在确认所述第三类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,对所述第四类控制器执行如下操作:
将所述控制器上的业务迁移到其它控制器中最高优先级的控制器上,并将所述最高优先级的控制器作为新的主领导控制器;
在所述新的主领导控制器对被控制的网络设备的业务流量进行监控并确定所述业务流量恢复正常后,在所述新的主领导控制器的控制下利用所述新版本文件进行升级;
在所述控制器完成与新的主领导控制器的配置同步后,所述控制器升级完成。
4.根据权利要求1所述的方法,其特征在于,所述对所述控制器集群中的所有控制器进行分类包括:
将处于开启状态且为非主领导控制器并且在备份组内担任备控制器的控制器划分为第一类控制器;将处于开启状态且为非主领导控制器并且在备份组内担任主控制器的控制器划分为第二类控制器;将处于开启状态的主领导控制器划分为第三类控制器。
5.根据权利要求4所述的方法,其特征在于,所述控制所述控制器进行逐类别升级包括:
对所述第一类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到同一备份组内的主控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
在确认所述第一类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,对所述第二类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到同一备份组内的一个备控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
在确认所述第二类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,对所述第三类控制器执行如下操作:
将所述控制器上的业务迁移到其它控制器中最高优先级的控制器上,并将所述最高优先级的控制器作为新的主领导控制器;
在所述新的主领导控制器对被控制的网络设备的业务流量进行监控并确认所述业务流量恢复正常后,在所述新的主领导控制器的控制下利用所述新版本文件进行升级;
在所述控制器完成与新的主领导控制器的配置同步后,所述控制器升级完成。
6.一种不中断业务软件升级装置,应用于控制器集群中的主领导控制器,其特征在于,该装置包括:
接收模块,用于接收新版本文件;
发送模块,用于将所述接收模块接收的新版本文件发送给所述控制器集群中的所有成员控制器;
状态确认模块,用于确认所述控制器集群中每个控制器的状态;所述控制器的状态包括所述控制器在控制器集群中担任的角色,所述角色为备控制器、主控制器和主领导控制器中的至少一种;
分类模块,用于根据状态确认模块所确认的控制器状态对所述控制器集群中的所有控制器进行分类;
控制模块,用于根据所述分类模块对所述控制器的分类结果,按照先升级备控制器、再升级主控制器的顺序,控制所有成员控制器进行逐类别升级;
业务迁移模块,用于在完成所有成员控制器的升级后,将自身的业务迁移到其它控制器中最高优先级的控制器上,所述最高优先级的控制器为新的主领导控制器;和
升级模块,用于在所述新的主领导控制器的控制下,利用所述新版本文件进行升级。
7.根据权利要求6所述的装置,其特征在于,所述分类模块具体用于将处于开启状态且为非主领导控制器所在备份组内担任备控制器的控制器划分为第一类控制器;将处于开启状态且为非主领导控制器所在备份组内担任主控制器的控制器划分为第二类控制器;将处于开启状态且在主领导控制器所在的备份组内的非主领导控制器划分为第三类控制器;将处于开启状态的主领导控制器划分为第四类控制器。
8.根据权利要求7所述的装置,其特征在于,所述控制模块具体用于,对所述第一类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到同一备份组内的主控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
在确认所述第一类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,对所述第二类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到同一备份组内的一个备控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
在确认所述第二类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,在所述第三类控制器不为空且第三类控制器中的控制器未被升级时,对所述第三类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到主领导控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
在确认所述第三类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,通知所述业务迁移模块进行业务迁移。
9.根据权利要求6所述的装置,其特征在于,所述分类模块具体用于将处于开启状态且为非主领导控制器并且在备份组内担任备控制器的控制器划分为第一类控制器;将处于开启状态且为非主领导控制器并且在备份组内担任主控制器的控制器划分为第二类控制器;将处于开启状态的主领导控制器划分为第三类控制器。
10.根据权利要求9所述的装置,其特征在于,所述控制模块具体用于,对所述第一类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到同一备份组内的主控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
在确认所述第一类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,对所述第二类控制器中的每个控制器执行如下操作:
控制所述控制器上的业务迁移到同一备份组内的一个备控制器上;
对被控制的网络设备的业务流量进行监控,当所述业务流量恢复正常后,利用所述新版本文件对所述控制器进行升级;
监控所述控制器与主领导控制器的配置同步情况,在所述控制器完成与主领导控制器的配置同步后,确认所述控制器升级完成;
在确认所述第二类控制器中的各控制器的升级完成且对业务流量的控制恢复正常后,通知所述业务迁移模块进行业务迁移。
CN201410751501.3A 2014-12-10 2014-12-10 不中断业务软件升级方法及装置 Active CN104486394B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410751501.3A CN104486394B (zh) 2014-12-10 2014-12-10 不中断业务软件升级方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410751501.3A CN104486394B (zh) 2014-12-10 2014-12-10 不中断业务软件升级方法及装置

Publications (2)

Publication Number Publication Date
CN104486394A true CN104486394A (zh) 2015-04-01
CN104486394B CN104486394B (zh) 2018-01-12

Family

ID=52760898

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410751501.3A Active CN104486394B (zh) 2014-12-10 2014-12-10 不中断业务软件升级方法及装置

Country Status (1)

Country Link
CN (1) CN104486394B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106230622A (zh) * 2016-07-22 2016-12-14 杭州华三通信技术有限公司 一种集群实现方法及装置
CN106803790A (zh) * 2016-12-06 2017-06-06 浙江大华技术股份有限公司 一种集群***的升级控制方法及装置
CN106953746A (zh) * 2017-02-28 2017-07-14 努比亚技术有限公司 集群节点升级***及方法
CN107491335A (zh) * 2017-08-31 2017-12-19 郑州云海信息技术有限公司 一种集群控制器的升级方法及升级***
CN108984195A (zh) * 2018-06-27 2018-12-11 新华三技术有限公司 一种软件升级方法及装置
CN109379758A (zh) * 2018-12-18 2019-02-22 锐捷网络股份有限公司 一种在软件升级时业务不中断的方法和装置
CN109417489A (zh) * 2016-07-01 2019-03-01 瑞典爱立信有限公司 移动网络中对于用户面的业务拆分器
CN114389949A (zh) * 2022-01-20 2022-04-22 网宿科技股份有限公司 路由升级方法、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060041881A1 (en) * 2004-08-19 2006-02-23 Adkasthala Bheema P Universal upgrade architecture
CN1852156A (zh) * 2005-11-03 2006-10-25 华为技术有限公司 不中断业务对处理***的程序版本进行升级的方法
CN101968744A (zh) * 2010-11-01 2011-02-09 杭州华三通信技术有限公司 一种基于irf***的盒式设备升级方法和***
CN102937925A (zh) * 2012-11-01 2013-02-20 中兴通讯股份有限公司 一种分布式通信设备软件升级方法及***
US20140050077A1 (en) * 2012-08-20 2014-02-20 Cisco Technology, Inc. Hitless pruning protocol upgrade on single supervisor network devices

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060041881A1 (en) * 2004-08-19 2006-02-23 Adkasthala Bheema P Universal upgrade architecture
CN1852156A (zh) * 2005-11-03 2006-10-25 华为技术有限公司 不中断业务对处理***的程序版本进行升级的方法
CN101968744A (zh) * 2010-11-01 2011-02-09 杭州华三通信技术有限公司 一种基于irf***的盒式设备升级方法和***
US20140050077A1 (en) * 2012-08-20 2014-02-20 Cisco Technology, Inc. Hitless pruning protocol upgrade on single supervisor network devices
CN102937925A (zh) * 2012-11-01 2013-02-20 中兴通讯股份有限公司 一种分布式通信设备软件升级方法及***

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109417489A (zh) * 2016-07-01 2019-03-01 瑞典爱立信有限公司 移动网络中对于用户面的业务拆分器
CN106230622A (zh) * 2016-07-22 2016-12-14 杭州华三通信技术有限公司 一种集群实现方法及装置
CN106230622B (zh) * 2016-07-22 2020-02-11 新华三技术有限公司 一种集群实现方法及装置
CN106803790A (zh) * 2016-12-06 2017-06-06 浙江大华技术股份有限公司 一种集群***的升级控制方法及装置
CN106803790B (zh) * 2016-12-06 2019-09-17 浙江大华技术股份有限公司 一种集群***的升级控制方法及装置
CN106953746A (zh) * 2017-02-28 2017-07-14 努比亚技术有限公司 集群节点升级***及方法
CN107491335A (zh) * 2017-08-31 2017-12-19 郑州云海信息技术有限公司 一种集群控制器的升级方法及升级***
CN108984195A (zh) * 2018-06-27 2018-12-11 新华三技术有限公司 一种软件升级方法及装置
CN108984195B (zh) * 2018-06-27 2022-05-31 新华三技术有限公司 一种软件升级方法及装置
CN109379758A (zh) * 2018-12-18 2019-02-22 锐捷网络股份有限公司 一种在软件升级时业务不中断的方法和装置
CN114389949A (zh) * 2022-01-20 2022-04-22 网宿科技股份有限公司 路由升级方法、电子设备及存储介质
CN114389949B (zh) * 2022-01-20 2024-04-12 网宿科技股份有限公司 路由升级方法、电子设备及存储介质

Also Published As

Publication number Publication date
CN104486394B (zh) 2018-01-12

Similar Documents

Publication Publication Date Title
CN104486394A (zh) 不中断业务软件升级方法及装置
CN101888304A (zh) 一种路由设备的升级方法、装置和***
CN1536819B (zh) 下一代网络中双归属的实现方法
US9088477B2 (en) Distributed fabric management protocol
CN101968744B (zh) 一种基于irf***的盒式设备升级方法和***
CN103856357B (zh) 一种堆叠***故障处理方法及堆叠***
CN102546839B (zh) 面向大规模网络的高效、可靠的软件分发方法
CN103685530A (zh) Wlan现网ap自动升级控制方法及***
CN109218086B (zh) 一种交换网构建方法与***
CN111654384A (zh) 一种主备切换方法、bras设备及存储介质
CN103347048A (zh) 一种城市轨道交通信号***的自动升级方法
CN102104521B (zh) 以太环网链路故障恢复方法、以太环网及节点设备
US20180120828A1 (en) Integrated monitoring control device and integrated monitoring control system
CN108076155B (zh) 跨机房业务调度的方法、装置、***及服务器
CN101777996A (zh) 一种实现业务主备切换的装置及方法
CN104125079A (zh) 一种确定双机热备份配置信息的方法及装置
CN108667640B (zh) 通信方法及设备、网络接入***
CN107529180B (zh) 一种基站云测试环境构建装置和方法
CN103109269A (zh) 低或中压配电网络
CN105207824A (zh) 一种基于sdn的自动保护倒换的***及其方法
CN107395436A (zh) 一种管理主从网络设备的设备配置***及方法
CN103914339A (zh) 服务器管理***及服务器管理方法
CN107370612B (zh) 一种网络质量管理***检测任务调度方法、装置
CN105207811A (zh) 一种替换非AllJoyn设备的方法及装置
CN113497740A (zh) 网络转发设备、链路故障检测方法、装置及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 310052 Binjiang District Changhe Road, Zhejiang, China, No. 466, No.

Applicant after: Xinhua three Technology Co., Ltd.

Address before: 310052 Binjiang District Changhe Road, Zhejiang, China, No. 466, No.

Applicant before: Huasan Communication Technology Co., Ltd.

GR01 Patent grant
GR01 Patent grant