CN111078248A - 一种云平台的升级方法、装置及存储介质 - Google Patents

一种云平台的升级方法、装置及存储介质 Download PDF

Info

Publication number
CN111078248A
CN111078248A CN201911046657.0A CN201911046657A CN111078248A CN 111078248 A CN111078248 A CN 111078248A CN 201911046657 A CN201911046657 A CN 201911046657A CN 111078248 A CN111078248 A CN 111078248A
Authority
CN
China
Prior art keywords
node
hot standby
source node
virtual machine
upgrading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201911046657.0A
Other languages
English (en)
Inventor
喻明飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fiberhome Telecommunication Technologies Co Ltd
Original Assignee
Fiberhome Telecommunication Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fiberhome Telecommunication Technologies Co Ltd filed Critical Fiberhome Telecommunication Technologies Co Ltd
Priority to CN201911046657.0A priority Critical patent/CN111078248A/zh
Publication of CN111078248A publication Critical patent/CN111078248A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/65Updates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明涉及一种云平台的升级方法、装置及存储介质。该方法包括步骤:为待升级的源节点添加热备节点,将所述源节点上运行的虚拟机业务同步到所述热备节点;对所述源节点执行升级操作,在升级后的所述源节点上重新运行所述虚拟机业务。本发明可以使得云平台升级过程中虚拟机可靠性高、数据丢失的风险低。

Description

一种云平台的升级方法、装置及存储介质
技术领域
本发明涉及云计算技术领域,尤其涉及一种云平台的升级方法、装置及存储介质。
背景技术
基础设施服务(IaaS)是把基础设备这些设施作为一种底层资源来为上层提供服务。当前IaaS技术已趋于成熟,在基于云计算产品的数据中心中,需要更多地依赖自动化运维***来完成升级改造功能。对于已经运行的计算服务,升级前会将该节点的计算服务迁移到另一节点上。当前迁移的方式主要有冷迁移和热迁移两种技术。
冷迁移,是把虚拟机彻底关掉,然后只需要把存储资源转移到另外一台计算节点上,冷迁移方式会导致虚拟机业务被中断。
热迁移,是通过拷贝虚拟机正在运行的内存的方式把正在运行的虚拟机拷贝到另外一台节点上,从而保证机器在迁移过程中仍然是持续运行的状态,不会导致虚拟机上的服务发生中断。但是也存在问题:1)数据可能会丢失,热迁移时虚拟机业务不能完全保证稳定性,因为在数据迁移过程中,并没有一个很准确的方法能够判断虚拟机是否能成功,均是通过打包虚拟机镜像以及虚拟机运行内存,拷贝到另外一台机器上以后尝试运行起来,失败了才回退,中途不可避免会存在一定数据丢失,特别在虚拟机业务运行压力较大的情况。2)业务仍然可能会被中断,迁移失败后的恢复不能完全保证,当前的热迁移,是在保证待升级的源节点持续运行的基础上,同时拷贝源节点虚拟机***运行的内存到目标机器上,确定满足迁移条件以后,在关闭源节点的虚拟机同时在迁移目标节点上启动起来,从而保证机器在迁移过程中仍然是持续运行的状态,不会导致虚拟机上的服务发生中断。但是由于始终需要先关闭源节点上虚拟机然后在目标机器上启动起来,因而属于一次尝试性迁移,如果发生失败了再进行回退操作,尝试将计划迁走的虚拟机再次在源节点运行起来,由于虚拟机存在一定的负载,或者由于网络波动影响,虚拟机的迁移和源节点的重启都可能失败,那么虚拟机业务就会完全中断,那么就不得不切换成为冷迁移了。在对***运行可靠性要求高的应用场景中,这种问题是不可接受的。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提出了一种云平台的升级方法、装置及存储介质,能够解决现有升级中数据可能丢失、业务可能会被中断的问题。
根据本发明的第一方面,本发明提供了一种云平台的升级方法,包括步骤:
为待升级的源节点添加热备节点,将所述源节点上运行的虚拟机业务同步到所述热备节点;
对所述源节点执行升级操作,在升级后的所述源节点上重新运行所述虚拟机业务。
优选地,所述将所述源节点上运行的虚拟机业务同步到所述热备节点,具体是:
将所述源节点上正在运行的虚拟机业务的内存拷贝到所述热备节点;
在所述热备节点上运行所述虚拟机业务。
优选地,所述为待升级的源节点添加热备节点具体是:
记录所述源节点的主机信息和所述热备节点的主机信息并建立关联表。
优选地,所述为待升级的源节点关联热备节点前,还包括:
为处于空闲状态的计算节点安装使所述计算节点成为热备节点。
优选地,若将所述源节点上运行的虚拟机业务同步到所述热备节点失败,则为所述源节点取消关联所述热备节点,并返回失败原因。
优选地,所述升级操作执行成功后,为所述源节点取消关联所述热备节点。
根据本发明的第二方面,本发明提供了一种云平台的升级方法,其特征在于,包括步骤:
判断待升级的源节点上是否正在运行虚拟机业务;
若是,则执行本发明的第一方面中所述的升级方法;
若否,则将所述源节点的存储资源拷贝到另一计算节点上后,对所述源节点执行升级操作。
根据本发明的第三方面,本发明提供了一种云平台的升级装置,包括:
热备管理模块,用来为待升级的源节点添加热备节点,将所述源节点上运行的虚拟机业务同步到所述热备节点;
升级切换管理模块,用来对所述源节点执行升级操作,在升级后的所述源节点上重新运行所述虚拟机业务。
根据本发明的第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现任一项上述的升级方法。
综上所述,总体而言,通过本发明所构思的以上技术方案与现有技术相比,虚拟机可靠性高,在升级过程中不会因为意外情况导致业务中断,并且会降低数据丢失的风险。
附图说明
图1是现有技术中的采用迁移技术的云平台升级方法流程示意图;
图2是现有技术中的热迁移工作原理示意图;
图3是本发明实施例的一种云平台的升级装置的工作示意图;
图4是本发明实施例的源节点的状态机示意图;
图5是本发明实施例的热备同步过程的信息交互示意图。
图6是本发明实施例的热备同步的工作原理示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
云平台中的计算节点是基于操作***运行的,虚拟化业务是运行在操作***上的软件。但是虚拟机软件不同于一般应用软件直接安装就可以运行,它与操作***内核强相关,因此依赖大量的基础软件包。在对计算节点进行升级时,需要把这些基础包一并升级,甚至在较大版本升级时还需要重新安装操作***。因此,如何在重新安装计算节点时能保证当前该计算节点上运行的虚拟机的业务持续运行,是非常重要的。现有技术中云平台完整升级流程如图1所示,主要使用技术为虚拟机迁移技术,通过冷热两种方式均可以迁移到目标主机上。热迁移的工作原理如图2所示。
本发明提出了一种云平台的升级方法,为待升级的源节点添加热备节点,将该源节点上运行的虚拟机业务同步到该添加的热备节点上运行,然后对源节点执行升级操作,在升级后的源节点上重新运行所述虚拟机业务。和现有技术的热迁移技术区别在于:热迁移技术是在将源节点的运行内存迁移到目标主机后,在关闭源节点虚拟机的同时在目标机器上启动虚拟机,然后对源节点进行升级,可能由于启动失败导致数据丢失。本发明是将源节点的虚拟机业务同步到热备节点即在热备节点上启动虚拟机业务后,再进行升级,升级成功后再将热备节点上运行的虚拟机业务切换到源节点上,源节点的正在运行的虚拟机业务由于有热备保证,可提供正常服务,不会出现任何中断的情况,也不会存在数据丢失的问题。
本发明实施例的一种云平台的升级装置的工作原理如图3所示。升级装置被安装在控制节点上,包括升级管理模块和热备切换管理模块。热备管理模块,用来为待升级的源节点添加热备节点,将该源节点上运行的虚拟机业务同步到该关联的热备节点;升级切换管理模块,用来在同步完成后,关闭该源节点并对所述源节点执行升级操作,升级成功后,在升级后的源节点上重新运行所述虚拟机业务。
升级管理模块:该模块还可以用于管理当前补丁和计算节点的热备情况,在控制节点上,存在节点升级状态的管理模块,用于记录每台机器的升级情况。
源节点的完整流程状态机可以如图4所示,包括正常运行、待升级、已准备、升级中。
正常运行:初始安装完成或者升级完成后均处于该状态,或者处于升级中的计算节点升级完成以后,无问题产生,该状态为默认状态。如果运维人员提交了升级任务,则进入待升级状态。
待升级:平台上传升级补丁或需求以后,检查计算节点以后判断为需要升级,但是还未开始执行升级的状态中。待升级下一状态只能是已准备。
已准备:如果计算节点当前存在运行的业务虚拟机,需要添加热备节点,并等待虚拟机热备同步完成。热备节点可以是新安装的或者已经使用过的,只需要建立以下与待升级节点关联即可。当准备失败当或取消准备,则下一状态是取消准备返回到待升级状态。当准备成功则进入升级中状态。
升级中:待升级计算节点无业务正在运行,或者业务已经通过虚拟机热备同步由热备节点接管以后,开始重装或者打补丁的升级中状态。如果升级成功,则进入正常运行状态;否则取消当前关联的热备关系,上报错误原因,再次回到已准备状态。
热备切换管理模块使得计算节点和热备节点互换角色来承担虚拟机业务运行的工作,主要包括两种动作:
(1)为源节点添加热备节点并接管虚拟机业务运行,主要是在升级管理模块中注册主机信息,建立源节点与热备节点的关联。
(2)待升级节点升级完成后,需要同步运行在热备节点上的虚拟机返回升级成功的计算节点的过程。通过虚拟机热备技术让源节点上再次运行业务虚拟机,然后通过升级管理模块注册确定以升级成功的计算节点为业务运行的主节点,这样就完成了整个升级过程。
本发明实施例的一种云平台的升级方法,包括步骤:
S1,运维管理人员首先需要确认升级管理模块和计算节点热备切换管理模块均处于稳定运行状态,根据需要准备数台服务器作热备使用,可以预先通过升级管理模块把这些空闲服务器安装起来作为空闲的热备节点,主要通过平台已经具备的扩容功能完成操作***的安装并且做好相应设置,使之具备作为计算节点的条件。
S2,判断待升级的计算节点,即源节点上是否正在运行虚拟机业务;
S3,若待升级的计算节点上没有运行虚拟机业务,则采用冷迁移技术,将待升级的计算节点的存储资源拷贝到另一计算节点上后,对待升级的计算节点执行升级操作。若待升级的计算节点上运行虚拟机业务,则执行步骤S4至S7。
S4,运维管理人员首先选择一台热备机器,在升级管理模块中与某台待升级的计算节点建立热备关联。待升级的计算节点即源节点。然后通过热备切换管理模块同步待升级节点和热备节点之间的虚拟机业务,随后即可对待升级节点实施升级工作。
S5,升级管理模块设置待升级的计算节点,做好配置准备后即可触发计算节点的升级,由于此时待升级节点上的虚拟机业务已经全部运行在热备节点上,该节点无论做何种升级操作,都不会有任何影响。
S6,升级管理模块等待升级完成确定没问题以后,通知热备切换管理模块把热备节点上运行的业务虚拟机再次切换回已经升级完成的计算节点。然后升级管理模块就可以取消热备节点与已升级计算节点的关联了。利用这个再次空闲的热备主机,就可以循环执行步骤S4至S6,实现利用一台热备节点完成所有节点的升级工作,当然,如果有多台热备节点,步骤S4至S6可以多台同步进行以提升效率。
S7,在计算节点升级完成并且重新接管原有的虚拟机后,热备节点上应该处于完全空闲状态,运维人员可以选择通过热备切换管理模块去掉热备节点,也可留着下次升级使用。
步骤S4的具体信息交互过程如图5所示。
热备切换同虚拟机热迁移不同的地方包括:
同步过程中,虚拟机在源节点和热备节点上是同时运行的,不会有任何尝试关闭源节点虚拟机的动作;而虚拟机热迁移是在目标节点满足迁移条件后,关闭源节点虚拟机再启动目标节点上的虚拟机。
同步完成后,虚拟机在源节点和热备节点上是完全一致的,均处于提供服务状态,任何操作都会完全同步到另外一台虚拟机上;而热迁移即将完成时,源节点的虚拟机就会被强制关闭,以保证同时只有一边的虚拟机处于提供服务的状态。
因此可以把虚拟机热备理解成虚拟机的Active-Active模式,而虚拟机热迁移理解成Active-Backup模式。热备同步基本原理如图6所示。
本发明主要通过保证高可靠的虚拟机运行,来控制虚拟机迁移过程,保证不会因为意外情况致使升级失败造成不可挽回的后果。有以下有益效果:
1)虚拟机可靠性高,在升级过程中不会因为意外情况导致业务中断,因为至始至终都有一个热备虚拟机在同步运行,一旦发现异常情况,则切换至正常节点上;
2)升级过程可控,每次业务操作都有准确的衡量标准,即业务是否存在风险,因此可以保证升级过程的高质量。
为了实现上述实施例,本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行以实现上述任一云平台的升级方法实施例的技术方案。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种云平台的升级方法,其特征在于,包括步骤:
为待升级的源节点添加热备节点,将所述源节点上运行的虚拟机业务同步到所述热备节点;
对所述源节点执行升级操作,在升级后的所述源节点上重新运行所述虚拟机业务。
2.如权利要求1所述的一种云平台的升级方法,其特征在于,所述将所述源节点上运行的虚拟机业务同步到所述热备节点,具体是:
将所述源节点上正在运行的虚拟机业务的内存拷贝到所述热备节点;
在所述热备节点上运行所述虚拟机业务。
3.如权利要求1或2所述的一种云平台的升级方法,其特征在于,所述为待升级的源节点添加热备节点具体是:
记录所述源节点的主机信息和所述热备节点的主机信息并建立关联表。
4.如权利要求1或2所述的一种云平台的升级方法,其特征在于,所述为待升级的源节点关联热备节点前,还包括:
为处于空闲状态的计算节点安装操作***使所述计算节点成为热备节点。
5.如权利要求1或2所述的一种云平台的升级方法,其特征在于,若将所述源节点上运行的虚拟机业务同步到所述热备节点失败,则为所述源节点取消关联所述热备节点,并返回失败原因。
6.如权利要求1或2所述的一种云平台的升级方法,其特征在于,所述升级操作执行成功后,为所述源节点取消关联所述热备节点。
7.一种云平台的升级方法,其特征在于,包括步骤:
判断待升级的源节点上是否正在运行虚拟机业务;
若是,则执行权利要求1至6任一项所述的升级方法;
若否,则将所述源节点的存储资源拷贝到另一计算节点上后,对所述源节点执行升级操作。
8.一种云平台的升级装置,其特征在于,包括:
热备管理模块,用来为待升级的源节点添加热备节点,将所述源节点上运行的虚拟机业务同步到所述热备节点;
升级切换管理模块,用来对所述源节点执行升级操作,在升级后的所述源节点上重新运行所述虚拟机业务。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。
CN201911046657.0A 2019-10-30 2019-10-30 一种云平台的升级方法、装置及存储介质 Withdrawn CN111078248A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911046657.0A CN111078248A (zh) 2019-10-30 2019-10-30 一种云平台的升级方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911046657.0A CN111078248A (zh) 2019-10-30 2019-10-30 一种云平台的升级方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN111078248A true CN111078248A (zh) 2020-04-28

Family

ID=70310532

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911046657.0A Withdrawn CN111078248A (zh) 2019-10-30 2019-10-30 一种云平台的升级方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN111078248A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105446790A (zh) * 2014-07-15 2016-03-30 华为技术有限公司 一种虚拟机迁移方法及装置
CN105589697A (zh) * 2016-03-17 2016-05-18 广州杰赛科技股份有限公司 一种云平台的升级方法及装置
CN106293781A (zh) * 2015-05-15 2017-01-04 阿里巴巴集团控股有限公司 在线升级机器虚拟器的方法与设备
CN106301876A (zh) * 2015-06-26 2017-01-04 中兴通讯股份有限公司 物理机升级方法、业务迁移方法及装置
CN106815068A (zh) * 2016-12-09 2017-06-09 中电科华云信息技术有限公司 基于Openstack实现Hyperv虚拟机热迁移的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105446790A (zh) * 2014-07-15 2016-03-30 华为技术有限公司 一种虚拟机迁移方法及装置
CN106293781A (zh) * 2015-05-15 2017-01-04 阿里巴巴集团控股有限公司 在线升级机器虚拟器的方法与设备
CN106301876A (zh) * 2015-06-26 2017-01-04 中兴通讯股份有限公司 物理机升级方法、业务迁移方法及装置
CN105589697A (zh) * 2016-03-17 2016-05-18 广州杰赛科技股份有限公司 一种云平台的升级方法及装置
CN106815068A (zh) * 2016-12-09 2017-06-09 中电科华云信息技术有限公司 基于Openstack实现Hyperv虚拟机热迁移的方法

Similar Documents

Publication Publication Date Title
US20190205220A1 (en) System and method for live migration of a virtual machine
US10140112B2 (en) Update management system and update management method
US9460028B1 (en) Non-disruptive and minimally disruptive data migration in active-active clusters
US8875134B1 (en) Active/active storage and virtual machine mobility over asynchronous distances
US20180018244A1 (en) Node system, server apparatus, scaling control method, and program
US7661025B2 (en) Method of ensuring consistent configuration between processors running different versions of software
Nguyen et al. Availability modeling and analysis of a data center for disaster tolerance
US9454417B1 (en) Increased distance of virtual machine mobility over asynchronous distances
US11106454B2 (en) Software update control device, software update control method, and recording medium having software update control program stored thereon
US8726083B1 (en) Synchronized taking of snapshot memory images of virtual machines and storage snapshots
US9069597B2 (en) Operation management device and method for job continuation using a virtual machine
CN104850416B (zh) 一种升级***、方法、装置及云计算节点
US7925761B2 (en) System and method for implementing a dead man dependency technique for cluster resources
US8682852B1 (en) Asymmetric asynchronous mirroring for high availability
WO2018137520A1 (zh) 一种业务恢复方法及装置
US10880153B2 (en) Method and system for providing service redundancy between a master server and a slave server
CN112434008A (zh) 分布式数据库升级方法、设备及介质
US20210089379A1 (en) Computer system
CN112380062A (zh) 一种基于***备份点多次快速恢复***的方法及***
CN105740049A (zh) 一种控制方法及装置
WO2017000586A1 (zh) 虚拟网元的升级方法、装置和计算机存储介质
WO2015196692A1 (zh) 一种云计算***以及云计算***的处理方法和装置
US8726067B1 (en) Utilizing both application and storage networks for distributed storage over asynchronous distances
CN111078248A (zh) 一种云平台的升级方法、装置及存储介质
CN115643168B (zh) 一种节点超融合升级方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20200428

WW01 Invention patent application withdrawn after publication