CN112367186B - 一种基于0penStack裸机的故障保护方法及装置 - Google Patents

一种基于0penStack裸机的故障保护方法及装置 Download PDF

Info

Publication number
CN112367186B
CN112367186B CN202011089740.9A CN202011089740A CN112367186B CN 112367186 B CN112367186 B CN 112367186B CN 202011089740 A CN202011089740 A CN 202011089740A CN 112367186 B CN112367186 B CN 112367186B
Authority
CN
China
Prior art keywords
bare
resource
deployment
computer
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011089740.9A
Other languages
English (en)
Other versions
CN112367186A (zh
Inventor
李凤娟
朱进强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202011089740.9A priority Critical patent/CN112367186B/zh
Publication of CN112367186A publication Critical patent/CN112367186A/zh
Application granted granted Critical
Publication of CN112367186B publication Critical patent/CN112367186B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0813Configuration setting characterised by the conditions triggering a change of settings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/142Reconfiguring to eliminate the error
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/50Address allocation
    • H04L61/5046Resolving address allocation conflicts; Testing of addresses
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/50Address allocation
    • H04L61/5061Pools of addresses

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种基于0penStack裸机的故障保护方法及装置,当裸机资源出现故障或存储资源不足时,获取到故障恢复指令后,则提取原裸机资源的配置信息,对目标环境进行匹配,生成一套复制关系;目标环境中存在裸机所需的镜像和网络信息,则执行裸机的恢复指令,否则先进行裸机所需镜像复制和网络资源的创建;根据复制关系进行裸机资源部署后,提取恢复后的裸机资源信息,与原有裸机资源信息进行比对,若比对不一致,则调用同步任务,进行数据同步,直到数据一致,裸机资源恢复成功。通过上述方式,本发明能够保证恢复裸机资源数据的准确性,避免了数据的丢失,减少耗费时间和人力成本,提高***稳定性。

Description

一种基于0penStack裸机的故障保护方法及装置
技术领域
本发明涉及云平台资源管理技术领域,特别是涉及一种基于0penStack裸机的故障保护方法及装置。
背景技术
随着信息时代的不断进步,云计算管理平台越来越炙手可热,对虚拟化资源的管理技术也越来越成熟,但是仅有虚拟化的资源是不够的,对于某些高性能计算,安全性、可靠性要求高的,及其他数据库主机等,用户需要直接使用物理服务器资源,所以对物理资源的纳管也越来越炙手可热。
所谓裸机,就是指没有配置操作***的计算机。OpenStack将其纳管到平台中,通过部署云物理机对其安装操作***,实现虚拟化和物理资源的无缝衔接,满足更多用户的需求。OpenStack是一个开源的云计算管理平台项目,是一系列软件开源项目的组合。
当OpenStack平台提供裸机服务过程中出现故障或者是***资源不足时,裸机资源无法继续为用户提供服务,此时就需要更换其他平台或裸机重新进行服务的部署。但切换后需要重新搭建资源,无法进行原有资源和数据的同等迁移,而裸机服务的部署调试也需要耗费大量的时间和人力成本,由此引发的数据丢失在现实生活中也可能会造成重大生产事故。
发明内容
本发明主要解决的技术问题是提供一种基于0penStack裸机的故障保护方法及装置,在OpenStack平台的裸机资源出现故障或者资源不足时,进行迁移保护裸机相关资源,能够保证恢复裸机资源数据的准确性,避免了数据的丢失,减少耗费时间和人力成本,提高***稳定性,可以避免因裸机资源故障时导致的重大生产事故。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种基于0penStack裸机的故障保护方法,包括以下步骤:
S1、生成复制关系,当裸机资源损坏不可恢复或者存储资源不足,无法继续提供服务时,向***发出告警信息;当***获取到告警信息并进行解析,获取关联目标环境信息并下发故障恢复请求,检测目标环境资源是否充足,提取原裸机资源配置信息,对目标环境进行匹配,形成与其相匹配的裸机资源之间的复制关系;
S2、裸机资源恢复环境配置,在目标环境上进行裸机所需镜像复制和网络资源的创建;
S3、裸机资源部署恢复,配置完裸机资源恢复环境后,在目标环境上根据复制关系进行裸机资源部署;
S4、验证裸机资源恢复结果,部署完成后,提取恢复后的裸机资源信息,与原有裸机资源信息进行比对,比对一致,裸机资源恢复成功。
进一步,所述步骤S1中原裸机资源配置信息通过挂载卷方式存储在共享存储***上;所述共享存储***上设有以ID为唯一关键字的复制文件夹,每个裸机资源配置信息存储到与其ID关联的卷复制文件夹下;所述裸机资源配置信息包括云物理机运行过程中的资源配额、网络存储数据。
进一步,所述步骤S2具体包括以下步骤:
S21、检测目标环境裸机部署时所用的部署镜像、***镜像和驱动信息是否存在,存在则进入S22;否则进行部署镜像、***镜像和驱动信息的复制,选择部署镜像、***镜像和驱动信息及其目标位置,复制好后备用;
S22、检测目标环境是否存在裸机部署网络,存在则进入S23;否则创建部署网络,并配置网络目的CIDR和下一跳地址;
S23、检测目标环境是否存在裸机租户网络,存在则进行裸机资源部署恢复;否则创建租户网络,用于云物理机创建使用。
进一步,所述步骤S3具体包括以下步骤:
S31、检测目标环境上是否已注册可用裸机,若注册直接进入S32;否则注册裸机到OpenStack,输入BMC IP地址、用户名、密码,选择步骤S2复制过来的部署镜像和驱动信息;
S32、将裸机转为可管理,部署服务时控制节点通过neutron的networking-generic-switch插件使用netmiko库ssh至交换机,下发交换机配置命令,将获取到的lldp信息配置到连接裸机部署网络的交换机端口上,lldp信息包括网卡地址、交换机mac地址、端口名称;
S33、将裸机转为可用,网络切换到部署网络,创建云物理机,创建完成后将交换机端口切换到租户网络,然后进入云物理机操作***重启网络服务,获取IP。
进一步,所述步骤S4具体包括以下步骤:恢复后的云物理机通过共享存储***复制关系获取原裸机资源信息,将恢复后的裸机资源信息与原裸机资源信息进行比对,比对一致后,裸机故障恢复成功,若比对不一致,则调用同步任务,进行数据同步,直到数据一致。
一种基于0penStack裸机的故障保护装置,包括:裸机资源信息存储模块、裸机资源恢复环境准备模块和裸机资源部署恢复模块;
所述裸机资源信息存储模块记录裸机部署及创建云物理机过程中使用的部署网络、Inspect网络、交换机配置、使用的部署镜像和***镜像;
当裸机资源出现故障后,所述裸机资源恢复环境准备模块将已有的裸机资源恢复到新的环境上,在新环境上进行裸机及云物理机部署的环境准备;
所述裸机资源部署恢复模块在新环境上进行裸机注册及云物理机的部署,部署完成后与原有资源进行比对,保证资源数据一致性。
本发明的有益效果是:本发明不需要重新搭建裸机相关资源,重新恢复裸机资源数据,根据原有的裸机资源进行一比一的故障迁移恢复,保证了数据的准确性,为用户的***服务支撑提供了高可用的技术支持,避免了数据的丢失、耗费时间和人力成本,更进一步的提高了***稳定性。
附图说明
图1是本发明一种基于0penStack裸机的故障保护方法一较佳实施例的流程图;
图2是本发明一种基于0penStack裸机的故障保护装置的结构图。
具体实施方式
下面结合附图对本发明的较佳实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
请参阅图1,本发明实施例包括:
一种基于0penStack裸机的故障保护方法,包括以下步骤:
S1,裸机环境配置好后,创建云物理机通过挂载卷方式将云物理机运行过程中的资源配额、网络存储等相关数据,存入到对应的共享存储***上以ID为唯一关键字的复制文件夹中,每个云物理机的运行数据都会存储到与其关联的卷复制文件夹下。当裸机资源损坏不可恢复或者存储资源不足,无法继续提供服务时,会向***发出告警信息。当获取到告警信息并进行解析问题,获取关联目标环境信息并下发故障恢复请求,检测目标环境资源是否充足;提取原裸机资源的配置信息,对目标环境进行匹配,形成与其相匹配的裸机资源之间的复制关系。
S2,获取原有裸机资源的配置信息后,会对目标环境的配置信息进行匹配检测:
若目标环境裸机部署时所用的部署镜像和***镜像存在,则进行下一项;否则进行部署镜像和***镜像的复制:选择镜像后,选择目标位置,将镜像复制好后备用;
若目标环境存在裸机部署网络,则进行租户网络检测;否则创建部署网络,并配置网络目的CIDR和下一跳地址;
若目标环境存在裸机租户网络,则进行下一项;否则创建租户网络,用于云物理机创建使用。
S3,首先检测新环境上是否已注册可用裸机,若注册直接进行下一步;否则注册裸机到OpenStack,输入正确的BMC IP地址、用户名、密码等,选择上述复制过来的部署镜像和驱动信息;
将裸机转为可管理,部署服务时控制节点通过neutron的networking-generic-switch插件使用netmiko库ssh至交换机,下发交换机配置命令,将获取到的lldp信息配置到连接裸机部署网络的交换机端口上,lldp信息包括网卡地址、交换机mac地址、端口名称;
将裸机转为可用,网络切换到部署网络,创建云物理机,创建完成后将交换机端口切换到租户网络,然后进入云物理机操作***重启网络服务,获取IP。
S4,复制文件夹中已经保存了原有云物理机的卷ID信息,所以新的云物理机可以通过共享存储***复制关系获取到原有的业务数据,通过一致性组与原有裸机资源信息进行比对,比对一致后,裸机故障恢复成功,若比对不一致,则调用同步任务,进行数据同步,直到数据一致;至此,裸机资源恢复成功。
基于与前述实施例中基于0penStack裸机的故障保护方法同样的发明构思,本说明书实施例还提供一种基于0penStack裸机的故障保护装置,见图2,包括:裸机资源信息存储模块、裸机资源恢复环境准备模块和裸机资源部署恢复模块;
所述裸机资源信息存储模块记录裸机部署及创建云物理机过程中使用的部署网络、Inspect网络、交换机配置、使用的部署镜像和***镜像;
当裸机资源出现故障后,所述裸机资源恢复环境准备模块将已有的裸机资源恢复到新的环境上,在新环境上进行裸机及云物理机部署的环境准备;
所述裸机资源部署恢复模块在新环境上进行裸机注册及云物理机的部署,部署完成后与原有资源进行比对,保证资源数据一致性。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (4)

1.一种基于0penStack裸机的故障保护方法,其特征在于,包括以下步骤:
S1、生成复制关系,当获取到故障恢复指令后,提取原裸机资源配置信息,对目标环境进行匹配,生成一套复制关系;
S2、裸机资源恢复环境配置,在目标环境上进行裸机所需镜像复制和网络资源的创建;
S3、裸机资源部署恢复,配置完裸机资源恢复环境后,在目标环境上根据复制关系进行裸机资源部署;
S4、验证裸机资源恢复结果,部署完成后,提取恢复后的裸机资源信息,与原有裸机资源信息进行比对,比对一致,裸机资源恢复成功;
所述步骤S1中原裸机资源配置信息通过挂载卷方式存储在共享存储***上;所述共享存储***上设有以ID为唯一关键字的复制文件夹,每个裸机资源配置信息存储到与其ID关联的卷复制文件夹下;所述裸机资源配置信息包括云物理机运行过程中的资源配额、网络存储数据;
所述步骤S1中,当裸机资源损坏不可恢复或者存储资源不足,无法继续提供服务时,向***发出告警信息;当***获取到告警信息并进行解析,获取关联目标环境信息并下发故障恢复请求,检测目标环境资源是否充足,提取原裸机资源配置信息,对目标环境进行匹配,形成与其相匹配的裸机资源之间的复制关系;
所述步骤S2具体包括以下步骤:
S21、检测目标环境裸机部署时所用的部署镜像、***镜像和驱动信息是否存在,存在则进入S22;否则进行部署镜像、***镜像和驱动信息的复制,选择部署镜像、***镜像和驱动信息及其目标位置,复制好后备用;
S22、检测目标环境是否存在裸机部署网络,存在则进入S23;否则创建部署网络,并配置网络目的CIDR和下一跳地址;
S23、检测目标环境是否存在裸机租户网络,存在则进行裸机资源部署恢复;否则创建租户网络,用于云物理机创建使用;
所述步骤S3具体包括以下步骤:
S31、检测目标环境上是否已注册可用裸机,若注册直接进入S32;否则注册裸机到OpenStack,输入BMC IP地址、用户名、密码,选择步骤S2复制过来的部署镜像和驱动信息;
S32、将裸机转为可管理,部署服务时控制节点通过neutron的networking-generic-switch插件使用netmiko库ssh至交换机,下发交换机配置命令,将获取到的lldp信息配置到连接裸机部署网络的交换机端口上;
S33、将裸机转为可用,网络切换到部署网络,创建云物理机,创建完成后将交换机端口切换到租户网络,然后进入云物理机操作***重启网络服务,获取IP。
2.根据权利要求1所述的一种基于0penStack裸机的故障保护方法,其特征在于,所述步骤S32中lldp信息包括网卡地址、交换机mac地址、端口名称。
3.根据权利要求1所述的一种基于0penStack裸机的故障保护方法,其特征在于,所述步骤S4具体包括以下步骤:恢复后的云物理机通过共享存储***复制关系获取原裸机资源信息,将恢复后的裸机资源信息与原裸机资源信息进行比对,比对一致后,裸机故障恢复成功,若比对不一致,则调用同步任务,进行数据同步,直到数据一致。
4.一种基于0penStack裸机的故障保护装置,采用权利要求1所述的方法,其特征在于,包括:裸机资源信息存储模块、裸机资源恢复环境准备模块和裸机资源部署恢复模块;
所述裸机资源信息存储模块记录裸机部署及创建云物理机过程中使用的部署网络、Inspect网络、交换机配置、使用的部署镜像和***镜像;
当裸机资源出现故障后,所述裸机资源恢复环境准备模块将已有的裸机资源恢复到新的环境上,在新环境上进行裸机及云物理机部署的环境准备;
所述裸机资源部署恢复模块在新环境上进行裸机注册及云物理机的部署,部署完成后与原有资源进行比对,保证资源数据一致性。
CN202011089740.9A 2020-10-13 2020-10-13 一种基于0penStack裸机的故障保护方法及装置 Active CN112367186B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011089740.9A CN112367186B (zh) 2020-10-13 2020-10-13 一种基于0penStack裸机的故障保护方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011089740.9A CN112367186B (zh) 2020-10-13 2020-10-13 一种基于0penStack裸机的故障保护方法及装置

Publications (2)

Publication Number Publication Date
CN112367186A CN112367186A (zh) 2021-02-12
CN112367186B true CN112367186B (zh) 2023-01-10

Family

ID=74507206

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011089740.9A Active CN112367186B (zh) 2020-10-13 2020-10-13 一种基于0penStack裸机的故障保护方法及装置

Country Status (1)

Country Link
CN (1) CN112367186B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113708954B (zh) 2021-07-23 2023-04-25 苏州浪潮智能科技有限公司 一种网络切换方法、装置及电子设备和存储介质
CN114416434B (zh) * 2022-03-30 2022-07-08 苏州浪潮智能科技有限公司 一种裸金属磁盘备份方法、装置及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103618627A (zh) * 2013-11-27 2014-03-05 华为技术有限公司 一种管理虚拟机的方法、装置及***
CN107306277A (zh) * 2016-04-19 2017-10-31 中兴通讯股份有限公司 一种服务器同步扩容的方法及装置
CN111371620A (zh) * 2020-03-11 2020-07-03 苏州浪潮智能科技有限公司 一种基于分布式缓存的裸机服务部署方法及***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107329769A (zh) * 2017-07-07 2017-11-07 郑州云海信息技术有限公司 一种配置裸机服务器的方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103618627A (zh) * 2013-11-27 2014-03-05 华为技术有限公司 一种管理虚拟机的方法、装置及***
CN107306277A (zh) * 2016-04-19 2017-10-31 中兴通讯股份有限公司 一种服务器同步扩容的方法及装置
CN111371620A (zh) * 2020-03-11 2020-07-03 苏州浪潮智能科技有限公司 一种基于分布式缓存的裸机服务部署方法及***

Also Published As

Publication number Publication date
CN112367186A (zh) 2021-02-12

Similar Documents

Publication Publication Date Title
CN106850260A (zh) 一种虚拟化资源管理平台的部署方法和装置
TWI548987B (zh) 用於藉由提供預先建立環境之即時有效性來部署用於測試之環境的方法、系統、及電腦可讀取儲存裝置
WO2017162032A1 (zh) 执行数据恢复操作的方法及装置
US20090049438A1 (en) Method for Optimizing Migration of Software Applications to Address Needs
CN112367186B (zh) 一种基于0penStack裸机的故障保护方法及装置
CN109189860A (zh) 一种基于Kubernetes***的MySQL主备增量同步方法
CN107656705B (zh) 一种计算机存储介质和一种数据迁移方法、装置及***
US10048978B2 (en) Apparatus and method for identifying a virtual machine having changeable settings
CN113138882B (zh) 基于MySQL集群的自动化部署方法、装置及相关设备
CN112596951A (zh) 一种nas数据容灾方法、装置、设备及存储介质
CN108228308A (zh) 虚拟机的监控方法以及装置
WO2012171345A1 (zh) 临时故障时的数据修复方法及分布式缓存***
CN110399202B (zh) 一种高效的虚拟机容灾的方法及装置
CN110737501A (zh) Docker容器中检查点和恢复点的功能实现方法及***
CN111078352A (zh) 一种基于kvm虚拟化***的双机热备部署方法及***
CN115766405B (zh) 一种故障处理方法、装置、设备和存储介质
CN103780433B (zh) 自愈式虚拟资源配置管理数据架构
CN111262963A (zh) 一种实现虚拟机mac地址与ip地址绑定的方法及***
CN111355605A (zh) 一种云平台的虚拟机故障恢复方法及服务器
US11290318B2 (en) Disaster recovery of cloud resources
CN114598604A (zh) 虚拟网络功能实例信息的监控方法、监控装置及终端
CN110677469B (zh) 一种证券灾备***及灾备实现方法
CN115242688B (zh) 一种网络故障检测方法、装置以及介质
WO2024061219A1 (zh) 一种信息更新方法、装置、设备、存储介质及程序产品
CN112667449B (zh) 一种集群管理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant