CN108121586A - 一种PaaS层故障迁移装置及方法 - Google Patents

一种PaaS层故障迁移装置及方法 Download PDF

Info

Publication number
CN108121586A
CN108121586A CN201611073678.8A CN201611073678A CN108121586A CN 108121586 A CN108121586 A CN 108121586A CN 201611073678 A CN201611073678 A CN 201611073678A CN 108121586 A CN108121586 A CN 108121586A
Authority
CN
China
Prior art keywords
failure
virtual machine
module
state
layers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611073678.8A
Other languages
English (en)
Inventor
熊辉
朱国文
江均勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Cloud Information Technology Co Ltd
Original Assignee
Shanghai Cloud Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Cloud Information Technology Co Ltd filed Critical Shanghai Cloud Information Technology Co Ltd
Priority to CN201611073678.8A priority Critical patent/CN108121586A/zh
Publication of CN108121586A publication Critical patent/CN108121586A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例公开了一种PaaS层故障迁移装置及方法。该装置包括:可用性接口注册模块,用于为SaaS层虚拟机业务提供标准注册接口;云适配模块,用于对IaaS层提供的对外标准接口进行统一封装,确保向其他模块提供统一的抽象处理;故障监测模块,用于通过可用性接口注册模块和云适配模块监测虚拟机业务的状态、虚拟机自身状态以及虚拟机所在物理主机的状态;故障迁移与调度模块,用于根据故障监测模块的监测结果和资源配置需求对出现故障的虚拟机进行故障迁移。本发明实施例不仅实现了对IaaS层故障的迁移,还实现了对SaaS层故障的迁移,优化了故障迁移机制,实现了多维度故障检测,提高了故障迁移智能化。

Description

一种PaaS层故障迁移装置及方法
技术领域
本发明实施例涉及故障迁移技术,尤其涉及一种PaaS层故障迁移装置及方法。
背景技术
传统的应用服务器,例如Web应用、防火墙应用、负载均衡应用、IDS(入侵检测***)、IPS(入侵防护***)等,都是采用独立部署硬件的方式。当硬件发生故障且需要更换硬件时,这些应用无法持续提供服务。当应用本身发生异常时,操作人员需要登陆管理维护平台,并采取人工干预,无法做到自动化。
云计算的出现一定程度上缓解了以上问题,将底层资源(计算、存储和网络)进行池化,提供一种基础资源作为一种服务(Infrastructure as a Service,简称IaaS),将云上的应用都运行在VM(Virtual Machine,虚拟机)里,在IaaS层发生故障时,通过云计算特有的热迁移和冷迁移的能力来进行故障迁移。
然而,现有技术中对故障的迁移还停留在IaaS层,即只能是对虚拟机级别的迁移,无法保证业务的持续有效性,故障迁移机制还不够智能化。
发明内容
本发明实施例提供一种PaaS层故障迁移装置及方法,以实现优化故障迁移机制,提高故障迁移智能化的目的。
第一方面,本发明实施例提供了一种PaaS层故障迁移装置,包括:
可用性接口注册模块,用于为SaaS层虚拟机业务提供标准注册接口;
云适配模块,用于对IaaS层提供的对外标准接口进行统一封装,确保向其他模块提供统一的抽象处理;
故障监测模块,用于通过可用性接口注册模块和云适配模块监测虚拟机业务的状态、虚拟机自身状态以及虚拟机所在物理主机的状态;
故障迁移与调度模块,用于根据故障监测模块的监测结果和资源配置需求对出现故障的虚拟机进行故障迁移。
第二方面,本发明实施例还提供了一种用于上述PaaS层故障迁移装置的方法,包括:
通过可用性接口注册模块和云适配模块监测虚拟机业务的状态、虚拟机自身状态以及虚拟机所在物理主机的状态;
当监测到虚拟机业务的状态、虚拟机自身状态或者虚拟机所在物理主机的状态出现故障时,根据资源配置需求对出现故障的虚拟机进行故障迁移。
本发明实施例通过可用性接口注册模块为SaaS层虚拟机业务提供标准注册接口,云适配模块对IaaS层提供的对外标准接口进行统一封装,并由故障监测模块通过可用性接口注册模块和云适配模块监测虚拟机业务的状态、虚拟机自身状态以及虚拟机所在物理主机的状态,当出现故障时,通过故障迁移与调度模块根据故障监测模块的监测结果和资源配置需求对出现故障的虚拟机进行故障迁移,不仅实现了对IaaS层故障的迁移,还实现了对SaaS层故障的迁移,优化了故障迁移机制,实现了多维度故障检测,提高了故障迁移智能化。
附图说明
图1为本发明实施例一提供的一种PaaS层故障迁移装置的结构示意图;
图2为本发明实施例二提供的一种PaaS层故障迁移装置的结构示意图;
图3为本发明实施例三提供的一种PaaS层故障迁移方法的流程示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种PaaS层故障迁移装置的结构示意图,本实施例可适用于云计算中对SaaS层和IaaS发生的故障进行迁移的情况,该装置可通过硬件和/或软件的方式实现,并一般可集成于用于进行故障迁移的服务器中。参考图1,本实施例提供的PaaS层故障迁移装置具体包括:
可用性接口注册模块1,用于为SaaS层虚拟机业务提供标准注册接口;云适配模块2,用于对IaaS层提供的对外标准接口进行统一封装,确保向其他模块提供统一的抽象处理;故障监测模块3,用于通过可用性接口注册模块1和云适配模块2监测虚拟机业务的状态、虚拟机自身状态以及虚拟机所在物理主机的状态;故障迁移与调度模块4,用于根据故障监测模块3的监测结果和资源配置需求对出现故障的虚拟机进行故障迁移。
其中,SaaS提供给客户的服务是运营商运行在云计算基础设施上的应用程序,用户可以在各种设备上通过客户端界面(如浏览器)访问。用户不需要管理或控制任何云计算基础设施,包括网络、服务器、操作***、存储等等。
PaaS提供给用户的服务是把客户采用提供的开发语言和工具(例如Java,python,Net等)开发的或收购的应用程序部署到供应商的云计算基础设施上去。客户不需要管理或控制底层的云基础设施,包括网络、服务器、操作***、存储等,但客户能控制部署的应用程序,也可能控制运行应用程序的托管环境配置。
IaaS提供给用户的服务是对所有计算基础设施的利用,包括处理CPU、内存、存储、网络和其它基本的计算资源,用户能够部署和运行任意软件,包括操作***和应用程序。用户不管理或控制任何云计算基础设施,但能控制操作***的选择、存储空间、部署的应用,也有可能获得有限制的网络组件(例如路由器、防火墙、负载均衡器等)的控制。
优选的,所述标准注册接口为Rest(Representational State Transfer)接口。因此可在PaaS层提供标准的Rest接口进行注册,而不同的应用有不同的标识,如此可区别在可用性接口注册模块1进行注册的不同接口,注册完成后,故障监测模块3可定期访问该接口从而判断该接口中运行的虚拟机的业务是否正常。
进一步,可以以回掉函数的形式注册到可用性接口注册模块1中。
具体地,上层应用的用户可以在显示界面的编辑界面中自定义待注册的URL(Uniform Resource Locator,统一资源定位符)和返回结果的表现形式等信息,示例性的,返回结果的表现形式可以是,将返回值200定义为正常,将返回值201定义为异常。
其中,云适配模块2主要用于对接不同的云,包括公有云、私有云和混合云,它是PaaS平台为适应不同的IaaS提供的适配层,来屏蔽不同的IaaS平台带来的差异,提供了PaaS对IaaS层操作的统一接口。通过云适配,可以对IaaS和非IaaS进行接入管理,对已接入的虚拟机进行分组分类管理,为上层应用提供虚拟机用来部署应用和服务。
进一步,所述故障监测模块3具体包括:第一故障监测单元,用于通过可用性接口注册模块1周期性监测虚拟机业务的状态;第二故障监测单元,用于通过云适配模块2周期性监测虚拟机自身状态;第三故障监测单元,用于通过云适配模块2周期性监测虚拟机所在物理主机的状态。
其中,虚拟机业务可以是互联网响应用户发出的服务请求的所有业务,第一故障监测单元可以周期性访问URL指向的网页地址,并接收反馈回来的结果,根据返回的结果来判断当前该接口是否正常,示例性的,返回值为201时表示网页访问异常,说明该注册接口出现故障。
其中,第二故障监测单元可以通过云适配的接口周期性访问该接口指向的地址,并根据返回结果判断该接口的虚拟机是否正常运行。
其中,第三故障监测单元可以通过云适配的接口周期性访问该接口指向的地址,这里的云适配的接口主要对接的是私有云,因为私有云的虚拟机通常都可以查询该虚拟机的物理位置,即该虚拟机位于某机房某机柜号中的物理服务器上,具体的,该物理服务器可以发出相应的监测信号以检测当前网络连接性、资源负载的情况、磁盘是否损坏以及内存条是否可用等,并根据预先定义的返回值所代表的含义判断当前物理服务器是否出现故障以及出现了哪些故障。
进一步,所述故障迁移与调度模块4具体包括:获取单元,用于获取发生故障的虚拟机;资源配置检测单元,用于根据资源配置需求检测当前空闲的物理主机;故障迁移与调度单元,用于将发生故障的虚拟机迁移至所述空闲的物理主机中。
具体地,资源配置需求可以是根据当前该用户购买的虚拟机来判断当前是否有空闲的物理主机可用,例如,用户购买10台虚拟机,用了8台,有两台空闲,此时有两台发生了故障,则故障迁移与调度单元将发生故障的这两台迁移至未使用的两台虚拟机上。
本实施例的技术方案,通过可用性接口注册模块1为SaaS层虚拟机业务提供标准注册接口,云适配模块2对IaaS层提供的对外标准接口进行统一封装,并由故障监测模块3通过可用性接口注册模块1和云适配模块2监测虚拟机业务的状态、虚拟机自身状态以及虚拟机所在物理主机的状态,当出现故障时,通过故障迁移与调度模块4根据故障监测模块3的监测结果和资源配置需求对出现故障的虚拟机进行故障迁移,不仅实现了对IaaS层故障的迁移,还实现了对SaaS层故障的迁移,优化了故障迁移机制,实现了多维度故障检测,提高了故障迁移智能化。
实施例二
图2为本发明实施例二提供的一种PaaS层故障迁移装置的结构示意图,本实施例再上述实施例的基础上,优选是进一步增加了故障告警与反馈模块5,用于根据故障监测模块3的监测结果,当发生故障时,记录对应的故障信息,并上报已发生的故障。
优选的,所述故障信息可以包括故障类型、故障发生的时间以及引发故障的相关组件中的至少一种。
其中,故障信息可以以日志形式进行存储,并上报给技术人员供技术人员查看。
优选的,还可以根据故障信息对已发生的故障进行级别分类,例如,根据故障类型将故障分为强、中、弱三种等级,当检测到故障类型为强或弱两个等级时,主动上报给技术人员,而故障类型为弱时,仅仅做记录,并不上报给技术人员,但是技术人员可以主动察看。
本实施例的技术方案,通过故障告警与反馈模块5实时记录已发生的故障的相关信息,以方便技术人员随时调取该故障信息以及时了解已发生的故障的相关信息。
在上述技术方案的基础上,优选是进一步增加了自适应故障学习模块6,用于根据故障告警与反馈模块5记录的故障信息进行分析、处理以及建立学习模型。
具体地,所述故障学习模块具体包括:故障搜集单元,用于根据故障信息中记录的内容搜集故障;数据标准化处理单元,用于将搜集的故障按照预设格式进行数字标准化处理;信息提取单元,用于根据预设提取规则提取故障信息中的关键信息,过滤掉其他信息;学习模型建立单元,用于按照预设分类规则对提权的关键信息进行分类并建立模型。
其中,故障搜集单元可以实时获取故障告警与反馈模块5生成的故障信息,并交由数据标准化处理单元对该故障信息进行统一的数字标准化处理。具体地,数据标准化处理单元可以按照预设格式将故障信息中的相关信息进行归类,形成数字矩阵。进一步,信息提取单元按照预设提取规则先过滤掉数字矩阵中的不相关的信息,再通过PCA(PrincipalComponent Analysis,主成分分析)进行数据降维,以进一步过滤掉不相关的信息,仅保留数字矩阵中的关键信息,最后将剩下的关键信息发送给学习模型建立单元进行建模,具体可以通过SVM(Support Vector Machine,支持向量机)的方式按照预设分类规则对提权的关键信息来进行分类器构建,实现对已发生故障的深度学习,优选可以将出现频率较高的故障类型进行深度学习,实现对该类故障的预警。
实施例三
图3为本发明实施例三提供的一种PaaS层故障迁移方法的流程示意图,本实施例可适用于云计算中对SaaS层和IaaS发生的故障进行迁移的情况,该方法可由PaaS层故障迁移装置来执行,该装置可通过硬件和/或软件的方式实现,并一般可集成于用于进行故障迁移的服务器中。参考图3,该方法具体包括:
S310、通过可用性接口注册模块和云适配模块监测虚拟机业务的状态、虚拟机自身状态以及虚拟机所在物理主机的状态。
S320、当监测到虚拟机业务的状态、虚拟机自身状态或者虚拟机所在物理主机的状态出现故障时,根据资源配置需求对出现故障的虚拟机进行故障迁移。
在上述技术方案的基础上,优选是在监测到虚拟机业务的状态、虚拟机自身状态或者虚拟机所在物理主机的状态出现故障之后,进一步增加了:记录对应的故障信息,并上报已发生的故障。
本实施例提供的PaaS层故障迁移方法,与本发明任意实施例所提供的PaaS层故障迁移装置属于同一发明构思,可用于本发明任意实施例所提供的PaaS层故障迁移装置,具备执行装置相应的功能模块和有益效果。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种PaaS层故障迁移装置,其特征在于,包括:
可用性接口注册模块,用于为SaaS层虚拟机业务提供标准注册接口;
云适配模块,用于对IaaS层提供的对外标准接口进行统一封装,确保向其他模块提供统一的抽象处理;
故障监测模块,用于通过可用性接口注册模块和云适配模块监测虚拟机业务的状态、虚拟机自身状态以及虚拟机所在物理主机的状态;
故障迁移与调度模块,用于根据故障监测模块的监测结果和资源配置需求对出现故障的虚拟机进行故障迁移。
2.根据权利要求1所述的PaaS层故障迁移装置,其特征在于,还包括故障告警与反馈模块,用于根据故障监测模块的监测结果,当发生故障时,记录对应的故障信息,并上报已发生的故障。
3.根据权利要求2所述的PaaS层故障迁移装置,其特征在于,还包括自适应故障学习模块,用于根据故障告警与反馈模块记录的故障信息进行分析、处理以及建立学习模型。
4.根据权利要求1所述的PaaS层故障迁移装置,其特征在于,所述标准注册接口为Rest接口。
5.根据权利要求1所述的PaaS层故障迁移装置,其特征在于,所述故障监测模块具体包括:
第一故障监测单元,用于通过可用性接口注册模块周期性监测虚拟机业务的状态;
第二故障监测单元,用于通过云适配模块周期性监测虚拟机自身状态;
第三故障监测单元,用于通过云适配模块周期性监测虚拟机所在物理主机的状态。
6.根据权利要求1所述的PaaS层故障迁移装置,其特征在于,所述故障迁移与调度模块具体包括:
获取单元,用于获取发生故障的虚拟机;
资源配置检测单元,用于根据资源配置需求检测当前空闲的物理主机;
故障迁移与调度单元,用于将发生故障的虚拟机迁移至所述空闲的物理主机中。
7.根据权利要求2所述的PaaS层故障迁移装置,其特征在于,所述故障信息包括故障类型、故障发生的时间以及引发故障的相关组件中的至少一种。
8.根据权利要求3所述的PaaS层故障迁移装置,其特征在于,所述故障学习模块具体包括:
故障搜集单元,用于根据故障信息中记录的内容搜集故障;
数据标准化处理单元,用于将搜集的故障按照预设格式进行数字标准化处理;
信息提取单元,用于根据预设提取规则提取故障信息中的关键信息,过滤掉其他信息;
学习模型建立单元,用于按照预设分类规则对提权的关键信息进行分类并建立模型。
9.一种用于权利要求1-8任一项所述的PaaS层故障迁移方法,其特征在于,包括:
通过可用性接口注册模块和云适配模块监测虚拟机业务的状态、虚拟机自身状态以及虚拟机所在物理主机的状态;
当监测到虚拟机业务的状态、虚拟机自身状态或者虚拟机所在物理主机的状态出现故障时,根据资源配置需求对出现故障的虚拟机进行故障迁移。
10.根据权利要求9所述的PaaS层故障迁移方法,其特征在于,在监测到虚拟机业务的状态、虚拟机自身状态或者虚拟机所在物理主机的状态出现故障之后,还包括:
记录对应的故障信息,并上报已发生的故障。
CN201611073678.8A 2016-11-29 2016-11-29 一种PaaS层故障迁移装置及方法 Pending CN108121586A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611073678.8A CN108121586A (zh) 2016-11-29 2016-11-29 一种PaaS层故障迁移装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611073678.8A CN108121586A (zh) 2016-11-29 2016-11-29 一种PaaS层故障迁移装置及方法

Publications (1)

Publication Number Publication Date
CN108121586A true CN108121586A (zh) 2018-06-05

Family

ID=62225837

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611073678.8A Pending CN108121586A (zh) 2016-11-29 2016-11-29 一种PaaS层故障迁移装置及方法

Country Status (1)

Country Link
CN (1) CN108121586A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111786827A (zh) * 2020-06-29 2020-10-16 中国工商银行股份有限公司 分布式云计算环境的故障关联定位报警方法及装置
CN112698992A (zh) * 2021-03-23 2021-04-23 腾讯科技(深圳)有限公司 一种云集群的容灾管理方法以及相关装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103490938A (zh) * 2013-10-15 2014-01-01 河海大学 一种基于分层的云服务组合失效的恢复***和方法
CN103778031A (zh) * 2014-01-15 2014-05-07 华中科技大学 一种云环境下的分布式***多级故障容错方法
CN103957116A (zh) * 2014-03-31 2014-07-30 昆明理工大学 一种云故障数据的决策方法及***
CN105051698A (zh) * 2013-03-28 2015-11-11 瑞典爱立信有限公司 用于基础设施即服务云中故障管理的方法和布置
CN105323282A (zh) * 2014-07-28 2016-02-10 神州数码信息***有限公司 一种面向多租户的企业应用部署与管理***
CN105681115A (zh) * 2016-04-01 2016-06-15 北京新奥特云视科技有限公司 OnAir全媒体云平台应用方法及***
US20160259662A1 (en) * 2014-06-18 2016-09-08 International Business Machines Corporation Optimizing runtime performance of an application workload by minimizing network input/output communications between virtual machines on different clouds in a hybrid cloud topology during cloud bursting
US20160292000A1 (en) * 2015-04-03 2016-10-06 International Business Machines Corporation Migrating virtual machines based on relative priority of virtual machine in the context of a target hypervisor environment

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105051698A (zh) * 2013-03-28 2015-11-11 瑞典爱立信有限公司 用于基础设施即服务云中故障管理的方法和布置
CN103490938A (zh) * 2013-10-15 2014-01-01 河海大学 一种基于分层的云服务组合失效的恢复***和方法
CN103778031A (zh) * 2014-01-15 2014-05-07 华中科技大学 一种云环境下的分布式***多级故障容错方法
CN103957116A (zh) * 2014-03-31 2014-07-30 昆明理工大学 一种云故障数据的决策方法及***
US20160259662A1 (en) * 2014-06-18 2016-09-08 International Business Machines Corporation Optimizing runtime performance of an application workload by minimizing network input/output communications between virtual machines on different clouds in a hybrid cloud topology during cloud bursting
CN105323282A (zh) * 2014-07-28 2016-02-10 神州数码信息***有限公司 一种面向多租户的企业应用部署与管理***
US20160292000A1 (en) * 2015-04-03 2016-10-06 International Business Machines Corporation Migrating virtual machines based on relative priority of virtual machine in the context of a target hypervisor environment
CN105681115A (zh) * 2016-04-01 2016-06-15 北京新奥特云视科技有限公司 OnAir全媒体云平台应用方法及***

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
中国人工智能学会: "《中国人工智能进展 2009》", 31 December 2009 *
任传成: "《健康物联网》", 30 November 2015 *
房秉毅: "智慧城市云平台架构与部署方案浅析", 《邮电设计技术》 *
黄婕: "基于云计算的故障检测方法研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111786827A (zh) * 2020-06-29 2020-10-16 中国工商银行股份有限公司 分布式云计算环境的故障关联定位报警方法及装置
CN112698992A (zh) * 2021-03-23 2021-04-23 腾讯科技(深圳)有限公司 一种云集群的容灾管理方法以及相关装置
CN112698992B (zh) * 2021-03-23 2021-06-25 腾讯科技(深圳)有限公司 一种云集群的容灾管理方法以及相关装置

Similar Documents

Publication Publication Date Title
CN105357038B (zh) 监控虚拟机集群的方法和***
US11640465B2 (en) Methods and systems for troubleshooting applications using streaming anomaly detection
Aktas Hybrid cloud computing monitoring software architecture
CN104618693B (zh) 一种基于云计算的监控视频在线处理任务管理方法及***
US20190026459A1 (en) Methods and systems to analyze event sources with extracted properties, detect anomalies, and generate recommendations to correct anomalies
CN105743730B (zh) 为移动终端的网页服务提供实时监控的方法及其***
CN110704277B (zh) 一种监测应用性能的方法、相关设备及存储介质
US20200052993A1 (en) Methods and Systems that Diagnose and Manage Undesirable Operational States of Computing Facilities
US20190260831A1 (en) Distributed integrated fabric
CN108039964A (zh) 基于网络功能虚拟化的故障处理方法及装置、***
US20180165693A1 (en) Methods and systems to determine correlated-extreme behavior consumers of data center resources
US11636090B2 (en) Method and system for graph-based problem diagnosis and root cause analysis for IT operation
AU2015301284B2 (en) Recovering usability of cloud based service from system failure
CN103069749A (zh) 虚拟环境中的问题的隔离
CN107544832A (zh) 一种虚拟机进程的监控方法、装置和***
CN112579288A (zh) 一种基于云计算智能安全用数据管理***
Pătraşcu et al. Logging framework for cloud computing forensic environments
Dautov et al. Towards a framework for monitoring cloud application platforms as sensor networks
CN111371570B (zh) 一种nfv网络的故障检测方法及装置
CN108121586A (zh) 一种PaaS层故障迁移装置及方法
CN116194894A (zh) 原生云应用程序的故障定位
CN109818785A (zh) 一种数据处理方法、服务器集群及存储介质
Fadaei Tehrani et al. A threshold sensitive failure prediction method using support vector machine
US11748219B1 (en) Application event logging augmentation
CN115766768A (zh) 一种算力网络操作***中感知中枢设计方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180605

RJ01 Rejection of invention patent application after publication