CN104516789A - 用于检查点***中的故障转移检测和处理的方法和*** - Google Patents

用于检查点***中的故障转移检测和处理的方法和*** Download PDF

Info

Publication number
CN104516789A
CN104516789A CN201410514971.8A CN201410514971A CN104516789A CN 104516789 A CN104516789 A CN 104516789A CN 201410514971 A CN201410514971 A CN 201410514971A CN 104516789 A CN104516789 A CN 104516789A
Authority
CN
China
Prior art keywords
host
system supervisor
supervisor call
hypervisor calls
hypervisor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410514971.8A
Other languages
English (en)
Other versions
CN104516789B (zh
Inventor
S·Z·雅各布斯
D·A·拉尔森
K·A·卢克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN104516789A publication Critical patent/CN104516789A/zh
Application granted granted Critical
Publication of CN104516789B publication Critical patent/CN104516789B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/006Identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1479Generic software techniques for error detection or fault masking
    • G06F11/1482Generic software techniques for error detection or fault masking by means of middleware or OS functionality
    • G06F11/1484Generic software techniques for error detection or fault masking by means of middleware or OS functionality involving virtual machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0712Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a virtual computing platform, e.g. logically partitioned systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/203Failover techniques using migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45591Monitoring or debugging support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/485Task life-cycle, e.g. stopping, restarting, resuming execution
    • G06F9/4856Task life-cycle, e.g. stopping, restarting, resuming execution resumption being on a different machine, e.g. task migration, virtual machine migration

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及一种用于检查点***中的故障转移检测和处理的方法和***。一种用于在具有多个主机的***中处理***管理程序调用序列的方法包括:为所述***中的多个主机分配主机ID;标识***管理程序调用序列的第一***管理程序调用所源自的主机的第一主机ID;标识所述***管理程序调用序列的第二***管理程序调用所源自的主机的第二主机ID,其中所述第二***管理程序调用是在所述第一***管理程序调用之后的调用;以及确定所述第二主机ID是否等于所述第一主机ID。

Description

用于检查点***中的故障转移检测和处理的方法和***
技术领域
本公开涉及检查点***。具体地说,涉及用于检测和处理主机故障转移的***管理程序接口***。
背景技术
虚拟化涉及在硬件平台上创建抽象***。***管理程序在计算机***上创建一个或多个虚拟机,并且管理虚拟机的资源、存储器和设备分配。***管理程序可以直接安装在硬件上,或者可以安装在主机操作***上。每个虚拟机具有抽象组件,例如处理器、存储器和I/O设备,以及安装的客机操作***。
虚拟机通常执行并行任务并且针对任务进行管理。虚拟机可能由于以下项而失败:硬件故障、固件故障、电源中断,或者中断虚拟化***的操作的其它事故。高可用性是指以下概念:在发生此类故障的情况下维持虚拟组件的服务。
发明内容
本公开包括一种用于在具有多个主机的***中处理具有多个***管理程序调用的***管理程序调用序列的方法,所述方法包括:为***中的多个主机分配主机身份(ID);检索***管理程序调用序列的第一***管理程序调用所源自的主机的第一主机ID;从虚拟机接收所述***管理程序调用序列的第二***管理程序调用,其中所述第二***管理程序调用是在所述第一***管理程序调用之后的调用;检索标识所述第二***管理程序调用所源自的主机的第二主机ID;以及判定所述第二主机ID是否等于所述第一主机ID。
本公开包括一种用于在具有多个主机的***中处理具有多个***管理程序调用的***管理程序调用序列的计算机***,所述计算机***包括一个或多个处理器电路,其被配置和布置为执行以下操作:为***中的多个主机分配主机身份(ID);标识***管理程序调用序列的第一***管理程序调用所源自的主机的第一主机ID;标识所述***管理程序调用序列的第二***管理程序调用所源自的主机的第二主机ID,其中所述第二***管理程序调用是在所述第一***管理程序调用之后的调用;以及确定所述第二主机ID是否等于所述第一主机ID。
本公开包括一种用于在具有多个主机的***中处理具有多个***管理程序调用的***管理程序调用序列的计算机可读存储介质,所述计算机可读存储介质具有存储在其上的指令,当执行所述指令时,导致处理器执行以下操作:为***中的多个主机分配主机ID;标识***管理程序调用序列的第一***管理程序调用所源自的主机的第一主机ID;标识所述***管理程序调用序列的第二***管理程序调用所源自的主机的第二主机ID,其中所述第二***管理程序调用是在所述第一***管理程序调用之后的调用;以及确定所述第二主机ID是否等于所述第一主机ID。
附图说明
包括在本申请中的附图结合在本说明书中并构成本说明书的一部分。它们示出了本发明的实施例并与说明书一起用来解释本发明的原理。附图仅例示本发明的实施例并且并非限制本发明,这些附图是:
图1是根据本公开实施例的没有和具有故障转移的主机ID更改的示意图;
图2是根据本公开实施例的用于判定是否在***管理程序调用序列中的两个***管理程序调用之间发生故障转移的方法的示意图;
图3是根据本公开实施例的用于判定是否在***管理程序调用序列期间发生故障转移的方法的示意图;
图4是根据本公开实施例的用于判定是否在***管理程序调用序列中的调用期间发生故障转移的方法的示意图。
具体实施方式
本公开的各方面涉及检查点***,而更具体的方面涉及用于检测和处理主机故障转移的***管理程序接口***。尽管本发明并不一定限于这些应用,但可以通过使用该上下文讨论不同示例来理解本发明的不同方面。
与本公开的各实施例一致,虚拟机可以通过***管理程序调用发送对信息或动作的请求。在***管理程序调用期间,虚拟机通过***管理程序接口与***管理程序通信。当虚拟机进行***管理程序调用时,***管理程序接口设置调用的环境参数和条件,收集不同输入和数据块,对***管理程序进行调用,并且对来自虚拟机执行的操作***的***管理程序的结果进行解码。***管理程序接口可以充当过程转换器,并且可以在操作***与现有***管理程序接口之间添加其它***管理程序接口。
单个***管理程序调用可以包括单个动作,例如简单的操作。对于要执行更复杂动作的虚拟机,虚拟机可以执行简单***管理程序调用序列。***管理程序调用序列中的每个***管理程序调用可以执行独立的动作。***管理程序调用序列可以具有起始索引和调用计数器,以便在***管理程序调用序列中跟踪***管理程序调用。
如果操作一个或多个程序的主要主机***出现故障,则虚拟机可以通过称为实时迁移或故障转移的过程,迁移到镜像辅助主机。如果当发生故障转移时虚拟机正在执行***管理程序调用序列,则***管理程序调用序列的一部分可以在主要主机上执行,并且***管理程序调用序列的一部分可以在辅助主机上执行。在***管理程序调用期间使用来自多个***的数据或者由于故障转移而在错误***上执行动作可以导致意外结果。例如,主机可以通常以不同配置存在,当***迁移到另一个主机时,用于具有特定配置的主机的***管理程序调用可能无法正确执行。
根据本公开的各实施例,主机ID***管理程序接口可以评估***管理程序调用序列以便判定是否在高可用性***中发生故障转移。主机ID***管理程序接口可以维护***中的主机的主机ID,并且确定从中发送***管理程序调用或***管理程序调用序列的主机。***可以通过检测多个主机已执行***管理程序调用序列中的***管理程序调用,确定已发生故障转移。
图1是根据本公开实施例的具有通过中间***管理程序接口层与***管理程序通信的虚拟机的***的示意图。出于图1的目的,每个主要(A)和辅助(B)组件可以根据其图号统称为功能类似,尽管通常存在每个组件的不同配置。所述***可以包含两个或更多主机101(在此示出主要主机101A和辅助主机101B),这些主机通过网络110连接并对具有操作***107的虚拟机102进行抽象。每个主机101可以托管虚拟机102的相应实例,一个实例可以是活动实例,另一个实例可以是故障转移或冗余实例。虚拟机102可以包括操作***107。每个主机可以包含***管理程序104和主机硬件105。主机硬件105可以包括主机CPU 106和主机存储器107。不同主机101上的虚拟机102的相应实例可以在功能上和/或逻辑上相同。
在每个主机101上抽象的虚拟机102可以通过***管理程序接口层103与***管理程序104通信。***管理程序接口层103可以包括主机ID***管理程序接口108和操作***管理程序接口109。主机ID***管理程序接口108可以用于跟踪主机的执行实例。操作***管理程序接口109可以用于收集数据、执行特权功能,以及其它过程和信息任务。***管理程序接口层103可以具有多个操作***管理程序接口109。例如,如果***具有多个底层体系架构或***管理程序,则可以对多个操作***管理程序接口109进行***管理程序调用。操作***管理程序接口109可以是任何用于过程或信息用途的***管理程序接口。
主机ID***管理程序接口108可以在虚拟机102和涉及***管理程序调用的操作***管理程序接口109之间通信。主机ID***管理程序接口108可以是接收目的地为操作***管理程序接口109的输入和目的地为虚拟机102的输出的计算机实现。主机ID***管理程序接口108可以具有用于维护***中的每个主机101的主机ID,并且当由来自虚拟机102的***管理程序调用或调用序列查询或者接收来自虚拟机102的***管理程序调用或调用序列时,用于确定当前执行虚拟机102的主机101的逻辑。
例如,虚拟机102可以在主要主机101A上执行***管理程序调用序列的第一***管理程序调用。在没有主机ID***管理程序接口108的情况下,第一***管理程序调用将传递到主要操作***管理程序接口109。如果在序列期间发生故障转移,则虚拟机102可以迁移到辅助主机101B,从而使辅助主机101B上的虚拟机102的对应实例成为活动实例。当虚拟机102执行所述序列中的第二***管理程序调用时,第二***管理程序调用将再次传递到辅助操作***管理程序接口109B。如果要在不同机器上继续执行***管理程序调用序列,则可能出现不一致或次优结果。
继续该示例,在具有主机ID***管理程序接口108的情况下,在传递到主要操作***管理程序接口109A之前,第一***管理程序调用可以传递到主机ID***管理程序接口108。主机ID***管理程序接口108可以确定第一主机ID,该第一主机ID指示虚拟机102从中发起第一***管理程序调用的主要主机101A。如果在序列期间发生故障转移,则虚拟机102可以仍然迁移到辅助主机101B。但是,现在当由虚拟机102(目前在辅助主机101B上执行)执行第二***管理程序调用时,主机ID***管理程序接口108可以确定第二主机ID,该第二主机ID指示虚拟机102从中发送第二***管理程序调用的辅助主机101B。所述***然后可认识到第一和第二***管理程序调用发送自不同主机101,并且例如通过在辅助主机101B上重新启动***管理程序调用序列来处理故障转移。
主机101可以是具有处理器、存储器和输入/输出资源的数据处理***,例如服务器。主机101的***配置可以类似,尽管它们在***中的操作在功能上不同。主机101可以根据其故障转移条件进行物理配置,并且通常主要和辅助主机101将在物理上和电气上分离以便实现电源中断故障转移条件。对于需要更可靠的高可用性的***,***可以包括多个辅助主机101B。尽管可以根据特定功能描述主要和辅助主机101,但它们可以被配置为由于其故障转移功能而执行另一个主机的功能。
每个主机101可以具有作为固件或软件安装的***管理程序104(或虚拟机管理器)。***管理程序104可以直接安装在硬件上(类型1***管理程序),例如安装在固件或***存储器上,或者可以安装在操作***上(类型2***管理程序)。***管理程序104控制、管理物理资源之间的交互,并且将物理资源分配给在其主机101上抽象的虚拟机102。
主要和辅助主机101的主要和辅助***管理程序104可以将虚拟机102抽象到其相应主机101的硬件上。虚拟机102是物理机的软件或硬件实现,其可以像物理机那样执行指令。由主要***管理程序104A抽象到主要主机101A上的虚拟机102可以执行指令,并且消耗运行应用的处理器资源。由辅助***管理程序104B抽象到辅助主机101B上的虚拟机102可以通过检查点接收状态和存储页更新,但可能无法执行指令,直到发生故障转移并且控制转移到辅助主机101B。虚拟机的硬件实现可以包括硬件资源的逻辑分区。
图2是根据本公开实施例的用于判定是否在高可用性***中发生故障转移的方法的示意图。可以将有关图2的讨论与***(例如图1的***)一起使用。在***管理程序调用序列期间,***可以判定是否多个主机托管虚拟机102。主机ID***管理程序接口108为***中的多个主机101的每一个分配主机ID,如201中所示。主机ID***管理程序接口108从虚拟机接收***管理程序调用序列的第一***管理程序调用,如202中所示。主机ID***管理程序接口108检索第一主机ID,该第一主机ID标识第一***管理程序调用所源自的主机,如203中所示,并且存储该第一主机ID。***管理程序接口108从虚拟机接收***管理程序调用序列的后续第二***管理程序调用,如204中所示。主机ID***管理程序接口检索第二主机ID,该第二主机ID标识第二***管理程序调用所源自的主机,如205中所示。***中的逻辑(无论在主机ID***管理程序接口108中还是在虚拟机102中)例如通过将第二主机ID与第一主机ID相比较,判定第二主机ID是否等于第一主机ID,如206中所示。基于该判定的结果,***可以将第二***管理程序调用传递到操作***管理程序接口,如208中所示,或者例如通过重新启动***管理程序调用序列来处理故障转移,如207中所示。
图3是根据本公开实施例的用于判定是否在高可用性***中发生故障转移的另一方法的示意图。根据各实施例,针对***管理程序调用序列的起始***管理程序调用和调用序列中的终止***管理程序调用确定主机ID。主机ID***管理程序接口108针对***中的多个主机101的每一个分配和维护主机ID,如301中所示。当***管理程序在主机101上执行虚拟机102时,可以进行该分配。
主机ID***管理程序接口108接收***管理程序调用序列,如302中所示。主机ID***管理程序接口108确定当接收***管理程序调用序列时虚拟机102在其上主动执行的主机101的主机ID,并且将该主机ID维护为***管理程序调用序列的初始主机ID(IDI),如303中所示。所述***执行***管理程序调用序列,如304中所示。当***管理程序调用序列完成时,主机ID***管理程序接口确定当完成***管理程序调用序列时虚拟机在其上主动执行的主机101的主机ID,并且将该主机ID维护为***管理程序调用序列的最终主机ID(IDF),如305中所示。
主机ID***管理程序接口108可以判定最终主机ID(IDF)是否等于初始主机ID(IDI),如306中所示。备选地,虚拟机102可以查询主机ID***管理程序接口108以获得初始主机ID(IDI)和最终主机ID(IDF),并且判定最终主机ID(IDF)是否等于初始主机ID(IDI)。如果最终主机ID(IDF)等于初始主机ID(IDI),则***可以继续操作,如309中所示。如果最终主机ID(IDF)不等于初始主机ID(IDI),则主机ID***管理程序接口108可以将故障转移响应发送到虚拟机102,如307中所示,备选地,虚拟机102可以确认已发生故障转移。此外,所述***可以例如通过重新启动***管理程序调用序列来处理故障转移,如308中所示,并且主机ID***管理程序接口108可以返回到确定初始主机ID(IDI),如303中所示。
图4是根据本公开实施例的用于判定是否在高可用性***中发生故障转移的另一方法的示意图。根据各实施例,针对***管理程序调用序列的起始***管理程序调用和***管理程序调用序列中的后续调用确定主机ID。在某些实施例中,主机ID***管理程序接口可以检查每个后续调用及紧接其前的调用。在不同实施例中,主机ID***管理程序接口可以不检查每个调用。例如,主机ID***管理程序接口可以每隔两个调用而检查调用。主机ID***管理程序接口108针对***中的多个主机101的每一个分配和维护主机ID,如401中所示。当***管理程序103在主要主机101上执行虚拟机102时,可以进行该分配。
更具体地说,主机ID***管理程序接口108接收***管理程序调用序列,如402中所示。主机ID***管理程序接口108确定当接收***管理程序调用序列时虚拟机102在其上主动执行的主机101的主机ID,并且将该主机ID维护为序列ID(IDS),如403中所示。主机ID***管理程序接口108接收***管理程序调用,如404中所示。主机ID***管理程序接口108确定当接收***管理程序调用时虚拟机在其上执行的主机101的主机ID,并且将该主机ID维护为调用ID(IDC),如405中所示。
***管理程序接口可以判定调用ID(IDC)是否等于序列ID(IDS),如406中所示。如果调用ID(IDC)不等于序列ID(IDS),则主机ID***管理程序接口108可以将故障转移响应发送到虚拟机102,如407中所示。此外,所述***可以例如通过重新启动***管理程序调用序列来处理故障转移,如408中所示。如果调用ID(IDC)等于序列ID(IDS),则主机ID***管理程序接口108可以允许***管理程序调用通过,如409中所示。虚拟机102或主机ID***管理程序接口108可以评估当前***管理程序调用是否是***管理程序调用序列的最后一个***管理程序调用,如410中所示。如果当前***管理程序调用不是***管理程序调用序列的最后一个***管理程序调用,则主机ID***管理程序接口108可以返回到接收***管理程序调用,如404中所示。如果当前***管理程序调用是***管理程序调用序列的最后一个***管理程序调用,则主机ID***管理程序接口108可以继续***操作,如411中所示。
所属技术领域的技术人员知道,本公开的各个方面可以实现为***、方法或计算机程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、驻留软件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”、“器件”或“***”。此外,本发明的各个方面还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
可以采用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质可以是—但不限于—例如电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括例如在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括—但不限于—电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括—但不限于—无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开的各个方面的操作的计算机程序代码,所述程序设计语言包括面向对象的语言—诸如Java、Smalltalk、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机或服务器上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
以上已经参照根据本公开实施例的方法、装置(***)和计算机程序产品的流程图和/或框图描述本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。
也可以把这些计算机程序指令存储在计算机可读介质中,这些指令使得计算机、其它可编程数据处理装置、或其它设备以特定方式工作,从而,存储在计算机可读介质中的指令就产生出包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的指令的制造品(article ofmanufacture)。
也可以把计算机程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其它可编程装置上执行的指令提供实现流程图和/或框图中的一个或多个方框中规定的功能/动作的过程。
附图中的流程图和框图显示了根据本公开的不同实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
尽管根据特定实施例描述了本公开,但将预计到的是,对本公开的更改和修改将对于所属技术领域的技术人员来说变得显而易见。因此,以下权利要求旨在被解释为涵盖所有落入本公开的真实精神和范围之内的此类更改和修改。

Claims (20)

1.一种用于在具有多个主机的***中处理具有多个***管理程序调用的***管理程序调用序列的方法,所述方法包括:
为***中的多个主机分配主机身份ID;
标识***管理程序调用序列的第一***管理程序调用所源自的主机的第一主机ID;
标识所述***管理程序调用序列的第二***管理程序调用所源自的主机的第二主机ID,其中所述第二***管理程序调用是在所述第一***管理程序调用之后的调用;以及
确定所述第二主机ID是否等于所述第一主机ID。
2.根据权利要求1的方法,还包括:
确定所述第二主机ID不等于所述第一主机ID;以及
响应于确定所述第二主机ID不等于所述第一主机ID,重新启动所述***管理程序调用序列。
3.根据权利要求1的方法,
其中由虚拟机执行判定所述第二主机ID是否等于所述第一主机ID;以及
还包括将所述第一主机ID和所述第二主机ID发送到所述虚拟机。
4.根据权利要求1的方法,其中由在***管理程序与虚拟机之间通信的主机ID***管理程序接口执行判定所述第二主机ID是否等于所述第一主机ID。
5.根据权利要求4的方法,还包括:
确定所述第二主机ID等于所述第一主机ID;以及
响应于确定所述第二主机ID等于所述第一主机ID,传递所述第二***管理程序调用。
6.根据权利要求1的方法,还包括:
确定所述第二主机ID不等于所述第一主机ID;以及
响应于确定所述第二主机ID不等于所述第一主机ID,将故障转移响应发送到虚拟机。
7.根据权利要求1的方法,其中:
所述第一***管理程序调用是所述***管理程序调用序列的起始***管理程序调用;以及
所述第二***管理程序调用是所述***管理程序调用序列的终止***管理程序调用。
8.根据权利要求1的方法,还包括:
确定所述第二主机ID等于所述第一主机ID;
确定所述***管理程序调用序列中具有后续***管理程序调用;
响应于确定所述***管理程序调用序列中具有后续***管理程序调用,接收第三***管理程序调用;
确定所述***管理程序调用序列中没有后续***管理程序调用;以及
响应于确定所述***管理程序调用序列中没有后续***管理程序调用,完成所述***管理程序调用序列。
9.一种用于在具有多个主机的***中处理具有多个***管理程序调用的***管理程序调用序列的计算机***,所述计算机***包括:
一个或多个处理器电路,被配置和布置为执行以下操作:
为***中的多个主机分配主机身份ID;
标识***管理程序调用序列的第一***管理程序调用所源自的主机的第一主机ID;
标识所述***管理程序调用序列的第二***管理程序调用所源自的主机的第二主机ID,其中所述第二***管理程序调用是在所述第一***管理程序调用之后的调用;以及
确定所述第二主机ID是否等于所述第一主机ID。
10.根据权利要求9的计算机***,其中所述一个或多个处理器电路还被配置为:
确定所述第二主机ID不等于所述第一主机ID;以及
响应于确定所述第二主机ID不等于所述第一主机ID,重新启动所述***管理程序调用序列。
11.根据权利要求9的计算机***,其中所述一个或多个处理器电路还被配置为:
确定所述第二主机ID等于所述第一主机ID;以及
响应于确定所述第二主机ID等于所述第一主机ID,传递所述第二***管理程序调用。
12.根据权利要求9的计算机***,其中所述一个或多个处理器电路还被配置为:
确定所述第二主机ID不等于所述第一主机ID;以及
响应于确定所述第二主机ID不等于所述第一主机ID,将故障转移响应发送到虚拟机。
13.根据权利要求9的计算机***,其中:
所述第一***管理程序调用是所述***管理程序调用序列的起始***管理程序调用;以及
所述第二***管理程序调用是所述***管理程序调用序列的终止***管理程序调用。
14.根据权利要求9的计算机***,其中所述一个或多个处理器还被配置为:
确定所述第二主机ID等于所述第一主机ID;
响应于确定所述第二主机ID等于所述第一主机ID,确定所述***管理程序调用序列中具有后续***管理程序调用;
响应于确定所述***管理程序调用序列中具有后续***管理程序调用,接收第三***管理程序调用;
确定所述***管理程序调用序列中没有后续***管理程序调用;以及
响应于确定所述***管理程序调用序列中没有后续***管理程序调用,完成所述***管理程序调用序列。
15.一种用于在具有多个主机的***中处理具有多个***管理程序调用的***管理程序调用序列的计算机可读存储介质,所述计算机可读存储介质具有存储在其上的指令,当执行所述指令时,导致一个或多个处理器执行以下操作:
为***中的多个主机分配主机ID;
标识***管理程序调用序列的第一***管理程序调用所源自的主机的第一主机ID;
标识所述***管理程序调用序列的第二***管理程序调用所源自的主机的第二主机ID,其中所述第二***管理程序调用是在所述第一***管理程序调用之后的调用;以及
确定所述第二主机ID是否等于所述第一主机ID。
16.根据权利要求15的计算机可读存储介质,其中当执行所述指令时,还导致所述一个或多个处理器:
确定所述第二主机ID不等于所述第一主机ID;以及
响应于确定所述第二主机ID不等于所述第一主机ID,重新启动所述***管理程序调用序列。
17.根据权利要求15的计算机可读存储介质,其中当执行所述指令时,还导致所述一个或多个处理器:
确定所述第二主机ID等于所述第一主机ID;以及
响应于确定所述第二主机ID等于所述第一主机ID,传递所述第二***管理程序调用。
18.根据权利要求15的计算机可读存储介质,其中当执行所述指令时,还导致所述一个或多个处理器:
确定所述第二主机ID不等于所述第一主机ID;以及
响应于确定所述第二主机ID不等于所述第一主机ID,将故障转移响应发送到虚拟机。
19.根据权利要求15的计算机可读介质,其中:
所述第一***管理程序调用是所述***管理程序调用序列的起始***管理程序调用;以及
所述第二***管理程序调用是所述***管理程序调用序列的终止***管理程序调用。
20.根据权利要求15的计算机可读介质,其中当执行所述指令时,还导致所述一个或多个处理器:
确定所述第二主机ID等于所述第一主机ID;以及
确定所述***管理程序调用序列中具有后续***管理程序调用;
响应于确定所述***管理程序调用序列中具有后续***管理程序调用,接收第三***管理程序调用;
确定所述***管理程序调用序列中没有后续***管理程序调用;以及
响应于确定所述***管理程序调用序列中没有后续***管理程序调用,完成所述***管理程序调用序列。
CN201410514971.8A 2013-10-01 2014-09-28 用于检查点***中的故障转移检测和处理的方法和*** Active CN104516789B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/043,244 US9727357B2 (en) 2013-10-01 2013-10-01 Failover detection and treatment in checkpoint systems
US14/043,244 2013-10-01

Publications (2)

Publication Number Publication Date
CN104516789A true CN104516789A (zh) 2015-04-15
CN104516789B CN104516789B (zh) 2017-09-05

Family

ID=52741491

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410514971.8A Active CN104516789B (zh) 2013-10-01 2014-09-28 用于检查点***中的故障转移检测和处理的方法和***

Country Status (2)

Country Link
US (2) US9727357B2 (zh)
CN (1) CN104516789B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113424662A (zh) * 2019-02-14 2021-09-21 昕诺飞控股有限公司 通过多个无线连接协议确定电子设备的可达性

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11449394B2 (en) 2010-06-04 2022-09-20 Commvault Systems, Inc. Failover systems and methods for performing backup operations, including heterogeneous indexing and load balancing of backup and indexing resources
US9727357B2 (en) 2013-10-01 2017-08-08 International Business Machines Corporation Failover detection and treatment in checkpoint systems
JP6518672B2 (ja) 2013-12-30 2019-05-22 ストラタス・テクノロジーズ・バミューダ・リミテッド 動的チェックポインティングシステムおよび方法
WO2015102875A1 (en) 2013-12-30 2015-07-09 Stratus Technologies Bermuda Ltd. Checkpointing systems and methods of using data forwarding
WO2015102874A2 (en) 2013-12-30 2015-07-09 Stratus Technologies Bermuda Ltd. Method of delaying checkpoints by inspecting network packets
US20150205688A1 (en) * 2013-12-30 2015-07-23 Stratus Technologies Bermuda Ltd. Method for Migrating Memory and Checkpoints in a Fault Tolerant System
US9563518B2 (en) 2014-04-02 2017-02-07 Commvault Systems, Inc. Information management by a media agent in the absence of communications with a storage manager
US9612926B2 (en) * 2014-05-15 2017-04-04 International Business Machines Corporation Host swap hypervisor that provides high availability for a host of virtual machines
US9535803B2 (en) 2015-02-23 2017-01-03 Red Hat Israel, Ltd. Managing network failure using back-up networks
CN105099793B (zh) 2015-09-24 2019-02-05 华为技术有限公司 热备方法、装置及***
US10747630B2 (en) * 2016-09-30 2020-08-18 Commvault Systems, Inc. Heartbeat monitoring of virtual machines for initiating failover operations in a data storage management system, including operations by a master monitor node
US10922307B2 (en) 2017-12-11 2021-02-16 NextWorld, LLC Automated transaction engine
US11200124B2 (en) 2018-12-06 2021-12-14 Commvault Systems, Inc. Assigning backup resources based on failover of partnered data storage servers in a data storage management system
US11099956B1 (en) 2020-03-26 2021-08-24 Commvault Systems, Inc. Snapshot-based disaster recovery orchestration of virtual machine failover and failback operations

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050289553A1 (en) * 2004-06-23 2005-12-29 Kenichi Miki Storage system and storage system control method
US20110173608A1 (en) * 2009-07-23 2011-07-14 Brocade Communications Systems, Inc. Method and Apparatus for Providing Virtual Machine Information to a Network Interface
CN102726007A (zh) * 2009-04-01 2012-10-10 Nicira网络公司 用于实现和管理虚拟交换机的方法和装置
CN102789395A (zh) * 2011-05-14 2012-11-21 财团法人工业技术研究院 管理虚拟机器监视器中超级调用的装置与方法及其监视器
CN102999374A (zh) * 2012-12-10 2013-03-27 北京神州绿盟信息安全科技股份有限公司 一种基于虚拟机的信息记录方法

Family Cites Families (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3593366B2 (ja) 1994-09-19 2004-11-24 株式会社日立製作所 デ−タベ−ス管理方法
US6542926B2 (en) 1998-06-10 2003-04-01 Compaq Information Technologies Group, L.P. Software partitioned multi-processor system with flexible resource sharing levels
US6189112B1 (en) 1998-04-30 2001-02-13 International Business Machines Corporation Transparent processor sparing
US6622263B1 (en) 1999-06-30 2003-09-16 Jack Justin Stiffler Method and apparatus for achieving system-directed checkpointing without specialized hardware assistance
US6892383B1 (en) * 2000-06-08 2005-05-10 International Business Machines Corporation Hypervisor function sets
US20050132379A1 (en) * 2003-12-11 2005-06-16 Dell Products L.P. Method, system and software for allocating information handling system resources in response to high availability cluster fail-over events
US7434087B1 (en) * 2004-05-21 2008-10-07 Sun Microsystems, Inc. Graceful failover using augmented stubs
JP4462024B2 (ja) * 2004-12-09 2010-05-12 株式会社日立製作所 ディスク引き継ぎによるフェイルオーバ方法
US7840768B2 (en) 2005-12-13 2010-11-23 Reliable Technologies, Inc. Memory-controller-embedded apparatus and procedure for achieving system-directed checkpointing without operating-system kernel support
US7543182B2 (en) * 2006-01-12 2009-06-02 International Business Machines Corporation Automated failover system for logical partitions
US20080104586A1 (en) * 2006-10-27 2008-05-01 Microsoft Corporation Allowing Virtual Machine to Discover Virtual Status Thereof
JP4923990B2 (ja) * 2006-12-04 2012-04-25 株式会社日立製作所 フェイルオーバ方法、およびその計算機システム。
JP4809209B2 (ja) * 2006-12-28 2011-11-09 株式会社日立製作所 サーバ仮想化環境における系切り替え方法及び計算機システム
US20080189700A1 (en) * 2007-02-02 2008-08-07 Vmware, Inc. Admission Control for Virtual Machine Cluster
JP5032191B2 (ja) * 2007-04-20 2012-09-26 株式会社日立製作所 サーバ仮想化環境におけるクラスタシステム構成方法及びクラスタシステム
US8984504B2 (en) * 2007-06-22 2015-03-17 Red Hat, Inc. Method and system for determining a host machine by a virtual machine
US7836332B2 (en) * 2007-07-18 2010-11-16 Hitachi, Ltd. Method and apparatus for managing virtual ports on storage systems
US8468310B2 (en) * 2007-07-31 2013-06-18 Vmware, Inc. Method and system for tracking data correspondences
JP4468426B2 (ja) * 2007-09-26 2010-05-26 株式会社東芝 高可用システム及び実行状態制御方法
US8156491B2 (en) * 2008-02-29 2012-04-10 Red Hat, Inc. Fault tolerant virtual machine
US8201166B2 (en) * 2008-04-30 2012-06-12 Hewlett-Packard Development Company, L.P. Virtualization platform configured with virtual connect control
US8381032B2 (en) 2008-08-06 2013-02-19 O'shantel Software L.L.C. System-directed checkpointing implementation using a hypervisor layer
US9594582B2 (en) * 2009-01-05 2017-03-14 International Business Machines Corporation Detection and management of dynamic migration of virtual environments
US8352482B2 (en) * 2009-07-21 2013-01-08 Vmware, Inc. System and method for replicating disk images in a cloud computing based virtual machine file system
US8381033B2 (en) * 2009-10-30 2013-02-19 International Business Machines Corporation Fault management in virtual computing environments
CN102939588B (zh) * 2010-02-22 2016-06-01 维图斯瑞姆有限公司 不依赖于管理程序平台的数据中心管理的方法和装置
US9141580B2 (en) * 2010-03-23 2015-09-22 Citrix Systems, Inc. Systems and methods for monitoring and maintaining consistency of a configuration
US8812907B1 (en) * 2010-07-19 2014-08-19 Marathon Technologies Corporation Fault tolerant computing systems using checkpoints
US9183046B2 (en) * 2010-10-27 2015-11-10 Red Hat Israel, Ltd. Network address retrieval for live migration of a guest system in a virtual machine system
US8756602B2 (en) * 2010-11-14 2014-06-17 Brocade Communications Systems, Inc. Virtual machine and application migration over local and wide area networks without timeout
CN103503424B (zh) * 2010-12-20 2016-08-10 思杰***有限公司 用于实现多核***中的连接镜像的***和方法
US8826273B1 (en) * 2010-12-22 2014-09-02 Vmware, Inc. Synchronously logging to disk for main-memory database systems through record and replay
FR2972548B1 (fr) * 2011-03-08 2013-07-12 Thales Sa Dispositif pour l'amelioration de la tolerance aux fautes d'un processeur
US8984330B2 (en) * 2011-03-28 2015-03-17 Siemens Corporation Fault-tolerant replication architecture
US8924967B2 (en) * 2011-04-28 2014-12-30 Vmware, Inc. Maintaining high availability of a group of virtual machines using heartbeat messages
US8769531B2 (en) 2011-05-25 2014-07-01 International Business Machines Corporation Optimizing the configuration of virtual machine instances in a networked computing environment
US8984508B2 (en) * 2011-06-02 2015-03-17 Vmware, Inc. System and method for restarting a workload based on global load balancing
JP5817308B2 (ja) * 2011-08-04 2015-11-18 富士通株式会社 サーバ、サーバシステムおよびサーバの冗長切り替え方法
US8650359B2 (en) * 2011-08-26 2014-02-11 Vmware, Inc. Computer system accessing object storage system
TWI451245B (zh) 2011-09-14 2014-09-01 Inst Information Industry 虛擬機器監控方法、系統及儲存其之電腦可讀取紀錄媒體
US8756455B2 (en) * 2011-11-17 2014-06-17 Microsoft Corporation Synchronized failover for active-passive applications
US20130198739A1 (en) * 2012-01-30 2013-08-01 Microsoft Corporation Validation of Business Continuity Preparedness of a Virtual Machine
US9250945B2 (en) * 2012-03-27 2016-02-02 Microsoft Technology Licensing, Llc Detecting a repeating execution time sequence in a virtual machine
JP5976842B2 (ja) * 2012-04-23 2016-08-24 株式会社日立製作所 計算機システム、及び、計算機システムの仮想サーバ移行制御方法
US8910160B1 (en) * 2012-06-11 2014-12-09 Symantec Corporation Handling of virtual machine migration while performing clustering operations
US9081603B2 (en) * 2012-07-09 2015-07-14 Cisco Technology, Inc. Packet forwarding optimization with virtual machine mobility by comparing device identifiers to determine VM movement
JP2014044553A (ja) * 2012-08-27 2014-03-13 Fujitsu Ltd プログラム、情報処理装置および情報処理システム
US9032248B1 (en) * 2012-10-04 2015-05-12 Amazon Technologies, Inc. Memory write tracking for virtual machines
US9542249B2 (en) * 2012-11-02 2017-01-10 Hitachi, Ltd. System redundancy verification method and computer system
US9823942B2 (en) * 2013-02-08 2017-11-21 Avaya Inc. Virtual machine discovery and identification
US9298375B2 (en) * 2013-02-27 2016-03-29 Vmware, Inc. Method and apparatus for returning reads in the presence of partial data unavailability
US9990216B2 (en) * 2013-06-27 2018-06-05 Red Hat Israel, Ltd. Providing hypercall interface for virtual machines
US9729660B2 (en) * 2013-07-24 2017-08-08 Netapp, Inc. Method and system for detecting virtual machine migration
US10430217B2 (en) * 2013-09-16 2019-10-01 Vmware, Inc. High availability using dynamic quorum-based arbitration
US9727357B2 (en) 2013-10-01 2017-08-08 International Business Machines Corporation Failover detection and treatment in checkpoint systems

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050289553A1 (en) * 2004-06-23 2005-12-29 Kenichi Miki Storage system and storage system control method
CN102726007A (zh) * 2009-04-01 2012-10-10 Nicira网络公司 用于实现和管理虚拟交换机的方法和装置
US20110173608A1 (en) * 2009-07-23 2011-07-14 Brocade Communications Systems, Inc. Method and Apparatus for Providing Virtual Machine Information to a Network Interface
CN102789395A (zh) * 2011-05-14 2012-11-21 财团法人工业技术研究院 管理虚拟机器监视器中超级调用的装置与方法及其监视器
CN102999374A (zh) * 2012-12-10 2013-03-27 北京神州绿盟信息安全科技股份有限公司 一种基于虚拟机的信息记录方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113424662A (zh) * 2019-02-14 2021-09-21 昕诺飞控股有限公司 通过多个无线连接协议确定电子设备的可达性

Also Published As

Publication number Publication date
US20150095907A1 (en) 2015-04-02
US9727358B2 (en) 2017-08-08
CN104516789B (zh) 2017-09-05
US9727357B2 (en) 2017-08-08
US20150095908A1 (en) 2015-04-02

Similar Documents

Publication Publication Date Title
CN104516789A (zh) 用于检查点***中的故障转移检测和处理的方法和***
Bala et al. Fault tolerance-challenges, techniques and implementation in cloud computing
CN103189847B (zh) 用于操作数据处理***的方法和装置
US9465704B2 (en) VM availability during management and VM network failures in host computing systems
US9558082B2 (en) VM availability during migration and VM network failures in host computing systems
CN104205060A (zh) 提供用于ha集群的管理程序的基于应用的监控及恢复
US20120174115A1 (en) Runtime environment for virtualizing information technology appliances
CN108632057A (zh) 一种云计算服务器的故障恢复方法、装置及管理***
CN109168328B (zh) 虚拟机迁移的方法、装置和虚拟化***
US10346263B2 (en) Host swap hypervisor that provides high availability for a host of virtual machines
US10353786B2 (en) Virtualization substrate management device, virtualization substrate management system, virtualization substrate management method, and recording medium for recording virtualization substrate management program
CN112948063B (zh) 云平台的创建方法、装置、云平台以及云平台实现***
US20210089415A1 (en) High availability for a relational database management system as a service in a cloud platform
US10102088B2 (en) Cluster system, server device, cluster system management method, and computer-readable recording medium
US9971589B2 (en) Upgrade management for a shared pool of configurable computing resources
WO2013190694A1 (ja) 計算機の復旧方法、計算機システム及び記憶媒体
JP2013206379A (ja) クラスタ監視装置、クラスタ監視方法、及びプログラム
KR20230091168A (ko) 데이터 센터에서 장애 도메인을 전기적으로 격리하기 위한 구성을 생성하기 위한 기술들
CN109343955A (zh) 推荐服务调用方法、介质、装置和计算设备
CN109284169B (zh) 基于进程虚拟化的大数据平台进程管理方法及计算机设备
US20160210180A1 (en) Preventing recurrence of deterministic failures
CN115827148A (zh) 一种资源管理方法、装置、电子设备及存储介质
US20230289203A1 (en) Server maintenance control device, server maintenance system, server maintenance control method, and program
CN104683131A (zh) 一种应用级虚拟化高可靠性方法及装置
WO2018010068A1 (zh) 网络功能虚拟化环境中的报警方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant