CN113407403B - 一种云主机管理方法、装置、计算机设备及存储介质 - Google Patents

一种云主机管理方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN113407403B
CN113407403B CN202010180973.3A CN202010180973A CN113407403B CN 113407403 B CN113407403 B CN 113407403B CN 202010180973 A CN202010180973 A CN 202010180973A CN 113407403 B CN113407403 B CN 113407403B
Authority
CN
China
Prior art keywords
cloud host
connection channel
channel
management
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010180973.3A
Other languages
English (en)
Other versions
CN113407403A (zh
Inventor
詹念
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SF Technology Co Ltd
Original Assignee
SF Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SF Technology Co Ltd filed Critical SF Technology Co Ltd
Priority to CN202010180973.3A priority Critical patent/CN113407403B/zh
Publication of CN113407403A publication Critical patent/CN113407403A/zh
Application granted granted Critical
Publication of CN113407403B publication Critical patent/CN113407403B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明实施例公开了一种云主机管理方法、装置、计算机设备及存储介质,涉及数据处理技术领域。其中,方法包括:当接收到云主机通道管理指令时,根据通道管理指令获取待管理的云主机标识信息;若数据库中存在待管理的云主机标识信息;根据通道管理指令来对云主机标识信息所对应云主机的连接通道进行管理;检测云主机的连接通道状态;根据连接通道状态更新数据库中的云主机的连接通道状态。本发明实施例实现对云主机的连接通道进行管理,更新云主机的连接通道状态,避免连接通道出现异常而导致云主机不能工作,提高云主机管理运维的效率。

Description

一种云主机管理方法、装置、计算机设备及存储介质
技术领域
本发明涉及数据处理技术领域,具体涉及一种云主机管理方法、装置、计算机设备及存储介质。
背景技术
随着云主机运营规模的增长,管理运维海量云主机已成为当前云服务商的一个比较棘手的问题,尽管现有技术中存在某些云主机管理运维工具可以实现云主机的一些基本管理运维功能,但管理运维功能不够完善,同时管理运维的自由度不高且效率低。例如,在云主机与服务器通信时,云主机通过连接通道来进行通信,一旦连接通道异常,则云主机将不能服务器进行通信,提高云主机管理运维的难度。
发明内容
本发明实施例提供一种云主机管理方法、装置、计算机设备及存储介质,可实现对云主机连接通道的管理运维,提高云主机管理运维的效率。
本发明实施例提供了一种云主机管理方法,包括:
当接收到云主机通道管理指令时,根据所述通道管理指令获取待管理的云主机标识信息;
检测数据库中是否存在所述云主机标识信息;
若存在,根据所述通道管理指令来对所述云主机标识信息所对应云主机的连接通道进行管理;
检测所述云主机的连接通道状态;
根据所述连接通道状态更新所述数据库中的所述云主机的连接通道状态。
本发明实施例还提供了一种云主机管理装置,包括:
第一获取单元,用于当接收到云主机通道管理指令时,根据所述通道管理指令获取待管理的云主机标识信息;
第一检测单元,用于检测数据库中是否存在所述云主机标识信息;
第一管理单元,用于若存在所述云主机标识信息,根据所述通道管理指令来对所述云主机标识信息所对应云主机的连接通道进行管理;
状态检测单元,用于检测所述云主机的通道状态;
第一更新单元,用于根据所述连接通道状态更新所述数据库中的所述云主机的连接通道状态。
本发明实施例还提供了一种计算机设备,所述计算机设备包括:一个或多个处理器;存储器;以及一个或多个应用程序,其中所述处理器和所述存储器相连接,所述一个或多个应用程序被存储于所述存储器中,并配置为由所述处理器执行上述所述的云主机管理方法。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行上述所述的云主机管理方法。
本发明实施例当接收到云主机通道管理指令时,根据通道管理指令获取待管理的云主机标识信息;若数据库中存在待管理的云主机标识信息;根据通道管理指令来对云主机标识信息所对应的云主机的连接通道进行管理;检测云主机的连接通道状态;根据连接通道状态更新数据库中的云主机的连接通道状态。本发明实施例实现对云主机的连接通道进行管理,更新云主机的连接通道状态,避免连接通道出现异常而导致云主机不能工作,提高云主机管理运维的效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的云主机管理***的示意图;
图2是本发明实施例提供的云主机管理方法的流程示意图;
图2a是本发明实施例提供的云主机管理方法的通道管理的流程示意图;
图2b是本发明实施例提供的云主机管理方法的通道管理的流程示意图;
图2c是本发明实施例提供的云主机管理方法的通道管理的流程示意图;
图2d是本发明实施例提供的云主机管理方法的通道管理的流程示意图;
图3是本发明实施例提供的图形用户界面的示意图;
图4是本发明实施例提供的云主机管理方法的流程示意图;
图5是本发明实施例提供的云主机管理装置的示意性框图;
图6是本发明实施例提供的云主机管理装置的另一示意性框图;
图7是本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。另外,“第一”、“第二”这些术语用来将多个元素彼此区分开。例如,在不脱离本发明范围的前提下,第一约束条件可以被称为第二约束条件,并且类似地,第二约束条件可以被称为第一约束条件。第一约束条件和第二约束条件均为约束条件,但它们并非同一约束条件。
在本发明中,“示例性”一词用来表示“用作例子、例证或说明”。本发明中被描述为“示例性”的任何实施例不一定被解释为比其它实施例更优选或更具优势。为了使本领域任何技术人员能够实现和使用本发明,给出了以下描述。在以下描述中,为了解释的目的而列出了细节。应当明白的是,本领域普通技术人员可以认识到,在不使用这些特定细节的情况下也可以实现本发明。在其它实例中,不会对公知的结构和过程进行详细阐述,以避免不必要的细节使本发明的描述变得晦涩。因此,本发明并非旨在限于所示的实施例,而是与符合本发明所公开的原理和特征的最广范围相一致。
本发明实施例提供一种云主机管理方法、装置、计算机设备及存储介质。该云主机管理方法运行于计算机设备中,该计算机设备为服务器,该计算机设备可以为台式电脑、笔记本电脑等设备。服务器可以是单台服务器,也可以是由多个服务器组成的服务器集群。
为了更好的理解本发明实施例,本发明实施例提供了云主机管理***的结构示意图。如图1所示,该云主机管理***包括管理监控平台、云主机平台、控制器集群等。
管理监控平台用于管理云主机,包括云主机的信息管理、云主机的连接通道管理等,下文中将会详细描述。该管理监控平台中包括服务器,本发明实施例中提供的云主机管理方法运行于服务器中;本发明实施例中提供的云主机管理装置集成在该服务器中。在该管理监控平台中,还包括数据库,数据库中保存有云主机平台上报的云主机信息和控制器集群上报的云主机信息。在该管理监控平台中,还包括总Redis,该总Redis用于存储执行作业需要的云主机信息,将执行作业需要的云主机信息作为目标云主机信息。其中,Redis(Remote Dictionary Server),表示远程字典服务,是一个存储***。在本发明实施例中,总Redis用来缓存执行作业需要的云主机信息。从总Redis中获取执行作业需要的目标云主机信息后,将这些信息提供给作业(任务)入口,以供执行对应作业(任务)使用。其中,作业包括对云主机的所有操作,包括开启云主机、重启云主机、对云主机扩容、对云主机缩容、对云主机修改密码、对云主机备份、对云主机解锁、检测与云主机的连接状态等等。在该管理监控平台中,还提供有对应的图形用户界面(Graphical User Interface,简称GUI),又称图形用户接口。通过该图形用户界面向服务器发送一些云主机管理指令,如通道管理指令和云主机信息管理指令等。
云主机平台中包括了多个云主机信息,其中,云主机包括裸主机和非裸主机信息。其中,裸主机指的是还没有创建任何虚拟机的机器,非裸主机指的是已经创建了虚拟机的机器。当需要创建虚拟机时,如在裸主机上创建虚拟机时,会为所创建的虚拟机(云主机)分配一个机器的唯一标识符以及分配IP,将该分配的IP作为录入IP。需要注意的是,本申请实施例中将一个虚拟机看作是一个云主机,云主机的信息即指的是虚拟机的信息。同时云主机平台会把该云主机的相关信息上报给管理监控平台。其中,该云主机的相关信息包括:可用区的区域id(az_id)、一台机器的唯一标示符(ins_id)、录入ip(ip_address)、标签tag(非裸主机cvm,裸主机bms)、类型(type,包括:ctrlnode管理侧,tennant租户侧)、操作***类型(os_type)(目前只用两种类型(linux,windows)等。该云主机的相关信息中的可用区指的是研发环境、功能测试、测试可用区、生产、容灾、融通等环境,每个环境对应一个可用区,每个可用区相互独立。
控制器集群中包括多个控制器,该控制器为安装有agent服务器软件的计算机设备,该控制器为安装有agent客户端软件的云主机提供网关服务。可以理解地,该控制器是控制器服务器,对应于图3中的注册Server。当安装有agent客户端软件的云主机要与控制器进行通讯时,该云主机需要向控制器集群上报云主机自身的信息,如会上报自身的IP,将该IP作为注册IP。云主机上报了云主机自身的信息后,控制器集群通过网关服务提供的连接通道(agent通道)来连接该云主机,使得控制器集群与该云主机进行通信。将该连接通道称为第一连接通道或者agent通道或者anyx通道,该连接通道通过保持长连接来进行通信。需要注意的是,本发明实施例中的第一连接通道,除了agent通道之外,还可以包括其他与agent通道类似的需要安装软件(如客户端软件)才可以连接的连接通道。其中,控制器集群与该云主机建立连接后,也会向管理监控平台上报该云主机的信息。其中,控制器集群向管理监控平台上报的该云主机的信息包括:机器的唯一标识(ins_id)、注册ip(register_ip)、更新时间(update)、第一连接通道状态(anyx_stat)、第二连接通道状态(anyw_stat)、agent客户端版本(version)等。其中,agent客户端版本指的是该云主机上安装的agent客户端版本。更新时间指的是云主机自身的信息的更新时间。控制器向管理监控平台上报的云主机的信息保存在区域Redis数据库中。
其中,需要说明的是,本发明实施例中的控制器集群与云主机之间的通信除了使用第一连接通道来进行通信之外,控制器集群与云主机之间还通过第二连接通道来建立连接,以进行通信。其中,第二连接通道包括通过远程安全连接(Secure Shell,SSH)的方式建立连接的通道,即通过云主机的IP或者云主机的IP和连接密码等信息来与云主机建立连接的连接通道。需要注意的是,第二连接通道也可以包括与SSH方式连接相类似的其他的连接通道,即不需要安装软件的也可进行访问的连接通道。第二连接通道也可以称为anyw通道。可以理解地,本发明实施例中提供的连接云主机的连接通道包括两种:第一连接通道(agent通道或者anyx通道)和第二连接通道(anyw通道)。若想通过第一连接通道来连接云主机,那么该云主机上需安装agent客户端。
控制器集群还用于接收作业(任务),并执行该作业。例如,通过控制器集群的第一连接通道来连接作业中的云主机,将相应的作业指令下发到云主机上,以让云主机执行该作业。
下文中将分别具体介绍本发明实施例提供的云主机管理方法、装置、计算机设备及存储介质,其中,云主机管理方法运行于管理监控平台的服务器中。
图2是本发明实施例提供的一种云主机管理方法的流程示意图。如图所示,该方法包括的具体流程如下:
101,当接收到云主机通道管理指令时,根据通道管理指令获取待管理的云主机标识信息。
云主机通道管理指令可通过在管理监控平台提供的图形用户界面上执行相应的操作来触发,如触发云主机通道管理对应的控件,例如点击图像用户界面上的云主机通道管理对应的按钮,触发云主机通道管理指令;或者通过语音的方式来触发,例如检测到用户发送了对云主机通道管理相应的语音,触发云主机通道管理指令;或者也可以直接执行对应的命令来触发等。用户在图像用户界面上触发了云主机通道管理指令,将该通道管理指令发送至管理监控平台的服务器,当服务器接收到云主机通道管理指令时,根据通道管理指令获取待管理的云主机标识信息。其中,云主机标识信息为机器的唯一标识(ins_id)。
云主机通道管理指令包括连接通道状态检查指令、连接通道更新指令、连接通道启动指令、连接通道停止指令,连接通道修复指令等。其中,连接通道更新指令、连接通道启动指令、连接通道停止指令针对的是第一连接通道,根据上文中所述,若需要通过第一连接通道来连接云主机,则需要在该云主机上安装agent客户端软件,因此会涉及agent客户端软件的更新、启动和停止。
102,检测数据库中是否存在云主机标识信息。
获取了云主机标识信息之后,在数据库中查询该云主机标识信息,确定数据库中是否存在云主机标识信息。
若数据库中不存在云主机标识信息,则执行步骤103;若数据库中存在云主机标识信息,则执行步骤104。
103,进行提示。如可以将数据库中不存在对应的云主机标识信息的数据写入至列表中,或者写入至操作日志中,或者以对话框的形式等进行提示;或者多种方式相互结合来进行提示。
104,根据通道管理指令来对云主机标识信息所对应云主机的连接通道进行管理。
若通道管理指令为连接通道状态检查指令,则对云主机的连接通道进行管理即为检查连接通道的连接通道状态;若通道管理指令为连接通道更新指令,则对云主机的连接通道进行管理即为实现对第一连接通道的更新;若通道管理指令为连接通道启动指令,则对云主机的连接通道进行管理即为实现对第一连接通道的启动;若通道管理指令为连接通道停止指令,则对云主机的连接通道进行管理即为实现对第一连接通道的停止;若通道管理指令为连接通道修复指令,则对云主机的连接通道进行管理即为对连接通道状态为不活跃状态的连接通道进行修复。
其中,由于云主机的连接通道包括第一连接通道和第二连接通道。除了通道管理指令为连接通道状态检查指令外,即若云主机通道管理指令为连接通道更新指令、连接通道启动指令、连接通道停止指令,连接通道修复指令等,根据通道管理指令来对云主机的连接通道进行管理,包括:若管理指令为第一连接通道的通道管理指令,则通过第二连接通道连接所述云主机;根据通道管理指令对云主机的第一连接通道进行管理;若通道管理指令为第二连接通道的通道管理指令,则通过第一连接通道连接云主机;根据通道管理指令对云主机的第二连接通道进行管理。
例如,当需要对第一连接通道进行更新时,则通过第二连接通道连接该云主机,以在该云主机上实现对第一连接通道进行更新;当需要对第二连接通道进行修复时,则通过第一连接通道连接该云主机,以对该云主机的第二连接通道进行修复。
其中,可根据预设时间间隔来触发对应的云主机通道管理指令,根据通道管理指令来对云主机的连接通道进行管理。可以理解地,定时实施对云主机的连接通道进行管理。
105,检测云主机的连接通道状态。
若实现对第一连接通道的管理,则检测云主机的第一连接通道的连接通道状态;若实现第二连接通道的管理,则检测云主机的第二连接通道的连接通道状态。具体地,将云主机的信息传入至作业入口,通过作业入口发送至控制器集群,控制器集群选择对应的通道来检测对应的连接通道状态。例如,若检测云主机的第一连接通道状态,则控制器集群选择第一连接通道来检测第一连接通道的连接通道状态;若检测云主机的第二连接通道状态,则控制器集群选择第二连接通道来检测第二连接通道的连接通道状态。
可以理解地,若通道管理指令为连接通道更新指令,则对云主机的连接通道进行管理即为实现对第一连接通道的更新,在执行更新后检测云主机的第一连接通道状态;若通道管理指令为连接通道启动指令,则对云主机的连接通道进行管理即为实现对第一连接通道的启动,在执行启动后检测云主机的第一连接通道的状态;若通道管理指令为连接通道停止指令,则对云主机的连接通道进行管理即为实现对第一连接通道的停止,在执行停止后检测第一连接通道的状态;若通道管理指令为连接通道修复指令,则对云主机的连接通道进行管理即为对连接通道状态为不活跃状态的连接通道进行修复,在执行修复后检测连接通道状态(包括第一连接通道和第二连接通道)。
106,根据连接通道状态更新数据库中的云主机的连接通道状态。
即根据检测到的连接通道状态来更新数据库中的云主机的连接通道状态。以实时更新云主机的连接通道状态。
本发明实施例通过实现对云主机的连接通道进行管理,更新云主机的连接通道状态,避免连接通道出现异常而导致云主机不能工作,提高云主机管理运维的效率。
若云主机通道管理指令为云主机连接通道状态检查指令时,该云主机管理方法如图2a所示,包括如下步骤:
101a,当接收到云主机连接通道状态检查指令时,根据连接通道状态检查指令获取待检查的云主机标识信息。
在管理监控平台提供的图形用户界面上显示有云主机信息,可通过在管理监控平台提供的图形用户界面上确定待检查的云主机。例如,在每个云主机信息之前有一个选择框,通过点击该选择框,确定该云主机为待检查的云主机。可以理解地,在图形用户界面上还提供有检索表达式输入框,在该检索表示式输入框中输入检索表达式以确定待检查的云主机,例如,检索表达式:anyw状态:全部;anyx状态:全部;OS类型:liunx,windows,表示检查操作***类型为liunx,windows的所有云主机的anyw状态和anyx状态。可以理解地,在图形用户界面上还提供给条件检索框,根据所选择的检索条件,确定待检查的云主机。可以理解地,也可以在显示每个云主机信息对应的区域中,对应设置有相应的操作控件,例如,“检查”控件,可通过在显示云主机信息的区域触发“检查”控件,触发云主机连接通道检查指令,并根据该连接通道检查指令获取对应的云主机的标识信息。具体如图3所示。
确定待检查的云主机后,获取待检查的云主机的标识信息。其中,云主机的标识信息为机器的唯一标识(ins_id)。
102a,从待检查的云主机标识信息中获取一个云主机标识。
如可按照排序顺序从待检查的云主机的标识信息中获取一个云主机标识。也可以按照其他规则从待检查的云主机的标识信息中获取一个云主机标识。
103a,检测数据库中是否存在所获取的云主机标识。
若数据库中存在所获取的云主机标识,则执行步骤104a;若数据库中不存在所获取的云主机标识,则执行步骤109a。
104a,检查所获取的云主机标识所对应云主机的连接通道状态。
具体地,通过调用预设检查接口来检查云主机的连接通道状态,如第一连接通道状态和第二连接通道状态。该预设检查接口会生成一个作业(任务),将作业发送至控制器集群,控制器集群通过对应的连接通道执行该作业,例如,发送一个心跳包;预设检查接口检测是否接收到返回结果,若预设检查接口接收到返回结果对应的连接通道状态就是接通的状态(或者也称为活跃状态),若预设检查接口未接收到返回结果,则对应的连接通道状态就是未接通的状态(或者也称为不活跃状态)。例如,预设检查接口通过第一连接通道向云主机发送心跳包,若接收到返回结果,则该云主机的第一连接通道状态是接通的状态;若未接收到返回结果,则该云主机的第一连接通道状态是未接通的状态;第二连接通道同理。
105a,判断是否成功检查云主机的连接通道状态。
若服务器接收到预设检查接口返回的检查结果(包括接通和未接通),则确定成功检查云主机的连接通道状态。若未接收到预设检查接口返回的检查结果,则确定未成功检查云主机的连接通道状态。若成功检查云主机的连接通道状态,执行步骤106a;若未成功检查云主机的连接通道状态,执行步骤109a。
106a,根据云主机的连接通道状态更新数据库中云主机的连接通道状态。
其中,更新数据库中云主机的连接通道状态时,还需要修改数据库中的更新时间。
107a,检测是否成功更新云主机的连接通道状态。
例如,可通过提示来检测是否成功更新云主机的连接通道状态,若无出现提示,则意味着更新云主机的连接通道状态成功;若出现对应提示,则意味着更新云主机的连接通道状态失败。
若更新云主机的连接通道状态成功,则将该云主机的标识信息加入至检查成功列表,接着执行步骤108a;若更新云主机的连接通道状态失败,执行步骤109a。
108a,检测待检查的云主机标识信息是否都获取完毕。
若都获取完毕,则结束;若还有待检查的云主机标识信息未获取,则执行步骤102a。
109a,将对应的云主机标识加入至检查失败列表。
其中,检查失败列表和检查成功列表,可以记录入日志文件中,进一步地,还将检查失败列表和检查成功列表中对应的云主机信息显示在图形用户界面上,以通过图形用户界面更好的展示相关的信息,提高运维的效率和体验。该实施例进一步限定当云主机通道管理指令为云主机连接通道状态检查指令时,自动实现检查云主机的连接通道状态,提高云主机管理运维的效率。
若云主机通道管理指令为云主机连接通道更新指令时,该云主机管理方法如图2b所示,该云主机管理方法包括如下步骤:
101b,当接收到云主机连接通道更新指令时,根据连接通道更新指令获取待更新的云主机标识信息。
该连接通道更新指令更新的是云主机中的agent客户端软件。
可通过在管理监控平台提供的图形用户界面上确定待更新的云主机。例如,在显示每个云主机信息的区域,对应设置有相应的操作控件,例如,“anyx更新”、“anyx启动”、“anyx停止”、“anyx修复”等控件,可通过在显示云主机信息的区域触发“anyx更新”控件,触发云主机连接通道更新指令,并根据该连接通道更新指令获取对应的云主机的标识信息。如图3所示。也可以在图形用户界面上的检索表达式输入框中输入对应的检索表达式,根据该检索表达式确定待更新的云主机标识信息。还可以在图形用户界面上提供的条件检索框,选择对应的检索条件,根据所选择的检索条件,确定待更新的云主机的标识信息。
根据连接通道更新指令获取对应的云主机标识信息,可以是一个,也可以是多个。其中,云主机的标识信息为机器的唯一标识(ins_id)。
102b,检测数据库中是否存在待更新的云主机标识信息。
若数据库中存在待更新的云主机标识信息,则执行步骤104b;若数据库中不存在待更新的云主机标识信息,则执行步骤103b。
103b,进行提示。
如在对话框中进行提示,或者在图像用户界面上显示对应的颜色或显示高亮等来进行提示,以方便运维人员快速得到相关的信息,提高运维效率。
104b,通过第二连接通道,对云主机标识信息所对应云主机的第一连接通道进行更新,以得到更新结果。
具体地,将连接通道设置为第二连接通道,通过调用预设更新接口来对第一连接通道进行更新。例如,run-way:anyw(设置连接通道为第二连接通道),anyx_update(预设更新接口)。该预设更新接口会生成一个作业(任务),将作业会发送至控制器集群,控制器集群通过第二连接通道连接云主机标识信息所对应的云主机,执行对云主机的第一连接通道进行更新。对云主机的第一连接通道进行更新,具体地,包括:下载较新版本的agent客户端软件,在云主机上卸载先前安装的agent客户端软件,再在云主机上安装该较新版本的agent客户端软件。将对云主机的第一连接通道进行更新的更新结果返回至预设更新接口。其中,更新结果中包括更新是否成功的信息,以及若更新成功之后所对应的agent客户端软件版本的信息等。
105b,检查更新的云主机的第一连接通道状态。
具体地,通过调用预设检查接口来检查云主机的第一连接通道状态,详细内容请参看上文中的描述,在此不再赘述。
106b,根据更新结果和第一连接通道状态更新数据中云主机的第一连接通道所对应的更新版本和第一连接通道状态。
其中,云主机第一连接通道所对应的更新版本即指的是更新之后云主机所对应的agent客户端软件版本。
实施例进一步限定当云主机通道管理指令为云主机连接通道更新指令时,自动实现更新云主机的第一连接通道,并确定第一连接通道的状态,提高云主机管理运维的效率。
若云主机通道管理指令为云主机连接通道启动指令时,该云主机管理方法如图2c所示,该云主机管理方法包括如下步骤:
101c,当接收到云主机连接通道启动指令时,根据连接通道启动指令获取待启动的云主机标识信息。
其中,连接通道启动指令对应的第一连接通道的启动指令。
具体地,可通过图2b中的获取连接通道更新指令对应的云主机标识信息中的同样方式来获取连接通道启动指令对应的云主机标识信息。具体请参看上文中的描述,在此不再赘述。
102c,检测数据库中是否存在待启动的云主机标识信息。
若数据库中存在待启动的云主机标识信息,则执行步骤104c;若数据库中不存在待启动的云主机标识信息,则执行步骤103c。
103c,进行提示。
进行提示,以提高运维效率。具体地提示方式请参看上文中的对应描述,在此不再赘述。
104c,通过第二连接通道,启动云主机标识信息所对应云主机的第一连接通道。
具体地,将连接通道设置为第二连接通道,通过调用预设启动接口来对第一连接通道进行启动。例如,run-way:anyw(设置连接通道为第二连接通道),anyx_start(预设启动接口),该预设启动接口会生成一个作业(任务),将作业会发送至控制器集群,控制器集群通过第二连接通道连接云主机标识信息所对应的云主机,启动云主机的第一连接通道。具体地,控制器集群通过第二连接通道连接云主机标识信息所对应的云主机后,向云主机发送启动指令,云主机执行该启动指令,以启动云主机上的agent客户端软件,达到启动第一连接通道的目的。启动第一连接通道的启动结果会返回至预设启动接口。启动结果包括未成功启动、成功启动等。
105c,检测云主机的第一连接通道状态。
具体地,通过调用预设检查接口来检查云主机的第一连接通道状态,详细内容请参看上文中的描述,在此不再赘述。
106c,根据第一连接通道状态更新数据中云主机的第一连接通道状态。
实施例进一步限定当云主机通道管理指令为云主机连接通道启动指令时,自动实现启动云主机的第一连接通道,并确定第一连接通道的状态,提高云主机管理运维的效率。
若云主机通道管理指令为云主机连接通道停止指令时,对应地云主机管理方法与图2c所示的云主机连接通道启动指令时的云主机管理方法类似。仅仅只是实现了云主机的第一连接通道的停止而已,具体请参看图2c中所示。
若云主机通道管理指令为云主机连接通道修复指令时,对应的云主机管理方法如图2d所示,该云主机管理方法包括如下步骤:
101d,当接收到云主机连接通道修复指令时,获取连接通道状态为不活跃状态的云主机标识信息。
具体地,从数据库中筛选连接通道状态为不活跃状态的云主机标识信息。连接通道状态为不活跃状态包括第一连接通道状态为不活跃状态、第二连接通道状态为不活跃状态。将第一连接通道状态为不活跃状态的云主机标识信息保存至第一列表中,将第二连接通道状态为不活跃状态的云主机标识信息保存至第二列表中。
在步骤102d之前,可执行:检测数据库中是否存在不活跃状态的云主机标识信息,若存在执行步骤102d,若不存在,则进行提示。
102d,调用预设修复接口来修复云主机标识信息所对应云主机的连接通道。
其中,对于第一列表中的第一连接通道状态为不活跃状态的云主机,将连接通道设置为第二连接通道,通过调用第一连接通道所对应的预设修复接口来对第一连接通道进行修复。例如,run-way:anyw(设置连接通道为第二连接通道),anyx.repair(第一连接通道所对应的预设修复接口)。第一连接通道所对应的预设修复接口会生成一个作业(任务),将作业发送至控制器集群,控制器集群通过第二连接通道连接云主机标识信息所对应的云主机,自动修复云主机的第一连接通道。自动修复会修复云主机配置的问题、云主机防火墙问题、agent安装包的问题等等。将第一连接通道的修复结果返回至第一连接通道所对应的预设修复接口。
对于第二列表中的第二连接通道状态为不活跃状态的云主机,将连接通道设置为第一连接通道,通过调用第二连接通道所对应的预设修复接口来对第二连接通道进行修复。例如,run-way:anyx(设置连接通道为第一连接通道),anyw.repair(第二连接通道所对应的预设修复接口)。将第二连接通道的修复结果返回至第二连接通道所对应的预设修复接口。
修复结果包括是否成功修复,以及对应的引发修复的原因和修复方式等。
103d,检测云主机的连接通道状态。
具体地,若修复的是第一连接通道,则检测云主机的第一连接通道状态;若修复的是第二连接通道,则检测云主机的第二连接通道状态。具体地,通过调用对应的预设检查接口来检查云主机的第一连接通道状态和第二连接通道状态,例如,通过调用第一连接通道的预设检查接口来检查云主机的第一连接通道状态,通过调用第二连接通道的预设检查接口来检查云主机的第二连接通道状态。具体详细内容请参看上文中的描述,在此不再赘述。
104d,根据连接通道状态更新数据中云主机的连接通道状态。
根据第一连接通道状态更新数据库中云主机的第一连接通道状态;根据第二连接通道状态更新数据库中云主机的第二连接通道状态。
实施例进一步限定当云主机通道管理指令为云主机连接通道修复指令时,自动实现修复云主机的第一连接通道和第二连接通道,并确定第一连接通道的状态和第二连接通道状态,自动修复提高云主机管理运维的效率,减少人工运维成本。
以上实施例例举了云主机通道管理的一些管理场景中,所涉及的对云主机通道管理的具体方法,可以理解地,这些管理场景只是作为一种示例。云主机通道管理还会涉及更多的管理场景,在此不一一进行描述。
以下将涉及对云主机信息进行管理。根据前文的描述,云主机平台会向管理监控平台的服务器上报云主机信息,控制器集群也会向管理监控平台的服务器上报云主机信息。一般情况下,会先接收到云主机平台上报的云主机信息,再接收到控制器集群上报的云主机信息,可以理解地,先会分配IP(分配的IP有可能会存在改变),分配IP时对应有录入IP,而控制器集群与云主机建立连接之后,所对应的IP为注册IP,该注册IP已经是确定了的IP(注册IP不会发生改变,也可以理解为已经成功分配的IP)。在管理监控平台的数据库中,将以机器唯一标识为主键,记录相关的云主机的所有信息。
可以理解地,不能保证云服务平台等上报的云主机信息是全部正确的信息,但服务器可以对所上报的云主机信息进行自动判断,以确定是否存在数据异常,并进行标记,以避免执行作业(任务)失败,提高运维的效率。
因此在正式介绍本发明实施例提供的云主机管理方法之前,先介绍一些云主机信息管理中的存在数据异常的情况,包括:IP不一致、id不一致、IP重复、未注册、未同步、是否可以使用IP执行任务等。
IP不一致:一条记录的录入IP和注册IP不一致。例如图3表中第七条记录,录入IP为10.203.192.221,注册IP为10.203.192.206。
id不一致:两条记录一条有录入IP,另外一条有注册IP,这两个IP相等,但是机器唯一标识(ins_id)不一致。例如图3表中第三条记录和第五条记录,第三条记录的注册IP为10.203.192.219,机器唯一标识为06GPDCD;第五条记录的录入IP为10.203.192.219,机器唯一标识为2102312FLT10JC000053。
IP重复:一个IP被好几台机器使用,即多个不同的机器唯一标识所对应的录入IP和注册IP相同。在公有云的情况下这种情况存在是合理的,但是私有云不存在IP复用。本发明实施例中以私有云为例进行说明,因此不存在IP重复。需要说明的是,公有云中IP重复是允许的。
未注册:一条记录没有注册IP。这种情况通常是通道异常,没有主动上报云主机信息。
未同步:录入IP不存在。一般指其他专业组(如云主机平台)没有将云主机信息推送给服务器,此时也没有同步;还有一种情况是这些机器不是在云上搭建的,而是线下手工搭建的,这种情况下不会自动将云主机信息发送至服务器,需要服务器去同步。
以上所例举的数据异常的情况中,若存在对应的异常,则可以标记为1,若不存在对应的异常,则可以标记为0,以下以这种方式进行说明。还可以使用其他方式的标记。以上只是例举几个数据异常情况,可以理解地,还存在其他的数据异常的情况。
图4是本发明实施例提供的云主机管理方法的流程示意图。如图所示,该方法包括的具体流程如下:
201,当接收到云主机信息管理指令时,根据信息管理指令获取待管理的云主机信息。
云主机平台和控制器集群会向管理监控平台的服务器发送对应的云主机信息。在一些情况下,例如,当云主机平台中新增云主机信息时,会触发服务器产生云主机信息管理指令,如云主机信息新增指令,该云主机信息新增指令中包括新增的云主机信息,该云主机信息即为对应的云主机信息。可以理解地,在云主机平台新增云主机时,会触发管理监控平台的服务器新增该云主机信息。或者理解为,当云主机平台中新增云主机信息时,会同时向服务器发送云主机信息新增指令,该云主机信息新增指令中会携带该新增的云主机信息。更新和删除同理。控制器集群接收到云主机上的agent客户端发送的新增云主机信息时,也会触发服务器产生云主机信息管理指令或者向服务器发送云主机新增指令。更新和删除同理。
其中,云主机信息管理指令包括云主机信息新增指令、云主机信息更新指令、云主机信息删除指令、云主机信息同步指令等。
202,检测数据库中是否存在待管理的云主机信息对应的记录。
根据机器唯一标识(ins_id)检测数据库中是否存在待管理的云主机信息对应的记录。如从待管理的云主机信息中获取机器唯一标识,即云主机唯一标识,根据该机器唯一标识从数据库中进行查询,以确定是否存在对应的记录。若数据库中存在与机器唯一标识相同的记录,则确定存在所获取的云主机信息对应的记录。
若数据库中不存在所获取的云主机信息对应的记录,则执行步骤203;若数据库中存在所获取的云主机信息对应的记录,则执行步骤207。
203,查询数据库中是否存在录入IP或者注册IP等于待管理的云主机信息中的IP的记录。
如从待管理的云主机信息中获取对应的IP信息,在数据库中查询是否存在录入IP和注册IP等于待管理的IP的记录。
若不存在录入IP或者注册IP等于待管理的云主机信息中的IP的记录,则执行204;若存在录入IP或者注册IP等于待管理的云主机信息中的IP的记录,则执行步骤205。
204,确定数据异常的异常结果,并根据异常结果和待管理的云主机信息更新数据库。
即若不存在录入IP或者注册IP等于待管理的云主机信息中的IP的记录,则意味着数据库中并没有待管理的云主机信息的任何相关记录。
数据异常的异常结果包括:不存在IP不一致、不存在id不一致、不存在IP重复等;若待管理的云主机信息是控制器集群上传的云主机信息,则存在未同步;若待管理的云主机信息是云主机平台上传的云主机信息,则存在未注册。
其中,根据异常结果和待管理的云主机信息更新数据库,包括:根据异常结果在数据库中进行标记,并在数据库中更新(新增)待管理的云主机信息。
其中,根据异常结果在数据库中进行标记,包括:标记IP不一致字段为0(不存在IP不一致)、id不一致字段为0(不存在id不一致)、IP重复字段为0(不存在IP复用);若待管理的云主机信息是控制器集群上传的云主机信息,则标记未注册字段为1(存在未注册)、未同步字段为0(不存在未同步);若待管理的云主机信息是云主机平台上传的云主机信息,则标记未注册字段为0(不存在未注册)、未同步字段为0(不存在未同步)。
进一步地,还可标记执行方式。具体地,获取待管理的云主机信息中的操作***类型;若操作***类型为windows,则标记执行方式字段run-way:anyx;若操作***类型为liunx,则标记执行方式run-way:anyx、anyw。其中,需要说明的是,若操作***类型为windows,因为window不支持通过SSH的方式与云主机建立连接,则不能通过SSH的方式(anyw通道)与云主机建立连接,而只能通过anyx通道与云主机建立连接。可以理解地,若操作***类型为liunx,则可通过anyw通道和anyx通道与云主机建立连接。
进一步地,还可以标记是否可以使用IP执行作业(任务),如标记是否可以使用IP执行作业字段为0,即可以使用IP执行作业。
205,获取存在的记录的记录数量,并根据记录数量确定是否存在数据异常,以得到异常结果。
具体地,步骤205包括:若存在录入IP或者注册IP等于待管理的云主机信息中的IP的记录,查询数据库中是否存在录入IP为空、且注册IP为待管理的云主机信息中的IP的记录,或者录入IP为待管理的云主机信息中的IP、且注册IP为空的记录;若存在(存在录入IP为空、且注册IP为待管理的云主机信息中的IP的记录,或者录入IP为待管理的云主机信息中的IP、且注册IP为空的记录),获取存在的对应记录的第二记录数量,以及获取存在录入IP或者注册IP等于所获取的云主机信息中的IP的记录的第一记录数量;将第一记录数量与第二记录数量相减,以得到相减结果;根据相减结果确定是否存在数据异常,以得到异常结果;若不存在(不存在录入IP为空、且注册IP为待管理的云主机信息中的IP的记录,或者录入IP为待管理的云主机信息中的IP、且注册IP为空的记录),确定数据异常的异常结果。
其中,根据相减结果确定是否存在数据异常,以得到异常结果,包括:若相减结果小于1,意味着数据库中没有查到确定用此IP的机器,则数据异常的异常结果包括:不存在IP不一致、存在id不一致、不存在IP重复等;进一步地,确定执行方式为run-way:anyx,不可以使用IP执行任务。可以理解地,由于存在id不一致,有可能会存在同一个IP被多个机器公用的情况,则该IP不能用来执行作业(任务),不能使用SSH的方式来连接云主机,则确定执行方式为anyx。
若相减结果不小于1,意味着数据库中IP与待管理的IP相同的至少一条,则数据异常的异常结果包括:存在id不一致、存在IP重复等;进一步地,确定执行方式为run-way:anyx,不可以使用IP执行任务。可以理解地,若存在IP重复,则可能是由于网络组分配IP出现问题。
其中,若不存在(不存在录入IP为空、且注册IP为待管理的云主机信息中的IP的记录,或者录入IP为待管理的云主机信息中的IP、且注册IP为空的记录),确定数据异常的异常结果,包括:存在id不一致、存在IP重复等;进一步地,确定执行方式为anyx,不可以使用IP执行任务。
206,根据异常结果和待管理的云主机信息更新数据库。
具体地,包括:根据异常结果在数据库中进行标记,并在数据库中更新(新增)待管理的云主机信息。
其中,根据异常结果在数据库中进行标记,包括:若相减结果小于1,标记IP不一致字段为0、id不一致字段为1、IP重复字段为0、执行方式字段为anyx,是否可以使用IP执行任务字段为1等;若相减结果不小于1,标记id不一致字段为1、IP重复字段为1、执行方式字段为anyx、是否可以使用IP执行任务字段为1等。
若不存在(不存在录入IP为空、且注册IP为待管理的云主机信息中的IP的记录,或者录入IP为待管理的云主机信息中的IP、且注册IP为空的记录),根据异常结果在数据库中进行标记,包括:标记id不一致字段为1、IP重复字段为1、执行方式字段为anyx、是否可以使用IP执行任务字段为1等。
以上步骤203~206对应的是若在数据库中不存在待管理的云主机信息对应的记录,在数据库中新增待管理的云主机信息的对应流程。对应地,信息管理指令为云主机信息新增指令。
需要注意的是,以上步骤203~206中的根据异常结果和待管理的云主机信息更新数据库的同时,或者是在根据异常结果和待管理的云主机信息更新数据库之后,云主机管理方法还包括:从待管理的云主机信息中提取执行作业需要的云主机信息,并将执行作业需要的云主机信息保存至总Redis。通过总Redis来缓存执行作业需要的云主机信息,执行作业时从缓存中获取需要的云主机信息,可加快执行作业的速度。
207,根据待管理的云主机信息与本地数据库中保存的云主机信息进行比对,以确定是否存在数据异常,并得到异常结果。
即若在数据库中存在待管理的云主机信息对应的记录,根据待管理的云主机信息与本地数据库中保存的云主机信息进行比对,以确定是否存在数据异常,并得到异常结果。
具体地,步骤207,包括:获取待管理的云主机信息中的云主机的IP,并与数据库中对应的云主机的IP进行匹配;若匹配成功(即待管理的云主机的IP与数据库中确定的记录中的云主机的IP相同),获取待管理的云主机信息中的云主机的操作***类型,并与数据库中对应的云主机的操作***类型进行比对,以得到比对结果;根据比对结果确定数据异常的异常结果;若未匹配成功(即待管理的云主机的IP与数据库中确定的记录中的云主机的IP不相同,可理解为需要更新云主机的IP),获取数据库中对应的云主机的录入IP和注册IP,并判断所述录入IP和注册IP是否相等,以得到判断结果;根据判断结果确定数据异常的异常结果。
其中,根据比对结果确定数据异常的异常结果,包括:若待管理的云主机的操作***类型与数据库中的云主机的操作***类型相同,即比对结果为相同,意味着待管理的云主机的机器唯一标识、IP、操作***与数据库中确定的记录中的云主机的都对应相同;则确定数据异常的异常结果为:不存在IP不一致、不存在IP重复、不存在id不一致等(简单理解为不存在数据异常)。若待管理的云主机的操作***类型与数据库中的云主机的操作***类型不相同,即比对结果为不相同,意味着待管理的云主机的机器唯一标识、IP与数据库中确定的记录中的云主机的对应相同,而操作***类型不相同(可理解为需要更新云主机的操作***类型);则确定数据异常的异常结果为:不存在IP不一致、不存在IP重复、不存在id不一致等(简单理解为不存在数据异常)。
其中,若未匹配成功(即待管理的云主机的IP与数据库中确定的记录中的云主机的IP不相同,可理解为需要更新云主机的IP),获取数据库中对应的云主机的录入IP和注册IP,并判断所述录入IP和注册IP是否相等,以得到判断结果,包括:若未匹配成功,检测总Redis中是否存在待管理的IP;若总Redis中存在待管理的IP,则删除总Redis中的待管理的IP的相关信息(可理解为删除总Redis中不需要的IP的相关信息);若总Redis中不存在待管理的IP,获取数据库确定的记录中对应的云主机的录入IP和注册IP;判断该录入IP和注册IP是否相等,其中,判断结果包括:相等和不相等。
其中,根据判断结果确定数据异常的异常结果,包括:若录入IP和注册IP相等,意味着待管理的云主机的机器唯一标识与数据库中的对应相等,待管理的云主机的IP与数据库中对应记录中的IP不相等(需要更新云主机的IP),同时数据库中的录入IP和注册IP相等,则确定数据异常的异常结果为:不存在IP不一致、不存在IP重复、不存在id不一致等(简单理解为不存在数据异常)。若录入IP和注册IP不相等,意味着待管理的云主机的机器唯一标识与数据库中的对应相等,待管理的云主机的IP与数据库中对应记录中的IP不相等,同时数据库中的录入IP和注册IP不相等,则判断是否忽略IP不一致;若忽略IP不一致,则以待管理的云主机中的IP为准,来更新数据库中的对应的云主机信息,进一步地,根据待管理的云主机中的IP来确定是否存在IP重复;若不忽略IP不一致,则以数据库中的注册IP为准,来更新数据库中的对应的云主机信息,进一步地,根据待管理的云主机中的IP来确定是否存在IP重复。
208,根据异常结果和待管理的云主机信息更新数据库。
其中,包括:根据异常结果在数据库中进行标记,并根据待管理的云主机信息更新数据库。
在步骤207中所例举的情况下,若不存在数据异常,则无需在数据库中进行标记。若确定存在IP重复,则需要进行标记。
其中,若待管理的云主机的机器唯一标识、IP、操作***与数据库中确定的记录中的云主机的都对应相同,则根据待管理的云主机信息更新数据库,无需更新总Redis;若待管理的云主机的机器唯一标识、IP与数据库中确定的记录中的云主机的对应相同,而操作***类型不相同,则根据待管理的云主机信息更新数据库,并提取云主机信息中用于执行作业的云主机信息,更新至总Redis;若待管理的云主机的机器唯一标识与数据库中的对应相等,待管理的云主机的IP与数据库中对应记录中的IP不相等(需要更新云主机的IP),同时数据库中的录入IP和注册IP相等;则根据待管理的云主机信息更新数据库,并提取云主机信息中用于执行作业的云主机信息,更新至总Redis;若待管理的云主机的机器唯一标识与数据库中的对应相等,待管理的云主机的IP与数据库中对应记录中的IP不相等,同时数据库中的录入IP和注册IP不相等,当确定以待管理的云主机中的IP为准时,根据待管理的云主机信息更新数据库,并提取云主机信息中用于执行作业的云主机信息,更新至总Redis;若待管理的云主机的机器唯一标识与数据库中的对应相等,待管理的云主机的IP与数据库中对应记录中的IP不相等,同时数据库中的录入IP和注册IP不相等,当确定以数据库中的注册IP为准时,则根据待管理的云主机信息中除了IP信息之外的信息更新数据库,并提取云主机信息中用于执行作业的云主机信息,更新至总Redis。
该步骤中更新总Redis,以确保总Redis中保存的数据是最新的数据。
需要注意的是,以上步骤207~208对应的是若在数据库中存在待管理的云主机信息对应的记录,在数据库中更新待管理的云主机信息的对应流程。对应地,信息管理指令为云主机信息更新指令。
其中,若信息管理指令为云主机信息删除指令,所述云主机管理方法包括如下步骤:当接收到云主机信息删除指令时,根据信息删除指令获取待删除的云主机信息;检测数据库中是否存在待删除的云主机信息对应的记录;若不存在,则进行提示;若存在,删除区域Redis上保存的对应的待删除的云主机信息;通过第二连接通道,删除云主机上的第一连接通道所对应的客户端,即删除agent客户端软件;再执行步骤207~208中相应的步骤,只是将更新换成了删除,以删除总Redis中的相对应的待删除的云主机的相关信息、删除数据库中待删除的云主机信息。
其中,若信息管理指令为云主机信息同步指令,所述云主机管理方法包括如下步骤:当接收到云主机信息同步指令时,根据信息同步指令获取云主机平台上的云主机信息,将所获取的云主机平台上的云主机信息作为待同步的云主机信息;检测数据库中是否存在待同步的云主机信息对应的记录,即将待同步的云主机信息中的机器唯一标识与数据库中保存的云主机信息的机器唯一标识进行比对;若待同步的云主机信息中存在相应的机器唯一标识,而数据库中不存在,执行步骤203~206所对应的新增云主机信息的对应流程,以更新总Redis和数据库;若待同步的云主机信息中存在相应的机器唯一标识,而数据库中也存在,执行步骤207~208所对应的更新云主机信息的对应流程,以更新总Redis和数据库;若待同步的云主机信息中不存在相应的机器唯一标识,而数据库中存在相应的机器唯一标识,则确定数据库中该条云主机信息异常,并进行标记。
以上对对云主机信息管理的实施例中,对异常数据的异常结果的标记,也会显示在图形用户界面上,以更好的实现云主机的运维,提高运维体验和效率。
上述对云主机信息管理的实施例,根据待管理的云主机信息与数据库中保存的云主机信息进行比对,根据比对结果确定是否存在数据异常,并得到异常结果;并根据异常结果和待管理的云主机信息更新数据库。可以理解地,本发明实施例中的对待管理的云主机信息进行管理时,不仅实现了新增、更新、删除、同步等功能,同时也实现了对是否存在异常的异常数据的标记,根据标记的异常数据,可方便运维人员进行运维,提高云主机信息运维的效率和速度。
图5是本发明实施例提供的云主机管理装置的示意性框图。该云主机管理装置包括第一获取单元301、第一检测单元302、第一管理单元303、状态检测单元304以及第一更新单元305。
第一获取单元301,用于当接收到云主机通道管理指令时,根据通道管理指令获取待管理的云主机标识信息。
第一检测单元302,用于检测在本地数据库中是否存在待管理的云主机标识信息。
通道管理单元303,用于若存在待管理的云主机标识信息,根据通道管理指令来对云主机的连接通道进行管理。
状态检测单元304,用于检测云主机的连接通道状态。
第一更新单元305,用于根据连接通道状态更新数据库中的云主机的连接通道状态。
图6是本发明实施例提供的云主机管理装置的另一示意性框图。该云主机管理装置包括第二获取单元401、第二检测单元402、异常确定单元403以及第二更新单元404。其中,
第二获取单元401,用于当接收到云主机信息管理指令时,根据信息管理指令获取待管理的云主机信息。
第二检测单元402,用于检测数据库中是否存在待管理的云主机信息对应的记录。
异常确定单元403,用于若存在待管理的云主机信息对应的记录,根据待管理的云主机信息与数据库中保存的云主机信息进行比对,以确定是否存在数据异常,并得到异常结果。
第二更新单元404,用于根据异常结果和所述待管理的云主机信息更新数据库。
其中,云主机管理装置,还包括:删除单元。删除单元,用于通过第二连接通道,删除云主机上的第一连接通道所对应的客户端。
其中,云主机管理装置,还包括:查询单元。所述查询单元,用于在数据库中不存在所述待管理的云主机信息对应的记录,查询数据库中是否存在录入IP或者注册IP等于所述待管理的云主机信息中的IP的记录。所述异常确定单元308还用于存在录入IP或者注册IP等于所述待管理的云主机信息中的IP的记录,获取记录的记录数量,并根据记录数量确定是否存在数据异常,以得到异常结果。
在一实施例中,云主机管理装置包括上述图5实施例和图6实施例所涉及的所有单元。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述装置和各单元的具体实现过程和达到的有益效果,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
本发明实施例还提供一种计算机设备,其集成了本发明实施例所提供的任一种云主机管理方法,所述计算机设备包括:
一个或多个处理器;存储器;以及一个或多个应用程序,其中所述一个或多个应用程序被存储于所述存储器中,并配置为由所述处理器执行上述云主机管理方法实施例中任一实施例中所述的云主机管理方法中的步骤。
本发明实施例还提供一种计算机设备,其集成了本发明实施例所提供的任一种云主机管理装置。如图7所示,其示出了本发明实施例所涉及的计算机设备的结构示意图,具体来讲:
该计算机设备可以包括一个或者一个以上处理核心的处理器501、一个或一个以上计算机可读存储介质的存储器502、电源503和输入单元504等部件。本领域技术人员可以理解,图中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器501是该计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分,通过运行或执行存储在存储器502内的软件程序和/或模块,以及调用存储在存储器502内的数据,执行计算机设备的各种功能和处理数据,从而对计算机设备进行整体监控。可选的,处理器501可包括一个或多个处理核心;优选的,处理器501可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器501中。
存储器502可用于存储软件程序以及模块,处理器501通过运行存储在存储器502的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器502还可以包括存储器控制器,以提供处理器501对存储器502的访问。
计算机设备还包括给各个部件供电的电源503,优选的,电源503可以通过电源管理***与处理器501逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。电源503还可以包括一个或一个以上的直流或交流电源、再充电***、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该计算机设备还可包括输入单元504,该输入单元504可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,计算机设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,计算机设备中的处理器501会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器502中,并由处理器501来运行存储在存储器502中的应用程序,从而实现各种功能,如实现上述所述的云主机管理方法中任一实施例所对应的步骤。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本发明实施例提供一种计算机可读存储介质,该计算机存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行本发明实施例所提供的任一种云主机管理方法中的步骤。例如,所述计算机程序被处理器进行加载可以执行如上述所述的云主机管理方法中任一实施例所对应的步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对其他实施例的详细描述,此处不再赘述。
具体实施时,以上各个单元或结构可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元或结构的具体实施可参见前面的方法实施例,在此不再赘述。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
以上对本发明实施例所提供的一种云主机管理方法、装置、计算机设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种云主机管理方法,其特征在于,应用于管理监控平台的服务器中,包括:
当接收到云主机通道管理指令时,根据所述通道管理指令获取待管理的云主机标识信息;
检测所述管理监控平台的数据库中是否存在所述云主机标识信息;
若存在,根据所述通道管理指令来对所述云主机标识信息所对应云主机的连接通道进行管理,所述云主机的连接通道包括云主机平台上的云主机与控制器集群中的控制器服务器之间的连接通道,所述连接通道包括第一连接通道和第二连接通道,所述第一连接通道包括通过所述控制器服务器提供的网关服务与所述云主机之间建立连接的连接通道,所述第二连接通道包括所述云主机与所述控制器服务器之间通过远程安全连接的方式建立连接的连接通道;
所述对所述云主机标识信息所对应的云主机的连接通道进行管理的步骤包括:对所述云主机标识信息所对应的云主机的所述第一连接通道进行管理,和/或对所述云主机标识信息所对应的云主机的第二连接通道进行管理;
检测所述云主机的连接通道状态,其中,若实现对所述第一连接通道的管理,则检测所述云主机的所述第一连接通道的连接通道状态;若实现所述第二连接通道的管理,则检测所述云主机的所述第二连接通道的连接通道状态;
根据所述连接通道状态更新所述数据库中的所述云主机的连接通道状态。
2.如权利要求1所述的云主机管理方法,其特征在于,所述根据所述通道管理指令来对所述云主机标识信息所对应云主机的连接通道进行管理,包括:
若所述通道管理指令为第一连接通道的通道管理指令,则通过所述第二连接通道连接所述云主机;
根据所述通道管理指令对所述云主机标识信息所对应云主机的所述第一连接通道进行管理;
若所述通道管理指令为第二连接通道的通道管理指令,则通过所述第一连接通道连接所述云主机;
根据所述通道管理指令对所述云主机标识信息所对应云主机的所述第二连接通道进行管理。
3.如权利要求1所述的云主机管理方法,其特征在于,所述通道管理指令包括连接通道修复指令;
所述当接收到云主机通道管理指令时,根据所述通道管理指令获取待管理的云主机标识信息,包括:当接收到连接通道修复指令时,根据所述连接通道修复指令获取所述连接通道状态为不活跃状态的云主机标识信息;
所述根据所述通道管理指令来对所述云主机标识信息所对应云主机的通道进行管理,包括:根据所述连接通道修复指令来对所述云主机标识信息所对应云主机的连接通道进行修复。
4.如权利要求1所述的云主机管理方法,其特征在于,还包括:
当接收到云主机信息管理指令时,根据所述信息管理指令获取待管理的云主机信息;
检测数据库中是否存在所述待管理的云主机信息对应的记录;
若存在,根据所述待管理的云主机信息与数据库中保存的云主机信息进行比对,以确定是否存在数据异常,并得到异常结果;
并根据异常结果和所述待管理的云主机信息更新数据库。
5.如权利要求4所述的云主机管理方法,其特征在于,所述信息管理指令包括云主机信息删除指令;所述云主机对应的连接通道包括第一连接通道和第二连接通道;
若在数据库中存在所述待管理的云主机信息对应的记录,所述云主机管理方法,还包括:
通过所述第二连接通道,删除所述云主机上的第一连接通道所对应的客户端。
6.如权利要求4所述的云主机管理方法,其特征在于,所述信息管理指令包括云主机信息新增指令;所述云主机管理方法,还包括:
若在数据库中不存在所述待管理的云主机信息对应的记录,查询数据库中是否存在录入IP或者注册IP等于所述待管理的云主机信息中的IP的记录;
若存在,获取所述记录的记录数量,并根据所述记录数量确定是否存在数据异常,以得到异常结果;
根据异常结果和所述待管理的云主机信息更新数据库。
7.如权利要求4所述的云主机管理方法,其特征在于,所述根据所述待管理的云主机信息与数据库中保存的云主机信息进行比对,以确定是否存在数据异常,并得到异常结果,包括:
获取待管理的云主机信息中的云主机的IP,并与数据库中对应的云主机的IP进行匹配;
若匹配成功,则获取待管理的云主机信息中的云主机的操作***类型,并与数据库中对应的云主机的操作***类型进行比对,以得到比对结果;
根据所述比对结果确定数据异常的异常结果;
若未匹配成功,获取数据库中对应的云主机的录入IP和注册IP,并判断所述录入IP和所述注册IP是否相等,以得到判断结果;
根据所述判断结果确定数据异常的异常结果。
8.一种云主机管理装置,其特征在于,包括:
第一获取单元,用于当接收到云主机通道管理指令时,根据所述通道管理指令获取待管理的云主机标识信息;
第一检测单元,用于检测数据库中是否存在所述云主机标识信息;
第一管理单元,用于若存在所述云主机标识信息,根据所述通道管理指令来对所述云主机标识信息所对应云主机的连接通道进行管理,所述云主机的连接通道包括云主机平台上的云主机与控制器集群中的控制器服务器之间的连接通道,所述连接通道包括第一连接通道和第二连接通道,所述第一连接通道包括通过所述控制器服务器提供的网关服务与所述云主机之间建立连接的连接通道,所述第二连接通道包括所述云主机与所述控制器服务器之间通过远程安全连接的方式建立连接的连接通道;
所述第一管理单元,用于对所述云主机标识信息所对应的云主机的所述第一连接通道进行管理,和/或对所述云主机标识信息所对应的云主机的第二连接通道进行管理;
状态检测单元,用于检测所述云主机的通道状态,其中,若实现对所述第一连接通道的管理,则检测所述云主机的所述第一连接通道的连接通道状态;若实现所述第二连接通道的管理,则检测所述云主机的所述第二连接通道的连接通道状态;
第一更新单元,用于根据所述连接通道状态更新所述数据库中的所述云主机的连接通道状态。
9.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;存储器;以及一个或多个应用程序,其中所述处理器和所述存储器相连接,所述一个或多个应用程序被存储于所述存储器中,并配置为由所述处理器执行以实现权利要求1至7中任一项所述的云主机管理方法。
10.一种计算机存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行权利要求1至7任一项所述的云主机管理方法中的步骤。
CN202010180973.3A 2020-03-16 2020-03-16 一种云主机管理方法、装置、计算机设备及存储介质 Active CN113407403B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010180973.3A CN113407403B (zh) 2020-03-16 2020-03-16 一种云主机管理方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010180973.3A CN113407403B (zh) 2020-03-16 2020-03-16 一种云主机管理方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN113407403A CN113407403A (zh) 2021-09-17
CN113407403B true CN113407403B (zh) 2023-04-25

Family

ID=77676335

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010180973.3A Active CN113407403B (zh) 2020-03-16 2020-03-16 一种云主机管理方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN113407403B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113901409A (zh) * 2021-10-09 2022-01-07 紫光云技术有限公司 一种运维平台管理云主机的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106899518A (zh) * 2017-02-27 2017-06-27 腾讯科技(深圳)有限公司 一种基于互联网数据中心的资源处理方法以及装置
CN109218349A (zh) * 2017-06-29 2019-01-15 北京微影时代科技有限公司 一种管理服务器集群的方法及装置
CN109560835A (zh) * 2019-01-14 2019-04-02 广州供电局有限公司 电力通信多通道监测方法、装置、计算机设备和存储介质
CN109995564A (zh) * 2017-12-31 2019-07-09 ***通信集团辽宁有限公司 自动开通维护端口的方法、装置、设备及介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN202798798U (zh) * 2012-07-17 2013-03-13 江西省电力公司信息通信分公司 基于云计算技术的高可用***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106899518A (zh) * 2017-02-27 2017-06-27 腾讯科技(深圳)有限公司 一种基于互联网数据中心的资源处理方法以及装置
CN109218349A (zh) * 2017-06-29 2019-01-15 北京微影时代科技有限公司 一种管理服务器集群的方法及装置
CN109995564A (zh) * 2017-12-31 2019-07-09 ***通信集团辽宁有限公司 自动开通维护端口的方法、装置、设备及介质
CN109560835A (zh) * 2019-01-14 2019-04-02 广州供电局有限公司 电力通信多通道监测方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN113407403A (zh) 2021-09-17

Similar Documents

Publication Publication Date Title
CN108234170B (zh) 一种服务器集群的监控方法和装置
CN110838953B (zh) 一种测试方法、***、电子设备及存储介质
CN109697109B (zh) 一种区分识别冲突虚拟机的方法、***、装置及存储介质
CN101079881B (zh) 一种快速登录***及方法
CN109697078B (zh) 非高可用性组件的修复方法、大数据集群和容器服务平台
CN110890987A (zh) 自动创建集群的方法、装置、设备和***
CN114185577A (zh) 配置管理***、配置管理方法、服务器及存储介质
CN113407403B (zh) 一种云主机管理方法、装置、计算机设备及存储介质
JP2012069088A (ja) 医用情報処理装置及びソフトウェア配信システム
CN111831567A (zh) 应用的测试环境配置方法、装置、***和介质
CN111464603A (zh) 一种服务器扩容方法及扩容***
CN111506358A (zh) 更新容器配置的方法及装置
CN113535262A (zh) 一种代理节点的启动控制方法、装置、设备及存储介质
US12013750B2 (en) Network service management apparatus and network service management method
CN116225832A (zh) 数据库集群自动化部署的自动检测方法、存储介质及设备
JP2006113754A (ja) ソフトウェア更新装置及び方法
CN114598604B (zh) 虚拟网络功能实例信息的监控方法、监控装置及终端
CN112181785B (zh) 一种自动添加监控设备的方法、终端及存储介质
KR20160049568A (ko) 소스코드 비교 및 관리 시스템 및 방법
CN111600751B (zh) 一种数据中心管理方法及***
CN114764379A (zh) 应用软件的访问切换方法、设备和计算机可读存储介质
CN111324374B (zh) 基于应用性能管理***的应用程序的注册方法和装置
CN112667512A (zh) 数据驱动测试方法、装置、设备和计算机可读存储介质
WO2003003244A1 (fr) Procede d'elimination rapide de differentes informations dans les bases de donnees
JP2002063035A (ja) 情報処理装置の遠隔保守方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant