CN117478488A - 一种云管理平台切换的***、方法、设备及介质 - Google Patents

一种云管理平台切换的***、方法、设备及介质 Download PDF

Info

Publication number
CN117478488A
CN117478488A CN202311801894.XA CN202311801894A CN117478488A CN 117478488 A CN117478488 A CN 117478488A CN 202311801894 A CN202311801894 A CN 202311801894A CN 117478488 A CN117478488 A CN 117478488A
Authority
CN
China
Prior art keywords
management platform
cloud management
address
computing nodes
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311801894.XA
Other languages
English (en)
Other versions
CN117478488B (zh
Inventor
杨勇
刘立近
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Metabrain Intelligent Technology Co Ltd
Original Assignee
Suzhou Metabrain Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Metabrain Intelligent Technology Co Ltd filed Critical Suzhou Metabrain Intelligent Technology Co Ltd
Priority to CN202311801894.XA priority Critical patent/CN117478488B/zh
Publication of CN117478488A publication Critical patent/CN117478488A/zh
Application granted granted Critical
Publication of CN117478488B publication Critical patent/CN117478488B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/45Network directories; Name-to-address mapping
    • H04L61/4505Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols
    • H04L61/4511Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols using domain name system [DNS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1034Reaction to server failures by a load balancer

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Hardware Redundancy (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明涉及通信技术领域,提供了一种云管理平台切换的***、方法、设备及介质。***包括:云端的主云管理平台和备云管理平台,其分别包括部署在其中的服务端;边端的若干边缘计算集群,其分别包括一个部署在其中的客户端和由其管理的若干计算节点,客户端用于将若干计算节点的注册请求发送给主云管理平台的服务端并接收其返回的主云管理平台的第一IP地址和备云管理平台的第二IP地址,将第一IP地址发送给若干计算节点并在监测到主云管理平台当前运行异常时,将第二IP地址发送给若干计算节点以使若干计算节点的访问请求切换到备云管理平台。本发明的方案无需依赖全局DNS服务,且实现起来简单并且可扩展,减少了对网络服务的要求。

Description

一种云管理平台切换的***、方法、设备及介质
技术领域
本发明涉及通信技术领域,尤其涉及一种云管理平台切换的***、方法、设备及介质。
背景技术
边缘计算是一种分布式计算模型,可以将计算和数据处理从集中式的云计算移动到接近数据源的边缘设备或者边缘节点上处理,将计算资源尽可能地靠近数据源和最终用户。边缘计算可以减少数据在网络传输中的延迟和带宽消耗,提供实时的响应和分析能力,以满足用户对低延迟、高带宽和隐私保护的需求。
云管理平台部署在云端,负责全局调度、任务下发和云边通信、监控运维等操作,因此,云管理平台自身的容灾能力很重要。云管理平台实现容灾的主备切换的方式一般在公网上提供一个全局的DNS(Domain Name System,域名***)服务地址,各个边缘计算集群内的计算节点访问云管理平台时,通过公网DNS域名建立连接,由DNS服务将后端IP(Internet Protocol,网络互连协议)解析为当前可用的云平台地址,云管理平台发生故障切换后,自动将域名的后端IP指向备云管理平台。
目前这种方式依赖一个跨公有云服务商、甚至跨电信运营商的全局DNS服务,实现起来复杂,并且需要购买全局DNS服务,成本较高,对网络服务的要求也比较高。
发明内容
有鉴于此,有必要针对以上技术问题,提供一种云管理平台切换的***、方法、设备及介质。
根据本发明的第一方面,提供了一种云管理平台切换的***,所述云管理平台切换的***包括:
云端,包括主云管理平台和备云管理平台,所述主云管理平台和所述备云管理平台分别包括部署在其中的服务端;
边端,包括若干边缘计算集群,每个所述边缘计算集群包括一个部署在其中的客户端以及由其管理的若干计算节点,
其中,所述客户端用于将所述若干计算节点的注册请求发送给所述主云管理平台的服务端以及接收其返回的所述主云管理平台的第一IP地址和所述备云管理平台的第二IP地址,以及将所述第一IP地址发送给所述若干计算节点以使所述若干计算节点的访问请求指向所述主云管理平台,所述客户端进一步用于监测所述主云管理平台当前运行是否异常,并且响应于异常,将所述第二IP地址发送给所述若干计算节点以使所述若干计算节点的访问请求切换到所述备云管理平台。
在一些实施例中,所述客户端进一步用于将所述第一IP地址或所述第二IP地址发送给所述若干计算节点并启动所述若干计算节点上运行的域名解析规则配置任务,以使所述若干计算节点的访问请求指向对应的所述主云管理平台或所述备云管理平台。
在一些实施例中,所述若干计算节点用于根据接收的所述第一IP地址或所述第二IP地址以及所述域名解析规则配置任务将其域名解析规则配置为预设统一域名与所述第一IP地址或所述第二IP地址的组合。
在一些实施例中,所述若干计算节点进一步用于响应于访问所述预设统一域名,基于所述组合中的所述第一IP地址或所述第二IP地址将其访问请求指向对应的所述主云管理平台或所述备云管理平台。
在一些实施例中,所述客户端进一步用于响应于监测到当前连接的所述主云管理平台或所述备云管理平台当前运行异常,将所述主云管理平台和所述备云管理平台中的另一云管理平台的IP地址发送给所述若干计算节点并启动所述若干计算节点的域名解析规则配置任务来修改其域名解析规则,以使所述若干计算节点的访问请求切换到所述另一云管理平台。
在一些实施例中,所述若干计算节点用于根据接收的所述另一云管理平台的IP地址以及所述域名解析规则配置任务将其域名解析规则中当前的IP地址修改为所述另一云管理平台的IP地址,以得到预设统一域名与所述另一云管理平台的IP地址的组合,并且响应于访问所述预设统一域名,基于所述组合中的所述另一云管理平台的IP地址将其访问请求切换到所述另一云管理平台。
在一些实施例中,所述客户端进一步用于按照预设周期监测当前连接的所述主云管理平台或所述备云管理平台当前运行是否异常。
在一些实施例中,所述客户端进一步用于按照所述预设周期向当前连接的所述主云管理平台或所述备云管理平台的服务端的第一接口发起访问请求,并进一步根据所述第一接口的响应情况判断当前连接的所述主云管理平台或所述备云管理平台当前运行是否异常。
在一些实施例中,所述客户端进一步用于根据预设时间内未接收到所述第一接口的响应,判断当前连接的所述主云管理平台或所述备云管理平台当前运行异常。
在一些实施例中,所述客户端进一步用于根据所述预设时间内向所述第一接口发起预设最大请求次数的访问请求仍未接收到所述第一接口的响应,判断当前连接的所述主云管理平台或所述备云管理平台当前运行异常。
在一些实施例中,所述客户端进一步用于根据第一接口返回当前连接的所述主云管理平台或所述备云管理平台的当前状态为主动切换状态,判断当前连接的所述主云管理平台或所述备云管理平台当前运行异常。
在一些实施例中,所述主云管理平台的服务端和所述备云管理平台的服务端中分别存储所述主云管理平台与所述备云管理平台之间的关联。
在一些实施例中,当前连接的所述主云管理平台或所述备云管理平台的服务端用于根据所述关联向所述客户端返回所述主云管理平台的所述第一IP地址和所述备云管理平台的所述第二IP地址,并将其中当前连接的云管理平台对应的IP地址发送给所述若干计算节点。
根据本发明的第二方面,提供了一种云管理平台切换的方法,所述云管理平台切换的方法包括:
响应于部署在边缘计算集群中的客户端接收到所述边缘计算集群的若干计算节点的注册请求,所述客户端将所述注册请求发送给主云管理平台的服务端;
所述客户端接收所述主云管理平台的服务端返回的所述主云管理平台的第一IP地址和与所述主云管理平台关联的备云管理平台的第二IP地址,并将所述第一IP地址发送给所述若干计算节点,以基于所述第一IP地址使所述若干计算节点的访问请求指向所述主云管理平台;
所述客户端监测所述主云管理平台当前运行是否异常;
响应于所述客户端监测到所述主云管理平台当前运行异常,所述客户端将所述第二IP地址发送给所述若干计算节点,以基于所述第二IP地址使所述若干计算节点的访问请求切换到所述备云管理平台。
根据本发明的第三方面,还提供了一种电子设备,该电子设备包括:
至少一个处理器;以及
存储器,存储器存储有可在处理器上运行的计算机程序,处理器执行程序时执行前述的云管理平台切换的方法。
根据本发明的第四方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时执行前述的云管理平台切换的方法。
上述一种云管理平台切换的***,云端的主云管理平台以及备云管理平台中分别包括部署在其中的服务端,边端的每个边缘计算集群中包括一个部署在其中的客户端,客户端将边缘计算集群中的计算节点的注册请求发送给主云管理平台的服务端以及接收其返回的自身的第一IP地址和备云管理平台的第二IP地址,将第一IP地址发送给计算节点使其访问请求指向主云管理平台,当客户端监测到主云管理平台异常,则将第二IP地址发送给计算节点以使其访问请求切换到备云管理平台。上述方案无需依赖全局DNS服务,不需要购买全局DNS服务,当云管理平台发生主备切换后,边缘计算集群中的计算节点自动上链到备云管理平台,节约成本,且实现起来简单并且可扩展,减少了对网络服务的要求。
此外,本发明还提供了一种云管理平台切换的方法、一种电子设备和一种计算机可读存储介质,同样能实现上述技术效果,这里不再赘述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1示出的为边端和云端的网络拓扑示意图;
图2示出的为跨数据中心部署云管理平台的示意图;
图3示出的为跨云服务商部署云管理平台的示意图;
图4示出的为本发明一个实施例提供的一种云管理平台切换的***的示意图;
图5示出的为现有技术中主备云管理平台切换的示意图;
图6示出的为本发明一个实施例提供的基于防抖动退避算法对接口访问重试的流程图;
图7示出的为本发明另一个实施例提供的一种云管理平台切换的方法的流程图;
图8为本发明另一个实施例中电子设备的内部结构图;
图9为本发明另一个实施例中计算机可读存储介质结构图。
具体实施方式
为使本发明的目标、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
边缘计算是将计算资源尽可能地靠近数据源和最终用户,以减少数据在网络中传输的延迟和带宽消耗,并提供实时的响应和分析能力。在实际应用中,边缘计算至少存在以下几个方面具有优势:
(1)低延迟和高带宽,通过将计算和存储功能移至边缘设备附近,可以更快地响应实时数据处理需求,减少数据传输延迟,以及节省网络带宽;
(2)数据隐私和安全,通过在边缘设备上进行数据处理,可以避免将敏感数据传输到远程云服务器,提高数据隐私和安全性;
(3)离线运行能力,边缘设备可以在断开与云的连接时继续进行计算和存储,以满足边缘环境中的应用需求;
(4)大规模部署和扩展,边缘计算可以支持在分布式边缘节点上进行大规模的应用程序部署和扩展,提供更高的可靠性和容错性。
边缘计算与云计算相辅相成,构成了一种分层的计算架构。云计算提供高度集中和弹性的计算和存储能力,边缘计算为云计算提供更接近用户和数据源的端点处理能力,形成了一个全面的计算生态***。
边缘计算的适用场景一般为单向网络场景,即数据从源端传输到目标端,但目标端无法直接向源端发送响应或进行双向通信。图1示出的为边端和云端的网络拓扑示意图,如图1所示,边缘计算集群一般部署在客户现场,或者灵活部署在广大的地域范围之中,比如统一的云管平台部署在公有云上,而边缘计算集群部署在多个省的多个加油站中,或多个地域的风电站中,甚至有部署在移动车辆上的场景。这种情况下难以构建一个双向全互联的网络,常用的方式是助运营商公网,将云管理平台的地址暴露在公网上,构建一个跨地域的从边缘计算集群到云管理平台的单向网络,以完成从云管理平台对多个边缘计算集群的管理。
容灾能力是指在面临硬件故障、自然灾害、人为错误等意外情况时,***能够继续正常运行或迅速恢复的能力。在边缘计算和分布式***中,容灾能力是确保***高可用性和业务连续性的重要考虑因素之一。其中,对于边缘计算而言,容灾策略至少包括以下几种:
(1)数据备份与恢复,定期备份关键数据和配置,将其存储在可靠地方,以便在发生故障时能够快速恢复,备份数据应经过验证和测试,以确保数据的完整性和可用性;
(2)多地域部署,将***的不同组件部署在多个地理位置的数据中心或边缘计算节点上,以减轻单点故障的影响,通过使用负载均衡和故障转移机制,可以实现跨地域的高可用性和提高容灾能力;
(3)冗余和故障切换,在***的关键组件上实现冗余,比如使用多个容器实例、多个节点或多个云区域,当一个节点或容器实例发生故障时,自动将流量切换到备用节点或容器实例上,确保服务的连续性;
(4)自动化监测和警报,通过实时监测***的运行状态、资源利用率和性能指标,并设置相应的警报机制,能够快速检测到潜在故障,并及时采取相应的措施;
(5)异地灾备,在不同地理位置的数据中心或云服务提供商上部署***的副本,以实现跨地域的容灾和灾难恢复,当一个地区发生灾难性事件时,可以快速切换到备用地点以保持服务的可用性;
(6)容错和自愈性能,在***设计中考虑容错机制和自愈能力,比如使用健康检查、故障恢复和自动缩放等技术来保持***的可用性和性能。
基于以上云管理平台的容灾策略,图2示出的为跨数据中心部署云管理平台的示意图,如图2所示,在两个不同的数据中心中各部署一个云管理平台,并设置其中一个为主云管理平台;图3示出的为跨云服务商部署云管理平台的示意图,如图3所示,在两个不同的云服务商中各部署一个云管理平台,并设置其中一个为主云管理平台。各地的边缘计算集群正常情况下连接到主云管理平台上,当主云管理平台发生计划外故障,或在计划内进行主备切换时,将各边缘计算集群切换到备云管理平台,以保障云管理平台业务的持续运行。
在一个实施例中,请参照图4所示,本发明提供了一种云管理平台切换的***,具体来说,所述云管理平台切换的***包括:
云端101,包括主云管理平台104和备云管理平台105,主云管理平台104和备云管理平台105分别包括部署在其中的服务端,即部署在主云管理平台104中的服务端108以及部署在备云管理平台105中的服务端109;
边端102,包括若干边缘计算集群103,每个边缘计算集群103包括一个部署在其中的客户端106以及由其管理的若干计算节点107,
其中,客户端106用于将若干计算节点107的注册请求发送给主云管理平台104的服务端108以及接收主云管理平台104的服务端108返回的主云管理平台104的第一IP地址和备云管理平台105的第二IP地址,以及将第一IP地址发送给若干计算节点107以使若干计算节点107的访问请求指向主云管理平台104,客户端106进一步用于监测主云管理平台104当前运行是否异常,并且响应于异常,将第二IP地址发送给若干计算节点107以使若干计算节点107的访问请求切换到备云管理平台105。
为了进一步对本申请的技术方案的理解,下面对现有技术中实现主备云管理平台切换的方案进行阐述,图5示出了现有技术中主备云管理平台切换的示意图,如图5所示,主云管理平台和备云管理平台分别部署在两个不同的公网中,在公网中提供一个全局的DNS服务地址,比如本申请中的abc.com,各边缘计算集群内部的计算节点访问云管理平台时,通过公网DNS域名建立连接,由DNS服务将后端IP解析为当前可用的云平台地址;在云管理平台发生故障切换后,自动将域名的后端IP指向备云管理平台;边缘计算集群上的组件按照固定的云管理平台的域名自动重连,不需要修改配置。现有技术的这种主备云管理平台切换的方案,对于边缘计算集群而言,处理逻辑简单,但是需要依赖一个跨公有云服务商、甚至跨电信运营商的全局DNS服务,实现起来比较复杂,并且需要购买全局DNS服务,价格较为昂贵,对网络服务的要求较高。
与现有技术的主备云管理平台切换的方案相比,本申请的技术方案无需依赖全局DNS服务,不需要购买全局DNS服务,当云管理平台发生主备切换后,边缘计算集群中的计算节点自动上链到备云管理平台,节约成本,且实现起来简单并且可扩展,减少了对网络服务的要求。
根据本发明的若干实施例,客户端106进一步用于将第一IP地址或第二IP地址发送给若干计算节点107并启动若干计算节点107上运行的域名解析规则配置任务,以使若干计算节点107的访问请求指向对应的主云管理平台104或备云管理平台105。每个边缘计算集群103通过DNS域名访问主云管理平台104或者备云管理平台105,域名解析规则在计算节点107本地进行配置,无需全局DNS服务配置,可以实现云端101的主云管理平台104与备云管理平台105之间切换时,自动将边缘计算集群103中各计算节点107的本地DNS域名解析由主云管理平台104变更为备云管理平台105,边缘计算集群103中的计算节点107的服务组件断线重连即可,实现了即使在边缘计算单向网络的限制下,也可以实现云端101的主云管理平台104与备云管理平台105之间切换时,边缘计算集群103自动上链到当前连接的备云管理平台105的目的。
根据本发明的若干实施例,若干计算节点107用于根据接收的第一IP地址或第二IP地址以及域名解析规则配置任务将计算节点107的域名解析规则配置为预设统一域名与第一IP地址或第二IP地址的组合。通过设置统一域名和对应云管理平台IP地址组合的形式配置每一个计算节点107的域名解析规则,减少了计算复杂度,并且当云管理平台实现切换时无需计算节点107修改任何配置即可。
在一些实施例中,域名解析规则配置任务一般配置在/etc/hosts文件中,该域名解析规则配置任务可以实现对计算节点107的域名配置。比如,主云管理平台104的第一IP地址为22.33.44.55,备云管理平台105的第二IP地址为66.77.88.99,预设统一域名为abc.com,则计算节点107用于根据接收的第一IP地址或第二IP地址将其域名解析规则配置为abc.com 22.33.44.55或者abc.com 66.77.88.99。
根据本发明的若干实施例,若干计算节点107进一步用于响应于访问预设统一域名,基于组合中的第一IP地址或第二IP地址将其访问请求指向对应的主云管理平台104或备云管理平台105。对于计算节点107上的服务,只需要访问预设统一域名为abc.com,即可将其访问请求指向对应的主云管理平台104或备云管理平台105。实现了当计算节点107访问统一域名即可上链到对应的云管理平台,避免了对全部DNS服务的依赖。
在一些实施例中,若干计算节点107的访问请求基于第一IP地址22.33.44.55指向主云管理平台104,当发生主备切换时,若干计算节点107中的域名解析规则中的第一IP地址修改为第二IP地址66.77.88.99,若干计算节点107的访问请求基于第二IP地址66.77.88.99指向备云管理平台105。对于计算节点107而言,只需要访问预设统一域名为abc.com即可上链到对应的云管理平台,而不需要修改任何配置。
根据本发明的若干实施例,客户端106进一步用于响应于监测到主云管理平台104或所述备云管理平台105当前运行异常(如主云管理平台104异常),将主云管理平台104和备云管理平台105中的另一云管理平台的IP地址(如备云管理平台105的第二IP地址)发送给若干计算节点107并启动若干计算节点107的域名解析规则配置任务来修改其域名解析规则,以使若干计算节点107的访问请求切换到另一云管理平台,如切换到备云管理平台105。在一个示例中,当主云管理平台104当前运行异常,客户端106将其保存在本地的备云管理平台105的第二IP地址发送给若干计算节点107并同时启动若干计算节点107的域名解析规则配置任务来修改其域名解析规则即可,无需再次向云端101的主云管理平台104或者备云管理平台105发起请求,减少了与云端101的交互频率,提高了***整体的处理效率。
根据本发明的若干实施例,若干计算节点107用于根据接收的另一云管理平台的IP地址以及域名解析规则配置任务将其域名解析规则中当前的IP地址修改为另一云管理平台的IP地址,以得到预设统一域名与另一云管理平台的IP地址的组合,并且响应于访问预设统一域名,基于组合中的另一云管理平台的IP地址将其访问请求切换到另一云管理平台,如切换到备云管理平台105。在一个示例中,当云端101发生主云管理平台104切换为备云管理平台105时,只需将若干计算节点107中的解析规则中的第一IP地址修改为第二IP地址,即可上链到备云管理平台105上,实现了计算节点107通过预设统一域名无感知的切换到备云管理平台。
根据本发明的若干实施例,客户端106进一步用于按照预设周期监测当前连接的主云管理平台104或备云管理平台105当前运行是否异常。通过客户端106按周期监测,可以及时获取计算节点107当前所连接的主云管理平台104或备云管理平台105的健康状况,以提高***对云管理平台切换的响应速度。
在一些实施例中,通过自定义的预设周期监测当前连接的主云管理平台104或备云管理平台105当前运行状况,比如是否存在主动切换状态、云管理平台的健康状态、是否存在宕机、是否可以正常提供服务等指标。
根据本发明的若干实施例,客户端106进一步用于按照预设周期向当前连接的主云管理平台104的服务端108或备云管理平台105的服务端109的第一接口发起访问请求,并进一步根据第一接口的响应情况判断当前连接的主云管理平台104或备云管理平台105当前运行是否异常。根据第一接口的响应判断当前连接的主云管理平台104或备云管理平台105当前是否异常,提高***对云管理平台切换的响应速度。
根据本发明的若干实施例,客户端106进一步用于根据预设时间内未接收到第一接口的响应,判断当前连接的主云管理平台104或备云管理平台105当前运行异常。
根据本发明的若干实施例,客户端106进一步用于根据预设时间内向第一接口发起预设最大请求次数的访问请求仍未接收到第一接口的响应,判断当前连接的主云管理平台104或备云管理平台105当前运行异常。
根据本发明的若干实施例,客户端106进一步用于根据第一接口返回当前连接的主云管理平台104或备云管理平台105的当前状态为主动切换状态,判断当前连接的主云管理平台104或备云管理平台105当前运行异常。
上述列举的为客户端106根据第一接口的响应情况判断当前连接的主云管理平台104或备云管理平台105当前是否存在异常,以及时对需要进行主备云管理平台切换的情况进行及时切换,提供边端102的边缘计算集群103对云端101的主备云管理平台切换的响应速度。
在一些实施例中,云端101的主云管理平台104的服务端108或备云管理平台105的服务端109分别提供一个healthcheck接口,通过该healthcheck接口可以向客户端106返回当前连接的云管理平台的健康状态。比如,当healthcheck接口返回当前连接的云管理平台已主动切换,或者已故障切换的响应,客户端106再次为每个计算节点107启动一个修改本节点域名解析规则的任务,将边缘计算集群103内各计算节点107的域名解析配置为备云管理平台105,并同时开启对备云管理平台105的healthcheck接口的监测。当前连接的云管理平台的healthcheck接口连接失败时,基于配置的防抖动退避算法在预设时间内对healthcheck接口进行多次访问,图6示出的为基于防抖动退避算法对接口访问重试的流程图,如图6所示,当客户端106访问第一接口失败时,基于重试次数n和预设时间内最大重试次数m计算等待间隔,其中,重试次数n和重试基数t可以由用户指定,若达到最大访问次数m仍然失败,则判断当前连接的云管理平台异常。
根据本发明的若干实施例,主云管理平台104的服务端108和备云管理平台105的服务端109中分别存储主云管理平台104与备云管理平台105之间的关联。将为主备关系的主管理平台104和备管理平台105之间的主备关系分别存储在各自对应的服务器108和服务器109中,可以实现客户端106访问当前一个云管理平台可以获取互为主备关系的主管理平台104和备管理平台105各自的IP地址。
根据本发明的若干实施例,当前连接的主云管理平台104的服务端108或备云管理平台105的服务端109用于根据关联向客户端106返回主云管理平台104的第一IP地址和备云管理平台105的第二IP地址,并将其中当前连接的云管理平台对应的IP地址发送给若干计算节点107。客户端106可以根据当前所连接的云管理平台自适应将对应的IP地址发送给计算节点107,而无需依赖全局DNS服务将对应云管理平台的IP地址下发给计算节点107,当云管理平台发生主备切换后,边缘计算集群103中的计算节点107自动上链到备云管理平台105,节约成本。
在一些实施例中,请参照图7所示,本发明还提供了一种云管理平台切换的方法200,所述方法包括:
步骤201,响应于部署在边缘计算集群中的客户端接收到所述边缘计算集群的若干计算节点的注册请求,所述客户端将所述注册请求发送给主云管理平台的服务端;
步骤202,所述客户端接收所述主云管理平台的服务端返回的所述主云管理平台的第一IP地址和与所述主云管理平台关联的备云管理平台的第二IP地址,并将所述第一IP地址发送给所述若干计算节点,以基于所述第一IP地址使所述若干计算节点的访问请求指向所述主云管理平台;
步骤203,所述客户端监测所述主云管理平台当前运行是否异常;
步骤204,响应于所述客户端监测到所述主云管理平台当前运行异常,所述客户端将所述第二IP地址发送给所述若干计算节点,以基于所述第二IP地址使所述若干计算节点的访问请求切换到所述备云管理平台。
根据本发明的若干实施例,所述步骤202包括:所述客户端将所述第一IP地址或所述第二IP地址发送给所述若干计算节点并启动所述若干计算节点上运行的域名解析规则配置任务,以使所述若干计算节点的访问请求指向对应的所述主云管理平台或所述备云管理平台。
根据本发明的若干实施例,所述步骤202还包括:所述若干计算节点根据接收的所述第一IP地址或所述第二IP地址以及所述域名解析规则配置任务将其域名解析规则配置为预设统一域名与所述第一IP地址或所述第二IP地址的组合。
根据本发明的若干实施例,所述步骤202还包括:响应于访问所述预设统一域名,所述若干计算节点基于所述组合中的所述第一IP地址或所述第二IP地址将其访问请求指向对应的所述主云管理平台或所述备云管理平台。
根据本发明的若干实施例,所述步骤204包括:响应于所述客户端监测到当前连接的所述主云管理平台或所述备云管理平台当前运行异常,将所述主云管理平台和所述备云管理平台中的另一云管理平台的IP地址发送给所述若干计算节点并启动所述若干计算节点的域名解析规则配置任务来修改其域名解析规则,以使所述若干计算节点的访问请求切换到所述另一云管理平台。
根据本发明的若干实施例,所述步骤204还包括:所述若干计算节点根据接收的所述另一云管理平台的IP地址以及所述域名解析规则配置任务将其域名解析规则中当前的IP地址修改为所述另一云管理平台的IP地址,以得到预设统一域名与所述另一云管理平台的IP地址的组合,并且响应于访问所述预设统一域名,基于所述组合中的所述另一云管理平台的IP地址将其访问请求切换到所述另一云管理平台。
根据本发明的若干实施例,所述步骤203包括:所述客户端按照预设周期监测当前连接的所述主云管理平台或所述备云管理平台当前运行是否异常。
根据本发明的若干实施例,所述步骤203还包括:所述客户端按照所述预设周期向当前连接的所述主云管理平台或所述备云管理平台的服务端的第一接口发起访问请求,并进一步根据所述第一接口的响应情况判断当前连接的所述主云管理平台或所述备云管理平台当前运行是否异常。
根据本发明的若干实施例,所述步骤203还包括:所述客户端根据预设时间内未接收到所述第一接口的响应,判断当前连接的所述主云管理平台或所述备云管理平台当前运行异常。
根据本发明的若干实施例,所述步骤203还包括:所述客户端根据所述预设时间内向所述第一接口发起预设最大请求次数的访问请求仍未接收到所述第一接口的响应,判断当前连接的所述主云管理平台或所述备云管理平台当前运行异常。
根据本发明的若干实施例,所述步骤203还包括:所述客户端根据第一接口返回当前连接的所述主云管理平台或所述备云管理平台的当前状态为主动切换状态,判断当前连接的所述主云管理平台或所述备云管理平台当前运行异常。
根据本发明的若干实施例,所述主云管理平台的服务端和所述备云管理平台的服务端中分别存储所述主云管理平台与所述备云管理平台之间的关联。
根据本发明的若干实施例,所述步骤202还包括:当前连接的所述主云管理平台或所述备云管理平台的服务端根据所述关联向所述客户端返回所述主云管理平台的所述第一IP地址和所述备云管理平台的所述第二IP地址,并将其中当前连接的云管理平台对应的IP地址发送给所述若干计算节点。
根据本发明的另一方面,提供了一种电子设备,该电子设备可以是服务器,其内部结构图请参照图8和数据库。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该电子设备的数据库用于存储数据。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时实现以上所述的路由路径规划方法或以上所述的云管理平台切换的方法。
根据本发明的又一方面,提供了一种计算机可读存储介质,请参照图9所示,其上存储有计算机程序,计算机程序被处理器执行时实现以上所述的云管理平台切换的方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (16)

1.一种云管理平台切换的***,其特征在于,包括:
云端,包括主云管理平台和备云管理平台,所述主云管理平台和所述备云管理平台分别包括部署在其中的服务端;
边端,包括若干边缘计算集群,每个所述边缘计算集群包括一个部署在其中的客户端以及由其管理的若干计算节点,
其中,所述客户端用于将所述若干计算节点的注册请求发送给所述主云管理平台的服务端以及接收其返回的所述主云管理平台的第一IP地址和所述备云管理平台的第二IP地址,以及将所述第一IP地址发送给所述若干计算节点以使所述若干计算节点的访问请求指向所述主云管理平台,所述客户端进一步用于监测所述主云管理平台当前运行是否异常,并且响应于异常,将所述第二IP地址发送给所述若干计算节点以使所述若干计算节点的访问请求切换到所述备云管理平台。
2.根据权利要求1所述的云管理平台切换的***,其特征在于,所述客户端进一步用于将所述第一IP地址或所述第二IP地址发送给所述若干计算节点并启动所述若干计算节点上运行的域名解析规则配置任务,以使所述若干计算节点的访问请求指向对应的所述主云管理平台或所述备云管理平台。
3.根据权利要求2所述的云管理平台切换的***,其特征在于,所述若干计算节点用于根据接收的所述第一IP地址或所述第二IP地址以及所述域名解析规则配置任务将其域名解析规则配置为预设统一域名与所述第一IP地址或所述第二IP地址的组合。
4.根据权利要求3所述的云管理平台切换的***,其特征在于,所述若干计算节点进一步用于响应于访问所述预设统一域名,基于所述组合中的所述第一IP地址或所述第二IP地址将其访问请求指向对应的所述主云管理平台或所述备云管理平台。
5.根据权利要求1所述的云管理平台切换的***,其特征在于,所述客户端进一步用于响应于监测到当前连接的所述主云管理平台或所述备云管理平台当前运行异常,将所述主云管理平台和所述备云管理平台中的另一云管理平台的IP地址发送给所述若干计算节点并启动所述若干计算节点的域名解析规则配置任务来修改其域名解析规则,以使所述若干计算节点的访问请求切换到所述另一云管理平台。
6.根据权利要求5所述的云管理平台切换的***,其特征在于,所述若干计算节点用于根据接收的所述另一云管理平台的IP地址以及所述域名解析规则配置任务将其域名解析规则中当前的IP地址修改为所述另一云管理平台的IP地址,以得到预设统一域名与所述另一云管理平台的IP地址的组合,并且响应于访问所述预设统一域名,基于所述组合中的所述另一云管理平台的IP地址将其访问请求切换到所述另一云管理平台。
7.根据权利要求1所述的云管理平台切换的***,其特征在于,所述客户端进一步用于按照预设周期监测当前连接的所述主云管理平台或所述备云管理平台当前运行是否异常。
8.根据权利要求7所述的云管理平台切换的***,其特征在于,所述客户端进一步用于按照所述预设周期向当前连接的所述主云管理平台或所述备云管理平台的服务端的第一接口发起访问请求,并进一步根据所述第一接口的响应情况判断当前连接的所述主云管理平台或所述备云管理平台当前运行是否异常。
9.根据权利要求8所述的云管理平台切换的***,其特征在于,所述客户端进一步用于根据预设时间内未接收到所述第一接口的响应,判断当前连接的所述主云管理平台或所述备云管理平台当前运行异常。
10.根据权利要求9所述的云管理平台切换的***,其特征在于,所述客户端进一步用于根据所述预设时间内向所述第一接口发起预设最大请求次数的访问请求仍未接收到所述第一接口的响应,判断当前连接的所述主云管理平台或所述备云管理平台当前运行异常。
11.根据权利要求8所述的云管理平台切换的***,其特征在于,所述客户端进一步用于根据第一接口返回当前连接的所述主云管理平台或所述备云管理平台的当前状态为主动切换状态,判断当前连接的所述主云管理平台或所述备云管理平台当前运行异常。
12.根据权利要求1所述的云管理平台切换的***,其特征在于,所述主云管理平台的服务端和所述备云管理平台的服务端中分别存储所述主云管理平台与所述备云管理平台之间的关联。
13.根据权利要求12所述的云管理平台切换的***,其特征在于,当前连接的所述主云管理平台或所述备云管理平台的服务端用于根据所述关联向所述客户端返回所述主云管理平台的所述第一IP地址和所述备云管理平台的所述第二IP地址,并将其中当前连接的云管理平台对应的IP地址发送给所述若干计算节点。
14.一种云管理平台切换的方法,其特征在于,所述云管理平台切换的方法包括:
响应于部署在边缘计算集群中的客户端接收到所述边缘计算集群的若干计算节点的注册请求,所述客户端将所述注册请求发送给主云管理平台的服务端;
所述客户端接收所述主云管理平台的服务端返回的所述主云管理平台的第一IP地址和与所述主云管理平台关联的备云管理平台的第二IP地址,并将所述第一IP地址发送给所述若干计算节点,以基于所述第一IP地址使所述若干计算节点的访问请求指向所述主云管理平台;
所述客户端监测所述主云管理平台当前运行是否异常;
响应于所述客户端监测到所述主云管理平台当前运行异常,所述客户端将所述第二IP地址发送给所述若干计算节点,以基于所述第二IP地址使所述若干计算节点的访问请求切换到所述备云管理平台。
15. 一种电子设备,其特征在于,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现权利要求14所述方法的步骤。
16.一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时实现权利要求14所述方法的步骤的计算机程序。
CN202311801894.XA 2023-12-26 2023-12-26 一种云管理平台切换的***、方法、设备及介质 Active CN117478488B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311801894.XA CN117478488B (zh) 2023-12-26 2023-12-26 一种云管理平台切换的***、方法、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311801894.XA CN117478488B (zh) 2023-12-26 2023-12-26 一种云管理平台切换的***、方法、设备及介质

Publications (2)

Publication Number Publication Date
CN117478488A true CN117478488A (zh) 2024-01-30
CN117478488B CN117478488B (zh) 2024-03-19

Family

ID=89627794

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311801894.XA Active CN117478488B (zh) 2023-12-26 2023-12-26 一种云管理平台切换的***、方法、设备及介质

Country Status (1)

Country Link
CN (1) CN117478488B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101583024A (zh) * 2009-06-04 2009-11-18 中兴通讯股份有限公司 分布式网络视频监控***及其注册控制方法
CN102231677A (zh) * 2011-06-23 2011-11-02 中兴通讯股份有限公司 Iptv***中一种基于双中心容灾的切换方法及其装置
CN111917846A (zh) * 2020-07-19 2020-11-10 中信银行股份有限公司 一种Kafka集群切换方法、装置、***、电子设备及可读存储介质
CN112333108A (zh) * 2019-08-05 2021-02-05 南京中兴新软件有限责任公司 业务调度的方法及装置
CN116996369A (zh) * 2023-09-26 2023-11-03 苏州元脑智能科技有限公司 容器化管理服务器及其主备管理方法、装置和存储介质
CN117118814A (zh) * 2023-08-09 2023-11-24 广州盈风网络科技有限公司 基于多云管理平台的云资源切换方法、装置、设备及介质
CN117201507A (zh) * 2023-11-08 2023-12-08 苏州元脑智能科技有限公司 云平台切换方法、装置、电子设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101583024A (zh) * 2009-06-04 2009-11-18 中兴通讯股份有限公司 分布式网络视频监控***及其注册控制方法
CN102231677A (zh) * 2011-06-23 2011-11-02 中兴通讯股份有限公司 Iptv***中一种基于双中心容灾的切换方法及其装置
CN112333108A (zh) * 2019-08-05 2021-02-05 南京中兴新软件有限责任公司 业务调度的方法及装置
CN111917846A (zh) * 2020-07-19 2020-11-10 中信银行股份有限公司 一种Kafka集群切换方法、装置、***、电子设备及可读存储介质
CN117118814A (zh) * 2023-08-09 2023-11-24 广州盈风网络科技有限公司 基于多云管理平台的云资源切换方法、装置、设备及介质
CN116996369A (zh) * 2023-09-26 2023-11-03 苏州元脑智能科技有限公司 容器化管理服务器及其主备管理方法、装置和存储介质
CN117201507A (zh) * 2023-11-08 2023-12-08 苏州元脑智能科技有限公司 云平台切换方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN117478488B (zh) 2024-03-19

Similar Documents

Publication Publication Date Title
CN107465721B (zh) 基于双活架构的全局负载均衡方法和***及调度服务器
Kobo et al. Efficient controller placement and reelection mechanism in distributed control system for software defined wireless sensor networks
CN111130835A (zh) 数据中心双活***、切换方法、装置、设备及介质
CN112003721B (zh) 一种大数据平台管理节点高可用的实现方法及装置
CN112181660A (zh) 一种基于服务器集群的高可用方法
US9569319B2 (en) Methods for improved server redundancy in dynamic networks
US8370897B1 (en) Configurable redundant security device failover
CN117478488B (zh) 一种云管理平台切换的***、方法、设备及介质
Zhang et al. Reliability models for systems with internal and external redundancy
US11258632B2 (en) Unavailable inter-chassis link storage area network access system
CN113407382A (zh) 一种服务故障动态调控方法与***
Aglan et al. Reliability and scalability in SDN networks
CN111953808A (zh) 一种双机双活架构的数据传输切换方法及架构构建***
CN115484208A (zh) 一种基于云安全资源池的分布式引流***和方法
US10382301B2 (en) Efficiently calculating per service impact of ethernet ring status changes
CN115408199A (zh) 一种边缘计算节点的容灾处理方法及装置
CN113127271A (zh) 交易***的部署方法、装置、计算机设备和存储介质
CN112882771A (zh) 应用***的服务器切换方法及装置、存储介质及电子设备
US10277700B2 (en) Control plane redundancy system
US7484124B2 (en) Method and system for fault protection in communication networks, related network and computer program product
JPWO2020158016A1 (ja) バックアップシステム及びその方法並びにプログラム
Fujisaki et al. A scalable fault-tolerant network management system built using distributed object technology
KR100793446B1 (ko) 이중화 통신 시스템의 페일 오버 및 원복 처리 방법
CN112256497B (zh) 一种通用的高可用服务实现方法、***、介质及终端
US9019964B2 (en) Methods and systems for routing application traffic

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant