CN115297124B - 一种***运维管理方法、装置及电子设备 - Google Patents

一种***运维管理方法、装置及电子设备 Download PDF

Info

Publication number
CN115297124B
CN115297124B CN202210877828.XA CN202210877828A CN115297124B CN 115297124 B CN115297124 B CN 115297124B CN 202210877828 A CN202210877828 A CN 202210877828A CN 115297124 B CN115297124 B CN 115297124B
Authority
CN
China
Prior art keywords
edge node
data
edge
preset
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210877828.XA
Other languages
English (en)
Other versions
CN115297124A (zh
Inventor
吴文峰
林洁琬
黄鹄
毛廷鸿
沈聪
全树强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianyi Cloud Technology Co Ltd
Original Assignee
Tianyi Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianyi Cloud Technology Co Ltd filed Critical Tianyi Cloud Technology Co Ltd
Priority to CN202210877828.XA priority Critical patent/CN115297124B/zh
Publication of CN115297124A publication Critical patent/CN115297124A/zh
Priority to PCT/CN2022/141396 priority patent/WO2024021469A1/zh
Application granted granted Critical
Publication of CN115297124B publication Critical patent/CN115297124B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1034Reaction to server failures by a load balancer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1031Controlling of the operation of servers by a load balancer, e.g. adding or removing servers that serve requests
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种***运维管理方法、装置及电子设备,该方法为:在***中新增代理服务器,基于新增代理服务器部署边缘节点状态监控任务,当监控到异常边缘节点时,从预设镜像数据库中确定出异常边缘节点对应的镜像数据,基于镜像数据执行异常边缘节点的恢复,和/或当基于自适应调度***预测预设时间内的业务流量波动趋势时,将***中边缘节点数量值依据预设列表从第一数量值调整为第二数量值,控制第二数量值的边缘节点处理业务流量。通过上述方法,依据短时流量走势,自适应调度边缘节点资源,使资源更有效利用;在边缘云上配置高可用应用、状态监控及镜像定时备份恢复任务,将中心云与边缘云协同运维,提升了运维自动化程度,确保了业务的连续性及可靠性。

Description

一种***运维管理方法、装置及电子设备
技术领域
本申请涉及云计算技术领域,尤其涉及一种***运维管理方法、装置及电子设备。
背景技术
随着云计算技术的发展,云计算越来越广泛的运用到生活中,比如:用户进行网络视频直播时,通常需要中心云与边缘云的支持,边缘云是一种全新的网络架构和开放平台,边缘云作为中心云的延伸,将中心云的部分服务和/或能力扩展到边缘基础设施之上,该能力包括存储、计算、网络、大数据、安全等,该开放平台在网络边缘侧整合了网络、计算、存储和应用的核心能力,边缘云改变了传统集中云的工作方式,可以向用户提供更加灵活的服务、更快的响应速度。
具体的,中心云与边缘云的作用不同、各自所属的硬件平台也不同,各自部署的服务也不同,中心云与边缘云的实际部署以及升级的过程中,中心云与边缘云都需要单独进行部署。
目前,由于中心云与边缘云需要单独进行运维管理,在业务流量有较大波动时,无法自适应纳管或释放边缘节点资源,从而导致在业务流量大时,边缘节点资源无法有效使用,业务流量小时,边缘节点的资源没有及时释放,造成不能自适应调度边缘节点资源,并且,边缘云和中心云需要单独运维管理,高可用的应用没有整合到一起,在新的节点接入或释放时,一些高可用的应用需要手动接入***,且对安装部署的镜像缺少有效的管理和维护,导致运维困难、且可靠性不足。
发明内容
本申请提供了一种***运维管理方法、装置及电子设备,用于提高***的可定性以及可靠性,并且,还用于实现了对***中边缘节点的自适应调度。
第一方面,本申请提供了一种***运维管理方法,所述方法包括:
在***中新增代理服务器,基于所述新增代理服务器部署边缘节点状态监控任务,其中,所述边缘节点状态监控任务用于监控所述***中各个边缘节点的状态;
当监控到异常边缘节点时,从预设镜像数据库中确定出所述异常边缘节点对应的镜像数据,并基于所述镜像数据执行所述异常边缘节点的恢复,其中,所述预设镜像数据库中存储了所述***中各个边缘节点用于恢复的备份镜像数据;和/或
当基于自适应调度***预测预设时间内的业务流量波动趋势时,将***中边缘节点数量值依据预设列表从第一数量值调整为第二数量值,并控制所述第二数量值的边缘节点处理所述业务流量。
在一种可能的设计中,在***中新增代理服务器,包括:
从所述新增代理服务器中部署高可用应用,并从所述高可用应用中确定出主服务器以及备用服务器;
基于所述主服务器与所述备用服务器生成虚拟IP地址,并将所述虚拟IP地址与所述主服务器绑定;
当检测到所述主服务器异常时,将所述虚拟IP地址与所述主服务器解绑,并将所述备用服务器与所述虚拟IP地址绑定,直至所述主服务器恢复。
在一种可能的设计中,当监控到异常边缘节点时,还包括:
确定出未响应所述心跳信息的第一边缘节点,并将所述第一边缘节点作为异常边缘节点,其中,所述心跳信息用于确定出异常边缘节点;和/或
确定出所述第二边缘节点的运行状态为等待状态时,响应于所述等待状态对应的等待时长超过预设时长,则将所述第二边缘节点作为异常边缘节点;和/或
确定出所述运行状态为正在恢复状态的第三边缘节点,并将所述第三边缘节点作为异常边缘节点。
在一种可能的设计中,基于所述业务流量将所述***中边缘节点的数量值从第一数量值调整为第二数量值,包括:
将所述边缘节点数据按照预设方式进行处理,获得所述边缘节点数据对应的参数值;
基于所述参数值以及预设流量预测模块获得所述业务流量在预设时间内的流量走势,其中,所述流量走势代表所述业务流量在所述预设时间之内的波动幅度;
基于所述流量走势将***中的边缘节点的数量值从第一数量值调整为第二数量值。
在一种可能的设计中,将所述边缘节点数据按照预设方式进行处理,获得所述边缘节点数据对应的参数值,包括:
提取出所述边缘节点数据中的各个类型的边缘数据,基于第一预设方法删除各个边缘数据中的无效数据,生成所述边缘节点数据对应的各组去噪数据,其中,所述无效数据为所述边缘节点数据中的重复数据以及与所述边缘节点数据中其他数据具有较大偏差的数据;
基于所述第二预设方法处理各组去噪数据,获得所述各组去噪数据各自对应的训练数据;
将所述各组训练数据输入预设模型中进行训练,获得所述各组训练数据各自对应的参数值。
在一种可能的设计中,将***中边缘节点数量值依据预设列表从第一数量值调整为第二数量值,并控制所述第二数量值的边缘节点处理所述业务流量,包括:
获得当前边缘节点的第一数量值,以及获得业务流量的总量;
基于所述总量从所述预设列表中确定出所述业务流量对应的边缘节点的第二数量值;
将所述第一数量值调整为第二数量值,并控制所述第二数量值的边缘节点处理所述业务流量。
第二方面,本申请提供了一种***运维管理装置,所述装置包括:
监控模块,用于在***中新增代理服务器,基于所述新增代理服务器部署边缘节点状态监控任务;
恢复模块,用于当监控到异常边缘节点时,从预设镜像数据库中确定出所述异常边缘节点对应的镜像数据,并基于所述镜像数据执行所述异常边缘节点的恢复;
调整模块,用于当基于自适应调度***预测预设时间内的业务流量波动趋势时,将***中边缘节点数量值依据预设列表从第一数量值调整为第二数量值,并控制所述第二数量值的边缘节点处理所述业务流量。
在一种可能的设计中,所述监控模块,具体用于从所述新增代理服务器中部署高可用应用,并从所述高可用应用中确定出主服务器以及备用服务器,基于所述主服务器与所述备用服务器生成虚拟IP地址,并将所述虚拟IP地址与所述主服务器绑定,当检测到所述主服务器异常时,将所述虚拟IP地址与所述主服务器解绑,并将所述备用服务器与所述虚拟IP地址绑定,直至所述主服务器恢复。
在一种可能的设计中,所述恢复模块,具体用于当监控到异常边缘节点时,还包括:确定出未响应所述心跳信息的第一边缘节点,并将所述第一边缘节点作为异常边缘节点,和/或确定出所述第二边缘节点的运行状态为等待状态时,响应于所述等待状态对应的等待时长超过预设时长,则将所述第二边缘节点作为异常边缘节点,和/或确定出所述运行状态为正在恢复状态的第三边缘节点,并将所述第三边缘节点作为异常边缘节点。
在一种可能的设计中,所述调整模块,具体用于将所述边缘节点数据按照预设方式进行处理,获得所述边缘节点数据对应的参数值,基于所述参数值以及预设流量预测模块获得所述业务流量在预设时间内的流量走势,基于所述流量走势将***中的边缘节点的数量值从第一数量值调整为第二数量值。
在一种可能的设计中,所述调整模块,还用于提取出所述边缘节点数据中的各个类型的边缘数据,基于第一预设方法删除各个边缘数据中的无效数据,生成所述边缘节点数据对应的各组去噪数据,基于所述第二预设方法处理各组去噪数据,获得所述各组去噪数据各自对应的训练数据,将所述各组训练数据输入预设模型中进行训练,获得所述各组训练数据各自对应的参数值。
在一种可能的设计中,所述调整模块,还用于获得当前边缘节点的第一数量值,以及获得业务流量的总量,基于所述总量从所述预设列表中确定出所述业务流量对应的边缘节点的第二数量值,将所述第一数量值调整为第二数量值,并控制所述第二数量值的边缘节点处理所述业务流量。
第三方面,本申请提供了一种电子设备,包括:
存储器,用于存放计算机程序;
处理器,用于执行所述存储器上所存放的计算机程序时,实现上述的一种***运维管理方法步骤。
第四方面,一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述的一种***运维管理方法步骤。
上述第一方面至第四方面中的各个方面以及各个方面可能达到的技术效果请参照上述针对第一方面或第一方面中的各种可能方案可以达到的技术效果说明,这里不再重复赘述。
附图说明
图1为本申请提供的一种***运维管理方法步骤的流程图;
图2为本申请提供的一种***运维管理装置的结构示意图;
图3为本申请提供的一种电子设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述。方法实施例中的具体操作方法也可以应用于装置实施例或***实施例中。需要说明的是,在本申请的描述中“多个”理解为“至少两个”。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。A与B连接,可以表示:A与B直接连接和A与B通过C连接这两种情况。另外,在本申请的描述中,“第一”、“第二”等词汇,仅用于区分描述的目的,而不能理解为指示或暗示相对重要性,也不能理解为指示或暗示顺序。
目前,在中心云与边缘云的***中,由于中心云与边缘云的作用不同,硬件平台不同,部署的服务也不同,中心云与边缘云都需要单独进行运维管理,中心云与边缘云高可用的应用没有整合在一起,在新的节点接入或释放时,一些高可用的应用需要手动接入***,且对安装部署的镜像缺少有效的管理和维护,导致***运维困难、且可靠性不足,并且,***中的边缘云节点无法自适应纳管或释放边缘节点资源,从而导致不能自适应调度边缘节点资源。
为了解决上述描述的问题,本申请实施例提供了一种***运维管理方法,用于实现***中边缘云资源的自适应调度以及提高***的高可用性以及稳定性。其中,本申请实施例所述方法和装置基于同一技术构思,由于方法及装置所解决问题的原理相似,因此装置与方法的实施例可以相互参见,重复之处不再赘述。
下面结合附图,对本申请实施例进行详细描述。
参照图1,本申请提供了一种***运维管理的方法,该方法可以提高***的高可用性以及稳定性,并且,能够使得***中的边缘云资源实现自适应调度,提高了边缘云资源的利用率,该方法的实现流程如下:
步骤S1:在***中存在新增代理服务器,基于所述新增代理服务器部署边缘节点状态监控任务。
本申请实施例是为了提高***的高可用性以及稳定性,为了使得***的运维管理更加便捷,在包括中心云以及边缘云的***中新增了两个代理服务器以及自适应调度***,该代理服务器基于配置高可用应用的方式实现对边缘云的运维管理,该高可用应用可以为边缘节点状态监控任务,还可以为镜像定时备份任务,还可以为负载均衡任务以及流量转发任务等,由于高可用应用能够基于***的实际运维情况进行调整,因此,这里不做一一说明。
上述描述的自适应调度***基于代理服务器发送的边缘节点数据预测接下来***中的业务流量,从而实现对边缘节点资源的自适应调度,基于上述描述代理服务器、高可用应用以及自适应调度模块的协同运维,能够实现对中心云以及边缘云的统一管理,在该***实时的运维管理中,上述服务以动态接入的方式自动连通至运维管理***中,从而提升了云边协同的运维能力。
进一步需要说明的是,在***中新增代理服务器时,该新增代理服务器至少包括:主服务器以及备用服务器,本申请实施例中的主服务器以及备用服务器的数量各为1,主服务器以及备用服务器的数量能够根据实际情况进行调整,这里不作过多说明。
具体的,主服务器与备用服务器之间存在虚拟IP地址,该虚拟IP地址与主服务器绑定,当检测到主服务器异常时,为了不影响***的运维,以及确保***中各个节点进行正常工作,备用服务器将代替主服务器进行工作,该虚拟IP地址将与主服务器解绑,并与备用服务器进行绑定,直至主服务器恢复。
上述描述的新增代理服务器用于在***中部署业务代理、流量转发、负载均衡和节点状态监控及多路径等服务,该新增代理服务器部署了边缘节点状态监控任务,该边缘节点状态监控任务用与监控***中各个边缘节点的状态。
基于上述的描述,当主服务器异常时,备用服务器代替主服务器进行工作,实现了***中的业务不中断,从而确保了***的稳定性以及高可用性。
步骤S2:当监控到异常边缘节点时,从预设镜像数据库中确定出所述异常边缘节点对应的镜像数据,并基于所述镜像数据执行所述异常边缘节点的恢复。
上述描述的边缘节点状态监控任务会向各个边缘节点发送心跳信息,当***中的边缘节点处于正常工作状态时,该边缘节点会对接收的心跳信息做出响应,因此,边缘节点状态监控任务能够基于边缘节点是否响应心跳信息从而判断出该边缘节点是否异常。另外,边缘节点状态监控任务还能够基于边缘节点的运行状态确定出边缘节点是否异常。
监控到***中出现异常边缘节点时,异常边缘节点出现的具体情况如下所示:
当确定出***中未响应心跳信息的第一边缘节点时,将该第一边缘节点作为异常边缘节点。和/或
当确定出***中运行状态为等待状态的第二边缘节点,当该第二边缘节点的等待状态对应的等待时长超过预设时长时,将第二边缘节点作为异常边缘节点。和/或
当确定出***中运行状态为正在恢复的第三边缘节点时,由于运行状态为正在恢复的边缘节点为恢复失败的边缘节点,因此,将第三边缘节点作为异常边缘节点。
确定出异常边缘节点之后,需要确定出异常边缘节点在预设镜像数据库中对应的镜像数据,该预设镜像数据库中存放了***中所有模块的镜像,预设镜像数据库可以为Docker镜像库,这里不做限定,确定出异常边缘节点对应的镜像数据之后,通过确定出的镜像数据对异常边缘节点进行恢复。
本申请实施例中的边缘节点状态监任务可以为crontab定时守护进程,该crontab命令常见于Unix和类Unix的操作***之中,用于设置周期性被执行的指令,边缘节点状态监控任务可以按照预设周期对***中的边缘节点进行检测,边缘节点的运行状态可以基于自动化运维工具获取,比如:ansible工具,当边缘节点状态异常时,***将显示边缘节点的状态为ERROR,则通过多路径服务将业务快速切换到预设服务器,预设服务器可以为BACKUP服务器,并发送消息到边缘节点镜像恢复任务。
边缘节点镜像恢复任务收到边缘节点状态监控任务的消息后,边缘节点镜像恢复任务会对接收的消息进行解析,然后从预设镜像库中找到对应节点的镜像数据,并使用预设命令进行镜像恢复,该预设命令可以为docker命令。
需要进行说明的是,为了确保能够实时对***中的异常边缘节点进行恢复,***中的镜像定时备份任务将对***中的各个边缘节点的镜像数据进行备份,具体的备份方法为通过ansible定时到各个集群节点容器查看并选择镜像进行备份。
基于上述的方法,当***中出现异常边缘节点时,通过对各个边缘节点的镜像备份数据对异常边缘节点进行快速恢复,实现***中对异常边缘节点的更新,确保了***中边缘节点的正常状态,使得***部署更加灵活,以及提高了***运维的便捷性。
步骤S3:当基于自适应调度***预测预设时间内的业务流量波动趋势时,将***中边缘节点数量值依据预设列表从第一数量值调整为第二数量值,并控制所述第二数量值的边缘节点处理所述业务流量。
在本申请实施例中的***运维管理方法中,还包括对边缘节点资源的自适应调度,用于实现边缘节点资源的高利用率,边缘节点资源的自适应调度的具体过程如下:
当基于自适应调度***预测预设时间内的业务流量波动趋势时,需要实时获取边缘节点的边缘节点数据,该边缘节点数据中至少包括:请求错误率、CPU负载、内存使用率、丢包率等,该边缘节点数据中包含了多种类型的边缘数据,由于各个边缘数据中包含了无效数据,该无效数据为边缘数据中的重复数据以及与业务数据中其他数据具有较大偏差的数据,因此,需要将无效数据从各个边缘数据中删除。
具体的,基于第一预设方法将各个业务数据中的无效数据进行删除,第一预设方法具体为:将删除无效数据的各个业务数据通过k-近邻法进行去噪,基于k-近邻法处理数据为本领域人员公知的技术,因此,这里对基于k-近邻法对数据进行去噪的详细过程不作具体阐述。
基于k-近邻法能够将各个边缘数据中的距离5个近邻距离超过阈值的数据作为异常数据进行删除,并生成各个边缘数据对应的去噪数据,获得边缘节点数据对应的各组去噪数据。
获得业务流量的各组去噪数据之后,需要将各组去噪数据进行归一化处理,将各组去噪数据的参数统一到一个大致相同的数值区间,本申请实施例中可以采用离差标准化方法对性能参数进行数据归一化处理,获得各组去噪数据对应的训练数据。
获得训练数据之后,需要将训练数据输入预设模型中进行训练,该预设模型中的训练方法至少包括:多参数拟合、相关系数、线性回归算法等,获得各组训练数据对应的参数值。
***检测到业务流量对应的一系列参数值之后,能够基于各个参数值以及预设流量预测模块确定出业务流量在预设时间之内的流量走势,该流量走势代表业务流量在预设时间之内的波动幅度。
比如:边缘节点数据如表1所示:
边缘节点数据 边缘数据
a {1.2、2.3、2.4、5.7、2.3、1.9、3.2、6、1.2}
b {2.1、1.9、3.3、2.2、2.8、1.6、1.2、3、3.2}
c {1.7、2.6、1.4、3.6、1.3、1.7、1.2、3、2.2}
...... ......
表1
上述表1中记录了边缘节点数据的部分边缘数据,上述表1中只例举了3组边缘数据,每一组边缘数据中有9个参数,并且,各组业务数据为经过去重之后的数据,对9个参数进行训练以及归一化,由于上述已经描述了将数据进行归一化的方法,因此,这里不作过多阐述。
基于上述表1中的各组边缘数据,对各组边缘数据进行训练以及归一化之后,获得如下表2:
边缘节点数据 参数值
a 2.6
b 3.1
c 1.8
...... ......
表2
在上述表2中,例举了3组边缘数据分别对应的参数值,边缘数据a对应参数值为2.6,边缘数据b对应的参数值为3.1,边缘数据c对应的参数值为1.8,基于该参数值能够确定出业务流量对应的流量走势,其他边缘数据以及其他边缘数据对应的参数值参考上述表2,这里不作过多阐述。
确定出该业务流量的流量走势之后,基于该流量走势对***中边缘节点的数量值从第一数量值调整为第二数量值。
将边缘节点的数量值进行调整的具体方式如下:获得当前边缘节点的第一数量值,为了能够确定出业务数据的流量走势,需要获得业务流量的总量,基于该总量从预设列表中确定出业务流量的总量对应的边缘节点的第二数量值,该预设列表记录了业务流量的总量与边缘节点的第二数量值之间的对应关系,该预设列表如下所示:
业务流量的总量 边缘节点的第二数量值
90 10
100 20
110 30
...... ......
表3
上述表3中,每一个业务流量的总量都各自对应边缘节点的第二数量值,上述表3只是列举了3个例子用于说明业务总量与第二数量值之间的对应关系,其他业务流量的总量各自对应的边缘节点的第二数量值参考上述表3中的例子,这里不作一一列举。
通过上述表3,确定出当前***中边缘节点的第一数量值,再基于业务流量的流量走势将第一数量值调整为第二数量值,从而在对业务流量进行处理之前就确定出边缘节点的数量,进而实现了对边缘节点资源的有效调度。
当流量走势较大时,***能够纳管新的边缘节点,从而达到减少边缘节点的压力的目的;当流量走势较小时,***能够释放边缘节点,并将释放的边缘节点的业务流量进行转发,使得边缘节点的资源能够有效利用。
基于上述的描述,当基于自适应调度***预测预设时间内的业务流量波动趋势时,能够基于边缘节点的负载情况对边缘节点的数量进行调整,避免了各个边缘节点处理业务流量时超负荷的问题,并且,对业务流量进行处理之后,得到业务流量对应的参数值,再获得业务流量对应的流量走势,从而基于流量走势***中的边缘节点的数量进行调整,确保了边缘节点数量的自适应调整,提高了边缘节点的利用率。
基于同一发明构思,本申请实施例中还提供了一种***运维管理装置,该***运维管理装置用于实现了一种***运维管理方法的功能,参照图2,所述装置包括:
监控模块201,用于在***中新增代理服务器,基于所述新增代理服务器部署边缘节点状态监控任务;
恢复模块202,用于当监控到异常边缘节点时,从预设镜像数据库中确定出所述异常边缘节点对应的镜像数据,并基于所述镜像数据执行所述异常边缘节点的恢复;
调整模块203,用于当基于自适应调度***预测预设时间内的业务流量波动趋势时,将***中边缘节点数量值依据预设列表从第一数量值调整为第二数量值,并控制所述第二数量值的边缘节点处理所述业务流量。
在一种可能的设计中,所述监控模块201,具体用于从所述新增代理服务器中部署高可用应用,并从所述高可用应用中确定出主服务器以及备用服务器,基于所述主服务器与所述备用服务器生成虚拟IP地址,并将所述虚拟IP地址与所述主服务器绑定,当检测到所述主服务器异常时,将所述虚拟IP地址与所述主服务器解绑,并将所述备用服务器与所述虚拟IP地址绑定,直至所述主服务器恢复。
在一种可能的设计中,所述恢复模块202,具体用于当监控到异常边缘节点时,还包括:确定出未响应所述心跳信息的第一边缘节点,并将所述第一边缘节点作为异常边缘节点,和/或确定出所述第二边缘节点的运行状态为等待状态时,响应于所述等待状态对应的等待时长超过预设时长,则将所述第二边缘节点作为异常边缘节点,和/或确定出所述运行状态为正在恢复状态的第三边缘节点,并将所述第三边缘节点作为异常边缘节点。
在一种可能的设计中,所述调整模块203,具体用于将所述边缘节点数据按照预设方式进行处理,获得所述边缘节点数据对应的参数值,基于所述参数值以及预设流量预测模块获得所述业务流量在预设时间内的流量走势,基于所述流量走势将***中的边缘节点的数量值从第一数量值调整为第二数量值。
在一种可能的设计中,所述调整模块203,还用于提取出所述边缘节点数据中的各个类型的边缘数据,基于第一预设方法删除各个边缘数据中的无效数据,生成所述边缘节点数据对应的各组去噪数据,基于所述第二预设方法处理各组去噪数据,获得所述各组去噪数据各自对应的训练数据,将所述各组训练数据输入预设模型中进行训练,获得所述各组训练数据各自对应的参数值。
在一种可能的设计中,所述调整模块203,还用于获得当前边缘节点的第一数量值,以及获得业务流量的总量,基于所述总量从所述预设列表中确定出所述业务流量对应的边缘节点的第二数量值,将所述第一数量值调整为第二数量值,并控制所述第二数量值的边缘节点处理所述业务流量。
基于同一发明构思,本申请实施例中还提供了一种电子设备,所述电子设备可以实现前述一种***运维管理装置的功能,参考图3,所述电子设备包括:
至少一个处理器301,以及与至少一个处理器301连接的存储器302,本申请实施例中不限定处理器301与存储器302之间的具体连接介质,图3中是以处理器301和存储器302之间通过总线300连接为例。总线300在图3中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线300可以分为地址总线、数据总线、控制总线等,为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。或者,处理器301也可以称为控制器,对于名称不做限制。
在本申请实施例中,存储器302存储有可被至少一个处理器301执行的指令,至少一个处理器301通过执行存储器302存储的指令,可以执行前文论述的一种***运维管理方法。处理器301可以实现图2所示的装置中各个模块的功能。
其中,处理器301是该装置的控制中心,可以利用各种接口和线路连接整个该控制设备的各个部分,通过运行或执行存储在存储器302内的指令以及调用存储在存储器302内的数据,该装置的各种功能和处理数据,从而对该装置进行整体监控。
在一种可能的设计中,处理器301可包括一个或多个处理单元,处理器301可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器301中。在一些实施例中,处理器301和存储器302可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
处理器301可以是通用处理器,例如中央处理器(CPU)、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的一种***运维管理方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器302作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器302可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器302是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器302还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
通过对处理器301进行设计编程,可以将前述实施例中介绍的一种***运维管理方法所对应的代码固化到芯片内,从而使芯片在运行时能够执行图1所示的实施例的一种***运维管理步骤。如何对处理器301进行设计编程为本领域技术人员所公知的技术,这里不再赘述。
基于同一发明构思,本申请实施例还提供一种存储介质,该存储介质存储有计算机指令,当该计算机指令在计算机上运行时,使得计算机执行前文论述的一种***运维管理方法。
在一些可能的实施方式中,本申请提供一种***运维管理方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在装置上运行时,程序代码用于使该控制设备执行本说明书上述描述的根据本申请各种示例性实施方式的一种***运维管理方法中的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (8)

1.一种***运维管理方法,其特征在于,包括:
在***中新增代理服务器,基于所述新增代理服务器部署边缘节点状态监控任务,其中,所述边缘节点状态监控任务用于监控所述***中各个边缘节点的状态;
当监控到异常边缘节点时,从预设镜像数据库中确定出所述异常边缘节点对应的镜像数据,并基于所述镜像数据执行所述异常边缘节点的恢复,其中,所述预设镜像数据库中存储了所述***中各个边缘节点用于恢复的备份镜像数据;
当基于自适应调度***预测预设时间内的业务流量波动趋势时,提取出所述边缘节点数据中的各个类型的边缘数据,基于第一预设方法删除各个边缘数据中的无效数据,生成所述边缘节点数据对应的各组去噪数据,其中,所述无效数据为所述边缘节点数据中的重复数据以及与所述边缘节点数据中其他数据具有较大偏差的数据;
基于第二预设方法处理各组去噪数据,获得所述各组去噪数据各自对应的训练数据;
将所述各组训练数据输入预设模型中进行训练,获得所述各组训练数据各自对应的参数值;
基于所述参数值以及预设流量预测模块获得所述业务流量在预设时间内的流量走势,其中,所述流量走势代表所述业务流量在所述预设时间之内的波动幅度;
基于所述流量走势以及预设列表将***中的边缘节点的数量值从第一数量值调整为第二数量值,并控制所述第二数量值的边缘节点处理所述业务流量,其中,所述预设列表为所述业务流量与边缘节点数量的对应关系。
2.如权利要求1所述的方法,其特征在于,在***中新增代理服务器,包括:
从所述新增代理服务器中部署高可用应用,并从所述高可用应用中确定出主服务器以及备用服务器;
基于所述主服务器与所述备用服务器生成虚拟IP地址,并将所述虚拟IP地址与所述主服务器绑定;
当检测到所述主服务器异常时,将所述虚拟IP地址与所述主服务器解绑,并将所述备用服务器与所述虚拟IP地址绑定,直至所述主服务器恢复。
3.如权利要求1所述的方法,其特征在于,当监控到异常边缘节点时,还包括:
确定出未响应心跳信息的第一边缘节点,并将所述第一边缘节点作为异常边缘节点,其中,所述心跳信息用于确定出异常边缘节点;和/或
确定出第二边缘节点的运行状态为等待状态时,响应于所述等待状态对应的等待时长超过预设时长,则将所述第二边缘节点作为异常边缘节点;和/或
确定出所述运行状态为正在恢复状态的第三边缘节点,并将所述第三边缘节点作为异常边缘节点。
4.如权利要求1所述的方法,其特征在于,基于所述流量走势以及预设列表将***中的边缘节点数量值从第一数量值调整为第二数量值,并控制所述第二数量值的边缘节点处理所述业务流量,包括:
获得当前边缘节点的第一数量值,以及获得业务流量的总量;
基于所述总量从所述预设列表中确定出所述业务流量对应的边缘节点的第二数量值;
将所述第一数量值调整为第二数量值,并控制所述第二数量值的边缘节点处理所述业务流量。
5.一种***运维管理装置,其特征在于,包括:
监控模块,用于在***中新增代理服务器,基于所述新增代理服务器部署边缘节点状态监控任务;
恢复模块,用于当监控到异常边缘节点时,从预设镜像数据库中确定出所述异常边缘节点对应的镜像数据,并基于所述镜像数据执行所述异常边缘节点的恢复;
调整模块,用于当基于自适应调度***预测预设时间内的业务流量波动趋势时,提取出所述边缘节点数据中的各个类型的边缘数据,基于第一预设方法删除各个边缘数据中的无效数据,生成所述边缘节点数据对应的各组去噪数据,基于第二预设方法处理各组去噪数据,获得所述各组去噪数据各自对应的训练数据,将所述各组训练数据输入预设模型中进行训练,获得所述各组训练数据各自对应的参数值,基于所述参数值以及预设流量预测模块获得所述业务流量在预设时间内的流量走势,基于所述流量走势以及预设列表将***中的边缘节点的数量值从第一数量值调整为第二数量值,并控制所述第二数量值的边缘节点处理所述业务流量。
6.如权利要求5所述的装置,其特征在于,所述监控模块,具体用于从所述新增代理服务器中部署高可用应用,并从所述高可用应用中确定出主服务器以及备用服务器,基于所述主服务器与所述备用服务器生成虚拟IP地址,并将所述虚拟IP地址与所述主服务器绑定,当检测到所述主服务器异常时,将所述虚拟IP地址与所述主服务器解绑,并将所述备用服务器与所述虚拟IP地址绑定,直至所述主服务器恢复。
7.一种电子设备,其特征在于,包括:
存储器,用于存放计算机程序;
处理器,用于执行所述存储器上所存放的计算机程序时,实现权利要求1-4任一项所述的方法步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-4任一项所述的方法步骤。
CN202210877828.XA 2022-07-25 2022-07-25 一种***运维管理方法、装置及电子设备 Active CN115297124B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210877828.XA CN115297124B (zh) 2022-07-25 2022-07-25 一种***运维管理方法、装置及电子设备
PCT/CN2022/141396 WO2024021469A1 (zh) 2022-07-25 2022-12-23 一种***运维管理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210877828.XA CN115297124B (zh) 2022-07-25 2022-07-25 一种***运维管理方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN115297124A CN115297124A (zh) 2022-11-04
CN115297124B true CN115297124B (zh) 2023-08-04

Family

ID=83824243

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210877828.XA Active CN115297124B (zh) 2022-07-25 2022-07-25 一种***运维管理方法、装置及电子设备

Country Status (2)

Country Link
CN (1) CN115297124B (zh)
WO (1) WO2024021469A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115297124B (zh) * 2022-07-25 2023-08-04 天翼云科技有限公司 一种***运维管理方法、装置及电子设备
CN116450356B (zh) * 2023-04-21 2024-02-02 珠海创投港珠澳大桥珠海口岸运营管理有限公司 一种基于云管控的跨境物流管理方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111355610A (zh) * 2020-02-25 2020-06-30 网宿科技股份有限公司 一种基于边缘网络的异常处理方法及装置
CN111756800A (zh) * 2020-05-21 2020-10-09 网宿科技股份有限公司 一种处理突发流量的方法和***
CN112822283A (zh) * 2021-01-21 2021-05-18 重庆紫光华山智安科技有限公司 边缘节点的控制方法、装置、控制节点及存储介质
CN113315719A (zh) * 2020-02-27 2021-08-27 阿里巴巴集团控股有限公司 流量调度方法、设备、***及存储介质
CN114499979A (zh) * 2021-12-28 2022-05-13 云南电网有限责任公司信息中心 一种基于联邦学习的sdn网络异常流量协同检测方法
CN114679463A (zh) * 2022-05-09 2022-06-28 苏州思萃工业互联网技术研究所有限公司 一种实现pcdn资源管理的方法和装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3229405B1 (en) * 2015-12-31 2020-07-15 Huawei Technologies Co., Ltd. Software defined data center and scheduling and traffic-monitoring method for service cluster therein
CN110838932A (zh) * 2018-08-17 2020-02-25 阿里巴巴集团控股有限公司 网络限流方法、装置以及电子设备
CN111314149B (zh) * 2020-02-26 2023-07-18 赛特斯信息科技股份有限公司 基于多个边缘云平台实现统一监控运维管理的***
US20220104127A1 (en) * 2020-09-25 2022-03-31 Samsung Electronics Co., Ltd. Method and apparatus for power management in a wireless communication system
US11941879B2 (en) * 2020-10-22 2024-03-26 Mineral Earth Sciences Llc Edge-based processing of agricultural data
CN112511456B (zh) * 2020-12-21 2024-03-22 北京百度网讯科技有限公司 流量控制方法、装置、设备、存储介质和计算机程序产品
US20220116289A1 (en) * 2021-12-22 2022-04-14 Palaniappan Ramanathan Adaptive cloud autoscaling
CN115297124B (zh) * 2022-07-25 2023-08-04 天翼云科技有限公司 一种***运维管理方法、装置及电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111355610A (zh) * 2020-02-25 2020-06-30 网宿科技股份有限公司 一种基于边缘网络的异常处理方法及装置
CN113315719A (zh) * 2020-02-27 2021-08-27 阿里巴巴集团控股有限公司 流量调度方法、设备、***及存储介质
CN111756800A (zh) * 2020-05-21 2020-10-09 网宿科技股份有限公司 一种处理突发流量的方法和***
CN112822283A (zh) * 2021-01-21 2021-05-18 重庆紫光华山智安科技有限公司 边缘节点的控制方法、装置、控制节点及存储介质
CN114499979A (zh) * 2021-12-28 2022-05-13 云南电网有限责任公司信息中心 一种基于联邦学习的sdn网络异常流量协同检测方法
CN114679463A (zh) * 2022-05-09 2022-06-28 苏州思萃工业互联网技术研究所有限公司 一种实现pcdn资源管理的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
云计算***中基于边缘节点和容量的延迟分析;刘嵩; 李文蕙;《计算机应用于软件》;第31卷(第04期);全文 *

Also Published As

Publication number Publication date
WO2024021469A1 (zh) 2024-02-01
CN115297124A (zh) 2022-11-04

Similar Documents

Publication Publication Date Title
CN115297124B (zh) 一种***运维管理方法、装置及电子设备
CN106951559B (zh) 分布式文件***中数据恢复方法及电子设备
CN109656742B (zh) 一种节点异常处理方法、装置及存储介质
CN102385541B (zh) 受控的数据中心服务的自动复原
CN109286529B (zh) 一种恢复RabbitMQ网络分区的方法及***
CN105229613A (zh) 协调分布式***中的故障恢复
CN106789141B (zh) 一种网关设备故障处理方法及装置
CN106874142B (zh) 一种实时数据容错处理方法及***
CN112477919B (zh) 一种适用于列车控制***平台的动态冗余备份方法及***
CN103414712A (zh) 一种分布式虚拟桌面管理***和方法
CN116340005B (zh) 容器集群的调度方法、装置、设备及存储介质
CN1322422C (zh) 在可修复的故障后使群集器***自动投入运行的方法和设备
CN108268305A (zh) 用于虚拟机自动扩缩容的***和方法
CN110399152A (zh) 一种设备***双备份升级方法及装置
CN108170507B (zh) 虚拟应用管理方法/***、计算机可读存储介质及服务端
CN112395124A (zh) 集群环境下机器人异常的管控方法及装置
CN111209084B (zh) 一种faas分布式计算方法和装置
CN113132176B (zh) 一种控制边缘节点的方法、节点及边缘计算***
CN113489149B (zh) 基于实时状态感知的电网监控***业务主节点选取方法
CN109725916B (zh) 流处理的拓扑结构更新***和方法
CN116400987B (zh) 持续集成方法、装置、电子设备及存储介质
CN112269693B (zh) 一种节点自协调方法、装置和计算机可读存储介质
CN109032674B (zh) 一种多进程管理方法、***及网络设备
CN112612604B (zh) 基于Actor模型的任务调度方法、装置
CN115291891A (zh) 一种集群管理的方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant