CN110677288A - 一种通用于多场景部署的边缘计算***及方法 - Google Patents

一种通用于多场景部署的边缘计算***及方法 Download PDF

Info

Publication number
CN110677288A
CN110677288A CN201910911688.1A CN201910911688A CN110677288A CN 110677288 A CN110677288 A CN 110677288A CN 201910911688 A CN201910911688 A CN 201910911688A CN 110677288 A CN110677288 A CN 110677288A
Authority
CN
China
Prior art keywords
management
host
service
management server
configuration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910911688.1A
Other languages
English (en)
Inventor
黄舒泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang 99Cloud Information Service Co Ltd
Original Assignee
Zhejiang 99Cloud Information Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang 99Cloud Information Service Co Ltd filed Critical Zhejiang 99Cloud Information Service Co Ltd
Priority to CN201910911688.1A priority Critical patent/CN110677288A/zh
Publication of CN110677288A publication Critical patent/CN110677288A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及边缘云计算领域,尤其涉及一种通用于多场景部署的边缘计算***及方法。该一种通用于多场景部署的边缘计算***及方法,包括云平台,其特征是:云平台内设有若干个管理服务器,分别为配置管理、故障管理、主机管理、服务管理和软件管理服务器。其益效果是:量级部署,可以灵活部署在较为恶劣的环境内工作,由于体量的减轻还提高了***的健壮性,当遇到服务器宕机时,***可以在极短的时间内自动复原并重新投入服务,减少了未来可能出现的***拓展带来的维护成本;且拥有超低延时,提高了对高复杂度计算的能力。

Description

一种通用于多场景部署的边缘计算***及方法
技术领域
本发明涉及边缘云计算领域,尤其涉及一种通用于多场景部署的边缘计算***及方法。
背景技术
现有技术中,随着5G技术的成熟,需要根据客户的需求在一些非传统科技力量强的偏远地区或区域性业务部署云操作***来满足其数据处理的要求,传统云操作***体量大,建构复杂度高,对部署环境要求较高,需要较大的机房;且传统云平台的管理方式无法远程配置和监控***,对***错误反应慢,运营成本和维护成本高。
发明内容
本发明的目的在于提供一种通用于多场景部署的边缘计算***及方法,本发明采用的技术方案是:
本发明一种通用于多场景部署的边缘计算***及方法,包括云平台,其特征是:云平台内设有若干个管理服务器,分别为配置管理、故障管理、主机管理、服务管理和软件管理服务器,其中,
配置管理负责进行各组件的安装配置,每次启动,***存量服务和控制器配置服务以及计算配置器服务都会被重新执行,保证***在重启后能快速恢复到正常配置;
故障管理可以统计报警次数和查看日志,同时包括了中心云和边缘云的物理和虚拟资源;
主机管理可对硬件资源进行监控,并从资源编排服务、服务管理、配置管理收集和同步虚拟机报警、关键进程和H/W故障;主机管理可以在虚拟主机关机的情况下,根据集群状态、关键进程、资源的阀值、物理主机的故障等使用不同的调度策略来进行对主机的自动重启;
服务管理使用了多路通道来避免通信的断开和服务的脑裂问题,并对服务的状态进行监控;
软件管理提供了对升级时虚拟机关机问题的生命周期管理机制,当需要热迁移时,自动把需要更新的主机上的资源转移到可用主机上,并在更新完成后自动将资源分配到更新完成的主机上。
进一步,所述主机管理可以在虚拟主机关机的情况下,根据集群状态、关键进程、资源的阀值、物理主机的故障等使用不同的调度策略来进行对主机的自动重启。
本发明具有的有益效果是:轻量级部署,可以灵活部署在较为恶劣的环境内工作,由于体量的减轻还提高了***的健壮性,当遇到服务器宕机时,***可以在极短的时间内自动复原并重新投入服务,减少了未来可能出现的***拓展带来的维护成本;且拥有超低延时,提高了对高复杂度计算的能力。
附图说明
图1为本发明的操作***架构图;
图2为本发明的配置管理原理图;
图3为本发明的故障管理原理图;
图4为本发明的主机管理原理图;
图5为本发明的服务管理原理图;
图6为本发明的软件管理原理图;
图7为本发明的传统云平台架构图;
具体实施方式
下面将结合附图和实施例对本发明作进一步的说明。
本发明的一种通用于多场景部署的边缘计算***及方法,包括云平台,其特征是:云平台内设有若干个管理服务器,分别为配置管理、故障管理、主机管理、服务管理和软件管理服务器,其中,
配置管理负责进行各组件的安装配置,每次启动,***存量服务和控制器配置服务以及计算配置器服务都会被重新执行,保证***在重启后能快速恢复到正常配置;
故障管理可以统计报警次数和查看日志,同时包括了中心云和边缘云的物理和虚拟资源;
主机管理可对硬件资源进行监控,并从资源编排服务、服务管理、配置管理收集和同步虚拟机报警、关键进程和H/W故障;主机管理可以在虚拟主机关机的情况下,根据集群状态、关键进程、资源的阀值、物理主机的故障等使用不同的调度策略来进行对主机的自动重启;
服务管理使用了多路通道来避免通信的断开和服务的脑裂问题,并对服务的状态进行监控;
软件管理提供了对升级时虚拟机关机问题的生命周期管理机制,当需要热迁移时,自动把需要更新的主机上的资源转移到可用主机上,并在更新完成后自动将资源分配到更新完成的主机上。
进一步,所述主机管理可以在虚拟主机关机的情况下,根据集群状态、关键进程、资源的阀值、物理主机的故障等使用不同的调度策略来进行对主机的自动重启。
以下以1+1高可用双控制节点控制集群为例进行***阐述和说明:
i.在图1中是本发明云操作***的完整架构图,该***架构设计包括控制节点、计算节点、存储节点、虚拟网元接口、运营支持***和业务支持***,其中云计算平台、虚拟机、分布式存储***是底层的三个组成部分;运营支持***和业务支持***将与控制节点交换数据,虚拟网元接口将与计算节点交换计算结果;在计算节点对虚拟机进行了优化,在网络部分引进了SR-IOV、OVS-DPDK、Intel网络加速方案;在存储节点集成分布式存储方案Ceph;在上层虚拟网元接口VNFs在虚拟机中部署虚拟的EPC、CPE来实现对电信网元的支持;
ii.图2是配置管理服务的原理图,由sysinv提供整个软件的状态管理、***配置的修改,由controllerconfig/conputeconfig负责根据物理节点的角色设置***配置;
iii.图3是故障管理的原理图,其他***模块通过FM-API直接给fm-manager发送报警和日志信息,故障管理的中心日志***可收集***内所有节点的日志信息;故障管理的报警***接收所有节点角色的报警信息;
iv.图4是主机管理服务的的原理图,改图展现了主机管理服务与其他管理服务与监控模块之间的协作关系,主机管理使用rmon监控中央处理器和内存的存量及用量监控;使用pmon管理基础进程,监控计算和块存储服务;使用hbs服务提供平台的心跳检测服务;使用hwmond服务对服务器BWC提供管理服务;使用MTC服务总管MTCE平台其他服务模块,对外提供接口;
v.图5是服务管理的原理图,服务管理由三个组成部件,其高可用控制器为冗余模型采用1+1高可用双控制节点控制集群,主控制与备用控制节点实时通信,当主控制节点发生故障时,将自动触发HA进程,切换备用节点为主控制节点,可以拓展为N+M或N个控制节点;其高可靠消息服务可使用最多三个独立通信路径以避免通信的脑裂问题,配置LAG保护链路的每条路径,使用HMAC SHA-512对消息进行身份验证;其服务监控可以是主动或被动监控;
vi.图6是软件管理的原理图,软件管理提供patch制作工具和patch的管理服务,支持热补丁和reboot required的补丁,更换内核补丁需要重启节点;通过虚拟机的实时迁移服务,在管理节点安装reboot补丁时保障业务不中断;
vii.图7是传统云平台架构图,作为补充说明,传统云平台将计算节点,网络节点和存储节点放置于同一由栈组成的资源池里,用户使用API调用资源池的对应资源,底层是物理存储、网络交换和服务器,同样的,也是由栈组成。
缩略语、英文和关键术语定义列表:
KVM(Kernel-based Virtual Machine):基于内核的虚拟机是一种用于Linux内核中的虚拟化基础设施,可将Linux内核转化为一个虚拟机监视器;
EPC(Evolved Packet Core):该***的特点为仅有分组域而无电路域、基于全IP结构、控制与承载分离且网络结构扁平化;
CPE(Customer Premise Equipment):一种接收移动信号并以无线WIFI信号转发出来的移动信号接入设备;
Ceph:一个开源的软件存储平台,在单个分布式电脑集群上应用对象存储,并提供对象级、块级或文件级存储的接口;
SR-IOV:一种虚拟化硬件加速方案,初衷是为了虚拟机之间共享网络资源;
OVS-DPDK:Open vSwitch与DPDK将结合的虚拟机加速方案。
本发明轻量级部署,可以灵活部署在较为恶劣的环境内工作,由于体量的减轻还提高了***的健壮性,当遇到服务器宕机时,***可以在极短的时间内自动复原并重新投入服务,减少了未来可能出现的***拓展带来的维护成本;且拥有超低延时,提高了对高复杂度计算的能力。
本发明不局限于上述实施方式,任何人应得知在本发明的启示下做出的与本发明具有相同或相近的技术方案,均落入本发明的保护范围之内。
本发明未详细描述的技术、形状、构造部分均为公知技术。

Claims (2)

1.一种通用于多场景部署的边缘计算***及方法,包括云平台,其特征是:云平台内设有若干个管理服务器,分别为配置管理、故障管理、主机管理、服务管理和软件管理服务器,其中,
配置管理负责进行各组件的安装配置,每次启动,***存量服务和控制器配置服务以及计算配置器服务都会被重新执行,保证***在重启后能快速恢复到正常配置;
故障管理可以统计报警次数和查看日志,同时包括了中心云和边缘云的物理和虚拟资源;
主机管理可对硬件资源进行监控,并从资源编排服务、服务管理、配置管理收集和同步虚拟机报警、关键进程和H/W故障;主机管理可以在虚拟主机关机的情况下,根据集群状态、关键进程、资源的阀值、物理主机的故障等使用不同的调度策略来进行对主机的自动重启;
服务管理使用了多路通道来避免通信的断开和服务的脑裂问题,并对服务的状态进行监控;
软件管理提供了对升级时虚拟机关机问题的生命周期管理机制,当需要热迁移时,自动把需要更新的主机上的资源转移到可用主机上,并在更新完成后自动将资源分配到更新完成的主机上。
2.根据权利要求1所述的一种通用于多场景部署的边缘计算***及方法,其特征是:所述主机管理可以在虚拟主机关机的情况下,根据集群状态、关键进程、资源的阀值、物理主机的故障等使用不同的调度策略来进行对主机的自动重启。
CN201910911688.1A 2019-09-25 2019-09-25 一种通用于多场景部署的边缘计算***及方法 Pending CN110677288A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910911688.1A CN110677288A (zh) 2019-09-25 2019-09-25 一种通用于多场景部署的边缘计算***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910911688.1A CN110677288A (zh) 2019-09-25 2019-09-25 一种通用于多场景部署的边缘计算***及方法

Publications (1)

Publication Number Publication Date
CN110677288A true CN110677288A (zh) 2020-01-10

Family

ID=69079017

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910911688.1A Pending CN110677288A (zh) 2019-09-25 2019-09-25 一种通用于多场景部署的边缘计算***及方法

Country Status (1)

Country Link
CN (1) CN110677288A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111597043A (zh) * 2020-05-14 2020-08-28 行星算力(深圳)科技有限公司 一种全场景边缘计算方法、装置及***
CN112737934A (zh) * 2020-12-28 2021-04-30 常州森普信息科技有限公司 一种集群式物联网边缘网关装置及方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113515316A (zh) * 2021-07-29 2021-10-19 广州高维网络科技有限公司 一种新型边缘云操作***

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113515316A (zh) * 2021-07-29 2021-10-19 广州高维网络科技有限公司 一种新型边缘云操作***

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
OPENINFRA: "StarlingX overview和功能点详解", 《检索自互联网:<URL: HTTPS://BLOG.CSDN.NET/OPENINFRA/ARTICLE/DETAILS/97299626 >》 *
OPENINFRA: "基于StarlingX的边缘计算机器学习优化", 《检索自互联网:<URL:HTTPS://BLOG.CSDN.NET/OPENINFRA/ARTICLE/DETAILS/89395640?SPM=1001.2101.3001.6650.1&UTM_MEDIUM=DISTRIBUTE.PC_RELEVANT.NONE-TASK-BLOG-2%7EDEFAULT%7EBLOGCOMMENDFROMBAIDU%7EDEFAULT-1.HIGHLIGHTWORDSCORE&DEPTH_1-UTM_SOURCE=DIS>》 *
凌云时刻: "【干货分享】电信云/边缘云虚拟层软件StarlingX介绍", 《检索自互联网:<URL:HTTPS://BLOG.CSDN.NET/BJCHENXU/ARTICLE/DETAILS/107036191>》 *
无: "OpenStack StarlingX组件详解", 《检索自互联网:<URL: HTTPS://WWW.SOHU.COM/A/273284053_609513》 *
李振江等: "边缘计算IaaS平台架构StarlingX研究", 《2019全国边缘计算学术研讨会论文集》 *
边缘计算社区: "一文读懂StarlingX", 《检索自互联网:<URL: HTTPS://BLOG.CSDN.NET/WEIXIN_41033724/ARTICLE/DETAILS/99145584>》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111597043A (zh) * 2020-05-14 2020-08-28 行星算力(深圳)科技有限公司 一种全场景边缘计算方法、装置及***
CN111597043B (zh) * 2020-05-14 2024-05-10 行星算力(深圳)科技有限公司 一种全场景边缘计算方法、装置及***
CN112737934A (zh) * 2020-12-28 2021-04-30 常州森普信息科技有限公司 一种集群式物联网边缘网关装置及方法

Similar Documents

Publication Publication Date Title
US5875290A (en) Method and program product for synchronizing operator initiated commands with a failover process in a distributed processing system
CN103346903B (zh) 一种双机备份的方法和装置
US6012150A (en) Apparatus for synchronizing operator initiated commands with a failover process in a distributed processing system
CN107147540A (zh) 高可用性***中的故障处理方法和故障处理集群
CN100426751C (zh) 保证集群***中配置信息一致的方法
CN101483540A (zh) 一种高端数据通信设备中的主备倒换方法
CN110134518B (zh) 一种提高大数据集群多节点应用高可用性的方法及***
CN102916825A (zh) 一种双机热备***的管理设备、管理方法及双机热备***
US20080307254A1 (en) Information-processing equipment and system therefor
CN108347339B (zh) 一种业务恢复方法及装置
CN114090184B (zh) 一种虚拟化集群高可用性的实现方法和设备
CN103532753A (zh) 一种基于内存换页同步的双机热备方法
CN113515316A (zh) 一种新型边缘云操作***
CN108469996A (zh) 一种基于自动快照的***高可用方法
CN113127270A (zh) 一种基于云计算的3取2安全计算机平台
CN110677288A (zh) 一种通用于多场景部署的边缘计算***及方法
CN102045187B (zh) 一种利用检查点实现高可用性***的方法和设备
WO2015116048A1 (en) Shutdown of computing devices
CN101938369B (zh) 综合网管接入管理***、管理方法及应用的网络管理***
CN102487332B (zh) 故障处理方法、装置和***
CN101686261A (zh) 一种基于rac的冗余服务器***
CN101557307B (zh) 调度自动化***应用状态管理方法
CN110399254A (zh) 一种服务器cmc双机热活方法、***、终端及存储介质
CN113472891B (zh) 一种sdn控制器集群数据处理方法、设备及介质
CN109117320A (zh) 基于云平台的配电自动化主站故障容灾处理***及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200110