CN110086674A - 一种基于容器的应用高可用实现方法及*** - Google Patents

一种基于容器的应用高可用实现方法及*** Download PDF

Info

Publication number
CN110086674A
CN110086674A CN201910371627.0A CN201910371627A CN110086674A CN 110086674 A CN110086674 A CN 110086674A CN 201910371627 A CN201910371627 A CN 201910371627A CN 110086674 A CN110086674 A CN 110086674A
Authority
CN
China
Prior art keywords
container
cluster
monitoring
warning information
management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910371627.0A
Other languages
English (en)
Inventor
石光银
高传集
蔡卫卫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Inspur Cloud Information Technology Co Ltd
Original Assignee
Shandong Inspur Cloud Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Inspur Cloud Information Technology Co Ltd filed Critical Shandong Inspur Cloud Information Technology Co Ltd
Priority to CN201910371627.0A priority Critical patent/CN110086674A/zh
Publication of CN110086674A publication Critical patent/CN110086674A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Emergency Alarm Devices (AREA)

Abstract

本发明公开了一种基于容器的应用高可用实现方法及***,属于容器的应用技术领域。本发明基于容器的应用高可用实现方法,在容器服务器集群中部署监控告警***、告警信息管理组件和告警规则配置管理组件,监控告警***加载告警规则后,监控容器服务器集群资源,触发告警规则后,通过告警信息管理组件发送告警信息至集群管理后台应用,存储告警信息,用户通过集群管理浪潮云界面查看告警信息,运维人员通过集群管理运维界面查看集群的告警信息。该发明的基于容器的应用高可用实现方法可以实时监控浪潮云容器服务资源使用情况,同时,能保证基于浪潮云容器服务提供的应用高可用,保证应用稳定性,具有很好的推广应用价值。

Description

一种基于容器的应用高可用实现方法及***
技术领域
本发明涉及容器的应用技术领域,具体提供一种基于容器的应用高可用实现方法及***。
背景技术
近年来,容器技术是比较流行的提供微服务的paas技术,而kubernetes即容器服务编排程序是近期最流行的容器编排管理技术,各互联网厂商相继推出了基于容器服务编排程序的公有云容器服务。
容器服务编排程序是一个全新的基于容器技术的分布式架构领先方案,在Docker即容器引擎技术的基础上,为容器化的应用提供部署运行、资源调度、服务发现和动态伸缩等一系列完整功能,提高了大规模容器集群管理的便捷性和高可用性。浪潮云容器服务提供了一种应用高可用的实现方法,能够使应用自动化伸缩,保证应用的高可用,同时保证了集群的资源利用率。应用可以在高峰期扩容,能够保证应用的性能,可以在低峰期缩容,能够保证集群的资源不浪费。
发明内容
本发明的技术任务是针对上述存在的问题,提供一种可以实时监控浪潮云容器服务资源使用情况,同时,能保证基于浪潮云容器服务提供的应用高可用,保证应用稳定性的基于容器的应用高可用实现方法。
本发明进一步的技术任务是提供一种基于容器的应用高可用实现***。
为实现上述目的,本发明提供了如下技术方案:
一种基于容器的应用高可用实现方法,该方法在容器服务器集群中部署监控告警***、告警信息管理组件和告警规则配置管理组件,监控告警***加载告警规则后,监控容器服务器集群资源,触发告警规则后,通过告警信息管理组件发送告警信息至集群管理后台应用,存储告警信息,用户通过集群管理浪潮云界面查看告警信息,运维人员通过集群管理运维界面查看集群的告警信息。
该基于容器的应用高可用实现方法在具体的过程中,k8s集群触发告警信息,通过发送短信的方式将告警信息发送告警短信,并可以发送告警邮件。通过应用伸缩组触发应用自动伸缩,用户可以直接查看告警信息,也可以通过查看告警短信和告警邮件查看告警信息,根据触发的应用自动伸缩制定应用纵向伸缩或应用横向伸缩。用户访问应用,应用自动伸缩,并将应用返回给用户。
作为优选,通过告警信息管理组件发送告警信息至集群管理后台应用,存储告警信息,通过emai或短信的方式发送告警信息。
作为优选,所述容器服务器集群为两个,每个容器服务器集群中均部署监控告警***、告警信息管理组件和告警规则配置管理组件。
作为优选,所述容器服务器集群为k8s集群。
作为优选,该方法中,应用横向伸缩管理容器组部署资源和副本集,应用横向伸缩通过监控告警***获取pod的监控数据后,调用容器组部署资源和副本集触发横向伸缩,修改pod的个数。
作为优选,应用横向伸缩通过监控指标获取监控信息,监控指标包括内置监控指标器、自定义监控指标器和外部扩展监控指标器,自定义监控指标器和外部扩展监控指标器通过监控指标汇集器获取监控数据。
作为优选,监控指标汇集器调用监控组件适配器配置监控规则,并调用监控告警***获取pod的监控数据。
作为优选,该方法中,应用纵向伸缩通过自定义监控指标器获取监控告警***的监控数据,应用纵向伸缩包括推荐器组件、更新器组件和准入控制器组件,推荐器组件、更新器组件和准入控制器组件通过接口服务器获取pod的资源使用情况,检测到pod的资源使用触发告警后,由容器组纵向扩容控制器修改pod的资源请求和资源限额数据。
一种基于容器的应用高可用实现***,该***包括若干容器服务集群和Iop管理集群,所述容器服务器集群中均部署监控告警***、告警信息管理组件和告警规则配置管理组件,监控告警***加载告警规则后,监控容器服务器集群资源,触发告警规则后,通过告警信息管理组件发送告警信息至Iop管理集群的集群管理后台应用,存储告警信息,用户通过集群管理浪潮云界面查看告警信息,运维人员通过集群管理运维界面查看集群的告警信息。
与现有技术相比,本发明的基于容器的应用高可用实现方法具有以下突出的有益效果:所述基于容器的应用高可用实现方法在浪潮公有云,可以实时监控浪潮云容器服务资源使用情况,同时,能保证基于浪潮云容器服务提供的应用高可用,保证应用稳定性,具有良好的推广应用价值。
附图说明
图1是本发明所述基于容器的应用高可用实现方法的流程图;
图2是本发明所述基于容器的应用高可用实现方法的应用横向伸缩设计流程图;
图3是本发明所述基于容器的应用高可用实现***的拓扑图。
具体实施方式
下面将结合附图和实施例,对本发明的基于容器的应用高可用实现方法及***作进一步详细说明。
实施例
其中,Kubernetes:容器服务编排程序。Docker:容器引擎。Prometheus:监控告警***。Resourcequota:资源限额。Node:容器服务节点。Pod:容器组。Pvc:持久化存储声明。Iop:浪潮开放平台。Cluster-web:集群管理运维界面。Cks-core-ui:集群管理浪潮云界面。Cks-cluster:集群管理后台应用。Alertmanager:告警信息管理组件。Alertrule-config:告警规则配置管理组件。Webhook:告警信息接收网络形式的接口。HorizontalPodAutoscaler(Hpa):容器组横向自动扩容器。MetricsAggregator:监控指标汇集器。Deployment:容器组部署资源。PrometheusAdapter:监控组件适配器。ReplicaSet:副本集。Metrics:监控指标。Metricsserver:内置监控指标器。custom.metrics.k8s.io:自定义监控指标器。external.metrics.k8s.io:外部扩展监控指标器。CustomMetricsApi:自定义监控数据获取接口。VerticalPodAutoscaler(VPA):容器组纵向自动扩容器。Recommender:推荐器。Updater:更新器。admission-controller:准入控制器。apiserver:接口服务器。VPA-controller:容器组纵向扩容控制器。Request:资源请求。Limit:资源限额。
如图1所示,本发明的基于容器的应用高可用实现方法,该方法在两个k8s容器服务器集群中分别部署监控告警***、告警信息管理组件和告警规则配置管理组件,监控告警***加载告警规则后,监控容器服务器集群资源,触发告警规则后,通过告警信息管理组件发送告警信息至集群管理后台应用,存储告警信息,用户通过集群管理浪潮云界面查看告警信息,运维人员通过集群管理运维界面查看集群的告警信息。用户通过集群管理浪潮云界面查看告警信息,了解到具体问题后,做相关动作消除告警。运维人员通过集群管理运维界面查看所有集群的告警信息。
在具体的过程中,k8s集群触发告警信息,通过发送短信的方式将告警信息发送告警短信,并可以发送告警邮件。通过应用伸缩组触发应用自动伸缩,用户可以直接查看告警信息,也可以通过查看告警短信和告警邮件查看告警信息,根据触发的应用自动伸缩制定应用纵向伸缩或应用横向伸缩。用户访问应用,应用自动伸缩,并将应用返回给用户。
通过告警信息管理组件发送告警信息至集群管理后台应用,存储告警信息,通过emai或短信的方式发送告警信息。
如图2所示,应用横向伸缩设计过程中,k8s容器服务器集群通过监控指标的api或获取监控信息,监控指标包括内置监控指标器组、自定义监控指标器和外部扩展监控指标器,自定义监控指标器和外部扩展监控指标器通过监控指标汇集器获取监控数据。使用自定义监控指标器获取k8s容器服务器集群的监控数据。
监控指标汇集器调用监控组件适配器配置监控规则,并调用监控告警***获取pod的监控数据。
应用横向伸缩主要管理容器组部署资源和副本集,应用横向伸缩通过监控告警***获取pod的监控数据后,调用容器组部署资源和副本集触发横向伸缩,修改pod的个数。
应用纵向伸缩通过自定义监控指标器获取监控告警***的监控数据,应用纵向伸缩包括推荐器组件、更新器组件和准入控制器组件。推荐器组件、更新器组件和准入控制器组件通过接口服务器获取pod的资源使用情况,检测到pod的资源使用触发告警后,由容器组纵向扩容控制器修改pod的资源请求和资源限额数据。
如图3所示,本发明的基于容器的应用高可用实现***,该***包括两个容器服务集群和Iop管理集群。容器服务器集群中均部署监控告警***、告警信息管理组件和告警规则配置管理组件,监控告警***加载告警规则后,监控容器服务器集群资源,触发告警规则后,通过告警信息管理组件发送告警信息至Iop管理集群的集群管理后台应用,存储告警信息,用户通过集群管理浪潮云界面查看告警信息,运维人员通过集群管理运维界面查看集群的告警信息。用户通过集群管理浪潮云界面查看告警信息,了解到具体问题后,做相关动作消除告警。运维人员通过集群管理运维界面查看所有集群的告警信息。
该基于容器的应用高可用实现***用于实现基于容器的应用高可用实现方法。其中,应用横向伸缩设计过程中,k8s容器服务器集群通过监控指标的api或获取监控信息,监控指标包括内置监控指标器组、自定义监控指标器和外部扩展监控指标器,自定义监控指标器和外部扩展监控指标器通过监控指标汇集器获取监控数据。使用自定义监控指标器获取k8s容器服务器集群的监控数据。监控指标汇集器调用监控组件适配器配置监控规则,并调用监控告警***获取pod的监控数据。
应用横向伸缩主要管理容器组部署资源和副本集,应用横向伸缩通过监控告警***获取pod的监控数据后,调用容器组部署资源和副本集触发横向伸缩,修改pod的个数。应用纵向伸缩通过自定义监控指标器获取监控告警***的监控数据,应用纵向伸缩包括推荐器组件、更新器组件和准入控制器组件。推荐器组件、更新器组件和准入控制器组件通过接口服务器获取pod的资源使用情况,检测到pod的资源使用触发告警后,由容器组纵向扩容控制器修改pod的资源请求和资源限额数据。
所述基于容器的应用高可用实现***使用浪潮云容器服务告警项收集浪潮云容器服务告警信息,使用浪潮告警收集接口收集浪潮云容器服务的告警信息,使用浪潮云容器服务伸缩组保证应用高可用伸缩特性,保证基于浪潮云容器服务提供的应用高可用,保证应用稳定性。
以上所述的实施例,只是本发明较优选的具体实施方式,本领域的技术人员在本发明技术方案范围内进行的通常变化和替换都应包含在本发明的保护范围内。

Claims (9)

1.一种基于容器的应用高可用实现方法,其特征在于:该方法在容器服务器集群中部署监控告警***、告警信息管理组件和告警规则配置管理组件,监控告警***加载告警规则后,监控容器服务器集群资源,触发告警规则后,通过告警信息管理组件发送告警信息至集群管理后台应用,存储告警信息,用户通过集群管理浪潮云界面查看告警信息,运维人员通过集群管理运维界面查看集群的告警信息。
2.根据权利要求1所述的基于容器的应用高可用实现方法,其特征在于:通过告警信息管理组件发送告警信息至集群管理后台应用,存储告警信息,通过emai或短信的方式发送告警信息。
3.根据权利要求2所述的基于容器的应用高可用实现方法,其特征在于:所述容器服务器集群为两个,每个容器服务器集群中均部署监控告警***、告警信息管理组件和告警规则配置管理组件。
4.根据权利要求3所述的基于容器的应用高可用实现方法,其特征在于:所述容器服务器集群为k8s集群。
5.根据权利要求4所述的基于容器的应用高可用实现方法,其特征在于:该方法中,应用横向伸缩管理容器组部署资源和副本集,应用横向伸缩通过监控告警***获取pod的监控数据后,调用容器组部署资源和副本集触发横向伸缩,修改pod的个数。
6.根据权利要求5所述的基于容器的应用高可用实现方法,其特征在于:应用横向伸缩通过监控指标获取监控信息,监控指标包括内置监控指标器、自定义监控指标器和外部扩展监控指标器,自定义监控指标器和外部扩展监控指标器通过监控指标汇集器获取监控数据。
7.根据权利要求6所述的基于容器的应用高可用实现方法,其特征在于:监控指标汇集器调用监控组件适配器配置监控规则,并调用监控告警***获取pod的监控数据。
8.根据权利要求4所述的基于容器的应用高可用实现方法,其特征在于:该方法中,应用纵向伸缩通过自定义监控指标器获取监控告警***的监控数据,应用纵向伸缩包括推荐器组件、更新器组件和准入控制器组件,推荐器组件、更新器组件和准入控制器组件通过接口服务器获取pod的资源使用情况,检测到pod的资源使用触发告警后,由容器组纵向扩容控制器修改pod的资源请求和资源限额数据。
9.一种基于容器的应用高可用实现***,其特征在于:该***包括若干容器服务集群和Iop管理集群,所述容器服务器集群中均部署监控告警***、告警信息管理组件和告警规则配置管理组件,监控告警***加载告警规则后,监控容器服务器集群资源,触发告警规则后,通过告警信息管理组件发送告警信息至Iop管理集群的集群管理后台应用,存储告警信息,用户通过集群管理浪潮云界面查看告警信息,运维人员通过集群管理运维界面查看集群的告警信息。
CN201910371627.0A 2019-05-06 2019-05-06 一种基于容器的应用高可用实现方法及*** Pending CN110086674A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910371627.0A CN110086674A (zh) 2019-05-06 2019-05-06 一种基于容器的应用高可用实现方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910371627.0A CN110086674A (zh) 2019-05-06 2019-05-06 一种基于容器的应用高可用实现方法及***

Publications (1)

Publication Number Publication Date
CN110086674A true CN110086674A (zh) 2019-08-02

Family

ID=67418815

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910371627.0A Pending CN110086674A (zh) 2019-05-06 2019-05-06 一种基于容器的应用高可用实现方法及***

Country Status (1)

Country Link
CN (1) CN110086674A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110737508A (zh) * 2019-10-14 2020-01-31 浪潮云信息技术有限公司 一种基于浪潮云的云容器服务网络***及实现方法
CN111026409A (zh) * 2019-10-28 2020-04-17 烽火通信科技股份有限公司 一种自动监控方法、装置、终端设备及计算机存储介质
CN111045901A (zh) * 2019-12-11 2020-04-21 东软集团股份有限公司 容器的监控方法、装置、存储介质和电子设备
CN111459763A (zh) * 2020-04-03 2020-07-28 中国建设银行股份有限公司 跨kubernetes集群监控***及方法
CN112015433A (zh) * 2020-08-28 2020-12-01 北京浪潮数据技术有限公司 一种资源调度方法、装置及电子设备和存储介质
CN112099911A (zh) * 2020-08-28 2020-12-18 中国—东盟信息港股份有限公司 一种基于Kubernetes构建动态资源准入控制器的方法
CN112783642A (zh) * 2019-11-11 2021-05-11 阿里巴巴集团控股有限公司 容器内逻辑配置方法、设备以及计算机可读介质
CN113037547A (zh) * 2021-03-03 2021-06-25 浪潮云信息技术股份公司 一种资源性能采集监控与告警***
CN113037549A (zh) * 2021-03-04 2021-06-25 浪潮云信息技术股份公司 一种运维环境告警方法
CN117032950A (zh) * 2023-07-10 2023-11-10 企迈科技有限公司 基于日志的实时数据透传方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106020930A (zh) * 2016-05-13 2016-10-12 深圳市中润四方信息技术有限公司 一种基于应用容器的应用管理方法及***
CN107463410A (zh) * 2017-08-11 2017-12-12 四川长虹电器股份有限公司 一种部署与监控在线平台应用的方法
CN109245931A (zh) * 2018-09-19 2019-01-18 四川长虹电器股份有限公司 基于kubernetes的容器云平台的日志管理和监控报警的实现方法
CN109639472A (zh) * 2018-12-04 2019-04-16 科大国创软件股份有限公司 基于Grafana的容器云平台的集成告警控制方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106020930A (zh) * 2016-05-13 2016-10-12 深圳市中润四方信息技术有限公司 一种基于应用容器的应用管理方法及***
CN107463410A (zh) * 2017-08-11 2017-12-12 四川长虹电器股份有限公司 一种部署与监控在线平台应用的方法
CN109245931A (zh) * 2018-09-19 2019-01-18 四川长虹电器股份有限公司 基于kubernetes的容器云平台的日志管理和监控报警的实现方法
CN109639472A (zh) * 2018-12-04 2019-04-16 科大国创软件股份有限公司 基于Grafana的容器云平台的集成告警控制方法及***

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110737508A (zh) * 2019-10-14 2020-01-31 浪潮云信息技术有限公司 一种基于浪潮云的云容器服务网络***及实现方法
CN111026409A (zh) * 2019-10-28 2020-04-17 烽火通信科技股份有限公司 一种自动监控方法、装置、终端设备及计算机存储介质
CN112783642A (zh) * 2019-11-11 2021-05-11 阿里巴巴集团控股有限公司 容器内逻辑配置方法、设备以及计算机可读介质
CN111045901A (zh) * 2019-12-11 2020-04-21 东软集团股份有限公司 容器的监控方法、装置、存储介质和电子设备
CN111045901B (zh) * 2019-12-11 2024-03-22 东软集团股份有限公司 容器的监控方法、装置、存储介质和电子设备
CN111459763A (zh) * 2020-04-03 2020-07-28 中国建设银行股份有限公司 跨kubernetes集群监控***及方法
CN111459763B (zh) * 2020-04-03 2023-10-24 中国建设银行股份有限公司 跨kubernetes集群监控***及方法
CN112099911A (zh) * 2020-08-28 2020-12-18 中国—东盟信息港股份有限公司 一种基于Kubernetes构建动态资源准入控制器的方法
CN112099911B (zh) * 2020-08-28 2024-02-13 中国—东盟信息港股份有限公司 一种基于Kubernetes构建动态资源准入控制器的方法
CN112015433A (zh) * 2020-08-28 2020-12-01 北京浪潮数据技术有限公司 一种资源调度方法、装置及电子设备和存储介质
CN113037547A (zh) * 2021-03-03 2021-06-25 浪潮云信息技术股份公司 一种资源性能采集监控与告警***
CN113037549A (zh) * 2021-03-04 2021-06-25 浪潮云信息技术股份公司 一种运维环境告警方法
CN117032950A (zh) * 2023-07-10 2023-11-10 企迈科技有限公司 基于日志的实时数据透传方法及***

Similar Documents

Publication Publication Date Title
CN110086674A (zh) 一种基于容器的应用高可用实现方法及***
US6012152A (en) Software fault management system
JP6653774B2 (ja) 通知に対するユーザ可用性又は受容性を測定する方法、装置及び機械可読媒体
CN112789832B (zh) 动态切片优先级处理
CN107067289A (zh) 一种个性化营销推荐***
CN109271602A (zh) 深度学习模型发布方法及装置
CN111405030B (zh) 一种消息推送方法、装置、电子设备和存储介质
US20210182307A1 (en) System and methods for autonomous monitoring and recovery in hybrid energy management
CN106203956A (zh) 基于云计算的项目管理***
CN103716356A (zh) 基于web的存储过程操作方法、装置和***
CN107193616A (zh) 一种应用程序升级方法及终端
CN106982128B (zh) 基于网络的社群构建方法
CN114327890B (zh) 一种多指标融合的容器配额推荐方法和***
Mihailescu et al. Towards collaborative sensing using dynamic intelligent virtual sensors
CN108009089A (zh) 一种基于透明计算的增量机器学习方法及***
CN107479974A (zh) 一种虚拟机调度方法及装置
CN106886452B (zh) 一种简化云化***任务调度的方法
CN110035126A (zh) 一种文件处理方法、装置、计算设备及存储介质
CN109391980A (zh) 一种基于NB-IoT网络下行流量控制的方法及***
CN110807330B (zh) 语义理解模型评估方法、装置及存储介质
CN110377488A (zh) 一种统一运维及动态扩展的方法及***
US9229898B2 (en) Causation isolation using a configuration item metric identified based on event classification
CN110109666A (zh) 一种it基础设施管理维护的方法、装置、***及存储介质
CN109697196A (zh) 一种情境建模方法、装置及设备
CN105320741B (zh) 一种基于云的web电子阅览室实现方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190802