CN112149975B - 一种基于人工智能的apm监控***及监控方法 - Google Patents

一种基于人工智能的apm监控***及监控方法 Download PDF

Info

Publication number
CN112149975B
CN112149975B CN202010956247.6A CN202010956247A CN112149975B CN 112149975 B CN112149975 B CN 112149975B CN 202010956247 A CN202010956247 A CN 202010956247A CN 112149975 B CN112149975 B CN 112149975B
Authority
CN
China
Prior art keywords
performance
index
unit
application program
application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010956247.6A
Other languages
English (en)
Other versions
CN112149975A (zh
Inventor
朱桂芝
杨克伟
康俊健
林小莎
伍闵
许宜斌
李雅辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Eastcom Software Technology Co ltd
Original Assignee
Hangzhou Eastcom Software Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Eastcom Software Technology Co ltd filed Critical Hangzhou Eastcom Software Technology Co ltd
Priority to CN202010956247.6A priority Critical patent/CN112149975B/zh
Publication of CN112149975A publication Critical patent/CN112149975A/zh
Application granted granted Critical
Publication of CN112149975B publication Critical patent/CN112149975B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种基于人工智能的APM监控***。在一个实施例中,指标采集单元,用于对应用程序微服务运行平台的应用程序性能指标以及应用之间的关系进行采集;数据分析单元,通过人工智能分析模型对所述性能指标进行分析;告警单元,根据数据分析单元对所述性能指标的分析结果,实时给出性能指标告警并对异常指标进行跟踪定位;自动化运维单元,根据数据分析单元对所述性能指标的分析结果,自动触发应用程序微服务运行平台的虚拟化设备的自动扩缩容,恢复业务;APM调用链拓扑展示单元,用于以拓扑图形的方式对应用之间的关系进行展示。使得从应用性能指标的采集到基于自动化运维模型触发虚拟化设备的自动扩缩容恢复业务,形成自动化运维闭环。

Description

一种基于人工智能的APM监控***及监控方法
技术领域
本发明涉及自动化运维技术领域,尤其涉及一种基于人工智能的APM监控***及监控方法。
背景技术
APM(Application Performance Management)即应用性能管理,属于IT运维管理。主要是针对企业关键业务的IT应用性能和用户体验的监测、优化,提高企业IT应用的可靠性和质量,保证用户得到良好的服务,降低IT总拥有成本(TCO)。
现有技术中对IT设备及其上面运行的应用软件的监控都是按分层来进行的,其分层结构如图1所示,分为IAAS层、PAAS层、SAAS层,即基础设施(如网络、主机、虚拟机上的CPU、内存、磁盘等)、***(操作***、中间件、数据库)、应用(子***、模块、功能的申请量、交易量、成功率、失败率)、前端(用户申请页面、动作等)。其监控过程如下:
采集监控指标:维护人员定期或者自动化下发采集任务,采集从IAAS层到SAAS层的资源、性能、告警等监控指标;
资源管理:搭建资源模型,呈现资源数据,对数据做简单的统计分析。
拓扑管理:手工构建从IAAS层到SAAS层的拓扑;
性能管理:制定监控策略,呈现性能数据,通过基线算法,能够通过对一定时期的历史数据进行采样并统计分析。
告警显示:设置阈值,对业务性能及其运行的IT设备性能指标自动告警。
现有的技术方案重在解决IAAS层和PAAS层的监控和告警,对应用本身的性能和管理关注较少。另外,随着技术更新换代,硬件方面:随着网络硬件功能虚拟化(NFV),可以进行云化、按需动态伸缩和自动化部署;软件方面:软件微服务化、分布式架构改造。应用程序的性能、告警监控和自动化运维的问题越来越突出,比如一个请求会涉及多个服务,而服务本身可能也会依赖其他服务,整个请求路径就构成了一个网状的调用链,而在整个调用链中一旦某个节点发生异常,整个调用链的稳定性就会受到影响。
另外,现有的APM监控***,人工智能只是部分应用不能形成从指标采集到应用性能自愈这样的自动化运维闭环。现有的APM监控***具有如下缺点:
指标采集方式,需维护人员定期或者自动化下发采集任务,工作量繁琐且易出错;
APM拓扑,无法做到业务***及其运行的IT设备自动更新拓扑图,时效性差;
告警显示,无法对APM业务性能及其运行的IT设备性能指标自动告警。
无法快速故障自愈:现有应用程序部署方式发生很大改变,基于传统的自动化运维思想,很难做到业务故障的快速自愈。
发明内容
有鉴于此,本申请实施例提供了一种基于人工智能的APM监控***及监控方法。
第一方面,本发明申请提供了一种基于人工智能的APM监控***,包括:
指标采集单元,用于对应用程序微服务运行平台的应用程序性能指标以及应用之间的关系进行采集;
数据分析单元,通过人工智能分析模型对所述性能指标进行分析;
告警单元,根据数据分析单元对所述性能指标的分析结果,实时给出性能指标告警并对异常指标进行跟踪定位;
自动化运维单元,根据数据分析单元对所述性能指标的分析结果,自动触发应用程序微服务运行平台的虚拟化设备的自动扩缩容,恢复业务;
APM调用链拓扑展示单元,用于以拓扑图形的方式对应用之间的关系进行展示。
可选地,所述***还包括:数据存储单元
所述数据存储单元,用于对指标采集单元采集的性能指标、应用之间的关系进行存储,以及对数据分析单元的分析统计结果进行存储。
可选地,所述***还包括:数据查询单元;
所述数据查询单元,用于使用户对所述性能指标、所述应用之间的关系和所述性能指标的分析结果进行查询。
可选地,所述***还包括:数据显示单元;
所述数据显示单元,用于根据用户的查询结果对应用的性能指标数据进行显示;
所述APM调用链拓扑展示单元,用于根据用户的查询结果对应用程序的相关的硬件、软件组件,所述软件组件之间的交互进行展现,以及对业务实时交易的路径进行图形化展现。
可选地,所述指标采集单元具体用于:通过日志埋点的方式对应用程序的性能指标进行采集,以及通过部署Agent自动发现应用之间的关系。
可选地,所述应用程序的性能指标包括:网络的监控指标、主机指标、存储指标、中间件指标、虚拟机指标、应用和模块指标、服务间调用指标中的一种或多种。
第二方面,本发明申请提供了一种基于人工智能的APM监控方法,包括:
采集应用程序的性能指标;
对所述应用程序的性能指标进行实时监控和数据分析,并对所述性能指标和所述性能指标的分析结果进行存储;
根据所述性能指标的分析结果,触发对超过阈值上限或者低于阈值下限的性能指标进行告警,或者,触发对虚拟化设备的自动扩缩容。
可选地,所述采集应用程序的性能指标以及应用之间的关系包括:通过日志埋点的方式对应用程序的性能指标进行采集,以及通过部署Agent自动发现应用关系。
可选地,所述对所述应用程序的性能指标进行实时监控和数据分析,并对所述性能指标和所述性能指标的分析结果进行存储之后还包括:
响应于用户的查询操作,对采集的应用程序的性能指标以及所述性能指标的分析结果进行显示;
或者,响应于用户的查询操作对应用程序的相关的硬件、软件组件,所述软件组件之间的交互进行展现,以及对业务实时交易的路径进行图形化展现。
可选地,所述触发对虚拟化设备的自动扩缩容包括:
基于自动化运维模型,当应用程序的虚拟内存不足时,触发自动扩缩容,恢复业务。
本申请实施例提供一种基于人工智能的APM监控***及方法,在一个实施例中,通过指标采集单元从应用程序微服务运行平台采集应用程序的性能指标,将采集的应用性能指标通过性能监控单元发送到数据分析单元进行统计分析,并将统计分析结果存储在数据存储单元。自动化运维单元根据数据分析单元的分析结果,基于自动化运维模型,触发虚拟化设备的自动扩缩容,恢复业务。使得在本发明申请实施例中从应用性能指标的采集到基于自动化运维模型触发虚拟化设备的自动扩缩容恢复业务,形成自动化运维闭环。进一步地,通过性能监控单元对应用程序的性能指标进行实时监控,通过APM调用链拓扑展示单元以拓扑图形的方式展示应用之间的调用关系实现对应用的调用关系进行更加直观的监控,通过告警单元对异常性更指标进行告警以及性能故障进行快速定位,实现应用性能的全面优化。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为现有技术中的监控分层示意图;
图2为本发明申请一种基于人工智能的APM监控***的结构示意图;
图3为本发明申请一种基于人工智能的APM监控方法的流程图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
在本发明申请实施例中,提供了一种基于人工智能的APM监控***,主要聚焦与应用本身的性能和管理上,从应用服务指标采集、性能指标监控、性能告警、拓扑展示、智能运维、应用服务自愈形成一个闭环。
图2为本发明申请一种基于人工智能的APM监控***,如图2所示,本发明申请实施例中的一种基于人工智能的APM监控***包括:应用服务器微服务运行平台201、指标采集单元202、性能监控单元203、数据分析单元204、数据存储单元205、自动化运维单元206、告警单元207、数据查询单元208、数据显示单元209、APM调用链拓扑展示单元210。
应用程序微服务运行平台201包括至少一个微服务和引用程序微服务运行的基础设施和容器。
指标采集单元202用于采集应用的性能数据和自动发现应用之间的关系。
在一个可能的实施例中,指标采集单元202通过日志埋点来采集应用的性能指标。通过部署Agent来自动发现应用与应用之间的关系。
其中,通过日志埋点采集的指标包括:网络的监控指标、主机指标、存储指标、中间件指标、虚拟机指标、应用和模块指标、服务间调用指标等。
网络的监控指标包括:端口流出利用率、端口流入利用率、cpu利用率、内存利用率。
主机指标包括:cpu利用率、内存利用率、磁盘利用率、网卡mac地址、服务器资源信息(运行时间、cpu核数、cpu类型、内存大小、操作***标识)。
存储指标包括:SqlServer的指标:数据库的可用总页数、启动事务数/S,实例的分发事务速率、日志大小等。
中间件指标包括:Nginx的监控指标:连通性、处理的请求数、当前活动连接数,平均每秒连接数等。
虚拟机指标包括:cpu利用率、内存利用率、磁盘利用率、网卡输入(bps)、网卡输出(bps)等。
应用和模块指标包括:子***、模块、功能的申请量、成功率、失败率等。
服务间调用指标包括:可用性、异常、响应时间、当前等待笔数、线程数、服务调用次数、访问量、服务可用性等。
通过部署Agent来自动发现应用与应用之间的关系包括:通过服务端定期扫描网络,部署agent后自动发现应用关系。
性能监控单元203通过ELK平台分析日志数据,并对指标采集单元202采集应用的性能指标进行监控。
数据分析单元204通过人工智能分析模型对指标采集单元202采集的应用的性能指标进行分析。
数据存储单元205用于对指标采集单元202采集的应用的性能指标进行存储,以及对数据分析单元203分析统计结果进行存储。
自动化运维单元206基于自动化运维模型,当应用性能变差时,如虚拟内存不足,触发自动扩缩容,恢复业务。
在一个可能的实施例中,自动化运维单元206通过采集的应用程序的内存使用率,当内存使用率低于某个阈值下限,***提示虚拟内存不足,自动化运维单元206根据事先配置的弹性扩容策略,按照当前容器的配置类型创建新的副本,自动加入至应用程序的现有的集群中。
告警单元207用于对超过阈值的应用的性能指标进行告警,基于告警分析模型,实时给出APM业务性能及其运行的IT设备性能指标告警,非侵入式埋点,基于分布式跟踪的应用程序性能监控***,提供代码级的跟踪定位故障。
在一个可能的实施例中,设置虚拟机的CPU利用率的上限阈值为70%,当获取的当前指标超过阈值上限时,触发告警。
数据查询单元208用于查询应用的性能指标和分析统计结果。
数据显示单元209用于显示应用的性能指标数据。
APM调用链拓扑展示单元210用于展示应用程序的相关的硬件、软件组件,并对这些组件之间的交互进行展现,以及对业务实时交易的路径进行清晰的图形化展现。具体包括:给出APM的应用服务调用链,其中的拓扑节点可以定位到服务模块,使得对应用的调用关系链进行更加直观的监控。
数据查询单元208针对的是用户,当用户需要对当前采集的应用的性能指标,或者对采集的应用的性能指标的分析统计结果进行查询时,可以通过触发数据查询单元208进行查询。查询的结果通过数据显示单元209进行显示。
进一步地,用户也可以通过触发数据查询模块208对应用程序与应用程序之间的关系、应用程序的相关硬件、软件组件以及这些组件之间的交互关系、业务实时交易的路径进行查询并通过APM调用链拓扑展示单元210以拓扑图形式进行展示。使得可以对应用的调用关系链更加直观的监控。
在本发明申请实施例中,通过指标采集单元202从应用程序微服务运行平台201采集应用的性能指标,将采集的应用性能指标通过性能监控单元203发送到数据分析单元204进行统计分析,并将统计分析结果存储在数据存储单元205。自动化运维单元206根据数据分析单元204的分析结果,基于自动化运维模型,触发虚拟化设备的自动扩缩容,恢复业务。使得在本发明申请实施例中,从应用性能指标的采集到基于自动化运维模型,触发虚拟化设备的自动扩缩容恢复业务,形成自动化运维闭环。
图3为本发明申请一种基于人工智能的APM监控方法的流程图,参照图3本发明申请实施例中的一种基于人工智能的APM监控方法包括步骤S301-步骤S303
步骤S301:采集应用程序的性能指标以及应用关系;
通过日志埋点或者部署Agent,采集应用性能指标和自动发现应用关系并将采集的应用性能指标和应用关系存储在数据存储单元中。
步骤S302:对采集性能指标进行实时监控和数据分析,并将分析结果进行存储;
通过ELK平台对应用程序的日志数据进行分析,并对采集的应用程序的性能指标进行实时监控。
数据分析单元通过人工智能模型对采集的应用性能指标进行分析,并将分析结果保存在数据存储单元中。
步骤S303:根据对应用程序的性能指标的分析结果,对超过阈值上限或者低于阈值下限的性能指标进行告警或者对应用程序的基础设施和容器进行扩容;
通过自动化运维单元和告警模块对应用程序性能指标的分析结果进行判断,当发现存在应用程序的性能指标超过预先设定的阈值上限或者低于预先设定的阈值下限时,触发告警单元对该性能指标进行告警,或触发自动化运维单元进行自动扩缩容,恢复业务。
在一个可能的实施例中,设定虚拟机的CPU的利用率的阈值上限为70%,当获取的应用程序的性能指标指示该虚拟机的CPU的利用率为90%时,触发告警单元进行告警。当采集的应用程序的性能指标指示应用程序的内存使用率低于预先设定的阈值下限时,通过告警模块提示虚拟内存不足,并触发自动化运维模块根据事先配置的弹性扩容策略,按照当前容器的配置类型创建新的副本,自动加入至应用程序的现有的集群中。
在一个可能的实施例中,当采集的应用程序的性能指标和对该性能指标的分析结果存储在数据存储单元以后,用户可以通过数据查询模块对采集的应用程序的性能指标和分析结果进行查询并通过数据显示模块进行显示。
进一步地,用户也可以通过数据查询模块对应用程序的相关硬件、软件组件、以及这些组件质安监的交互进行查询,或者对业务实时交易的路径进行查询。其查询结果通过拓扑链的方式进行展示。通过APM调用链拓扑展示单元给出APM的应用服务调用链,通过该调用链中的拓扑节点可以定位到服务模块,使得***对应用的调用关系能够更加直观的进行监控。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (10)

1.一种基于人工智能的APM监控***,包括:
指标采集单元,用于对应用程序微服务运行平台的应用程序性能指标以及应用之间的关系进行采集;
数据分析单元,通过人工智能分析模型对所述性能指标进行分析;
告警单元,根据数据分析单元对所述性能指标的分析结果,实时给出性能指标告警并对异常指标进行跟踪定位;
自动化运维单元,根据数据分析单元对所述性能指标的分析结果,自动触发应用程序微服务运行平台的虚拟化设备的自动扩缩容,恢复业务;
APM调用链拓扑展示单元,用于以拓扑图形的方式对应用之间的关系进行展示;
其中,所述应用的性能指标包括:虚拟机指标、应用和模块指标和服务间调用指标,当发现存在应用程序的性能指标超过预先设定的阈值上限或者低于预先设定的阈值下限时,触发自动化运维模块根据事先配置的弹性扩容策略,按照当前容器的配置类型创建新的副本,自动加入至应用程序的现有的集群中。
2.根据权利要求1所述的***,其特征在于,还包括:数据存储单元;
所述数据存储单元,用于对指标采集单元采集的性能指标、应用之间的关系进行存储,以及对数据分析单元的分析统计结果进行存储。
3.根据权利要求1或 2所述的***,其特征在于,还包括:数据查询单元;
所述数据查询单元,用于使用户对所述性能指标、所述应用之间的关系和所述性能指标的分析结果进行查询。
4.根据权利要求3所述的***,其特征在于,还包括:数据显示单元;
所述数据显示单元,用于根据用户的查询结果对应用的性能指标数据进行显示;
所述APM调用链拓扑展示单元,用于根据用户的查询结果对应用程序的相关的硬件、软件组件,所述软件组件之间的交互进行展现,以及对业务实时交易的路径进行图形化展现。
5.根据权利要求1所述的***,其特征在于,所述指标采集单元具体用于:通过日志埋点的方式对应用程序的性能指标进行采集,以及通过部署Agent自动发现应用之间的关系。
6.根据权利要求1所述的***,其特征在于,所述应用程序的性能指标包括:网络的监控指标、主机指标、存储指标、中间件指标、虚拟机指标、应用和模块指标、服务间调用指标中的一种或多种。
7.一种基于人工智能的APM监控方法,包括:
采集应用程序的性能指标;
对所述应用程序的性能指标进行实时监控和数据分析,并对所述性能指标和所述性能指标的分析结果进行存储;
根据所述性能指标的分析结果,触发对超过阈值上限或者低于阈值下限的性能指标进行告警,或者,触发对虚拟化设备的自动扩缩容;
其中,所述应用的性能指标包括:虚拟机指标、应用和模块指标和服务间调用指标,当发现存在应用程序的性能指标超过预先设定的阈值上限或者低于预先设定的阈值下限时,触发自动化运维模块根据事先配置的弹性扩容策略,按照当前容器的配置类型创建新的副本,自动加入至应用程序的现有的集群中。
8.根据权利要求7所述的方法,其特征在于,所述采集应用程序的性能指标以及应用之间的关系包括:通过日志埋点的方式对应用程序的性能指标进行采集,以及通过部署Agent自动发现应用关系。
9.根据权利要求7所述的方法,其特征在于,所述对所述应用程序的性能指标进行实时监控和数据分析,并对所述性能指标和所述性能指标的分析结果进行存储之后还包括:
响应于用户的查询操作,对采集的应用程序的性能指标以及所述性能指标的分析结果进行显示;
或者,响应于用户的查询操作对应用程序的相关的硬件、软件组件,所述软件组件之间的交互进行展现,以及对业务实时交易的路径进行图形化展现。
10.根据权利要求7所述的方法,其特征在于,所述触发对虚拟化设备的自动扩缩容包括:
基于自动化运维模型,当应用程序的虚拟内存不足时,触发自动扩缩容,恢复业务。
CN202010956247.6A 2020-09-11 2020-09-11 一种基于人工智能的apm监控***及监控方法 Active CN112149975B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010956247.6A CN112149975B (zh) 2020-09-11 2020-09-11 一种基于人工智能的apm监控***及监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010956247.6A CN112149975B (zh) 2020-09-11 2020-09-11 一种基于人工智能的apm监控***及监控方法

Publications (2)

Publication Number Publication Date
CN112149975A CN112149975A (zh) 2020-12-29
CN112149975B true CN112149975B (zh) 2023-04-18

Family

ID=73890902

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010956247.6A Active CN112149975B (zh) 2020-09-11 2020-09-11 一种基于人工智能的apm监控***及监控方法

Country Status (1)

Country Link
CN (1) CN112149975B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115102828A (zh) * 2022-08-26 2022-09-23 歌尔股份有限公司 一种故障分析方法及装置
CN115562932A (zh) * 2022-09-08 2023-01-03 ***数智科技有限公司 一种基于多接口平台的任务监控与异常自愈方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017028697A1 (zh) * 2015-08-17 2017-02-23 阿里巴巴集团控股有限公司 计算机集群的扩容和缩容方法及设备
CN110581773A (zh) * 2018-06-07 2019-12-17 北京怡合春天科技有限公司 一种自动化服务监控与报警管理***

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726072B (zh) * 2018-07-18 2022-01-14 平安科技(深圳)有限公司 WebLogic服务器的监控告警方法、装置、***及计算机存储介质
CN109934361B (zh) * 2019-02-25 2022-03-11 江苏电力信息技术有限公司 一种基于容器和大数据的自动化运维平台模型
CN111181767A (zh) * 2019-12-10 2020-05-19 中国航空工业集团公司成都飞机设计研究所 一种面向复杂***的监控和故障自愈***及其方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017028697A1 (zh) * 2015-08-17 2017-02-23 阿里巴巴集团控股有限公司 计算机集群的扩容和缩容方法及设备
CN110581773A (zh) * 2018-06-07 2019-12-17 北京怡合春天科技有限公司 一种自动化服务监控与报警管理***

Also Published As

Publication number Publication date
CN112149975A (zh) 2020-12-29

Similar Documents

Publication Publication Date Title
CN110661659B (zh) 一种告警方法、装置、***及电子设备
CN109714192B (zh) 一种监控云平台的监控方法及***
US10747591B2 (en) Endpoint process state collector
CN104407964B (zh) 一种基于数据中心的集中监控***及方法
CN108365985A (zh) 一种集群管理方法、装置、终端设备及存储介质
CN102231681A (zh) 一种高可用集群计算机***及其故障处理方法
CN112149975B (zh) 一种基于人工智能的apm监控***及监控方法
CN110611597A (zh) 一种基于单向网闸环境的跨域运维***
CN114356499A (zh) Kubernetes集群告警根因分析方法及装置
CN112306802A (zh) ***的数据获取方法、装置、介质和电子设备
CN109800133A (zh) 一种统一监控告警的方法、一站式监控告警平台及***
CN115248826A (zh) 一种大规模分布式图数据库集群运维管理的方法和***
CN113760652A (zh) 基于应用的全链路监控的方法、***、设备和存储介质
CN109474470A (zh) 一种自监控方法和装置
CN117632897A (zh) 动态扩缩容方法及装置
CN115237566A (zh) 批量任务执行方法、装置、设备、介质及产品
CN111339466A (zh) 接口管理方法、装置、电子设备及可读存储介质
CN116895046A (zh) 基于虚拟化的异常运维数据处理方法
CN115858499A (zh) 一种数据库分区处理方法、装置、计算机设备和存储介质
CN105072161A (zh) 一种基于云计算的应用程序管理***
CN115981950A (zh) 监控告警方法、装置、设备及计算机可读存储介质
CN115840656A (zh) 一种基于故障自愈的应用程序自动化运维方法和***
CN113824601A (zh) 一种基于业务日志的电力营销监控***
CN111737092B (zh) 一种基于无状态计算的服务器自动化运维***及方法
CN114327849A (zh) 一种基于智能监控的资源调度方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant