CN113760652B - 基于应用的全链路监控的方法、***、设备和存储介质 - Google Patents

基于应用的全链路监控的方法、***、设备和存储介质 Download PDF

Info

Publication number
CN113760652B
CN113760652B CN202110929024.5A CN202110929024A CN113760652B CN 113760652 B CN113760652 B CN 113760652B CN 202110929024 A CN202110929024 A CN 202110929024A CN 113760652 B CN113760652 B CN 113760652B
Authority
CN
China
Prior art keywords
application
link
monitoring
relation
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110929024.5A
Other languages
English (en)
Other versions
CN113760652A (zh
Inventor
郭涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan Inspur Data Technology Co Ltd
Original Assignee
Jinan Inspur Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan Inspur Data Technology Co Ltd filed Critical Jinan Inspur Data Technology Co Ltd
Priority to CN202110929024.5A priority Critical patent/CN113760652B/zh
Publication of CN113760652A publication Critical patent/CN113760652A/zh
Application granted granted Critical
Publication of CN113760652B publication Critical patent/CN113760652B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种基于应用的全链路监控的方法、***、设备和存储介质,方法包括:根据服务类型创建多个应用,并在每个应用中添加与所述应用相关的所有资源;根据所述所有资源分析所述应用的调用链关系,并根据所述调用链关系形成所述应用的拓扑图;通过代理服务监控所述拓扑图中每条链路的资源使用情况,并判断是否存在链路的流量超过阈值或所述调用链关系出现故障;以及响应于存在链路的流量超过阈值和/或所述调用链关系出现故障,根据异常的等级采用相应的告警方式进行告警。本发明通过将和应用相关的所有资源都加入应用中,用户通过应用就能查看和此应用相关的所有资源的监控信息,整体性更好,避免了数据割裂,更加易用。

Description

基于应用的全链路监控的方法、***、设备和存储介质
技术领域
本领域涉及数据监控领域,更具体地,特别是指一种基于应用的全链路监控的方法、***、设备和存储介质。
背景技术
随着云计算的发展,在过去的十年中,用户的传统数据中心逐步迁移到云计算环境中,应用部署也逐渐从传统物理机迁移到虚拟化环境中,虚拟机和容器是目前比较流行的两种虚拟化方式。应用迁移到云上之后,需要借助监控和运维能力实现对应用的性能指标监控,以便及时了解应用的运行情况。但是随着技术日新月异,中间件、数据库也越来越多样化,对应用的整体监控也提出了更高的要求,一个大型的企业用户***可能多达几十种甚至上百种,多样性应用监控运维成为迫切需求。
目前已有的监控运维***基本都是按照资源的视角进行监控,监控数据割裂,无法有效的从整体上对整个应用***进行监控分析,无法从整体上定位应用***出现了故障的位置,从而失去了监控的意义。
发明内容
有鉴于此,本发明实施例的目的在于提出一种基于应用的全链路监控的方法、***、计算机设备及计算机可读存储介质,本发明通过将和应用相关的所有资源都加入应用中,用户通过应用就能查看和此应用相关的所有资源的监控信息,整体性更好,避免了数据割裂,更加易用。
基于上述目的,本发明实施例的一方面提供了一种基于应用的全链路监控的方法,包括如下步骤:根据服务类型创建多个应用,并在每个应用中添加与所述应用相关的所有资源;根据所述所有资源分析所述应用的调用链关系,并根据所述调用链关系形成所述应用的拓扑图;通过代理服务监控所述拓扑图中每条链路的资源使用情况,并判断是否存在链路的流量超过阈值或所述调用链关系出现故障;以及响应于存在链路的流量超过阈值和/或所述调用链关系出现故障,根据异常的等级采用相应的告警方式进行告警。
在一些实施方式中,所述通过代理服务监控所述拓扑图中每条链路的资源使用情况包括:获取目标链路的安装目录,并在所述安装目录中增加代理。
在一些实施方式中,方法还包括:将服务日志的采集设置成界面化配置,并通过在界面填写采集目录对目标对象的日志进行采集。
在一些实施方式中,方法还包括:从所述日志中获取每一种应用程序接口的操作频率和应用程序接口的平均响应时间,并根据所述操作频率和平均响应时间对应用程序接口进行优化。
本发明实施例的另一方面,提供了一种基于应用的全链路监控的***,包括:创建模块,配置用于根据服务类型创建多个应用,并在每个应用中添加与所述应用相关的所有资源;分析模块,配置用于根据所述所有资源分析所述应用的调用链关系,并根据所述调用链关系形成所述应用的拓扑图;监控模块,配置用于通过代理服务监控所述拓扑图中每条链路的资源使用情况,并判断是否存在链路的流量超过阈值或所述调用链关系出现故障;以及告警模块,配置用于响应于存在链路的流量超过阈值和/或所述调用链关系出现故障,根据异常的等级采用相应的告警方式进行告警。
在一些实施方式中,所述监控模块配置用于:获取目标链路的安装目录,并在所述安装目录中增加代理。
在一些实施方式中,***还包括采集模块,配置用于:将服务日志的采集设置成界面化配置,并通过在界面填写采集目录对目标对象的日志进行采集。
在一些实施方式中,***还包括优化模块,配置用于:从所述日志中获取每一种应用程序接口的操作频率和应用程序接口的平均响应时间,并根据所述操作频率和平均响应时间对应用程序接口进行优化。
本发明实施例的又一方面,还提供了一种计算机设备,包括:至少一个处理器;以及存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现如上方法的步骤。
本发明实施例的再一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时实现如上方法步骤的计算机程序。
本发明至少具有以下有益技术效果:
(1)把和应用相关的所有资源都加入应用中,用户通过应用就能查看和此应用相关的所有资源的监控信息,整体性更好,避免了数据割裂,更加易用;
(2)通过无侵入技术实现对服务本身和应用数据库、中间件的监控,真正实现应用全方位的监控,降低数字***故障频率,提前发现流量瓶颈,提升处理和排查效率;
(3)从应用的视角分析用户的行为,以操作日志和访问应用程序接口的数量为基础,统计用户经常访问的功能,给开发者提供热点功能视图,为进一步分析***性能和提高***易用性稳定性提供帮助;
(4)日志采集功能可以将和该应用相关的组件以及服务的日志全部采集,自动以应用进行了分类,分类后方便用户查看和功能排查。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本发明提供的基于应用的全链路监控的方法的实施例的示意图;
图2为本发明提供的基于应用的全链路监控的***的实施例的示意图;
图3为本发明提供的基于应用的全链路监控的计算机设备的实施例的硬件结构示意图;
图4为本发明提供的基于应用的全链路监控的计算机存储介质的实施例的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
本发明实施例的第一个方面,提出了一种基于应用的全链路监控的方法的实施例。图1示出的是本发明提供的基于应用的全链路监控的方法的实施例的示意图。如图1所示,本发明实施例包括如下步骤:
S1、根据服务类型创建多个应用,并在每个应用中添加与所述应用相关的所有资源;
S2、根据所述所有资源分析所述应用的调用链关系,并根据所述调用链关系形成所述应用的拓扑图;
S3、通过代理服务监控所述拓扑图中每条链路的资源使用情况,并判断是否存在链路的流量超过阈值或所述调用链关系出现故障;以及
S4、响应于存在链路的流量超过阈值和/或所述调用链关系出现故障,根据异常的等级采用相应的告警方式进行告警。
本实施例提供应用管理能力,一个应用代表了一个应用***,应用***包含了部署应用的一个或者一组虚拟机,还包含了部署应用的中间件、数据库等。除此之外,应用中还包含了应用***本身的服务,例如前端的开发服务,使用目前比较流行的微服务框架开发的微服务***,如使用springCloud构建的微服务。
本实施例提供了数据库和中间件的监控运维能力,通过插件代理实现数据库和中间件的数据采集。除了数据库和中间件之外,对于用java或者python编写的业务***也可以进行插件代理安装,安装后实现对业务层的监控分析。
本实施例提供了用户行为分析能力,通过API(Application ProgrammingInterface,应用程序接口)调用链的分析,可以反向推理用户的高频操作,这样可以在***正式上线后,统计用户的使用习惯,对于高频操作就可以后期考虑进行重点开发和优化,以便进一步的完善产品。
本实施例提供了日志收集能力,可以以应用的角度,收集整个应用***的日志,防止应用宕机后日志丢失,也可以在***出现问题时,进一步分析,增强整个***的安全性。
根据服务类型创建多个应用,并在每个应用中添加与所述应用相关的所有资源。应用***是一种视图展示,用户可以创建一个应用,并指明应用的名称。在应用***中可以添加和该应用相关的虚拟机、容器等,包括中间件、数据库等,也就是说和整个应用***相关的所有组件都可以添加到该应用中。该过程由开发人员手动保证和维护。其中,应用删除时仅仅是删除应用本身,和应用相关的虚拟机等资源不会自动删除,如果想同步删除的话,需要在删除的时候选择同步删除资源。
根据所述所有资源分析所述应用的调用链关系,并根据所述调用链关系形成所述应用的拓扑图。拓扑图的生成是使用了基于调用链的自动生成拓扑技术,该技术可以通过自动化分析后台的调用链关系,自动形成一个拓扑图。拓扑图可以非常形象的展示整个***的调用关系,服务和服务之间的关系。
通过代理服务监控所述拓扑图中每条链路的资源使用情况,并判断是否存在链路的流量超过阈值或所述调用链关系出现故障。用户点击一个应用之后,会进入应用的详情中,在详情中不仅展示了部署应用的介质(虚拟机)的监控信息,例如包括CPU内存磁盘IO(输入输出)和网络IO等,还展示了应用的整个链路信息,链路信息以一种拓扑图的形式进行展示。
在一些实施方式中,所述通过代理服务监控所述拓扑图中每条链路的资源使用情况包括:获取目标链路的安装目录,并在所述安装目录中增加代理。
本实施例中采用pinpoint为基础的自动化安装代理服务链路监控技术,本技术兼容CGLIB、Java Javassist和ASM多种字节码操作技术探针,支持应用探针健康检测,提供了无侵入式的调用链监控、方法执行详情查看、应用状态信息监控等功能。目前pinpoint是一种比较成熟的技术了,之所以选择pinpoint为基础是因为pinpoint支持的组件较为丰富而且技术成熟,但是pinpoint的注入对于每一种应用来说配置都不一样,而且配置比较复杂,不易用。本实施例在支持pinpoint的同时,把代理安装自动化,在***内内置了很多插件,研发人员可以点击下载后进行安装,就可以将代理安装到组件中。以tomcat为例进行说明,如果用户想对tomcat进行链路追踪,点击下载后***会自动识别tomcat的安装目录,并找到tomcat的启动脚本,在脚本中增加对代理的支持,如下:
profiler.collector.ip=pinpointserver_IP
CATALINA_OPTS="$CATALINA_OPTS-javaagent:/data/pp-agent/pinpoint-bootstrap-1.5.2.jar"
CATALINA_OPTS="$CATALINA_OPTS-Dpinpoint.agentId=XXXXX"
CATALINA_OPTS="$CATALINA_OPTS-Dpinpoint.applicationName=XXXX
接下来重启tomcat就能实现对tomcat的链路监控。***中内置了springBoot、mysql、python等组件的支持,极大方便了用户的开发和使用。
响应于存在链路的流量超过阈值和/或所述调用链关系出现故障,根据异常的等级采用相应的告警方式进行告警。当某一个链路的流量较大时,或者调用关系出现故障时,会有链路故障或者拥堵的提示,并产生告警,用户就可以及时了解应用风险。并且,可以根据异常的等级采用不同的告警方式,例如,当异常等级较低时可以仅发出警报,当异常等级较高时可以既发出警报又通过短信、电话等方式通知用户。
在一些实施方式中,方法还包括:将服务日志的采集设置成界面化配置,并通过在界面填写采集目录对目标对象的日志进行采集。
日志采集存储可以为开发者提供后期分析,当***宕机后,可以留作证据进行排错分析。本实施例的日志采集采用业界通用的filebeat+logstash+ES的架构方案,该方案在业界发展比较成熟。本实施例的优化点在于,针对每一种的服务日志采集做成了界面化配置,用户不需要进入每个服务,改动filebeat的采集目录等,只需要在界面填写采集目录即可,可以自动化的将配置下发给filebeat。此外,日志是以应用为单位进行展示,业界的日志采集方案大部分都是全部保存在ES中进行分词等,如果想查询和搜索的话非常的不便,本实施例以应用为视角,进入应用后,自动过滤和此应用相关的日志信息,其他不相关的日志已经自动排除,这样用户就可以很方便的查找日志了。
在一些实施方式中,方法还包括:从所述日志中获取每一种应用程序接口的操作频率和应用程序接口的平均响应时间,并根据所述操作频率和平均响应时间对应用程序接口进行优化。
本实施例提供了基于用户操作日志和访问接口相结合的行为分析方法。本实施例中的操作日志详细记录了用户操作一个功能的时间、成功与否、操作对象、操作行为、描述等信息。每一种操作都对应一个操作码,后台可以根据操作码对操作进行唯一性的识别,通过统计分析,可以统计出用户的高频行为,并结合操作行为的上下文,分析用户的操作典型场景。除此之外,还可以结合后台的访问应用程序接口进行统计,应用程序接口统计主要包括每一种应用程序接口的操作频率以及应用程序接口的平均响应时间。通过两者的结合,可以分析出用户的日常操作和对应的后台接口,以此为基础,就可以针对***的功能进行进一步的优化。不断提高产品的性能和稳定性,提高产品竞争力。
本实施例将和应用相关的所有资源都加入应用中,用户通过应用就能查看和此应用相关的所有资源的监控信息,因此整体性更好,避免了数据割裂,更加易用;本实施例通过无侵入技术实现对服务本身和应用数据库、中间件的监控,能够真正实现应用全方位的监控,降低数字***故障频率,提前发现流量瓶颈,提升处理和排查效率;本实施例从应用的视角分析用户的行为,以操作日志和访问应用程序接口的数量为基础,统计用户经常访问的功能,给开发者提供热点功能视图,为进一步分析***性能和提高***易用性稳定性提供帮助;本实施例的日志采集功能可以将和该应用相关的组件以及服务的日志全部采集,自动以应用进行了分类,分类后方便用户查看和功能排查。
需要特别指出的是,上述基于应用的全链路监控的方法的各个实施例中的各个步骤均可以相互交叉、替换、增加、删减,因此,这些合理的排列组合变换之于基于应用的全链路监控的方法也应当属于本发明的保护范围,并且不应将本发明的保护范围局限在实施例之上。
基于上述目的,本发明实施例的第二个方面,提出了一种基于应用的全链路监控的***。如图2所示,***200包括如下模块:创建模块,配置用于根据服务类型创建多个应用,并在每个应用中添加与所述应用相关的所有资源;分析模块,配置用于根据所述所有资源分析所述应用的调用链关系,并根据所述调用链关系形成所述应用的拓扑图;监控模块,配置用于通过代理服务监控所述拓扑图中每条链路的资源使用情况,并判断是否存在链路的流量超过阈值或所述调用链关系出现故障;以及告警模块,配置用于响应于存在链路的流量超过阈值和/或所述调用链关系出现故障,根据异常的等级采用相应的告警方式进行告警。
在一些实施方式中,所述监控模块配置用于:获取目标链路的安装目录,并在所述安装目录中增加代理。
在一些实施方式中,***还包括采集模块(图中未示出),配置用于:将服务日志的采集设置成界面化配置,并通过在界面填写采集目录对目标对象的日志进行采集。
在一些实施方式中,***还包括优化模块(图中未示出),配置用于:从所述日志中获取每一种应用程序接口的操作频率和应用程序接口的平均响应时间,并根据所述操作频率和平均响应时间对应用程序接口进行优化。
本实施例将和应用相关的所有资源都加入应用中,用户通过应用就能查看和此应用相关的所有资源的监控信息,由此整体性更好,而且避免了数据割裂,更加易用;本实施例至少通过无侵入技术实现对服务本身和应用数据库、中间件的监控,能够真正实现应用全方位的监控,降低数字***故障频率,提前发现流量瓶颈,并且提升处理和排查效率;本实施例从应用的视角分析用户的行为,以操作日志和访问应用程序接口的数量为基础,统计用户经常访问的功能,给开发者提供热点功能视图,为进一步分析***性能和提高***易用性稳定性提供帮助;本实施例的日志采集功能可以将和该应用相关的组件以及服务的日志全部采集,自动以应用进行了分类,分类后方便用户查看和功能排查。
基于上述目的,本发明实施例的第三个方面,提出了一种计算机设备,包括:至少一个处理器;以及存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行以实现如下步骤:S1、根据服务类型创建多个应用,并在每个应用中添加与所述应用相关的所有资源;S2、根据所述所有资源分析所述应用的调用链关系,并根据所述调用链关系形成所述应用的拓扑图;S3、通过代理服务监控所述拓扑图中每条链路的资源使用情况,并判断是否存在链路的流量超过阈值或所述调用链关系出现故障;以及S4、响应于存在链路的流量超过阈值和/或所述调用链关系出现故障,根据异常的等级采用相应的告警方式进行告警。
在一些实施方式中,所述通过代理服务监控所述拓扑图中每条链路的资源使用情况包括:获取目标链路的安装目录,并在所述安装目录中增加代理。
在一些实施方式中,步骤还包括:将服务日志的采集设置成界面化配置,并通过在界面填写采集目录对目标对象的日志进行采集。
在一些实施方式中,步骤还包括:从所述日志中获取每一种应用程序接口的操作频率和应用程序接口的平均响应时间,并根据所述操作频率和平均响应时间对应用程序接口进行优化。
本实施例将和应用相关的所有资源都加入应用中,用户通过应用就能查看和此应用相关的所有资源的监控信息,因此整体性更好,并且避免了数据割裂,更加易用;本实施例还可以通过无侵入技术实现对服务本身和应用数据库、中间件的监控,真正实现应用全方位的监控,降低数字***故障频率,提前发现流量瓶颈,并且提升处理和排查效率;本实施例从应用的视角分析用户的行为,以操作日志和访问应用程序接口的数量为基础,统计用户经常访问的功能,给开发者提供热点功能视图,为进一步分析***性能和提高***易用性稳定性提供帮助;本实施例的日志采集功能可以将和该应用相关的组件以及服务的日志全部采集,自动以应用进行了分类,分类后方便用户查看和功能排查。
如图3所示,为本发明提供的上述基于应用的全链路监控的计算机设备的一个实施例的硬件结构示意图。
以如图3所示的装置为例,在该装置中包括一个处理器301以及一个存储器302。
处理器301和存储器302可以通过总线或者其他方式连接,图3中以通过总线连接为例。
存储器302作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的基于应用的全链路监控的方法对应的程序指令/模块。处理器301通过运行存储在存储器302中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例的基于应用的全链路监控的方法。
存储器302可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储根据基于应用的全链路监控的方法的使用所创建的数据等。此外,存储器302可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器302可选包括相对于处理器301远程设置的存储器,这些远程存储器可以通过网络连接至本地模块。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个基于应用的全链路监控的方法对应的计算机指令303存储在存储器302中,当被处理器301执行时,执行上述任意方法实施例中的基于应用的全链路监控的方法。
执行上述基于应用的全链路监控的方法的计算机设备的任何一个实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
本发明还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时执行如上基于应用的全链路监控的方法的计算机程序。
如图4所示,为本发明提供的上述基于应用的全链路监控的计算机存储介质的一个实施例的示意图。以如图4所示的计算机存储介质为例,计算机可读存储介质401存储有被处理器执行时执行如上方法的计算机程序402。
最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,基于应用的全链路监控的方法的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,程序的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

Claims (6)

1.一种基于应用的全链路监控的方法,其特征在于,包括如下步骤:
根据服务类型创建多个应用,并在每个应用中添加与所述应用相关的所有资源;
根据所述所有资源分析所述应用的调用链关系,并根据所述调用链关系形成所述应用的拓扑图;
通过代理服务监控所述拓扑图中每条链路的资源使用情况,并判断是否存在链路的流量超过阈值或所述调用链关系出现故障;以及
响应于存在链路的流量超过阈值和/或所述调用链关系出现故障,根据异常的等级采用相应的告警方式进行告警,
方法还包括:
将服务日志的采集设置成界面化配置,并通过在界面填写采集目录对目标对象的日志进行采集,
从所述日志中获取每一种应用程序接口的操作频率和应用程序接口的平均响应时间,并根据所述操作频率和平均响应时间对应用程序接口进行优化。
2.根据权利要求1所述的方法,其特征在于,所述通过代理服务监控所述拓扑图中每条链路的资源使用情况包括:
获取目标链路的安装目录,并在所述安装目录中增加代理。
3.一种基于应用的全链路监控的***,其特征在于,包括:
创建模块,配置用于根据服务类型创建多个应用,并在每个应用中添加与所述应用相关的所有资源;
分析模块,配置用于根据所述所有资源分析所述应用的调用链关系,并根据所述调用链关系形成所述应用的拓扑图;
监控模块,配置用于通过代理服务监控所述拓扑图中每条链路的资源使用情况,并判断是否存在链路的流量超过阈值或所述调用链关系出现故障;以及
告警模块,配置用于响应于存在链路的流量超过阈值和/或所述调用链关系出现故障,根据异常的等级采用相应的告警方式进行告警,
***还包括采集模块,配置用于:
将服务日志的采集设置成界面化配置,并通过在界面填写采集目录对目标对象的日志进行采集,
***还包括优化模块,配置用于:
从所述日志中获取每一种应用程序接口的操作频率和应用程序接口的平均响应时间,并根据所述操作频率和平均响应时间对应用程序接口进行优化。
4.根据权利要求3所述的***,其特征在于,所述监控模块配置用于:
获取目标链路的安装目录,并在所述安装目录中增加代理。
5. 一种计算机设备,其特征在于,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现权利要求1-2任意一项所述方法的步骤。
6.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-2任意一项所述方法的步骤。
CN202110929024.5A 2021-08-13 2021-08-13 基于应用的全链路监控的方法、***、设备和存储介质 Active CN113760652B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110929024.5A CN113760652B (zh) 2021-08-13 2021-08-13 基于应用的全链路监控的方法、***、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110929024.5A CN113760652B (zh) 2021-08-13 2021-08-13 基于应用的全链路监控的方法、***、设备和存储介质

Publications (2)

Publication Number Publication Date
CN113760652A CN113760652A (zh) 2021-12-07
CN113760652B true CN113760652B (zh) 2023-12-26

Family

ID=78789225

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110929024.5A Active CN113760652B (zh) 2021-08-13 2021-08-13 基于应用的全链路监控的方法、***、设备和存储介质

Country Status (1)

Country Link
CN (1) CN113760652B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114328139A (zh) * 2021-12-17 2022-04-12 江苏银承网络科技股份有限公司 大厅接口的监控方法、装置、存储介质及服务器
CN114826864A (zh) * 2022-03-11 2022-07-29 阿里巴巴(中国)有限公司 应用***的架构确定方法和装置、电子设备及计算机可读存储介质
CN116737514B (zh) * 2023-08-15 2023-12-22 南京国睿信维软件有限公司 一种基于日志与探针解析自动化运维方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224445A (zh) * 2015-10-28 2016-01-06 北京汇商融通信息技术有限公司 分布式跟踪***
WO2018137254A1 (zh) * 2017-01-26 2018-08-02 华为技术有限公司 一种基于调用链的并发控制的方法、装置及控制节点
CN109873717A (zh) * 2019-01-18 2019-06-11 深圳壹账通智能科技有限公司 监控方法、装置、计算机设备及存储介质
CN110245035A (zh) * 2019-05-20 2019-09-17 平安普惠企业管理有限公司 一种链路跟踪方法及装置
WO2020220638A1 (zh) * 2019-04-29 2020-11-05 平安科技(深圳)有限公司 链路***与日志***的关联方法、装置及存储介质
CN112346930A (zh) * 2020-10-30 2021-02-09 银盛支付服务股份有限公司 一种基于cat监控全链路方法及***
CN112596974A (zh) * 2020-12-10 2021-04-02 长沙市到家悠享网络科技有限公司 一种全链路监控方法、装置、设备和存储介质
CN112653586A (zh) * 2019-10-12 2021-04-13 苏州工业园区测绘地理信息有限公司 基于全链路监控的时空大数据平台应用性能管理方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224445A (zh) * 2015-10-28 2016-01-06 北京汇商融通信息技术有限公司 分布式跟踪***
WO2018137254A1 (zh) * 2017-01-26 2018-08-02 华为技术有限公司 一种基于调用链的并发控制的方法、装置及控制节点
CN109873717A (zh) * 2019-01-18 2019-06-11 深圳壹账通智能科技有限公司 监控方法、装置、计算机设备及存储介质
WO2020147419A1 (zh) * 2019-01-18 2020-07-23 深圳壹账通智能科技有限公司 监控方法、装置、计算机设备及存储介质
WO2020220638A1 (zh) * 2019-04-29 2020-11-05 平安科技(深圳)有限公司 链路***与日志***的关联方法、装置及存储介质
CN110245035A (zh) * 2019-05-20 2019-09-17 平安普惠企业管理有限公司 一种链路跟踪方法及装置
CN112653586A (zh) * 2019-10-12 2021-04-13 苏州工业园区测绘地理信息有限公司 基于全链路监控的时空大数据平台应用性能管理方法
CN112346930A (zh) * 2020-10-30 2021-02-09 银盛支付服务股份有限公司 一种基于cat监控全链路方法及***
CN112596974A (zh) * 2020-12-10 2021-04-02 长沙市到家悠享网络科技有限公司 一种全链路监控方法、装置、设备和存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Research on Network Traffic Anomaly Detection Based on Stream Characteristics in Unsaturated Link;Jun Han等;2019 IEEE 4th International Conference on Advanced Robotics and Mechatronics (ICARM);全文 *
一种云环境下分布式应用业务态势感知***设计方法;郭杰;王磊;王建纲;;冶金自动化(第04期);全文 *
一种基于APM应用全链路监控工具设计;刘霞霞;高阿朋;任春雷;文建军;史金奇;;网络安全技术与应用(第06期);全文 *
分布式***服务链追踪与监控;郑邦峰;;工业技术创新(第02期);全文 *

Also Published As

Publication number Publication date
CN113760652A (zh) 2021-12-07

Similar Documents

Publication Publication Date Title
CN113760652B (zh) 基于应用的全链路监控的方法、***、设备和存储介质
US20220206889A1 (en) Automatic correlation of dynamic system events within computing devices
US20180365085A1 (en) Method and apparatus for monitoring client applications
CN110908879B (zh) 埋点数据的上报方法、装置、终端和存储介质
CN105743730B (zh) 为移动终端的网页服务提供实时监控的方法及其***
CN110309029B (zh) 异常数据的采集方法、装置、计算机设备和存储介质
CN107704360B (zh) 监控数据的处理方法、设备、服务器及存储介质
WO2015009405A1 (en) Systems and methods for filtering low utility value messages from system logs
CN112350854B (zh) 一种流量故障定位方法、装置、设备及存储介质
CN105589782A (zh) 基于浏览器的用户行为采集方法
WO2022063032A1 (zh) 一种面向分布式***的故障信息关联上报方法及相关设备
CN116107846B (zh) 一种基于EBPF的Linux***事件监控方法及装置
CN108462598A (zh) 一种日志生成方法、日志分析方法及装置
CN113835836B (zh) 动态发布容器服务的***、方法、计算机设备及介质
US11635972B2 (en) Multi-tenant java agent instrumentation system
CN114697232A (zh) Skywalking探针的指标数据采集***、方法及电子设备
CN112685270A (zh) 一种***监控日志的采集方法、装置、电子设备及介质
US10180914B2 (en) Dynamic domain name service caching
CN115729727A (zh) 故障修复方法、装置、设备及介质
US10644971B2 (en) Graph search in structured query language style query
CN108959041B (zh) 信息发送的方法、服务器及计算机可读存储介质
CN114816914A (zh) 基于Kubernetes的数据处理方法、设备及介质
CN113282557A (zh) 一种基于Spring框架的大数据日志分析的方法和***
US10296967B1 (en) System, method, and computer program for aggregating fallouts in an ordering system
CN112437067A (zh) 一种分布式集群数据上报的方法、***、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant