CN114625597A - 监控运维***、方法、装置、电子设备及存储介质 - Google Patents

监控运维***、方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114625597A
CN114625597A CN202011521087.9A CN202011521087A CN114625597A CN 114625597 A CN114625597 A CN 114625597A CN 202011521087 A CN202011521087 A CN 202011521087A CN 114625597 A CN114625597 A CN 114625597A
Authority
CN
China
Prior art keywords
monitoring
module
task
alarm
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011521087.9A
Other languages
English (en)
Inventor
张晓兰
***
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asiainfo Technologies China Inc
Original Assignee
Asiainfo Technologies China Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asiainfo Technologies China Inc filed Critical Asiainfo Technologies China Inc
Priority to CN202011521087.9A priority Critical patent/CN114625597A/zh
Publication of CN114625597A publication Critical patent/CN114625597A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本公开提供了一种监控运维***、方法、装置、电子设备及存储介质,涉及监控技术领域。该***包括监控配置模块,用于确认待监控目标,并基于待监控目标创建监控任务;参数采集模块,用于基于监控任务采集监控目标的监控参数,并将监控参数发送至参数处理模块;参数处理模块,用于对监控参数进行分析,并将分析结果存入预设的分布式数据库中;报警模块,用于基于分析结果按照预设的规则发出警报。本公开实施例通过使用分布式数据库,原生支持水平弹性扩展、ACID事务、标准SQL、MySQL语法和MySQL协议,不需要依赖第三方组件,提供高并发、高可用、水平扩展特性,从而很好地满足监控***的数据实时性存储、历史数据的海量存储访问及数据存储的可靠性。

Description

监控运维***、方法、装置、电子设备及存储介质
技术领域
本公开涉及监控技术领域,具体而言,本公开涉及一种监控运维***、方法、装置、电子设备及存储介质。
背景技术
监控技术在很多场景都有着十分广阔的应用,可以说现代生活已经离不开监控,而对监控***产生的历史数据的访问和存储,都会严重影响整个监控***的性能。
现有的监控***中,多是以单体架构构建,存在***过度复杂、开发速度缓慢、代码部署复杂易错、难以扩展、可靠性差及技术栈单一等等缺点。在监控数据存储方面,传统的Mysql数据库需要结合第三方的负载均衡、mycat组件来提供高并发、海量数据的访问及存储,同时采用主备模式提高数据的可靠性,部署及运维复杂,且数据访问及存储效率低。
由此可见,现有技术中存在监控***结构复杂且对数据的存储和访问效率低的技术问题,急需解决。
发明内容
本公开的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中存在监控***结构复杂且对数据的存储和访问效率低的技术问题。
第一方面,提供了一种监控运维***,该***包括监控配置模块、参数采集模块、参数处理模块以及报警模块,其中:
所述监控配置模块,用于确认待监控目标,并基于所述待监控目标创建监控任务;
所述参数采集模块,用于基于所述监控任务采集所述监控目标的监控参数,并将所述监控参数发送至所述参数处理模块;
所述参数处理模块,用于对所述监控参数进行分析,得到分析结果,并将所述分析结果存入预设的分布式数据库中;
所述报警模块,用于基于所述分析结果按照预设的规则发出警报。
作为本公开一个可能的实施例,所述***还包括集中管理模块,其中,所述集中管理模块用于配置和/或删除和/或更新所述监控配置模块、所述参数采集模块、所述参数处理模块、以及所述报警模块。
作为本公开一个可能的实施例,所述集中管理模块、所述监控配置模块、所述参数采集模块、所述参数处理模块、以及所述报警模块都采用微服务架构。
作为本公开一个可能的实施例,所述监控配置模块包括:
监控目标确认单元,用于基于用户的配置请求确认待监控目标;
任务创建单元,用于基于所述配置请求和所述待监控目标建立监控任务。
作为本公开一个可能的实施例,所述监控配置模块在创建监控任务之后,还用于将所述监控任务发送至任务队列,所述参数采集模块包括:
任务监听单元,用于监听所述任务队列,获取所述任务队列中的所述监控任务;
参数采集单元,用于按照预设的协议采集所述待监控目标的监控参数。
作为本公开一个可能的实施例,所述参数处理模块,包括:
参数处理单元,用于对所述监控参数进行分析,并得到分析结果;
数据存储单元,用于将所述分析结果中的正常结果存入预设的分布式数据库中;
异常处理单元,用于将所述分析结果中的异常结果发送至报警队列。
作为本公开一个可能的实施例,所述报警模块包括:
报警监听单元,用于监听所述报警队列,并获取所述报警队列中的所述异常结果;
报警单元,用于基于所述异常结果按照预设的规则发出警报。
第二方面,提供了一种监控运维方法,该方法包括:
接收监控配置请求,基于所述监控配置请求确认待监控目标并创建监控任务;
基于所述监控任务采集所述待监控目标的监控参数;
对所述监控参数进行分析,确定分析结果,并将所述分析结果存入预设的分布式数据库中;
基于所述分析结果按照预设的规则发出警报。
第三方面,提供了一种监控运维装置,该装置包括:
任务创建模块,用于接收监控配置请求,基于所述监控配置请求确认待监控目标并创建监控任务;
数据采集模块,用于基于所述监控任务采集所述待监控目标的监控参数;
数据分析模块,用于对所述监控参数进行分析,确定分析结果,并将所述分析结果存入预设的分布式数据库中;
警告模块,用于基于所述分析结果按照预设的规则发出警报。
第四方面,提供了一种电子设备,该电子设备包括:
处理器、存储器和总线;
所述总线,用于连接所述处理器和所述存储器;
所述存储器,用于存储操作指令;
所述处理器,用于通过调用所述操作指令,执行上述的监控运维方法。
第五方面,提供了一种存储介质,所述存储介质存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述的监控运维方法。
本公开实施例通过使用分布式数据库,原生支持水平弹性扩展、ACID事务、标准SQL、MySQL语法和MySQL协议,不需要依赖第三方组件,提供高并发、高可用、水平扩展特性,从而很好地满足监控***的数据实时性存储、历史数据的海量存储访问及数据存储的可靠性。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对本公开实施例描述中所需要使用的附图作简单地介绍。
图1为本公开实施例提供的一种监控运维***的结构示意图;
图2为本公开实施例提供的一种监控示意图;
图3为本公开实施例提供的一种集中管理模块的结构示意图;
图4为本公开实施例提供的一种监控配置模块的结构示意图;
图5为本公开实施例提供的一种参数采集模块的结构示意图;
图6为本公开实施例提供的一种参数处理模块的结构示意图;
图7为本公开实施例提供的一种报警模块的结构示意图;
图8为本公开实施例提供的一种监控运维方法的流程示意图;
图9为本公开实施例提供的一种监控运维装置的结构示意图;
图10为本公开实施例提供的一种电子设备的结构示意图。
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对装置、模块或单元进行区分,并非用于限定这些装置、模块或单元一定为不同的装置、模块或单元,也并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
现有的监控***中,对于监控***历史数据的存储和访问,会严重影响***的性能,比如,被监控的主机有300台,平均每台主机有100个监控项,监控间隔为1分钟,数据存储期限为90天,则历史数据可达到3,888,000,000条,假如每条历史数据所占空间为50B,则存储历史数据所占空间需要大约182GB。而传统的开源监控***如zabbix、cacti,使用MySQL数据库,随着历史数据的增加,数据库将成为***性能瓶颈,本***使用分布式数据库,原生支持水平弹性扩展、ACID事务、标准SQL、MySQL语法和MySQL协议,不需要依赖第三方组件,提供高并发、高可用、水平扩展特性,从而很好地满足监控***的数据实时性存储、历史数据的海量存储访问及数据存储的可靠性。
本公开提供的监控运维***、方法、装置、电子设备和存储介质,旨在解决现有技术的如上技术问题。
下面以具体地实施例对本公开的技术方案以及本公开的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本公开的实施例进行描述。
本公开实施例中提供了一种监控运维***,如图1所示,该***包括监控配置模块101、参数采集模块102、参数处理模块103以及报警模块104,其中:
所述监控配置模块101,用于确认待监控目标,并基于所述待监控目标创建监控任务。
本公开实施例提供的监控运维***可以对计算机***中的计算机硬件、软件、网络、数据等进行监控,其中待监控目标可以是一台或多台计算机、一个或多个网络、一个或多个软件以及计算机网络中的所有数据等,比如,待监控目标可以是某台电脑的实时显示画面或者后台运行程序等,也可以是计算机***中某个任务的执行过程,还可以是某个数据库中数的增减、删除以及更新等。针对不同的监控目标,需要创建不同的监控任务,例如,如监控目标是某台电脑的实时显示画面,则对应创建的监控任务可能是监控该画面中是否出现违法内容,如监控目标是某个任务的执行过程,则对应创建的监控任务可能是该任务的执行过程是否满足预设的要求等。
所述参数采集模块102,用于基于所述监控任务采集所述监控目标的监控参数,并将所述监控参数发送至所述参数处理模块。
在本公开实施例中,监控参数是指基于监控任务采集的监控目标的参数,待监控目标不同,采集的参数不同,监控任务不同,采集的参数也不同。例如,当监控目标是某个数据库时,监控任务是该数据库中的数据是否发生增加、删除或更新时,采集的数据为该数据库中数的变化。在采集监控目标的参数时,可以根据预设的时间间隔对参数进行采集,并将采集到的参数发送至参数处理模块。
所述参数处理模块103,用于对所述监控参数进行分析,得到分析结果,并将所述分析结果存入预设的分布式数据库中。
在本公开实施例中,分布式数据库采用TiDB分布式数据库,原生支持水平弹性扩展、ACID事务、标准SQL(Structured Query Language,结构化查询语言)结构化查询语言、MySQL语法和MySQL协议,不需要依赖第三方组件,提供高并发、高可用、水平扩展特性,从而很好地满足监控***的数据实时性存储、历史数据的海量存储访问及数据存储的可靠性。参数处理模块用于基于监控任务对参数进行分析,判断参数是否异常,并将分析结果存入分布式数据库中。
所述报警模块104,用于基于所述分析结果按照预设的规则发出警报。
在本公开实施例中,报警模块主要用户基于分析结果按照预设的规则发出警报,其中,该预设的规则是指预先设置的报警规则,针对不同的待监控目标和监控任务,报警规则不同,例如,当待监控内容为某台电脑的实时显示画面,监控任务是该电脑的实时画面是否出现违法内容时,若通过参数采集模块采集到该电脑的实时显示画面的参数中,通过参数处理模块处理后得出的结论是该电脑画面出现了违法内容,则报警模块会发出警报,其中,发出警报的方式可以是将该次警报上报至用户终端,供用户处理,或者直接显示报警页面,发出报警声音等。
对于本公开实施例,为方便说明,以一个具体实施例为例,如图2所示,本公开实施例提供的监控运维***监控的其中一个目标是局域网201中接入设备的数量,在确定待监控目标时,监控配置模块通过确认该局域网201是否存在,并将该局域网201作为待监控目标,并创建相应的监控任务,其中,监控任务为该局域网201中接入设备的数量是否异常,可选的,可以根据预先设定的值确定该局域网201中接入设备的数量是否异常,如当该局域网中接入设备的数量在30~150之间是为正常,否则为异常。在创建监控任务之后,参数采集模块开始采集参数,相对应该任务来说,采集的参数为该局域网201中接入设备的数量,可选的,可以每个10s采集一次,例如,参数采集模块采集到的数量分别为85、76、98、114、167,并将该五次采集的参数发送至参数处理模块,参数处理模块开始对这五次采集的参数进行处理,经过与预设的阈值进行对比,可以得到前四次采集的参数都第五次采集的参数超出阈值,属于异常,并将该五次分析结构存入预设的TiDB分布式数据库,报警模块从数据库中获取到该五次结果中的异常结果,并发出警报,如将此次异常数据上报至用户终端,方便用户查询异常原因并处理异常。
本公开实施例通过使用分布式数据库,原生支持水平弹性扩展、ACID事务、标准SQL、MySQL语法和MySQL协议,不需要依赖第三方组件,提供高并发、高可用、水平扩展特性,从而很好地满足监控***的数据实时性存储、历史数据的海量存储访问及数据存储的可靠性。
本公开实施例提供了一种可能的实现方式,在该实现方式中,如图3所示,该监控运维***还包括集中管理模块105,其中,所述集中管理模块105用于配置和/或删除和/或更新所述监控配置模块101、所述参数采集模块102、所述参数处理模块103、以及所述报警模块104,其中,所述集中管理模块、所述监控配置模块、所述参数采集模块、所述参数处理模块、以及所述报警模块都采用微服务架构。
在本公开实施例中,所述监控配置模块101、所述参数采集模块102、所述参数处理模块103、所述报警模块104、以及所述集中管理模块105都采用Spring Cloud微服务架构,将监控***分解为一组明确定义了职责范围的细粒度服务;每个服务可以由独立团队开发,团队只需专注某个服务,加快开发速度,且可以自由选择合理的技术栈,只要服务遵守API(Application Programming Interface,应用程序编程接口)约定即可,每个服务单独部署,提高了***水平扩展能力,其中,集中管理模块105采用Spring Cloud Config微服务,用于集中管理微服务的配置,解耦微服务的配置与部署,动态更新微服务配置,增加、删除微服务,或者更新微服务等,可以实现微服务配置集中管理、微服务弹性扩缩、服务故障或降级的熔断、服务可跟踪、微服务不同版本的A/B测试以及微服务的无缝升级,简化***的开发、管理、运维,提高***的可用性及可靠性,提高开发及运维人员的工作效率。
本公开实施例提供了一种可能的实现方式,在该实现方式中,如图4所示,所述监控配置模块包括:
监控目标确认单元401,用于基于用户的配置请求确认待监控目标;
任务创建单元402,用于基于所述配置请求和所述待监控目标建立监控任务。
在本公开实施例中,用户的配置请求包括请求配置监控任务和需要监控的待监控目标以及需要监控的相关参数。
对于本公开实施例,在监控目标确认单元401在接收到用户的配置请求之后,确认待监控目标,并确认该带监控目标的目标信息和监控任务的任务信息,其中,该目标信息可以包括目标名称、关联的监控模板、归属的监控组、归属的资源类型等信息,任务信息可以是任务名称、采集使用的协议、采集脚本、间隔时间、保存时长等等信息,任务创建单元根据上述配置创建相应的监控任务,其中,用户的一次配置请求可以包含多个监控任务和多个监控目标。
对于本公开实施例,为方便说明,以一个具体实施例为例,用户通过用户终端发起的配置请求中,包括的待监控目标为某个任务的执行流程,配置的监控任务为该任务的执行流程是否符合预设进度,则监控目标确认单元基于该配置请求确认需要监控的任务,并将该任务的执行进度确定为监控参数,规定采集参数时间的间隔为一分钟,创建监控任务,对该任务的执行进度进行监控。
本公开实施例提供的监控配置模块提供批量监控项配置,同时提供定制化监控项配置,保障***的稳定性。
本公开实施例提供了一种可能的实现方式,在该实现方式中,所述监控配置模块在创建监控任务之后,还用于将所述监控任务发送至任务队列,如图5所示,所述参数采集模块包括:
任务监听单元501,用于监听所述任务队列,获取所述任务队列中的所述监控任务;
参数采集单元502,用于按照预设的协议采集所述待监控目标的监控参数。
在本公开实施例中,考虑到监控任务的大量快速产生,引入任务队列,缓冲对参数采集模块的冲击,保障***的稳定性。任务队列用于存放已经创建的监控任务,并对监控任务进行排序,其中,排序可以根据任务创建的先后顺序进行排序,也可以根据任务的优先级进行排序。
对于本公开实施例,任务监听单元501用于监听任务队列的任务,并从任务队列中获取监控任务,参数采集单元502基于该监控任务开始采集参数,其中,采集参数使用的协议包括Http协议、SSH协议、SNMP协议、IPMI协议,参数采集单元根据配置的协议,调用对应的客户端,执行预置的脚本或者命令,采集数据,并将采集的数据发送给参数处理模块。
对于本公开实施例,为方便说明,以一个具体实施例为例,当任务监听单元监听到任务队列有新的监控任务时,获取该监控任务,如该监控任务为监控某台电脑的实时画面,参数采集模块基于该监控任务,按照Http协议、SSH协议、SNMP协议、IPMI协议对电脑的实时画面进行采集,并将采集到的数据发送至参数处理模块。
本公开实施例提供的参数采集模块支持对服务器、网络设备、存储设备、数据库、中间件、容器等等各种物理、虚拟资源的性能指标采集,全面监控各项资源的运行状态,保障各项资源的正常运行,减少运维成本和时间。
本公开实施例提供了一种可能的实现方式,在该实现方式中,如图6所示,所述参数处理模块,包括:
参数处理单元601,用于对所述监控参数进行分析,并得到分析结果;
数据存储单元602,用于将所述分析结果中的正常结果存入预设的分布式数据库中;
异常处理单元603,用于将所述分析结果中的异常结果发送至报警队列。
在本公开实施例中,参数处理单元601可以是具有计算能力的计算机、服务器等,服务器可以是一台服务器,或者有若干台服务器,或者是一个虚拟化平台,或者是一个云计算服务中心,用于对参数进行分析并得到分析结果,其中,针对监控任务的不同,分析结果有正常结果和异常结果,对于正常结果,数据存储单元602将该正常结果存入至预设的分布式数据库中,对于异常结果,异常处理单元603用于将该异常结果发送至报警队列。
对于本公开实施例,为方便说明,以一个具体实施例为例,根据用户配置请求,对采集的原始数据进行预处理将预处理后的性能数据入库对于异常性能数据,将满足异常阀值的性能数据,放入告警消息队列。在一个实施例中,单次采集服务器所有性能指标项所需数据,包括cpu(Central Processing Unit,中央处理器)、内存、磁盘、网络、进程数、登录用户数、操作***基本信息等等,采集数据以JSON字符串类型返回,解析JSON字符串,从而获取服务器cpu、内存、磁盘等等各方面的监控指标项数据,对入库前的数据进行格式化处理,通过Hystrix库执行数据持久化操作,对于异常数据,使用Spring AOP(Aspect OrientedProgramming,面向切面编程)技术,根据配置的数据阀值,检查性能数据是否异常,并将异常数据放入报警队列。
本公开实施例提供的参数处理模块,实现了一次采集多个指标数据,提高了***采集处理数据的性能。通过Hystrix库调用数据持久化操作,在数据库服务降级或者故障时,执行熔断和后备操作,防止***的级联崩溃,增强***稳定性,AOP技术的引入,将异常数据监控与数据持久化操作分离,***框架更清晰简洁。
本公开实施例提供了一种可能的实现方式,在该实现方式中,如图7所示,所述报警模块包括:
报警监听单元701,用于监听所述报警队列,并获取所述报警队列中的所述异常结果;
报警单元702,用于基于所述异常结果按照预设的规则发出警报。
在本公开实施例中,报警监听单元用于配置告警方式、故障恢复操作,并监听报警队列消息,获取异常结果,报警单元702用于根据配置的告警方式,将告警以指定方式通知或者展示,并用于主动故障恢复,将告警恢复以指定方式通知或者展示。
对于本公开实施例,为方便说明,以一个具体实施例为例,报警监听单元701从报警队列获取异常结果,组装报警信息,包括:监控目标名称、监控项名称、报警名称、报警等级、报警详细描述、发生时间、故障原因及故障处理措施等等,缓存入数据库。报警单元702根据预置的告警方式,包括微信、短信、邮件等,发出告警通知至指定用户,并配置的故障恢复操作命令,包括IPMI命令、Shell脚本,调用IPMI客户端或者SSH客户端,对监控目标执行恢复操作,尝试自动恢复故障。
本公开实施例提供的报警模块支持多种方式实时发送告警至指定人员,第一时间发现故障,及时处理故障。运维中绝大部分的故障都是简单、重复的操作便可以解决,通过内置的自动故障恢复操作,可以满足大部分故障的恢复,提高的自动化运维能力,减轻大量的运维人力和时间。
本公开实施例使用TiDB分布式数据库代替传统的Mysql数据库,由于TiDB原生支持水平弹性扩展、ACID事务、标准SQL、MySQL语法和MySQL协议,不需要依赖第三方组件就可以提供高并发、高可用、水平扩展特性,简化部署管理,提高数据访问存储效率,更好地满足监控***的数据实时性存储、历史数据的海量存储访问及数据存储的可靠性。采用SpringCloud微服务架构,简化***的开发、管理、运维,提高***的可用性及可靠性,提高开发及运维人员的工作效率。
本公开实施例提供了一种监控运维方法,如图8所示,该方法包括:
步骤S801,接收监控配置请求,基于所述监控配置请求确认待监控目标并创建监控任务。
本公开实施例提供的监控运维方法可以对计算机***中的计算机硬件、软件、网络、数据等进行监控,其中待监控目标可以是一台或多台计算机、一个或多个网络、一个或多个软件以及计算机网络中的所有数据等,比如,待监控目标可以是某台电脑的实时显示画面或者后台运行程序等,也可以是计算机***中某个任务的执行过程,还可以是某个数据库中数的增减、删除以及更新等。针对不同的监控目标,需要创建不同的监控任务,例如,如监控目标是某台电脑的实时显示画面,则对应创建的监控任务可能是监控该画面中是否出现违法内容,如监控目标是某个任务的执行过程,则对应创建的监控任务可能是该任务的执行过程是否满足预设的要求等。
步骤S802,基于所述监控任务采集所述待监控目标的监控参数。
在本公开实施例中,监控参数是指基于监控任务采集的监控目标的参数,待监控目标不同,采集的参数不同,监控任务不同,采集的参数也不同。例如,当监控目标是某个数据库时,监控任务是该数据库中的数据是否发生增加、删除或更新时,采集的数据为该数据库中数的变化。在采集监控目标的参数时,可以根据预设的时间间隔对参数进行采集,并将采集到的参数发送至参数处理模块。
步骤S803,对所述监控参数进行分析,确定分析结果,并将所述分析结果存入预设的分布式数据库中。
在本公开实施例中,分布式数据库采用TiDB分布式数据库,原生支持水平弹性扩展、ACID事务、标准SQL、MySQL语法和MySQL协议,不需要依赖第三方组件,提供高并发、高可用、水平扩展特性,从而很好地满足监控***的数据实时性存储、历史数据的海量存储访问及数据存储的可靠性。参数处理模块用于基于监控任务对参数进行分析,判断参数是否异常,并将分析结果存入分布式数据库中。
步骤S804,基于所述分析结果按照预设的规则发出警报。
在本公开实施例中,报警模块主要用户基于分析结果按照预设的规则发出警报,其中,该预设的规则是指预先设置的报警规则,针对不同的待监控目标和监控任务,报警规则不同,例如,当待监控内容为某台电脑的实时显示画面,监控任务是该电脑的实时画面是否出现违法内容时,若通过参数采集模块采集到该电脑的实时显示画面的参数中,通过参数处理模块处理后得出的结论是该电脑画面出现了违法内容,则报警模块会发出警报,其中,发出警报的方式可以是将该次警报上报至用户终端,供用户处理,或者直接显示报警页面,发出报警声音等。
对于本公开实施例,为方便说明,以一个具体实施例为例,本公开实施例提供的监控运维方法中监控的其中一个目标是局域网中接入设备的数量,在确定待监控目标时,通过确认该局域网是否存在,并将该局域网作为待监控目标,并创建相应的监控任务,其中,监控任务为该局域网中接入设备的数量是否异常,可选的,可以根据预先设定的值确定该局域网中接入设备的数量是否异常,如当该局域网中接入设备的数量在30~150之间是为正常,否则为异常。在创建监控任务之后,开始采集参数,相对于该任务来说,采集的参数为该局域网中接入设备的数量,可选的,可以每个10s采集一次,例如,采集到的数量分别为85、76、98、114、167,并对这五次采集的参数进行处理,经过与预设的阈值进行对比,可以得到前四次采集的参数都第五次采集的参数超出阈值,属于异常,并将该五次分析结构存入预设的TiDB分布式数据库,从数据库中获取到该五次结果中的异常结果,并发出警报,如将此次异常数据上报至用户终端,方便用户查询异常原因并处理异常。
本公开实施例使用TiDB分布式数据库代替传统的Mysql数据库,由于TiDB原生支持水平弹性扩展、ACID事务、标准SQL、MySQL语法和MySQL协议,不需要依赖第三方组件就可以提供高并发、高可用、水平扩展特性,简化部署管理,提高数据访问存储效率,更好地满足监控***的数据实时性存储、历史数据的海量存储访问及数据存储的可靠性。采用SpringCloud微服务架构,简化***的开发、管理、运维,提高***的可用性及可靠性,提高开发及运维人员的工作效率。
本公开实施例提供了一种监控运维装置,如图9所示,该监控运维装置90可以包括:任务创建模块910、数据采集模块920、数据分析模块930、以及警告模块940,其中,
任务创建模块910,用于接收监控配置请求,基于所述监控配置请求确认待监控目标并创建监控任务;
数据采集模块920,用于基于所述监控任务采集所述待监控目标的监控参数;
数据分析模块930,用于对所述监控参数进行分析,确定分析结果,并将所述分析结果存入预设的分布式数据库中;
警告模块940,用于基于所述分析结果按照预设的规则发出警报。
本公开实施例的监控运维装置可执行本公开前述实施例所示的监控运维方法,其实现原理相类似,此处不再赘述。
下面参考图10,其示出了适于用来实现本公开实施例的电子设备1000的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图10示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
电子设备包括:存储器以及处理器,其中,这里的处理器可以称为下文所述的处理装置1001,存储器可以包括下文中的只读存储器(ROM)1002、随机访问存储器(RAM)1003以及存储装置1008中的至少一项,具体如下所示:
如图10所示,电子设备1000可以包括处理装置(例如中央处理器、图形处理器等)1001,其可以根据存储在只读存储器(ROM)1002中的程序或者从存储装置1008加载到随机访问存储器(RAM)1003中的程序而执行各种适当的动作和处理。在RAM 1003中,还存储有电子设备1000操作所需的各种程序和数据。处理装置1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。
通常,以下装置可以连接至I/O接口1005:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置1006;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置1007;包括例如磁带、硬盘等的存储装置1008;以及通信装置1009。通信装置1009可以允许电子设备1000与其他设备进行无线或有线通信以交换数据。虽然图10示出了具有各种装置的电子设备1000,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置1009从网络上被下载和安装,或者从存储装置1008被安装,或者从ROM 1002被安装。在该计算机程序被处理装置1001执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者存储介质或者是上述两者的任意组合。存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收监控配置请求,基于所述监控配置请求确认待监控目标并创建监控任务;基于所述监控任务采集所述待监控目标的监控参数;对所述监控参数进行分析,确定分析结果,并将所述分析结果存入预设的分布式数据库中;基于所述分析结果按照预设的规则发出警报。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块或单元可以通过软件的方式实现,也可以通过硬件的方式来实现。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本公开的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本公开原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本公开的保护范围。

Claims (11)

1.一种监控运维***,其特征在于,所述***包括监控配置模块、参数采集模块、参数处理模块以及报警模块,其中:
所述监控配置模块,用于确认待监控目标,并基于所述待监控目标创建监控任务;
所述参数采集模块,用于基于所述监控任务采集所述监控目标的监控参数,并将所述监控参数发送至所述参数处理模块;
所述参数处理模块,用于对所述监控参数进行分析,得到分析结果,并将所述分析结果存入预设的分布式数据库中;
所述报警模块,用于基于所述分析结果按照预设的规则发出警报。
2.根据权利要求1所述的监控运维***,其特征在于,所述***还包括集中管理模块,其中,所述集中管理模块用于配置和/或删除和/或更新所述监控配置模块、所述参数采集模块、所述参数处理模块、以及所述报警模块。
3.根据权利要求1所述的监控运维***,其特征在于,所述集中管理模块、所述监控配置模块、所述参数采集模块、所述参数处理模块、以及所述报警模块都采用微服务架构。
4.根据权利要求1所述的监控运维***,其特征在于,所述监控配置模块包括:
监控目标确认单元,用于基于用户的配置请求确认待监控目标;
任务创建单元,用于基于所述配置请求和所述待监控目标建立监控任务。
5.根据权利要求1所述的监控运维***,其特征在于,所述监控配置模块在创建监控任务之后,还用于将所述监控任务发送至任务队列,所述参数采集模块包括:
任务监听单元,用于监听所述任务队列,获取所述任务队列中的所述监控任务;
参数采集单元,用于按照预设的协议采集所述待监控目标的监控参数。
6.根据权利要求1所述的监控运维***,其特征在于,所述参数处理模块,包括:
参数处理单元,用于对所述监控参数进行分析,并得到分析结果;
数据存储单元,用于将所述分析结果中的正常结果存入预设的分布式数据库中;
异常处理单元,用于将所述分析结果中的异常结果发送至报警队列。
7.根据权利要求6所述的监控运维***,其特征在于,所述报警模块包括:
报警监听单元,用于监听所述报警队列,并获取所述报警队列中的所述异常结果;
报警单元,用于基于所述异常结果按照预设的规则发出警报。
8.一种监控运维方法,其特征在于,包括:
接收监控配置请求,基于所述监控配置请求确认待监控目标并创建监控任务;
基于所述监控任务采集所述待监控目标的监控参数;
对所述监控参数进行分析,确定分析结果,并将所述分析结果存入预设的分布式数据库中;
基于所述分析结果按照预设的规则发出警报。
9.一种监控运维装置,其特征在于,包括:
任务创建模块,用于接收监控配置请求,基于所述监控配置请求确认待监控目标并创建监控任务;
数据采集模块,用于基于所述监控任务采集所述待监控目标的监控参数;
数据分析模块,用于对所述监控参数进行分析,确定分析结果,并将所述分析结果存入预设的分布式数据库中;
警告模块,用于基于所述分析结果按照预设的规则发出警报。
10.一种电子设备,其特征在于,其包括:
处理器、存储器和总线;
所述总线,用于连接所述处理器和所述存储器;
所述存储器,用于存储操作指令;
所述处理器,用于通过调用所述操作指令,执行上述权利要求8所述的监控运维方法。
11.一种存储介质,其特征在于,所述存储介质存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求8所述的监控运维方法。
CN202011521087.9A 2020-12-21 2020-12-21 监控运维***、方法、装置、电子设备及存储介质 Pending CN114625597A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011521087.9A CN114625597A (zh) 2020-12-21 2020-12-21 监控运维***、方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011521087.9A CN114625597A (zh) 2020-12-21 2020-12-21 监控运维***、方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114625597A true CN114625597A (zh) 2022-06-14

Family

ID=81896578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011521087.9A Pending CN114625597A (zh) 2020-12-21 2020-12-21 监控运维***、方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114625597A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115695549A (zh) * 2022-10-27 2023-02-03 武汉方舟拓海科技有限公司 一种软件架构、终端设备及软件架构的应用方法
CN115757055A (zh) * 2022-10-19 2023-03-07 北京新数科技有限公司 一种基于Spring Cloud的数据库统一运维及综合性能评分***
CN116016117A (zh) * 2022-12-27 2023-04-25 山西合力创新科技股份有限公司 网络设备运维数据采集方法、***、电子设备及存储介质
CN116737498A (zh) * 2023-06-15 2023-09-12 中科驭数(北京)科技有限公司 遥测数据采集方法、***、装置、设备及介质
CN117539728A (zh) * 2024-01-10 2024-02-09 浙江睿数云联科技有限公司 一种分布式数据库监控实现方法、***、装置及介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115757055A (zh) * 2022-10-19 2023-03-07 北京新数科技有限公司 一种基于Spring Cloud的数据库统一运维及综合性能评分***
CN115757055B (zh) * 2022-10-19 2023-10-27 北京新数科技有限公司 一种基于Spring Cloud的数据库统一运维及综合性能评分***
CN115695549A (zh) * 2022-10-27 2023-02-03 武汉方舟拓海科技有限公司 一种软件架构、终端设备及软件架构的应用方法
CN116016117A (zh) * 2022-12-27 2023-04-25 山西合力创新科技股份有限公司 网络设备运维数据采集方法、***、电子设备及存储介质
CN116737498A (zh) * 2023-06-15 2023-09-12 中科驭数(北京)科技有限公司 遥测数据采集方法、***、装置、设备及介质
CN117539728A (zh) * 2024-01-10 2024-02-09 浙江睿数云联科技有限公司 一种分布式数据库监控实现方法、***、装置及介质
CN117539728B (zh) * 2024-01-10 2024-04-12 浙江睿数云联科技有限公司 一种分布式数据库监控实现方法、***、装置及介质

Similar Documents

Publication Publication Date Title
CN114625597A (zh) 监控运维***、方法、装置、电子设备及存储介质
CN109582310B (zh) 数据处理方法、装置、电子设备及计算机可读存储介质
CN111352800A (zh) 大数据集群监控方法及相关设备
CN111198859B (zh) 数据处理方法、装置、电子设备及计算机可读存储介质
CN107644075B (zh) 收集页面信息的方法和装置
CN111597065A (zh) 用于采集设备信息的方法和装置
CN115809119A (zh) 容器编排引擎的监控方法、***及装置
CN115391041A (zh) 任务处理方法、装置、电子设备和存储介质
CN113032237B (zh) 数据处理方法及装置、电子设备和计算机可读存储介质
CN111198853B (zh) 数据处理方法、装置、电子设备及计算机可读存储介质
CN111382058B (zh) 一种服务的测试方法、装置,服务器及存储介质
CN111274104A (zh) 数据处理方法、装置、电子设备及计算机可读存储介质
CN114661807A (zh) 一种航班管理***异常的处理方法、装置、设备及介质
CN114035861A (zh) 集群配置方法、装置、电子设备和计算机可读介质
CN114443480A (zh) 测试方法、***、可读介质及电子设备
CN111382057B (zh) 测试用例生成方法,测试方法及装置,服务器及存储介质
CN109614137B (zh) 软件版本控制方法、装置、设备和介质
CN114070889A (zh) 配置方法、流量转发方法、设备、存储介质及程序产品
CN113434382A (zh) 数据库性能监控方法、装置、电子设备及计算机可读介质
CN111708846A (zh) 一种多终端的数据管理方法及装置
CN112311842A (zh) 用于信息交互的方法和装置
CN118233390A (zh) 一种流量控制方法及相关装置
CN117009168A (zh) 一种应用指标获取方法、装置、设备及介质
CN118200140A (zh) 数据处理方法、管理***及相关设备
CN117873609A (zh) 数据处理方法及装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination