CN110601879A - Zabbix告警过程信息的形成方法、装置及存储介质 - Google Patents

Zabbix告警过程信息的形成方法、装置及存储介质 Download PDF

Info

Publication number
CN110601879A
CN110601879A CN201910814528.5A CN201910814528A CN110601879A CN 110601879 A CN110601879 A CN 110601879A CN 201910814528 A CN201910814528 A CN 201910814528A CN 110601879 A CN110601879 A CN 110601879A
Authority
CN
China
Prior art keywords
alarm
information
zabbix
command
log file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910814528.5A
Other languages
English (en)
Other versions
CN110601879B (zh
Inventor
陈立鼎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
Original Assignee
OneConnect Smart Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Smart Technology Co Ltd filed Critical OneConnect Smart Technology Co Ltd
Priority to CN201910814528.5A priority Critical patent/CN110601879B/zh
Publication of CN110601879A publication Critical patent/CN110601879A/zh
Application granted granted Critical
Publication of CN110601879B publication Critical patent/CN110601879B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0246Exchanging or transporting network management information using the Internet; Embedding network management web servers in network elements; Web-services-based protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/064Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提出一种Zabbix告警过程信息的形成方法,该方法包括:获取发生告警的主机IP及告警时间;获取所述告警主机上Zabbix监控的shell脚本;获取所述shell脚本中需要查询的log文件;分析所获取的shell脚本,并提取发生告警部分的命令;将所提取的命令代入告警时间,形成一个还原告警场景的新命令;通过运行所述新命令分析所获取的log文件,得到触发告警的过程信息数据。本发明可以自动查询引发告警的过程信息,具有更强的泛化能力。

Description

Zabbix告警过程信息的形成方法、装置及存储介质
技术领域
本发明涉及云监控技术领域,尤其涉及一种Zabbix告警过程信息的形成方法、装置及存储介质。
背景技术
Zabbix是一个基于WEB界面的提供分布式***监视以及网络监视功能的企业级的开源解决方案,它可以实现对CPU负荷、内存使用状态、磁盘使用状态、网络状况、端口和日志的监控。
对于简单的监控情景,通过Zabbix自带的函数就可实现;对于复杂的监控情景,需要自定义shell脚本来辅助Zabbix监控。对于复杂的监控情景,一般的实现逻辑在shell脚本部分,而shell脚本只返回一个告警结果给Zabbix,因此,此类的告警出现时,告警邮件中只会携带一个结果,需要手动查询引起此告警的根本原因。
因此亟需一种可以自动显示Zabbix告警原因的方法。
发明内容
本发明提供一种Zabbix告警过程信息的形成方法、电子装置及计算机可读存储介质,其主要目的在于通过shell脚本实现自动查询引发告警的过程信息,能够适用于各个场景,具有更强的泛化能力。
为实现上述目的,本发明还提供一种Zabbix告警过程信息的形成方法,该方法包括:S110、获取发生告警的主机IP及告警时间;S120、获取所述告警主机上Zabbix监控的shell脚本;S130、获取所述shell脚本中需要查询的log文件;S140、分析所获取的shell脚本,并提取发生告警部分的命令;S150、将所提取的命令代入告警时间,形成一个还原告警场景的新命令;S160、通过运行所述新命令分析所获取的log文件,得到触发告警的过程信息数据。
优选的,对所述步骤S140中分析所获取的shell脚本,并提取发生告警部分的命令,包括:S210、在获取的log文件中截取一段log文件进行分析;S220、在所截取的log文件中截取包含告警产生的时间段的行;S230、在所截取的行内,剔除导致告警的信息之外的信息,得到发生告警的信息;S240、根据所述发生告警的信息,确定触发告警的shell命令。
优选的,当导致Zabbix告警的信息为接口的响应时间过长时,获取接口的平均响应时间的方法包括:在步骤S220中,在所截取的一段log文件中截取包含告警产生的时间段的行之后,在所截取的行内,提取包含接口响应时间的行;根据所提取的包含接口响应时间的行确定总行数和总的接口响应时间,根据下式获得平均响应时间:平均响应时间=总的响应时间/总行数。优选的,所述shell脚本包括shell命令,所述shell命令用于抓取并显示发生告警过程的信息数据。
优选的,所述发生告警过程的信息数据包括执行内容信息和执行时间的存档操作信息。
为实现上述目的,本发明提供一种电子装置,该电子装置包括:存储器、处理器,所述存储器中包括Zabbix告警过程信息的形成程序,所述Zabbix告警过程信息的形成程序被所述处理器执行时实现如下步骤:S110、获取发生告警的主机IP及告警时间;S120、获取所述告警主机上Zabbix监控的shell脚本;S130、获取所述shell脚本中需要查询的log文件;S140、分析所获取的shell脚本,并提取发生告警部分的命令;S150、将所提取的命令代入告警时间,形成一个还原告警场景的新命令;S160、通过运行所述新命令分析所获取的log文件,得到触发告警的过程信息数据。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中包括Zabbix告警过程信息的形成程序,所述Zabbix告警过程信息的形成程序被处理器执行时,实现上述的Zabbix告警过程信息的形成方法的步骤。
本发明提出的Zabbix告警过程信息的形成方法、电子装置及计算机可读存储介质,通过另外建立一个shell脚本来实现需要自定义shell脚本来辅助Zabbix监控场景下的,告警过程信息的显示,解决了告警过程中仅显示告警结果的问题。
附图说明
图1为本发明Zabbix告警过程信息的形成方法较佳实施例的流程图;
图2为本发明的分析shell脚本,提取发生告警部分的命令的流程图;
图3为本发明的Zabbix告警过程信息的形成方法的原理示意图;
图4为本发明的电子装置的较佳实施例的结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种Zabbix告警过程信息的形成方法。参照图1所示,为本发明Zabbix告警过程信息的形成方法较佳实施例的流程图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。在本申请中该方法是通过shell脚本实现。
zabbix自带有许多功能性的监控,自带的监控存在局限性,但当需要监控的场景复杂的情况下就不适用了;此时,就需要通过自定义shell脚本实现对某些场景下zabbix的监控。而添加自定义shell脚本的步骤如下,先修改zabbix-agent客户端配置,在被监控的zabbix-agent端增加需要监控的脚本(添加脚本的执行权限),修改zabbix-server端的配置,然后通过第三方软件进行测试后即完成添加。
在zabbix监控***中,linux主机做跳板,跳板机用于监控交换机。管理员在跳板机上输入shell启动指令,启动shell。zabbix监控***根据接收到的测试脚本下发指令,测试脚本包括若干shell命令。根据接收到的脚本运行指令,执行shell命令,对告警的过程信息进行提取;最终,将过程信息生成报表,显示在跳板机上。
在本实施例中,Zabbix告警过程信息的形成方法包括:步骤S110-步骤S160。
S110、获取发生告警的主机IP及告警时间。S120、获取所述告警主机上Zabbix监控的shell脚本;S130、获取所述shell脚本中需要查询的log文件。
其中,shell脚本的设置方法包括:创建log文件存放位置;修改路径、文件权限;添加shell命令并生效,进行存档操作;当出现疑似问题时,进行查看命令执行的log文件;然后将之前相关操作还原,查找问题原因。其中的文件权限包括root用户权限和一般用户权限。
通过shell脚本的设置,可以记录命令执行用户、时间、执行时登录使用IP等信息;以及执行命令的时间、执行用户的加入等等。以上信息均存储进入log文件,工作人员可以进行查看。也就是说,可以通过shell脚本获取需要查询的log文件。
当出现告警问题时,第一时间获取相关日志(log文件),并尽量多尽量准确全面,等待的时间越长日志可能就已覆盖,或清除,或环境重搭,致使告警定位工作受到阻碍。
其中,需要说明的是,用户直接面对的不是计算机硬件而是shell,用户把指令告诉shell,然后shell再传输给***内核,接着内核再去支配计算机硬件去执行各种操作。
换句话说,shell脚本是指在计算机中执行若干命令的一种方法。Shell是***的用户界面,提供了用户与内核进行交互操作的一种接口。它接收用户输入的命令并把它送入内核去执行。Shell脚本可以是文本的,也可以是图形的。Shell工具中包括shell命令,比如目录列表(ls)、文件移动(mv),和删除(rm)。一个shell脚本保存在一个文件中,并含有一组shell命令。
S140、分析所获取的shell脚本,并提取发生告警部分的命令;S150、将所提取的命令代入告警时间,形成一个还原告警场景的新命令;S160、通过运行所述新命令分析所获取的log文件,得到触发告警的过程信息数据。
示例性说明如下:
以监控tomcat接口响应时间为例,通过在zabbix***中创建一个监控对象,在此监控对象下创建监控项,监控项的数据由所述shell脚本获取,通过抓取页面,解析出存储空间数据与节点的运行情况,然后把数据发送给zabbix,最终在web页面实时展现,当tomcat5分钟内接口平均响应时间超过10s时,产生告警信息提醒用户。
但是,告警信息仅仅只携带一个结果。因此,就需要进一步添加能够自定义一种可以抓取并显示上述自定义脚本发生告警的时间等过程信息数据的shell命令。首先要创建log存放位置,修改路径和文件权限,然后添加shell命令并生效,进行存档操作;其中,shell命令执行上述S110-S160的步骤。而shell命令的log文件包括执行内容、执行时间的存档操作信息。
所以,在告警发生后,先查看告警出现时的log文件,然后将之前告警的相关操作进行还原,从而得到触发告警的过程信息的数据。
综上所述,当告警发生后,先获取发生告警的主机IP及告警时间;获取所述告警主机上Zabbix监控的shell脚本;以及获取所述shell脚本中需要查询的log文件;获取上述信息后,将上述信息进行分析提取,利用所提取的信息生成可以还原告警场景的新命令;最后,将通过运行新命令分析所获取的包含告警shell脚本的告警信息的log文件,最终得到触发告警的过程信息数据。
通过上述方法,当有大量告警发生在不同主机的时候,可以批量获取告警的原因,帮助运维人员快速定位告警的原因,迅速做出修复。
参照图2所示,图2为本发明的分析shell脚本,提取发生告警部分的命令的流程图。分析shell脚本,提取发生告警部分的命令的步骤包括:步骤S210-S240。
S210、在获取的log文件中截取一段log文件进行分析;S220、在所截取的log文件中截取包含告警产生的时间段的行;S230、在所截取的行内,剔除导致告警的信息之外的信息,得到发生告警的信息;S240、根据发生告警的信息,确定触发告警的shell命令。
需要进一步说明的是,在步骤S140中,分析所获取的shell脚本,并提取发生告警部分的命令;所述shell脚本就是步骤S120中所获取的shell脚本,所述发生告警部分的命令也就是说,提取步骤S210-S240中所涉及的获取过程的shell脚本中包含的shell命令。
以tomcat5分钟内接口平均响应时间超过10s为例,其中的平均响应时间=总的响应时间/总行数,例如总行数为10行;其中,第一至第四行的响应时间均为1s,第五行至第第七行的响应时间均为30s,第八行的响应时间为20s,第九行和第十行的响应时间均为2秒。因为平静响应时间超过了10s,所以触发了报警,但是,实际上,第一至第四行,以及第九行和第十行的响应时间是正常的,只有第五行至第八行的响应时间超长。通过步骤S140和步骤S160可以找到响应时间长的第五行至第八行中所涉及的接口。
在步骤S120中分析所获取的shell脚本的具体步骤包括,S210、在所述log文件中截取一段log文件中进行分析;一段log文件可以是100000行左右;S220、在所截取的log文件中截取包含告警产生的时间段的行;在具体实施过程中是提取列数为13的行;
S230、在所截取的行内,剔除导致告警的信息之外的信息,得到发生告警的信息;在具体实施例中,为根据告警时间,截取出含有告警时间段的行数并提取相应的响应时间;也就是说,在所截取的行内,进一步的提取包含响应时间的信息的行(将截取的行中,剔除不包含响应时间的信息的行,剩余的即为包含响应时间的信息的行),根据所提取的响应总行数以及响应的总时间,计算平均响应时间,其中平均响应时间=总的响应时间/总行数。
S240、根据发生告警的信息,确定触发告警的shell命令;在具体实施例中,为其中,选取平均响应时间超过设定时间的行,作为触发告警的shell命令。
示例性代码表示如下:
tail-1000000$acclog_path|awk'{if(NF==13)print$0}'|awk-vold_time="[$old_time"-v now="[$now"'$7>=old_time&&$7<=now{print$0}'|awk'{sum+=$6}END{if(NR>0)print sum/NR}'
提取包含响应时间的信息的行:
tail-1000000$acclog_path|awk'{if(NF==13)print$0}'|awk-vold_time="[$old_time"-v now="[$now"'$7>=old_time&&$7<=now{print$0}'
也就是说,剔除了不包含响应时间信息的部分:|awk'{sum+=$6}END{if(NR>0)print sum/NR}'
总的来说,本发明是能够自定义一种可以抓取并显示上述自定义脚本发生告警的时间等过程信息数据的shell命令。
其中,步骤S230中获取了发生告警的信息;步骤S240中根据得到的信息,确定shell命令。shell命令的形成的方法包括:先编写脚本文件,并写入log文件;为脚本赋予执行权限。因此,当我们获取了发生告警的信息后,可以顺利获得shell命令,此为本领域技术人员的公知技术,在此不再赘述。
通过使用shell脚本编写实现抓取我们所需要的告警发生时的一些关键信息,并生成log文件以便于管理人员查看,从而可以更加快速准确地定位告警问题。省去了人工手动去查看监控脚本,再根据监控脚本去检查log文件的繁琐程序。
参照图3所示,图3为本发明的Zabbix告警过程信息的形成方法的原理示意图。
Zabbix告警过程信息的形成方法的原理为,通过另外建立一个shell脚本来实现需要自定义shell脚本来辅助Zabbix监控场景下的,告警过程信息的显示,解决了告警过程中仅显示告警结果的问题,避免了手动查询告警过程信息中,操作繁琐的问题。
需要说明的是shell脚本包括shell命令,所述shell命令抓取并显示发生告警过程的信息数据。而发生告警过程的信息数据包括执行内容信息和执行时间的存档操作信息。最终,告警过程的信息通过Zabbix显示。
所述shell脚本的设置方法包括:创建log文件存放位置;修改路径、文件权限;添加shell命令并生效,进行存档操作;当出现疑似问题时,进行查看命令执行的log文件;然后将之前相关操作还原,查找问题原因。其中的文件权限包括root用户权限和一般用户权限。
通过shell脚本的设置,可以记录命令执行用户、时间、执行时登录使用IP等信息;以及执行命令的时间、执行用户的加入等等。以上信息均存储进入log文件,工作人员可以进行查看。
具体的原理为,当告警发生后,先获取发生告警的主机IP及告警时间;获取所述告警主机上Zabbix监控的shell脚本;以及获取所述shell脚本中需要查询的log文件;获取上述信息后,将上述信息进行分析提取,利用所提取的信息生成可以还原告警场景的新命令;最后,将通过运行新命令分析所获取的包含告警shell脚本的告警信息的log文件,最终得到触发告警的过程信息数据。
对于复杂的监控情景,需要自定义shell脚本来辅助Zabbix监控。而本申请在此场景下,能够自定义一种可以抓取并显示上述自定义脚本发生告警的时间等过程信息数据的shell命令。通过使用shell脚本编写实现抓取我们所需要的告警发生时的一些关键信息,并生成log文件以便于管理人员查看,从而可以更加快速准确地定位告警问题。
本发明针对Zabbix复杂的监控情景(用到自定义的shell监控脚本),能够快速(只需要一条命令)显示告警的过程信息,避免了人工手动去查看监控脚本,再根据监控脚本去检查log文件(人工查看过程需要登录告警主机与查询log文件,手动代入告警时间等参数,手动更新shell监控脚本中命令,手动运行新的命令查看结果)。
当有大量告警发生在不同主机的时候,可以批量获取告警的原因,帮助运维人员快速定位告警的原因,迅速做出修复。
本发明还提供一种Zabbix告警过程信息的形成装置,包括告警时间获取单元、shell脚本获取单元和log文件获取单元,还原告警命令生成单元以及告警过程信息获取单元;
其中,告警时间获取单元,用于获取发生告警的主机IP及告警时间;shell脚本获取单元,用于获取所述告警主机上Zabbix监控的shell脚本;log文件获取单元,用于获取所述shell脚本中需要查询的log文件;还原告警命令生成单元,用于分析所获取的shell脚本,并提取发生告警部分的命令;并将所提取的命令代入告警时间,形成一个还原告警场景的新命令;告警过程信息获取单元,用于通过运行所述新命令分析所获取的log文件,得到触发告警的过程信息数据,并将过程数据通过Zabbix进行显示。
在一个实施例中,告警信息仅仅只携带一个结果。因此,就需要进一步添加能够自定义一种可以抓取并显示上述自定义脚本发生告警的时间等过程信息数据的shell命令。首先要创建log存放位置,修改路径和文件权限,然后添加shell命令并生效,进行存档操作;其中,shell命令执行上述S110-S160的步骤。而shell命令的log文件包括执行内容、执行时间的存档操作信息。
通过shell脚本的设置,可以记录命令执行用户、时间、执行时登录使用IP等信息;以及执行命令的时间、执行用户的加入等等。以上信息均存储进入log文件,工作人员可以进行查看。
所以,在告警发生后,先查看告警出现时的log文件,然后将之前告警的相关操作进行还原,从而得到触发告警的过程信息的数据。
本发明能够自定义一种可以抓取并显示上述自定义脚本发生告警的时间等过程信息数据的shell命令。通过使用shell脚本编写实现抓取我们所需要的告警发生时的一些关键信息,并生成log文件以便于管理人员查看,从而可以更加快速准确地定位告警问题。
本发明之Zabbix告警过程信息的形成装置的具体实施方式与上述Zabbix告警过程信息的形成方法的具体实施方式大致相同,在此不再赘述。
本发明提供一种Zabbix告警过程信息的形成方法,应用于一种电子装置4。参照图4所示,为本发明Zabbix告警过程信息的形成方法较佳实施例的应用环境示意图。
在本实施例中,电子装置1可以是服务器、智能手机、平板电脑、便携计算机、桌上型计算机等具有运算功能的终端设备。
该电子装置4包括:处理器42、存储器41、通信总线43及网络接口44。
存储器41包括至少一种类型的可读存储介质。所述至少一种类型的可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器41等的非易失性存储介质。在一些实施例中,所述可读存储介质可以是所述电子装置4的内部存储单元,例如该电子装置4的硬盘。在另一些实施例中,所述可读存储介质也可以是所述电子装置4的外部存储器41,例如所述电子装置4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
在本实施例中,所述存储器41的可读存储介质通常用于存储安装于所述电子装置4的Zabbix告警过程信息的形成程序40等。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
处理器42在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行存储器41中存储的程序代码或处理数据,例如执行Zabbix告警过程信息的形成程序40等。
通信总线43用于实现这些组件之间的连接通信。
网络接口44可选地可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该电子装置4与其他电子设备之间建立通信连接。
图4仅示出了具有组件41-44的电子装置4,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
可选地,该电子装置4还可以包括用户接口,用户接口可以包括输入单元比如键盘(Keyboard)、语音输入装置比如麦克风(microphone)等具有语音识别功能的设备、语音输出装置比如音响、耳机等,可选地用户接口还可以包括标准的有线接口、无线接口。
可选地,该电子装置4还可以包括显示器,显示器也可以称为显示屏或显示单元。在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode,OLED)触摸器等。显示器用于显示在电子装置4中处理的信息以及用于显示可视化的用户界面。
可选地,该电子装置4还可以包括射频(Radio Frequency,RF)电路,传感器、音频电路等等,在此不再赘述。
在图4所示的装置实施例中,作为一种计算机存储介质的存储器41中可以包括操作***、以及Zabbix告警过程信息的形成程序40;处理器42执行存储器41中存储的Zabbix告警过程信息的形成程序40时实现如下步骤:
S110、获取发生告警的主机IP及告警时间。S120、获取所述告警主机上Zabbix监控的shell脚本;S130、获取所述shell脚本中需要查询的log文件;S140、分析所获取的shell脚本,并提取发生告警部分的命令;S150、将所提取的命令代入告警时间,形成一个还原告警场景的新命令;S160、通过运行所述新命令分析所获取的log文件,得到触发告警的过程信息数据。
其中,提取发生告警部分的命令的方法包括:S210、在获取的log文件中截取一段log文件进行分析;S220、在所截取的log文件中截取包含告警产生的时间段的行;S230、在所截取的行内,剔除导致告警的信息之外的信息,得到发生告警的信息;S240、根据发生告警的信息,确定触发告警的shell命令。
在一个实施例中,所述shell脚本的设置方法包括:创建log文件存放位置;修改路径、文件权限;添加shell命令并生效,进行存档操作;当出现疑似问题时,进行查看命令执行的log文件;然后将之前相关操作还原,查找问题原因。其中的文件权限包括root用户权限和一般用户权限。
上述实施例提出的电子装置4,自定义一种可以抓取并显示上述自定义脚本发生告警的时间等过程信息数据的shell命令。通过使用shell脚本编写实现抓取我们所需要的告警发生时的一些关键信息,并生成log文件以便于管理人员查看,从而可以更加快速准确地定位告警问题。
在其他实施例中,Zabbix告警过程信息的形成程序40还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器41中,并由处理器42执行,以完成本发明。本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段。
所述Zabbix告警过程信息的形成程序40可以被分割为:包括告警时间获取单元、shell脚本获取单元和log文件获取单元,还原告警命令生成单元以及告警过程信息获取单元。所述包括告警时间获取单元、shell脚本获取单元和log文件获取单元,还原告警命令生成单元以及告警过程信息获取单元所实现的功能或操作步骤均与上文类似,此处不再详述,示例性地,例如其中:告警时间获取单元,用于获取发生告警的主机IP及告警时间;shell脚本获取单元,用于获取所述告警主机上Zabbix监控的shell脚本;log文件获取单元,用于获取所述shell脚本中需要查询的log文件。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质中包括Zabbix告警过程信息的形成程序,所述Zabbix告警过程信息的形成程序被处理器执行时实现如下操作:
获取发生告警的主机IP及告警时间;获取所述告警主机上Zabbix监控的shell脚本;获取所述shell脚本中需要查询的log文件。分析所获取的shell脚本,并提取发生告警部分的命令;将所提取的命令代入告警时间,形成一个还原告警场景的新命令;通过运行所述新命令分析所获取的log文件,得到触发告警的过程信息数据。
在一个实施例中,在所述log文件中截取一段log文件中进行分析;一段log文件可以是100000行左右;在所截取的log文件中截取包含告警产生的时间段的行;在具体实施过程中是提取列数为13的行;根据告警时间,截取出含有告警时间段的行数并提取相应的响应时间;也就是说,在所截取的行内,进一步的提取包含响应时间的信息的行(将截取的行中,剔除不包含响应时间的信息的行);通过上述方式提取到发生告警部分的命令;将所提取的命令代入告警时间,形成一个还原告警场景的新命令;运行所述新命令分析之前所获取的log文件,得到触发告警的过程信息数据。
本发明之计算机可读存储介质的具体实施方式与上述Zabbix告警过程信息的形成方法、电子装置的具体实施方式大致相同,在此不再赘述。
总的来说,本发明针对Zabbix复杂的监控情景,能够快速(显示告警的过程信息,避免了人工查看过程需要登录告警主机与查询log文件,手动代入告警时间等参数,手动更新shell监控脚本中命令,手动运行新的命令查看结果。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种Zabbix告警过程信息的形成方法,应用于电子装置,其特征在于,所述方法包括:
S110、获取发生告警的主机IP及告警时间;
S120、获取所述告警主机上Zabbix监控的shell脚本;
S130、获取所述shell脚本中需要查询的log文件;
S140、分析所获取的shell脚本,并提取发生告警部分的命令;
S150、将所提取的命令代入告警时间,形成一个还原告警场景的新命令;
S160、通过运行所述新命令分析所获取的log文件,得到触发告警的过程信息数据。
2.根据权利要求1所述的Zabbix告警过程信息的形成方法,其特征在于,对所述步骤S140中分析所获取的shell脚本,并提取发生告警部分的命令,包括:
S210、在获取的log文件中截取一段log文件进行分析;
S220、在所截取的log文件中截取包含告警产生的时间段的行;
S230、在所截取的行内,剔除导致告警的信息之外的信息,得到发生告警的信息;
S240、根据所述发生告警的信息,确定触发告警的shell命令。
3.根据权利要求2所述的Zabbix告警过程信息的形成方法,其特征在于,当导致Zabbix告警的信息为接口的响应时间过长时,获取接口的平均响应时间的方法包括:在步骤S220中,在所截取的一段log文件中截取包含告警产生的时间段的行之后,在所截取的行内,提取包含接口响应时间的行;根据所提取的包含接口响应时间的行确定总行数和总的接口响应时间,根据下式获得平均响应时间:
平均响应时间=总的响应时间/总行数。
4.根据权利要求1-3中任一项所述的Zabbix告警过程信息的形成方法,其特征在于,所述shell脚本包括shell命令,所述shell命令用于抓取并显示发生告警过程的信息数据。
5.根据权利要求4所述的Zabbix告警过程信息的形成方法,其特征在于,所述发生告警过程的信息数据包括执行内容信息和执行时间的存档操作信息。
6.一种电子装置,其特征在于,该电子装置包括:存储器、处理器,所述存储器中包括Zabbix告警过程信息的形成程序,所述Zabbix告警过程信息的形成程序被所述处理器执行时实现如下步骤:
S110、获取发生告警的主机IP及告警时间;
S120、获取所述告警主机上Zabbix监控的shell脚本;
S130、获取所述shell脚本中需要查询的log文件;
S140、分析所获取的shell脚本,并提取发生告警部分的命令;
S150、将所提取的命令代入告警时间,形成一个还原告警场景的新命令;
S160、通过运行所述新命令分析所获取的log文件,得到触发告警的过程信息数据。
7.根据权利要求6所述的电子装置,其特征在于,对所述步骤S140中分析所获取的shell脚本,并提取发生告警部分的命令,包括:
S210、在获取的log文件中截取一段log文件进行分析;
S220、在所截取的log文件中截取包含告警产生的时间段的行;
S230、在所截取的行内,剔除导致告警的信息之外的信息,得到发生告警的信息;
S240、根据所述发生告警的信息,确定触发告警的shell命令。
8.根据权利要求8所述的电子装置,其特征在于,所述shell脚本包括shell命令,所述shell命令用于抓取并显示发生告警过程的信息数据。
9.根据权利要求7所述的电子装置,其特征在于,所述发生告警过程的信息数据包括执行内容信息和执行时间的存档操作信息。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括Zabbix告警过程信息的形成程序,所述Zabbix告警过程信息的形成程序被处理器执行时,实现如权利要求1至5中任一项所述的Zabbix告警过程信息的形成方法的步骤。
CN201910814528.5A 2019-08-30 2019-08-30 Zabbix告警过程信息的形成方法、装置及存储介质 Active CN110601879B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910814528.5A CN110601879B (zh) 2019-08-30 2019-08-30 Zabbix告警过程信息的形成方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910814528.5A CN110601879B (zh) 2019-08-30 2019-08-30 Zabbix告警过程信息的形成方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN110601879A true CN110601879A (zh) 2019-12-20
CN110601879B CN110601879B (zh) 2022-11-08

Family

ID=68857018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910814528.5A Active CN110601879B (zh) 2019-08-30 2019-08-30 Zabbix告警过程信息的形成方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110601879B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112711511A (zh) * 2020-12-29 2021-04-27 航天信息股份有限公司 一种基于脚本服务器对终端设备进行监控的方法及***

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484836A (zh) * 2014-12-26 2015-04-01 国家电网公司 一种电网故障辅助决策可视化***及其方法
WO2015043441A1 (zh) * 2013-09-24 2015-04-02 许继集团有限公司 基于多场景分析的智能告警推理方法
CN105183609A (zh) * 2015-09-16 2015-12-23 焦点科技股份有限公司 一种应用于软件***的实时监控***及方法
CN106371986A (zh) * 2016-09-08 2017-02-01 上海新炬网络技术有限公司 一种日志处理运维监控***
US20170126523A1 (en) * 2015-11-03 2017-05-04 International Business Machines Corporation Alert remediation automation
CN106681882A (zh) * 2015-11-06 2017-05-17 上海瑞致软件有限公司 基于Apriori算法的IT服务集中监控管理***
CN107632918A (zh) * 2017-08-30 2018-01-26 中国工商银行股份有限公司 计算存储设备的监控***及方法
CN108306749A (zh) * 2017-01-12 2018-07-20 阿里巴巴集团控股有限公司 一种监控***报警方法、监控***和监控装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015043441A1 (zh) * 2013-09-24 2015-04-02 许继集团有限公司 基于多场景分析的智能告警推理方法
CN104484836A (zh) * 2014-12-26 2015-04-01 国家电网公司 一种电网故障辅助决策可视化***及其方法
CN105183609A (zh) * 2015-09-16 2015-12-23 焦点科技股份有限公司 一种应用于软件***的实时监控***及方法
US20170126523A1 (en) * 2015-11-03 2017-05-04 International Business Machines Corporation Alert remediation automation
CN106681882A (zh) * 2015-11-06 2017-05-17 上海瑞致软件有限公司 基于Apriori算法的IT服务集中监控管理***
CN106371986A (zh) * 2016-09-08 2017-02-01 上海新炬网络技术有限公司 一种日志处理运维监控***
CN108306749A (zh) * 2017-01-12 2018-07-20 阿里巴巴集团控股有限公司 一种监控***报警方法、监控***和监控装置
CN107632918A (zh) * 2017-08-30 2018-01-26 中国工商银行股份有限公司 计算存储设备的监控***及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李静: "ELK日志分析***在河钢承钢的应用", 《电子技术与软件工程》, no. 15, 1 August 2017 (2017-08-01), pages 71 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112711511A (zh) * 2020-12-29 2021-04-27 航天信息股份有限公司 一种基于脚本服务器对终端设备进行监控的方法及***
CN112711511B (zh) * 2020-12-29 2023-09-01 航天信息股份有限公司 一种基于脚本服务器对终端设备进行监控的方法及***

Also Published As

Publication number Publication date
CN110601879B (zh) 2022-11-08

Similar Documents

Publication Publication Date Title
CN108108297B (zh) 自动化测试的方法和装置
CN110647438B (zh) 事件监控方法、装置、计算机设备和存储介质
CN110795325B (zh) 一种可视化埋点方法、装置、设备和存储介质
US10176327B2 (en) Method and device for preventing application in an operating system from being uninstalled
US8667333B2 (en) Extensible testing system
CN112491602B (zh) 行为数据的监控方法、装置、计算机设备及介质
CN110825619A (zh) 接口测试用例自动生成方法、装置及存储介质
CN113489713A (zh) 网络攻击的检测方法、装置、设备及存储介质
CN110647471A (zh) 接口测试用例生成方法、电子装置及存储介质
CN111459495A (zh) 单元测试代码文件生成方法、电子装置及存储介质
CN112148606B (zh) 埋点测试方法、装置、设备及计算机可读介质
CN112650658A (zh) 应用程序的异常记录和复现方法、装置及存储介质
CN111654495B (zh) 用于确定流量产生来源的方法、装置、设备及存储介质
CN110347565B (zh) 一种应用程序的异常分析方法及装置、电子设备
CN115033876A (zh) 日志处理方法、日志处理装置、计算机设备及存储介质
CN111767262A (zh) 日志展示方法、装置、设备及存储介质
CN115543827A (zh) 一种埋点数据展示方法及装置
CN110601879B (zh) Zabbix告警过程信息的形成方法、装置及存储介质
CN111324510A (zh) 日志处理方法、装置及电子设备
CN107908525B (zh) 告警处理方法、设备及可读存储介质
CN112148545A (zh) 嵌入式***的安全基线检测方法以及安全基线检测***
US20210049274A1 (en) Analysis device, analysis method, and recording medium
CN111435326A (zh) 一种分析崩溃日志的方法和装置
JP7230951B2 (ja) 携帯端末、情報処理システム、制御方法、及びプログラム
CN112558982B (zh) 代码检测方法、装置及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant