CN116662127A - 一种设备告警信息分类并预警的方法、***、设备和介质 - Google Patents
一种设备告警信息分类并预警的方法、***、设备和介质 Download PDFInfo
- Publication number
- CN116662127A CN116662127A CN202310787929.2A CN202310787929A CN116662127A CN 116662127 A CN116662127 A CN 116662127A CN 202310787929 A CN202310787929 A CN 202310787929A CN 116662127 A CN116662127 A CN 116662127A
- Authority
- CN
- China
- Prior art keywords
- information
- event
- alarm
- equipment
- classifying
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000003066 decision tree Methods 0.000 claims abstract description 34
- 238000003860 storage Methods 0.000 claims abstract description 19
- 238000012423 maintenance Methods 0.000 claims abstract description 14
- 230000004044 response Effects 0.000 claims abstract description 7
- 238000004458 analytical method Methods 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 abstract description 6
- 230000002159 abnormal effect Effects 0.000 abstract description 4
- 230000008859 change Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 9
- 238000012544 monitoring process Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 108010028984 3-isopropylmalate dehydratase Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241001290266 Sciaenops ocellatus Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/324—Display of status information
- G06F11/327—Alarm or error message display
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Debugging And Monitoring (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明提供一种设备告警信息分类并预警的方法、***、设备和存储介质,方法包括:对设备的原始告警信息进行采集,并将所述原始告警信息分类为事件信息和第一告警信息;将所述第一告警信息直接发送给用户,并将所述事件信息写入消息队列;定时获取所述消息队列中的事件信息,并通过预定算法对所述事件信息进行分析以预测设备发生告警的概率;以及响应于所述概率大于阈值,向运维人员发送第二告警信息。本发明通过消息队列区分告警和事件,缩短了处理告警上报的时间,并且通过预定算法(例如决策树算法),对事件进行分析,预测设备可能出现的异常状态,向运维人员提前发出预警。
Description
技术领域
本发明涉及设备监控领域,更具体地,特别是指一种设备告警信息分类并预警的方法、***、设备和存储介质。
背景技术
服务器、交换机等网络设备作为信息的载体,也发挥着重要的作用。这些设备作为网络的节点,存储、处理网络上80%的数据、信息,也被称为网络的灵魂。当网络设备发生故障或某些原因导致***处于不正常的工作状态时,***能够根据不同类型及不同模块出现的故障产生告警信息,同时生成日志信息。这些告警信息按照对***的影响又可分为:事件和告警。事件是指***正常运行时记录下来的关键事件,一般对***没有影响。告警是指可能影响***的正常运行的故障。
常规的监控网络设备的手段分为主动和被动两种:
主动的监控手段如通过IPMI、REDFISH或SNMP等协议获取设备数据,并通过设定的阈值来判断设备当前是否处于健康状态,如通过IPMI命令来获取设备的主板温度,如果超过设定的阈值,如30摄氏度,就向监控人员发出报警信息;被动的监控手段一般采用SNMPTrap的方式来接收设备侧主动发出的告警信息,从而向监控人员发出报警,此种方式需要预先在设备侧配置trap主机,指定接受告警的主机,一般设置为监控平台所在的主机。当设备侧产生告警信息,则BMC会主动向监控平台推送Trap告警。
一般管理平台会着重处理设备的告警类信息,往往忽略了事件类告警。
发明内容
有鉴于此,本发明实施例的目的在于提出一种设备告警信息分类并预警的方法、***、电子设备及计算机可读存储介质,本发明实施例通过消息队列区分告警和事件,缩短了处理告警上报的时间,并且通过预定算法(例如决策树算法),对事件进行分析,预测设备可能出现的异常状态,向运维人员提前发出预警,保证设备的安全性,并且,当设备发生海量数据后,本发明实施例通过将告警和事件以解析的方式分离,保证告警及时发送到运维人员手中,以供运维人员定位和分析问题根因,加快故障解决速度,降低因设备故障导致的损失。
基于上述目的,本发明实施例的一方面提供了一种设备告警信息分类并预警的方法,包括如下步骤:对设备的原始告警信息进行采集,并将所述原始告警信息分类为事件信息和第一告警信息;将所述第一告警信息直接发送给用户,并将所述事件信息写入消息队列;定时获取所述消息队列中的事件信息,并通过预定算法对所述事件信息进行分析以预测设备发生告警的概率;以及响应于所述概率大于阈值,向运维人员发送第二告警信息。
在一些实施方式中,所述将所述原始告警信息分类为事件信息和第一告警信息包括:通过结构化搜索、全文搜索、多字段搜索、近似匹配和部分匹配对所述原始告警信息进行解析以将所述原始告警信息分类为事件信息和第一告警信息。
在一些实施方式中,所述将所述事件信息写入消息队列包括:实时检测事件信息的流量,并将事件信息的流量中大于第二阈值的部分推迟到下一时刻进入消息队列。
在一些实施方式中,所述通过预定算法对所述事件信息进行分析以预测设备发生告警的概率包括:统计预设时间内同一设备发生事件及产生告警的情况以对同种类型的告警进行预测。
在一些实施方式中,所述预定算法包括决策树算法,并且所述通过预定算法对所述事件信息进行分析以预测设备发生告警的概率包括:计算每个事件的信息增益,并根据信息增益将事件生成决策树。
在一些实施方式中,所述计算每个事件的信息增益包括:计算每个事件的信息熵,计算以每个事件为特征的熵,并用事件的信息熵和以事件为特征的熵的差值作为每个事件的信息增益。
在一些实施方式中,所述根据信息增益将事件生成决策树包括:将最大信息增益的事件作为根节点以生成决策树。
本发明实施例的另一方面,提供了一种设备告警信息分类并预警的***,包括:采集模块,用于对设备的原始告警信息进行采集,并将所述原始告警信息分类为事件信息和第一告警信息;写入模块,用于将所述第一告警信息直接发送给用户,并将所述事件信息写入消息队列;分析模块,用于定时获取所述消息队列中的事件信息,并通过预定算法对所述事件信息进行分析以预测设备发生告警的概率;以及告警模块,用于响应于所述概率大于阈值,向运维人员发送第二告警信息。
本发明实施例的又一方面,还提供了一种电子设备,包括:至少一个处理器;以及存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现如上方法的步骤。
本发明实施例的再一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时实现如上方法步骤的计算机程序。
本发明具有以下有益技术效果:通过消息队列区分告警和事件,缩短了处理告警上报的时间,并且通过预定算法(例如决策树算法),对事件进行分析,预测设备可能出现的异常状态,向运维人员提前发出预警,保证设备的安全性,并且,当设备发生海量数据后,通过将告警和事件以解析的方式分离,保证告警及时发送到运维人员手中,以供运维人员定位和分析问题根因,加快故障解决速度,降低因设备故障导致的损失。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本发明提供的设备告警信息分类并预警的方法的实施例的示意图;
图2为本发明提供的设备告警信息分类并预警的方法的流程图;
图3为本发明提供的决策树的架构图;
图4为本发明提供的设备告警信息分类并预警的***的实施例的示意图;
图5为本发明提供的设备告警信息分类并预警的电子设备的实施例的硬件结构示意图;
图6为本发明提供的设备告警信息分类并预警的计算机存储介质的实施例的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
本发明实施例的第一个方面,提出了一种设备告警信息分类并预警的方法的实施例。图1示出的是本发明提供的设备告警信息分类并预警的方法的实施例的示意图。如图1所示,本发明实施例包括如下步骤:
S1、对设备的原始告警信息进行采集,并将所述原始告警信息分类为事件信息和第一告警信息;
S2、将所述第一告警信息直接发送给用户,并将所述事件信息写入消息队列;
S3、定时获取所述消息队列中的事件信息,并通过预定算法对所述事件信息进行分析以预测设备发生告警的概率;以及
S4、响应于所述概率大于阈值,向运维人员发送第二告警信息。
网络设备就像是邮局的交换机,而微机、笔记本、手机等固定或移动的网络终端,就如散落在家庭、各种办公场所、公共场所等处的电话机。与外界日常的生活、工作中的电话交流、沟通,必须经过交换机,才能到达目标电话;同样如此,网络终端设备如家庭、企业中的微机上网,获取资讯,与外界沟通、娱乐等,也必须经过这些网络设备,因此也可以说是网络设备在“组织”和“领导”这些设备,也能为网络用户提供集中计算、信息发表及数据管理等服务。服务器和交换机等网络设备的高性能主要体现在高速度的运算能力、长时间的可靠运行、强大的外部数据吞吐能力等方面。时代的发展离不开网络,也离不开网络设备的支持,因此保证网络设备的正常运行就十分重要。
本发明实施例能统一管理设备事件类告警,提供检索接口,并对事件类告警汇聚分析和预测,提前发现设备存在的风险,进一步提高设备管理的准确度。
图2为本发明提供的设备告警信息分类并预警的方法的流程图,结合图2对本发明实施例进行说明。
本发明实施例通过预警装置来实施设备告警信息分类并预警的方法,预警装置包括告警采集模块、告警解析模块、消息队列、预警分析模块以及告警推送模块,其中,预警分析模块为预警装置的核心模块。
告警采集模块主要负责主动对服务器,交换机等设备告警和事件进行采集,收集基础告警信息;告警解析模块,对告警采集模块的原始告警和事件信息进行了解析封装,提高了告警信息的可分析性,便于与***中其他模块进行集成;消息队列,接收告警解析模块发送的事件信息,并为预警分析模块提供接口;预警分析模块,定时调用消息队列的接口,获取最新的事件信息,对发送的事件进行分析,预测设备即将发生告警的机率,调用告警发送模块发出告警;告警发送模块,提供告警持久化能力和转发能力。能通过短信或邮箱向运维人员发送告警信息,并保存告警信息。
对设备的原始告警信息进行采集,并将所述原始告警信息分类为事件信息和第一告警信息。告警采集模块进行原始告警信息的收集和存储,通过告警采集模块搭建高可用环境,并存储原始告警信息,将收集的数据发送给告警解析模块。
在一些实施方式中,所述将所述原始告警信息分类为事件信息和第一告警信息包括:通过结构化搜索、全文搜索、多字段搜索、近似匹配和部分匹配对所述原始告警信息进行解析以将所述原始告警信息分类为事件信息和第一告警信息。告警解析模块提供了强大的解析能力,内置不同厂商、不同设备的告警解析功能,通过原始告警信息区分事件信息和告警信息,支持结构化搜索、全文搜索、多字段搜索、近似匹配、部分匹配等。便于运维人员排查设备发送的信息,同时也为告警转发模块和消息队列提供了接口。
将所述第一告警信息直接发送给用户,并将所述事件信息写入消息队列。
在一些实施方式中,所述将所述事件信息写入消息队列包括:实时检测事件信息的流量,并将事件信息的流量中大于第二阈值的部分推迟到下一时刻进入消息队列。消息队列,接收告警解析模块提供的事件信息,对短期大量的事件信息进行削峰处理,避免事件信息流量过大导致预警分析模块挂掉的情况。
定时获取所述消息队列中的事件信息,并通过预定算法对所述事件信息进行分析以预测设备发生告警的概率。所述预定算法可以包括决策树算法。预警分析模块内置了决策树算法,用于分析事件信息。同时,预警分析模块维护一个定时任务,周期性调用消息队列的接口,取出当前时段收集到消息队列的事件信息,并通过决策树算法分析事件消息,产生预警。
决策树(Decision Tree)是一种基本的分类和回归算法。该算法模型呈树形结构,主要由结点和有向边组成。结点又分为两种类型:内部结点和叶子结点。内部结点表示在一个属性或特征上的测试,每一个结点分枝代表一个测试输出,每一个叶子结点代表一个类别。决策树学习的算法通常是一个递归地选择最优特征,并根据该特征对训练数据进行分割,使得对各个子数据集有一个最好的分类的过程。这一过程对应着特征空间的划分,也对应着决策树的构建。使用id3构建决策树有以下概念:
熵:熵是表示随机变量不确定性的度量。随机变量的熵值越大则越不稳定,设X是一个有限值的离散随机变量,其概率分布为:
P(X=xi)=pi,i=1,2,......,n
随机变量X的熵定义为:
条件熵:条件熵H(Y∣X)表示在已知随机变量X的条件下随机变量Y的不确定性。随机变量X给定的条件下随机变量Y的条件熵公式如下:
ID3算法内部使用信息增益作为特征选择方法。信息增益表示得知特征X的信息而使得类Y的信息不确定性减少的程度,标记为g(Y,X)其公式如下:g(Y,X)=H(Y)-H(Y∣X)。信息增益大的特征,具有较强的分类能力。
在一些实施方式中,所述通过预定算法对所述事件信息进行分析以预测设备发生告警的概率包括:统计预设时间内同一设备发生事件及产生告警的情况以对同种类型的告警进行预测。
例如一段时间内端口断开告警和实体信息改变,邻居状态机改变,BGP连接建立,聚合成员选中状态事件的关系如下表:
在一些实施方式中,所述通过预定算法对所述事件信息进行分析以预测设备发生告警的概率包括:计算每个事件的信息增益,并根据信息增益将事件生成决策树。
在一些实施方式中,所述计算每个事件的信息增益包括:计算每个事件的信息熵,计算以每个事件为特征的熵,并用事件的信息熵和以事件为特征的熵的差值作为每个事件的信息增益。
在一些实施方式中,所述根据信息增益将事件生成决策树包括:将最大信息增益的事件作为根节点以生成决策树。
计算信息熵:H(s)=-4/6log2(4/6)-2/6log2(2/6)=0.91830。
实体信息改变事件为例:产生:6/0.5(样本/概率)、未产生:6/0.5(样本/概率)。
以实体信息改变事件为特征的熵为:
H(S|A)=0.5*H(S|A_1)+0.5*H(S|A_2)。
H(S|A_1)=-(2/3log2(2/3)+1/3log2(1/3))=0.91830;
H(S|A_2)=-(2/3log2(2/3)+1/3log2(1/3))=0.91830
故得到实体信息改变事件为特征的熵(平均信息期望/条件熵)为
H(S|A)=0.5*H(S|A_1)+0.5*H(S|A_2}=0.91830。
年龄特征的信息增益为:
G_{A}(S)=H(S)-H(S|A)=0.91830-0.91830=0。
同理可得邻居状态机改变事件:
H(S|B)=0.8742,G{b}(S)=0.1041。
BGP连接建立事件:
H(S|C)=0.9183,G{C}(S)=0。
可以看出,“邻居状态机改变事件”的信息增益最大,因此选择“邻居状态机改变事件”作为根节点来划分。
图3为本发明提供的决策树的架构图,如图3所示,将邻居状态机改变事件作为根节点,将实体信息改变事件和BGP连接建立事件作为叶子节点生成决策树。
响应于所述概率大于阈值,向运维人员发送第二告警信息。
根据决策树预测不同情况下发生告警的概率。可以预先获取每个事件改变的概率,再沿着树的分支将每个事件改变的概率相乘得到该分支的概率,并将发生告警的分支的概率相加,计算总的概率。或者,直接通过现有发生的事件来查看决策树中该分支对应的结果。例如,当出现实体信息改变,邻居状态改变,BGP连接未改变时,可以看出在这个状态下告警的大概是要出现的,此时应出现预警信息。
告警发送模块在收到预警分析模块发送的预警信息时,首先通过短信、邮件等方式向用户发出预警,然后将告警信息存储到数据库中,同时提供了历史告警查询接口以供使用。
本发明实施例把原始告警信息区分为事件和告警,分别对告警和事件进行不同处理,告警直接发送给客户,事件进入消息队列中,通过消息队列对短期爆发性事件进行削峰处理,同时预警分析模块对消息队列里的事件进行预测分析,根据分析结果***告警信息,并通过告警发送模块发送预警信息给客户。
需要特别指出的是,上述设备告警信息分类并预警的方法的各个实施例中的各个步骤均可以相互交叉、替换、增加、删减,因此,这些合理的排列组合变换之于设备告警信息分类并预警的方法也应当属于本发明的保护范围,并且不应将本发明的保护范围局限在实施例之上。
基于上述目的,本发明实施例的第二个方面,提出了一种设备告警信息分类并预警的***。如图4所示,***200包括如下模块:采集模块,用于对设备的原始告警信息进行采集,并将所述原始告警信息分类为事件信息和第一告警信息;写入模块,用于将所述第一告警信息直接发送给用户,并将所述事件信息写入消息队列;分析模块,用于定时获取所述消息队列中的事件信息,并通过预定算法对所述事件信息进行分析以预测设备发生告警的概率;以及告警模块,用于响应于所述概率大于阈值,向运维人员发送第二告警信息。
在一些实施方式中,所述采集模块还用于:通过结构化搜索、全文搜索、多字段搜索、近似匹配和部分匹配对所述原始告警信息进行解析以将所述原始告警信息分类为事件信息和第一告警信息。
在一些实施方式中,所述写入模块还用于:实时检测事件信息的流量,并将事件信息的流量中大于第二阈值的部分推迟到下一时刻进入消息队列。
在一些实施方式中,所述分析模块还用于:统计预设时间内同一设备发生事件及产生告警的情况以对同种类型的告警进行预测。
在一些实施方式中,所述预定算法包括决策树算法,并且所述分析模块还用于:计算每个事件的信息增益,并根据信息增益将事件生成决策树。
在一些实施方式中,所述分析模块还用于:计算每个事件的信息熵,计算以每个事件为特征的熵,并用事件的信息熵和以事件为特征的熵的差值作为每个事件的信息增益。
在一些实施方式中,所述分析模块还用于:将最大信息增益的事件作为根节点以生成决策树。
基于上述目的,本发明实施例的第三个方面,提出了一种电子设备,包括:至少一个处理器;以及存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行以实现如下步骤:S1、对设备的原始告警信息进行采集,并将所述原始告警信息分类为事件信息和第一告警信息;S2、将所述第一告警信息直接发送给用户,并将所述事件信息写入消息队列;S3、定时获取所述消息队列中的事件信息,并通过预定算法对所述事件信息进行分析以预测设备发生告警的概率;以及S4、响应于所述概率大于阈值,向运维人员发送第二告警信息。
在一些实施方式中,所述将所述原始告警信息分类为事件信息和第一告警信息包括:通过结构化搜索、全文搜索、多字段搜索、近似匹配和部分匹配对所述原始告警信息进行解析以将所述原始告警信息分类为事件信息和第一告警信息。
在一些实施方式中,所述将所述事件信息写入消息队列包括:实时检测事件信息的流量,并将事件信息的流量中大于第二阈值的部分推迟到下一时刻进入消息队列。
在一些实施方式中,所述通过预定算法对所述事件信息进行分析以预测设备发生告警的概率包括:统计预设时间内同一设备发生事件及产生告警的情况以对同种类型的告警进行预测。
在一些实施方式中,所述预定算法包括决策树算法,并且所述通过预定算法对所述事件信息进行分析以预测设备发生告警的概率包括:计算每个事件的信息增益,并根据信息增益将事件生成决策树。
在一些实施方式中,所述计算每个事件的信息增益包括:计算每个事件的信息熵,计算以每个事件为特征的熵,并用事件的信息熵和以事件为特征的熵的差值作为每个事件的信息增益。
在一些实施方式中,所述根据信息增益将事件生成决策树包括:将最大信息增益的事件作为根节点以生成决策树。
如图5所示,为本发明提供的上述设备告警信息分类并预警的电子设备的一个实施例的硬件结构示意图。
以如图5所示的装置为例,在该装置中包括一个处理器301以及一个存储器302。
处理器301和存储器302可以通过总线或者其他方式连接,图5中以通过总线连接为例。
存储器302作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的设备告警信息分类并预警的方法对应的程序指令/模块。处理器301通过运行存储在存储器302中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现设备告警信息分类并预警的方法。
存储器302可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储根据设备告警信息分类并预警的方法的使用所创建的数据等。此外,存储器302可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器302可选包括相对于处理器301远程设置的存储器,这些远程存储器可以通过网络连接至本地模块。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个设备告警信息分类并预警的方法对应的计算机指令303存储在存储器302中,当被处理器301执行时,执行上述任意方法实施例中的设备告警信息分类并预警的方法。
执行上述设备告警信息分类并预警的方法的电子设备的任何一个实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
本发明还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时执行设备告警信息分类并预警的方法的计算机程序。
如图6所示,为本发明提供的上述设备告警信息分类并预警的计算机存储介质的一个实施例的示意图。以如图6所示的计算机存储介质为例,计算机可读存储介质401存储有被处理器执行时执行如上方法的计算机程序402。
最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,设备告警信息分类并预警的方法的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,程序的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
Claims (10)
1.一种设备告警信息分类并预警的方法,其特征在于,包括如下步骤:
对设备的原始告警信息进行采集,并将所述原始告警信息分类为事件信息和第一告警信息;
将所述第一告警信息直接发送给用户,并将所述事件信息写入消息队列;
定时获取所述消息队列中的事件信息,并通过预定算法对所述事件信息进行分析以预测设备发生告警的概率;以及
响应于所述概率大于阈值,向运维人员发送第二告警信息。
2.根据权利要求1所述的设备告警信息分类并预警的方法,其特征在于,所述将所述原始告警信息分类为事件信息和第一告警信息包括:
通过结构化搜索、全文搜索、多字段搜索、近似匹配和部分匹配对所述原始告警信息进行解析以将所述原始告警信息分类为事件信息和第一告警信息。
3.根据权利要求1所述的设备告警信息分类并预警的方法,其特征在于,所述将所述事件信息写入消息队列包括:
实时检测事件信息的流量,并将事件信息的流量中大于第二阈值的部分推迟到下一时刻进入消息队列。
4.根据权利要求1所述的设备告警信息分类并预警的方法,其特征在于,所述通过预定算法对所述事件信息进行分析以预测设备发生告警的概率包括:
统计预设时间内同一设备发生事件及产生告警的情况以对同种类型的告警进行预测。
5.根据权利要求1所述的设备告警信息分类并预警的方法,其特征在于,所述预定算法包括决策树算法,并且所述通过预定算法对所述事件信息进行分析以预测设备发生告警的概率包括:
计算每个事件的信息增益,并根据信息增益将事件生成决策树。
6.根据权利要求5所述的设备告警信息分类并预警的方法,其特征在于,所述计算每个事件的信息增益包括:
计算每个事件的信息熵,计算以每个事件为特征的熵,并用事件的信息熵和以事件为特征的熵的差值作为每个事件的信息增益。
7.根据权利要求5所述的设备告警信息分类并预警的方法,其特征在于,所述根据信息增益将事件生成决策树包括:
将最大信息增益的事件作为根节点以生成决策树。
8.一种设备告警信息分类并预警的***,其特征在于,包括:
采集模块,用于对设备的原始告警信息进行采集,并将所述原始告警信息分类为事件信息和第一告警信息;
写入模块,用于将所述第一告警信息直接发送给用户,并将所述事件信息写入消息队列;
分析模块,用于定时获取所述消息队列中的事件信息,并通过预定算法对所述事件信息进行分析以预测设备发生告警的概率;以及
告警模块,用于响应于所述概率大于阈值,向运维人员发送第二告警信息。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现权利要求1-7任意一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310787929.2A CN116662127A (zh) | 2023-06-30 | 2023-06-30 | 一种设备告警信息分类并预警的方法、***、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310787929.2A CN116662127A (zh) | 2023-06-30 | 2023-06-30 | 一种设备告警信息分类并预警的方法、***、设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116662127A true CN116662127A (zh) | 2023-08-29 |
Family
ID=87726221
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310787929.2A Pending CN116662127A (zh) | 2023-06-30 | 2023-06-30 | 一种设备告警信息分类并预警的方法、***、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116662127A (zh) |
-
2023
- 2023-06-30 CN CN202310787929.2A patent/CN116662127A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111885012B (zh) | 基于多种网络设备信息采集的网络态势感知方法及*** | |
CN111092852B (zh) | 基于大数据的网络安全监控方法、装置、设备及存储介质 | |
US8676965B2 (en) | Tracking high-level network transactions | |
EP3965371A1 (en) | Alarm analysis method and related device | |
US20200160230A1 (en) | Tool-specific alerting rules based on abnormal and normal patterns obtained from history logs | |
CN105159964B (zh) | 一种日志监控方法及*** | |
EP2487860B1 (en) | Method and system for improving security threats detection in communication networks | |
US8761029B2 (en) | Methods, apparatus and articles of manufacture to perform root cause analysis for network events | |
WO2018103453A1 (zh) | 检测网络的方法和装置 | |
US20040098223A1 (en) | Computing performance thresholds based on variations in network traffic patterns | |
CN112114986B (zh) | 数据异常识别方法、装置、服务器和存储介质 | |
US20170288979A1 (en) | Blue print graphs for fusing of heterogeneous alerts | |
CN111881011A (zh) | 日志管理方法、平台、服务器及存储介质 | |
CN116166505B (zh) | 金融行业双态it架构的监控平台、方法、存储介质及设备 | |
CN111259073A (zh) | 基于日志、流量和业务访问的业务***运行状态智能研判*** | |
CN113760652B (zh) | 基于应用的全链路监控的方法、***、设备和存储介质 | |
CN109815085B (zh) | 告警数据的分类方法、装置和电子设备及存储介质 | |
CN112596975A (zh) | 对网络设备进行监控处理的方法、***、设备和存储介质 | |
CN112769605A (zh) | 一种异构多云的运维管理方法及混合云平台 | |
CN114338746A (zh) | 一种用于物联网设备数据收集的分析预警方法及*** | |
Kim et al. | Unsupervised anomaly detection and root cause analysis in mobile networks | |
CN116662127A (zh) | 一种设备告警信息分类并预警的方法、***、设备和介质 | |
Li et al. | An integrated data-driven framework for computing system management | |
CN114860543A (zh) | 异常检测方法、装置、设备与计算机可读存储介质 | |
CN112612679A (zh) | ***运行状态监控方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |