CN107239388A - 一种监测告警方法及*** - Google Patents

一种监测告警方法及*** Download PDF

Info

Publication number
CN107239388A
CN107239388A CN201710390872.7A CN201710390872A CN107239388A CN 107239388 A CN107239388 A CN 107239388A CN 201710390872 A CN201710390872 A CN 201710390872A CN 107239388 A CN107239388 A CN 107239388A
Authority
CN
China
Prior art keywords
monitoring
alarm
data
monitoring data
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710390872.7A
Other languages
English (en)
Inventor
殷武烁
袁鹏飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710390872.7A priority Critical patent/CN107239388A/zh
Publication of CN107239388A publication Critical patent/CN107239388A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Fuzzy Systems (AREA)
  • Alarm Systems (AREA)

Abstract

本申请公开了一种监测告警方法及***,包括:获取监测数据;利用监测模型分析监测数据,得到分析结果;判断分析结果是否满足预设条件;如果满足,则进行告警;其中,监测模型为基于Spark框架,利用历史监测数据,得到故障发生概率与历史监测数据的第一对应关系,利用第一对应关系,得到监测模型。本发明通过获取监测对象的监测数据,利用基于Spark框架,通过历史监测数据得到故障发生概率与历史监测数据的对应关系,制作而成的监测模型对监测数据进行分析,得到分析结果,再判断分析结果是否满足预设条件,如果满足预设条件,则告警,综上所述,实现了在故障发生前,依据当前数据分析出可能发生的故障并提前告警,从而避免故障的发生或扩大。

Description

一种监测告警方法及***
技术领域
本发明涉及大数据分析领域,特别涉及一种监测告警方法及***。
背景技术
随之科技的进步,大数据分析被应用到各个领域,大规模的监测***也适用于大数据分析领域。
Spark是由加州伯克利大学AMP实验室开发的分布式并行计算框架,主要特点是弹性分布式数据集,中间输出结果可以保存在内存中,节省了大量的磁盘I/O操作。除此之外还支持多次迭代计算,特别适合流计算和图计算。
传统的监控告警方案一般是使用Ganglia+Nagios,收集***和网络的各种数据日志,加以分析,上报故障警告。但是此种传统的监控告警方式有许多弊端。首先监控日志数据量非常大,但是能被运维人员利用到的只有一小部分,大部分数据占据存储空间但没有被利用。其次告警准确度和效率低下,通常告警需要工程师设置告警条件,但是条件的粒度很难把握,这样的告警机制很死板,尤其是针对复杂的业务监控,告警经常漏报和误报。最后传统的运监***只能被动的提示故障,却不能主动的规避故障,这往往让用户处在很被动的状态。
因此,如何能够在故障发生前进行告警,规避故障,成为了研究难点。
发明内容
有鉴于此,本发明的目的在于提供一种监测告警方法及***,在故障发生前提前告警,从而提醒用户进行维护和关注,进而避免故障的发生或扩大。其具体方案如下:
一种监测告警方法,包括:
获取监测数据;
利用监测模型分析所述监测数据,得到分析结果;
判断所述分析结果是否满足预设条件;
如果满足,则进行告警;
其中,所述监测模型为基于Spark框架,利用历史监测数据,得到故障发生概率与所述历史监测数据的第一对应关系,利用所述第一对应关系,得到所述监测模型。
可选的,所述监测数据包括监测日志和运维人员的操作日志。
可选的,所述监测模型创建过程,包括:
对所述历史监测数据逐条进行SQL统计分析,并将具有联系的数据建立关联,得到故障发生概率与所述历史监测数据的第一对应关系,利用所述第一对应关系,得到所述监测模型。
可选的,所述监测模型训练过程,还包括:
对所述历史监测数据逐条进行SQL统计分析,并将具有联系的数据建立关联,得到故障与所述历史监测数据的第二对应关系,利用所述第二对应关系,得到所述监测模型。
可选的,还包括:
接收用户输入的过滤列表;
停止对所述过滤列表中记录的故障告警。
可选的,还包括:
利用历史告警信息,分析出高频告警列表;
按照预设频率获取与所述高频告警列表中记录的故障相应的目标监测数据。
可选的,所述利用历史告警信息,分析出高频告警列表的过程,包括:
利用所述历史告警信息的告警次数、告警位置和告警时间,分析出高频告警信息;
接收用户输入的确定信息,并利用所述高频告警信息,得到所述高频告警列表。
本发明还公开了一种监测告警***,包括:
获取模块,用于获取监测数据;
分析模块,用于利用监测模型分析所述监测数据,得到分析结果;
判断模块,用于判断所述分析结果是否满足预设条件;
告警模块,用于如果满足,则进行告警;
其中,所述监测模型为基于Spark框架,利用历史监测数据,得到故障发生概率与所述历史监测数据的第一对应关系,利用所述第一对应关系,得到所述监测模型。
可选的,所述分析模块,包括:
监测模型创建单元,用于对所述历史监测数据逐条进行SQL统计分析,并将具有联系的数据建立关联,得到故障发生概率与所述历史监测数据的第一对应关系,利用所述第一对应关系,得到所述监测模型。
可选的,还包括:
告警分析模块,用于利用历史告警信息,分析出高频告警列表;
高频数据获取模块,用于按照预设频率获取与所述高频告警列表中记录的故障相应的目标监测数据。
本发明中,监测告警方法,包括:获取监测数据;利用监测模型分析监测数据,得到分析结果;判断分析结果是否满足预设条件;如果满足,则进行告警;其中,监测模型为基于Spark框架,利用历史监测数据,得到故障发生概率与历史监测数据的第一对应关系,利用第一对应关系,得到监测模型。本发明获取监测对象的监测数据,利用基于Spark框架,利用历史监测数据,得到故障发生概率与历史监测数据的对应关系,利用对应关系,制作而成的监测模型对监测数据进行分析,得到分析结果,在判断分析结果是否满足预设条件,决定是否告警,如果满足预设条件,则告警,综上所述,实现主动告警,即,在故障发生前,依据当前数据分析出可能发生的故障提前告警,从而提醒用户进行维护和关注,进而避免故障的发生或扩大。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种监测告警方法流程示意图;
图2为本发明实施例公开的一种监测告警***结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种监测告警方法,参见图1所示,该方法包括:
步骤S11:获取监测数据。
可以理解的是,为能对监测对象进行主动告警分析,可以详细的获取监测对象的各种基础数据,并根据监测对象的变更获取相应的监测数据,例如,监测对象可以为服务器,相应的获取监测数据也可以根据实际应用需求定时获取监测数据,例如,每隔10分钟获取一次监测对象的监测数据,当然,也可以实时获取监测对象的监测数据。
步骤S12:利用监测模型分析监测数据,得到分析结果。
具体的,监测模型为预先建立好的模型,在监测过程中可以直接调用,利用监测模型分析监测数据,得到分析结果以用于后续告警操作。
其中,监测模型为基于Spark框架制作而成的,利用历史监测数据,基于Spark框架进行多次迭代计算,得到故障发生概率与历史监测数据的第一对应关系,利用第一对应关系,得到监测模型。
可以理解的是,监测模型在分析当前监测数据时的过程与训练时的过程相同,对监测模型进行何种训练,在分析过程中便进行何种分析;可以利用Gnglia获取监测数据。
需要说明的是,监测模型可以不断地利用接收到的监测数据进行学习和更新,从而不断地增加告警的效率和准确度。
步骤S13:判断分析结果是否满足预设条件。
具体的,可以利用分析结果中利用监测数据分析出的故障发生概率判断是否满足预设概率,如果一项故障发生概率超过预设概率,则判定满足预设条件,例如,故障发生概率为50%,预设概率即预设条件为40%,则当前故障发生概率超过预设条件,判定满足预设条件,当然,如果故障发生概率不满足预设条件则不进行操作。
可以理解的是,由于分析结果中包括多种故障的故障发生概率,因此相应的预设条件也可以与故障一一对应,即,用户可以对每个故障判断是否告警的预设条件分别设定,例如,共有第一故障、第二故障和第三故障,用户可以分别对第一故障、第二故障和第三故障设定第一预设条件、第二预设条件和第三预设条件,其中,第一预设条件、第二预设条件和第三预设条件的设置可以不同。
步骤S14:如果满足,则进行告警。
具体的,当分析结果中的故障发生概率满足预设条件,则进行告警;其中,告警方式可以为蜂鸣告警或提示灯告警,也可以像用户的移动终端发送提示信息进行告警,在此不对告警的形式做限定;可以利用Nagios进行告警。
可见,本发明实施例中通过获取监测对象的监测数据,利用历史监测数据,得到故障发生概率与历史监测数据的对应关系,利用对应关系并基于Spark框架制作而成的监测模型对监测数据进行分析,得到分析结果,再判断分析结果是否满足预设条件,决定是否告警,如果满足预设条件,则告警,综上所述,实现了主动告警,即,在故障发生前,依据当前数据分析出可能发生的故障并提前告警,从而提醒用户进行维护和关注,避免了故障的发生或扩大。
本发明实施例公开了一种具体的监测告警方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。具体的:
步骤S21:获取监测日志和运维人员的操作日志。
具体的,监测数据可以为监测日志和运维人员的操作日志,监测日志中包括监测对象的各种监测数据,操作日志中记载有运维人员进行的各种操作记录,例如,维护记录等。
步骤S22:利用监测模型分析监测数据,得到分析结果。
其中,监测模型可以通过对历史监测日志和历史操作日志中的数据逐条进行SQL(Structured Query Language,结构化查询语言)统计分析,并将具有联系的数据建立关联,得到故障发生概率与历史监测数据的对应关系,利用对应关系得到。
具体的,利用SQL将历史监测日志和历史操作日志进行数据库化,按照数据的属性进行分类,并且从中分析出关键数据,建立具有联系的数据之间的关联,结合历史操作日志和历史监测日志可以分析出故障与监测日志中的那些数据相关,以使根据一个引发故障的数据的变化,可以推算出另一个引发故障的数据的变化,从而实现对故障的预测。
例如,将历史操作日志中的运维人员对故障的维护记录中进行的操作,在同一时段和地点引起的历史监测日志中变化的监测数据相关联,可以得知那些数据与故障相关,从而根据分析这些与故障相关的关键数据,根据部分关键数据的变化可以推算出故障发生概率,得到故障发生概率与历史监测数据的对应关系。
可以理解的是,监测模型在分析当前监测日志和操作日志的过程,与训练时进行的分析过程相同。
步骤S23:判断分析结果是否满足预设条件。
步骤S24:如果满足,则进行告警。
本发明实施例中,上述监测模型训练过程,还可以包括对历史监测数据逐条进行SQL统计分析,并将具有联系的数据建立关联,得到故障与历史监测数据的第二对应关系,利用第二对应关系,得到监测模型,通过训练出监测数据与故障的直接关系,为被动告警作出前提保证,被动告警即当故障发生时告警。
进一步的,可以对告警进行分类,将通过监测数据可以直接分析出的告警划分为基本告警,将需要通过多种监测数据组合推算出的告警划分为业务告警,因此,业务告警与基本告警存在一定的关系,即业务告警由一个或多个基本告警引起,业务告警与基本告警存在一定的继承关系,这样在告警时,通过区分基本告警和业务告警,可以使用户更能直观的分析出当前故障所在和故障的严重性。
在实际应用中,一些告警可能影响不大,例如,一些基本告警,且一些较大的故障可能会突然出现大量的告警,例如,一个业务告警级别的故障同时会引起大量基本告警级,过多的告警可能会影响用户的判断,因此,还可以接收用户输入的过滤列表;停止对过滤列表中记录的故障告警,实现对告警的筛选。
需要说明的是,过滤列表可以只是不对表中的故障不进行告警,而监测模型仍对过滤列表中的故障相应的监测数据进行监测和分析,当出现在过滤列表中的故障基础上引发的故障发生概率过高或发生故障,需要告警时则仍然告警,确保能够及时提醒用户保证安全,提高用户体验。
例如,一个业务告警,包括3个基本告警,过滤列表屏蔽了该业务告警的3个基本告警,当3个基本告警对应的任一故障出现,则不会产生与该故障对应的基本告警,但当3个基本告警对应的故障出现,导致业务告警的发生几率超过预设条件,则仍进行与业务告警相应的告警。
可以理解的是,一些故障可能常常频繁出现,通常的监测数据获取频率可能无法及时监测到此类故障,因此,可以对此类故障进行重点关注和监控,具体可以包括步骤S25和步骤S26;
S25:利用历史告警信息,分析出高频告警列表。
具体的,可以利用历史告警信息的告警次数、告警位置和告警时间,分析出高频告警信息,再接收用户输入的确定信息,可以由用户做出最终决定,判断分析出的高频告警信息,是否需要关注,并利用高频告警信息,得到高频告警列表。
S26:按照预设频率获取与高频告警列表中记录的故障相应的目标监测数据。
具体的,在分析出高频告警列表后,用户可以单独设定获取高频告警列表中记录的故障相应的目标监测数据的预设频率,例如,通用监测数据获取频率为每12小时获取一次,预设频率可以设定为每1小时获取一次,也可以设定为实时获取。
相应的,本发明实施例还公开了一种监测告警***,参见图2所示,该***包括:
获取模块11,用于获取监测数据。
具体的,监测数据可以包括监测日志和运维人员的操作日志。
分析模块12,用于利用监测模型分析监测数据,得到分析结果。
其中,监测模型为基于Spark框架,利用历史监测数据,得到故障发生概率与历史监测数据的第一对应关系,利用第一对应关系,得到监测模型。
判断模块13,用于判断分析结果是否满足预设条件。
告警模块14,用于如果满足,则进行告警。
本发明实施例中,上述分析模块12,具体可以包括监测模型创建单元,其中,
监测模型创建单元,用于对历史监测数据逐条进行SQL统计分析,并将具有联系的数据建立关联,得到故障发生概率与历史监测数据的第一对应关系,利用第一对应关系,得到监测模型。
监测模型创建单元,还可以具体用于对历史监测数据逐条进行SQL统计分析,并将具有联系的数据建立关联,得到故障与历史监测数据的第二对应关系,利用第二对应关系,得到监测模型。
本发明实施例中,还包括:
接收模块,用于接收用户输入的过滤列表;
过滤模块,用于停止对过滤列表中记录的故障告警。
告警分析模块12,用于利用历史告警信息,分析出高频告警列表;
高频数据获取模块11,用于按照预设频率获取与高频告警列表中记录的故障相应的目标监测数据。
上述告警分析模块12,具体可以包括分析单元和创建单元;其中,
分析单元,用于利用历史告警信息的告警次数、告警位置和告警时间,分析出高频告警信息;
创建单元,用于接收用户输入的确定信息,并利用高频告警信息,得到高频告警列表。
可见,本发明实施例中通过获取监测对象的监测数据,利用历史监测数据,得到故障发生概率与历史监测数据的对应关系,利用对应关系并基于Spark框架制作而成的监测模型对监测数据进行分析,得到分析结果,再判断分析结果是否满足预设条件,决定是否告警,如果满足预设条件,则告警,综上所述,实现了主动告警,即,在故障发生前,依据当前数据分析出可能发生的故障并提前告警,从而提醒用户进行维护和关注,避免了故障的发生或扩大。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种监测告警方法及***进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种监测告警方法,其特征在于,包括:
获取监测数据;
利用监测模型分析所述监测数据,得到分析结果;
判断所述分析结果是否满足预设条件;
如果满足,则进行告警;
其中,所述监测模型为基于Spark框架,利用历史监测数据,得到故障发生概率与所述历史监测数据的第一对应关系,利用所述第一对应关系,得到所述监测模型。
2.根据权利要求1所述的监测告警方法,其特征在于,所述监测数据包括监测日志和运维人员的操作日志。
3.根据权利要求1所述的监测告警方法,其特征在于,所述监测模型创建过程,包括:
对所述历史监测数据逐条进行SQL统计分析,并将具有联系的数据建立关联,得到故障发生概率与所述历史监测数据的第一对应关系,利用所述第一对应关系,得到所述监测模型。
4.根据权利要求1至3任一项所述的监测告警方法,其特征在于,所述监测模型训练过程,还包括:
对所述历史监测数据逐条进行SQL统计分析,并将具有联系的数据建立关联,得到故障与所述历史监测数据的第二对应关系,利用所述第二对应关系,得到所述监测模型。
5.根据权利要求1至3任一项所述的监测告警方法,其特征在于,还包括:
接收用户输入的过滤列表;
停止对所述过滤列表中记录的故障告警。
6.根据权利要求1至3任一项所述的监测告警方法,其特征在于,还包括:
利用历史告警信息,分析出高频告警列表;
按照预设频率获取与所述高频告警列表中记录的故障相应的目标监测数据。
7.根据权利要求4所述的监测告警方法,其特征在于,所述利用历史告警信息,分析出高频告警列表的过程,包括:
利用所述历史告警信息的告警次数、告警位置和告警时间,分析出高频告警信息;
接收用户输入的确定信息,并利用所述高频告警信息,得到所述高频告警列表。
8.一种监测告警***,其特征在于,包括:
获取模块,用于获取监测数据;
分析模块,用于利用监测模型分析所述监测数据,得到分析结果;
判断模块,用于判断所述分析结果是否满足预设条件;
告警模块,用于如果满足,则进行告警;
其中,所述监测模型为基于Spark框架,利用历史监测数据,得到故障发生概率与所述历史监测数据的第一对应关系,利用所述第一对应关系,得到所述监测模型。
9.根据权利要求8所述的监测告警***,其特征在于,所述分析模块,包括:
监测模型创建单元,用于对所述历史监测数据逐条进行SQL统计分析,并将具有联系的数据建立关联,得到故障发生概率与所述历史监测数据的第一对应关系,利用所述第一对应关系,得到所述监测模型。
10.根据权利要求8所述的监测告警***,其特征在于,还包括:
告警分析模块,用于利用历史告警信息,分析出高频告警列表;
高频数据获取模块,用于按照预设频率获取与所述高频告警列表中记录的故障相应的目标监测数据。
CN201710390872.7A 2017-05-27 2017-05-27 一种监测告警方法及*** Pending CN107239388A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710390872.7A CN107239388A (zh) 2017-05-27 2017-05-27 一种监测告警方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710390872.7A CN107239388A (zh) 2017-05-27 2017-05-27 一种监测告警方法及***

Publications (1)

Publication Number Publication Date
CN107239388A true CN107239388A (zh) 2017-10-10

Family

ID=59984576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710390872.7A Pending CN107239388A (zh) 2017-05-27 2017-05-27 一种监测告警方法及***

Country Status (1)

Country Link
CN (1) CN107239388A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108111625A (zh) * 2018-01-02 2018-06-01 广东欧珀移动通信有限公司 数据传输方法及相关产品
CN108255689A (zh) * 2018-01-11 2018-07-06 哈尔滨工业大学 一种基于历史任务分析的Apache Spark应用自动化调优方法
CN109617745A (zh) * 2019-01-11 2019-04-12 云智慧(北京)科技有限公司 告警预测方法、装置、***及存储介质
CN110022233A (zh) * 2019-04-11 2019-07-16 四川长虹电器股份有限公司 一种基于hfc分布式网管***的告警管理方法
CN110096408A (zh) * 2019-03-11 2019-08-06 中国平安人寿保险股份有限公司 告警监测方法、装置、电子设备及计算机可读存储介质
CN110646229A (zh) * 2019-09-16 2020-01-03 中国神华能源股份有限公司国华电力分公司 空气预热器故障诊断方法、装置及电子设备、存储介质
CN110647446A (zh) * 2018-06-26 2020-01-03 中兴通讯股份有限公司 一种日志故障关联与预测方法、装置、设备及存储介质
CN111708678A (zh) * 2020-08-18 2020-09-25 北京志翔科技股份有限公司 一种异常监测方法及装置
CN112506159A (zh) * 2020-12-11 2021-03-16 北京南洋思源智能科技有限公司 监测方法及装置、监测平台、计算机可读存储介质
CN112738819A (zh) * 2020-12-17 2021-04-30 南京方东通信***工程有限公司 无线通信基站信息管理***和方法
CN115561565A (zh) * 2022-12-05 2023-01-03 济宁矿业集团海纳科技机电股份有限公司 一种基于网络通信的高压变频器监测装置及方法
CN117236705A (zh) * 2023-11-16 2023-12-15 中钢集团武汉安全环保研究院有限公司 一种钢铁生产工艺参数安全监测告警方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105468917A (zh) * 2015-12-01 2016-04-06 北京无线电计量测试研究所 一种管线故障预测方法及装置
CN105589795A (zh) * 2014-12-31 2016-05-18 ***股份有限公司 基于预测模型的磁盘故障预测方法及装置
CN105808368A (zh) * 2016-03-15 2016-07-27 南京联成科技发展有限公司 一种基于随机概率分布的信息安全异常检测的方法及***
CN106209428A (zh) * 2016-06-28 2016-12-07 武汉合创源科技有限公司 一种网站故障监控预警方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105589795A (zh) * 2014-12-31 2016-05-18 ***股份有限公司 基于预测模型的磁盘故障预测方法及装置
CN105468917A (zh) * 2015-12-01 2016-04-06 北京无线电计量测试研究所 一种管线故障预测方法及装置
CN105808368A (zh) * 2016-03-15 2016-07-27 南京联成科技发展有限公司 一种基于随机概率分布的信息安全异常检测的方法及***
CN106209428A (zh) * 2016-06-28 2016-12-07 武汉合创源科技有限公司 一种网站故障监控预警方法及***

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108111625A (zh) * 2018-01-02 2018-06-01 广东欧珀移动通信有限公司 数据传输方法及相关产品
CN108111625B (zh) * 2018-01-02 2019-12-27 Oppo广东移动通信有限公司 数据传输方法及相关产品
CN108255689B (zh) * 2018-01-11 2021-02-12 哈尔滨工业大学 一种基于历史任务分析的Apache Spark应用自动化调优方法
CN108255689A (zh) * 2018-01-11 2018-07-06 哈尔滨工业大学 一种基于历史任务分析的Apache Spark应用自动化调优方法
CN110647446B (zh) * 2018-06-26 2023-02-21 中兴通讯股份有限公司 一种日志故障关联与预测方法、装置、设备及存储介质
CN110647446A (zh) * 2018-06-26 2020-01-03 中兴通讯股份有限公司 一种日志故障关联与预测方法、装置、设备及存储介质
CN109617745A (zh) * 2019-01-11 2019-04-12 云智慧(北京)科技有限公司 告警预测方法、装置、***及存储介质
CN109617745B (zh) * 2019-01-11 2022-03-04 云智慧(北京)科技有限公司 告警预测方法、装置、***及存储介质
CN110096408A (zh) * 2019-03-11 2019-08-06 中国平安人寿保险股份有限公司 告警监测方法、装置、电子设备及计算机可读存储介质
CN110022233A (zh) * 2019-04-11 2019-07-16 四川长虹电器股份有限公司 一种基于hfc分布式网管***的告警管理方法
CN110646229A (zh) * 2019-09-16 2020-01-03 中国神华能源股份有限公司国华电力分公司 空气预热器故障诊断方法、装置及电子设备、存储介质
CN110646229B (zh) * 2019-09-16 2022-04-12 中国神华能源股份有限公司国华电力分公司 空气预热器故障诊断方法、装置及电子设备、存储介质
CN111708678A (zh) * 2020-08-18 2020-09-25 北京志翔科技股份有限公司 一种异常监测方法及装置
CN112506159A (zh) * 2020-12-11 2021-03-16 北京南洋思源智能科技有限公司 监测方法及装置、监测平台、计算机可读存储介质
CN112738819A (zh) * 2020-12-17 2021-04-30 南京方东通信***工程有限公司 无线通信基站信息管理***和方法
CN115561565A (zh) * 2022-12-05 2023-01-03 济宁矿业集团海纳科技机电股份有限公司 一种基于网络通信的高压变频器监测装置及方法
CN115561565B (zh) * 2022-12-05 2023-03-03 济宁矿业集团海纳科技机电股份有限公司 一种基于网络通信的高压变频器监测装置及方法
CN117236705A (zh) * 2023-11-16 2023-12-15 中钢集团武汉安全环保研究院有限公司 一种钢铁生产工艺参数安全监测告警方法和装置
CN117236705B (zh) * 2023-11-16 2024-02-06 中钢集团武汉安全环保研究院有限公司 一种钢铁生产工艺参数安全监测告警方法和装置

Similar Documents

Publication Publication Date Title
CN107239388A (zh) 一种监测告警方法及***
CN102638100B (zh) 地区电网设备异常告警信号关联分析与诊断方法
Kondaveeti et al. Graphical tools for routine assessment of industrial alarm systems
CN101555806B (zh) 发电厂生产实时参数分类报警和识别辅助方法
US20190097873A1 (en) Predicting computer network equipment failure
CN106371986A (zh) 一种日志处理运维监控***
CN101916499B (zh) 一种智能报警装置及智能报警方法
CN109992440A (zh) 一种基于知识图谱和机器学习的it根故障分析识别方法
CN104363106A (zh) 一种基于大数据技术的电力信息通信故障预警分析方法
US11906112B2 (en) Methods for safety management of compressors in smart gas pipeline network and internet of things systems thereof
CN101668012B (zh) 安全事件检测方法及装置
CN107147213B (zh) 电网频发监控信息智能告警及综合分析治理方法
CN107104848A (zh) 信息技术***监控方法及装置
CN112136161A (zh) 用于智能报警分组的***和方法
Koltsidopoulos Papatzimos et al. Offshore wind turbine fault alarm prediction
CN108061841A (zh) 一种电网故障事件等级自动识别的方法
CN105743595A (zh) 中短波发射机故障预警方法及装置
CN104425046A (zh) 核电站运行安全指数量化方法和***
CN107658980A (zh) 一种用于复核电网监控告警信息的分析方法和***
CN112565009A (zh) 一种基于自定义性能阈值告警规则的处理方法及装置
CN106199251B (zh) 一种基于自适应建模分析的配电网故障预警***及方法
CN114172921A (zh) 一种调度录音***的日志审计方法及装置
CN106871963B (zh) 一种水库供水实时监测管理***
CN112711507A (zh) 设备告警方法、电子设备和介质
CN113159503A (zh) 一种远程遥控智能安全评估***和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171010