CN108075906A - 一种用于云计算数据中心的管理方法及*** - Google Patents

一种用于云计算数据中心的管理方法及*** Download PDF

Info

Publication number
CN108075906A
CN108075906A CN201610980467.6A CN201610980467A CN108075906A CN 108075906 A CN108075906 A CN 108075906A CN 201610980467 A CN201610980467 A CN 201610980467A CN 108075906 A CN108075906 A CN 108075906A
Authority
CN
China
Prior art keywords
index
managed
achievement data
abnormality detection
abnormality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610980467.6A
Other languages
English (en)
Inventor
邬建卫
沈琛魁
江均勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Cloud Information Technology Co Ltd
Original Assignee
Shanghai Cloud Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Cloud Information Technology Co Ltd filed Critical Shanghai Cloud Information Technology Co Ltd
Priority to CN201610980467.6A priority Critical patent/CN108075906A/zh
Publication of CN108075906A publication Critical patent/CN108075906A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用于云计算数据中心的管理方法及***。该方法包括:获取用户确定的云计算数据中心中的待管理指标,并获取所述待管理指标的指标数据;基于构建的异常检测模型,确定所述指标数据是否处于异常状态;如果所述指标数据处于异常状态,则以设定方式输出所述待管理指标的告警信息。利用该方法,能够基于训练学习得到的异常检测模型,自主的对待管理指标的异常状态进行准确检测,并快速进行预警通知,避免了传统监控告警***中需要运维人员为每个待管理指标配置静态阈值的繁琐操作,从而降低了对云式计算数据中心的运维管理资源投入。

Description

一种用于云计算数据中心的管理方法及***
技术领域
本发明实施例涉及云计算技术领域,尤其涉及一种用于云计算数据中心的管理方法及***。
背景技术
云计算是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备。简单而言,云计算数据中心相当于由大量的物理机(服务器)或虚拟机等计算设备组成的支持云计算的计算设备资源。随着互联网的发展,很多公司尤其是互联网公司的业务量剧增,为了支持业务高效运行,这些公司搭建了自有的数据中心,实现了业务的云部署。
为了保证业务应用的可靠稳定运行,很多企业都会搭建一套监控告警***来实现对云计算数据中心的管理。传统的监控告警***中,在确定云计算数据中心中待监控的指标后,需要相应的运维人员手动设置设定各资源指标的静态告警阈值,然后进行周期检测,对达到阈值的指标进行告警操作。
上述基于静态告警阈值方法存在以下不足:1、配置繁琐,运维人员需要在每个监控主机上分别对确定的指标进行进行静态告警阈值的配置,由于云计算数据中心所具有的服务器、虚拟机数量非常大,手工配置成本非常高;2、需要运维人员具有相当的***运维、业务运维专业知识,进行合理的静态告警阈值设定,否则,极易出现阈值设置过高导致漏告警或者阈值设置过低导致误告警,并且只有在故障发生后,运维人员才能知道,导致业务中断运行。
发明内容
本发明提供了一种用于云计算数据中心的管理方法及***,以实现对现有的云计算数据中心监控告警***的优化。
本发明实施例采用以下技术方案:
第一方面,本发明实施例提供了一种用于云计算数据中心的管理方法,该方法包括:
获取用户确定的云计算数据中心中的待管理指标,并获取所述待管理指标的指标数据;
基于构建的异常检测模型,确定所述指标数据是否处于异常状态;
如果所述指标数据处于异常状态,则以设定方式输出所述待管理指标的告警信息。
第二方面,本发明实施例还提供了一种用于云计算数据中心的管理***,该***包括:
指标数据采集模块,用于获取用户确定的云计算数据中心中的待管理指标,并获取所述待管理指标的指标数据;
异常状态检测模块,用于基于构建的异常检测模型,确定所述指标数据是否处于异常状态;
告警信息输出模块,用于当所述指标数据处于异常状态时,以设定方式输出所述待管理指标的告警信息。
本发明提供了一种用于云计算数据中心的管理方法及***,该管理方法首先确定云计算数据中心中的待管理指标,并获取所述待管理指标的指标数据;然后基于构建的异常检测模型,确定所述指标数据是否处于异常状态;最终当所述指标数据处于异常状态时,以设定方式输出所述待管理指标的告警信息。利用本发明所提的技术方案,能够基于训练学习得到的异常检测模型,自主的对待管理指标的异常状态进行准确检测,并快速进行预警通知,避免了传统监控告警***中需要运维人员为每个待管理指标配置静态阈值的繁琐操作,从而降低了对云式计算数据中心的运维管理资源投入。
附图说明
图1为本发明实施例一提供的一种用于云计算数据中心的管理方法的流程图;
图2为本发明实施例二提供的一种用于云计算数据中心的管理方法的流程图;
图3为本发明实施例三提供的一种用于云计算数据中心的管理装置的结构图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1为本发明实施例一提供的一种用于云计算数据中心的管理方法的流程图,本实施例可适用于对云计算数据中心中各项指标进行监控告警管理的情况,该方法可以由用于云计算数据中心的管理***来执行。该***可通过硬件和/或软件的方式实现,并一般可集成在进行云计算的服务平台中。
如图1所示,本发明实施例一提供的一种用于云计算数据中心的管理方法,具体包括:
S101、获取用户确定的云计算数据中心中的待管理指标,并获取所述待管理指标的指标数据。
在本实施例中,所述云计算数据中心具体可看做由大量的服务主机或虚拟机组成的计算设备资源中心,所述待管理指标具体可指云计算数据中心中用户期望管理的硬件或软件指标,可以是云计算数据中心中各待管理服务主机或虚拟机的使用指标(如服务主机的CUP占用率,CPU的当前温度或者内存占用率等等);还可以是用户配置在云计算数据中心上的相关应用的使用指标。一般地,可以根据用户在设定监控界面中的操作来确定所述待管理指标。
在本实施例中,在获取所确定所述待管理指标后,可以通过基于设定数据采集方式监测并获取所述待管理指标的指标数据。示例性地,可以基于资源占用监测程序监测并采集相应待管理服务主机的CPU或内存的占用率,还可以基于设置的温度传感器监测并采集云计算数据中心的当前温度信息。一般地,本实施例可以实时的采集所述待管理指标的指标数据,也可以基于一定的时间间隔进行指标数据的采集。此外,由于云计算数据中心中具有大量的计算设备资源,由此可以确定所述待管理指标的数量也相对较大。
S102、基于构建的异常检测模型,确定所述指标数据是否处于异常状态。
在本实施例中,可以通过构建的异常检测模型对所获取的指标数据进行异常状态的确定。所述异常检测模型具体可通过异常检测机器学习算法,通过不停的算法迭代训练学习而构建形成,训练学习后构建的异常检测模型可以形成所述云计算数据中心中待管理指标的标准特征值。
在本实施例中,在启动所述异常检测模型后,可以将指标数据以数据流形式输入所述异常检测模型,然后可以将所述指标数据产生的特征值与待管理指标的标准特征值相比对,以确定所述指标数据是否处于异常状态。具体地,如果所述指标数据产生的特征值不符合标准特征值,则可认为所述所述指标数据处于异常状态。
需要说明的是,由于所述指标数据以数据流形式输入,且云计算数据中心中具有大量的待管理指标,由此考虑基于分布式的流式计算平台对指标数据进行异常检测,示例性地,常见的分布式流式计算平台有SparkStreaming、Storm等流式计算平台。
S103、如果所述指标数据处于异常状态,则以设定方式输出所述待管理指标的告警信息。
在本实施例中,当基于步骤S102检测出所述指标数据处于异常状态时,可以确定所述云计算数据中心中待管理指标的当前工作状态异常,需要进行预警处理,具体地,可以已邮件或短信的方式向运维人员输出相应待管理指标的告警信息。
本发明实施例一提供的一种用于云计算数据中心的管理方法,首先确定云计算数据中心中的待管理指标,并获取所述待管理指标的指标数据;然后基于设定的异常检测模型,确定所述指标数据是否处于异常状态;最终当所述指标数据处于异常状态时,以设定方式输出所述待管理指标的告警信息。利用本发明所提的技术方案,能够基于训练学习得到的异常检测模型,自主的对待管理指标的异常状态进行准确检测,并快速进行预警通知,避免了传统监控告警***中需要运维人员为每个待管理指标配置静态阈值的繁琐操作,从而降低了对云式计算数据中心的运维管理资源投入。
实施例二
图2为本发明实施例二提供的一种用于云计算数据中心的管理方法的流程图。本发明实施例二以上述实施例为基础进行优化,在本实施例中,将获取所述待管理指标的指标数据,具体优化为:实时获取或以设定时间间隔获取所述待管理指标的指标数据;相应的,本实施例还优化增加了:将所述待管理指标的指标数据存储在设定的数据库中,形成所述待管理指标的历史指标数据。
进一步地,本实施例将基于构建的异常检测模型,确定所述指标数据是否处于异常状态,具体优化为:将所述指标数据作为构建的异常检测模型的输入值,产生对应的指标数据特征;如果所述指标数据特征符合所述异常检测模型的标准指标特征,则确定所述指标数据处于正常状态;否则,确定所述指标数据处于异常状态。
进一步地,本实施例还优化增加了:根据设定的异常检测训练学习算法,分布式构建所述云计算数据中心的异常检测模型。
如图2所示,本发明实施例二提供的一种用于云计算数据中心的管理方法,具体包括如下操作:
S201、获取用户确定的云计算数据中心中的待管理指标。
示例性地,可以获取运维人员在监控主机的监控界面中选中的指标选项,将上述指标选项确定为云计算数据中心中的待管理指标。例如,所述待管理指标可以是云计算数据中心中处于工作状态的服务主机或虚拟机的硬件或软件指标;还可以是用户配置于云计算数据中心上的应用程序的使用指标。
S202、实时获取或以设定时间间隔获取待管理指标的指标数据,并将指标数据存储在设定的数据库中,形成待管理指标的历史指标数据。
在本实施例中,所获取的指标数据往往是存在于内存中的即时数据,该指标数据可直接用于异常状态的监测管理,还可以对指标数据进行持久化操作,将指标数据存放于指定的数据库中,形成永久性的历史指标数据,该历史指标数据可用于后续异常检测模型的训练学习。可以理解的是,本实施例可以实时的监测并获取待管理指标的指标数据,由此体现本实施例所提供管理方法的实时性;此外,当所述待管理指标的数据变化频率较低时,可以考虑间隔的获取指标数据,由此在不影响本实施管理方法准确性的前提下,来降低运行时的资源消耗。
S203、根据设定的异常检测训练学习算法,分布式构建所述云计算数据中心的异常检测模型。
需要说明的是,步骤S203相当于一个异常检测模型的构建操作,与步骤S201和步骤202的实现无先后限制,只要在执行步骤S204之前实现即可。
在本实施例中,由于云计算数据中心中所确定的待管理指标的数量较大,由此考虑构建分布式的异常检测模型,以支持大数据量的异常检测算法迭代,同时加快对待管理指标异常状态的监控。在本实施例中,所述异常检测训练学习算法可以是但不限定于一类支持向量机(One-Class SVM)及多维高斯分布等现有的异常检测学习算法。
进一步地,所述根据设定的异常检测训练学***台上部署设定的异常检测训练学***台上训练获得所述云计算数据中心的异常检测模型。
在本实施例中,在异常检测模型的构建过程中,首先需要在分布式计算平台部署设定的异常检测训练学***台有Spark和Hadoop平台等;然后可以基于调度框架Oozie或者调度***Cron定时的从数据库中获取所述待管理指标的历史指标数据,以作为异常检测训练学***台上训练获得所述云计算数据中心的异常检测模型。
S204、将待管理指标的指标数据作为构建的异常检测模型的输入值,产生对应的指标数据特征。
在本实施例中,步骤S204和步骤S205具体描述了指标数据的异常状态的判定过程。具体地,可以将待管理指标的指标数据基于分布式流式计算平台输入至异常检测模型,基于该异常检测模型的可以产生相应的指标数据特征,之后可以基于所述指标数据特征判定指标数据的异常状态。
S205、如果指标数据特征符合异常检测模型的标准指标特征,则确定所述指标数据处于正常状态;否则,确定所述指标数据处于异常状态。
在本实施例中,所述标准指标特征具体可理解为基于步骤S203的操作训练获得的云计算数据中心中的指标应该满足的正常指标特征。因此,当指标数据的指标数据特征符合异常检测模型的标准指标特征时,可认为指标数据处于正常状态。可以理解的是,基于上述操作,可以自主的基于训练学习后的异常检测模型准确快速的实现对待管理指标的异常监控。
S206、如果所述指标数据处于异常状态,则以设定方式输出所述待管理指标的告警信息。
示例性地,当所监控的指标数据处于异常状态时,就可以设定的短信方式向运维人员输出相应待管理指标的告警信息,以使运维人员能够及时的对异常的待管理指标进行维护。
本发明实施例二提供的一种用于云计算数据中心的管理方法,具体化了异常检测模型的构造过程,同时具体化了异常状态的判定过程。利用该方法,能够基于异常检测机器学习的思想,通过不停的算法迭代自动建模出云计算数据中心的正常模型,避免了传统监控告警***中运维人员手动设置大量静态告警阈值的繁琐操作;此外,基于分布式计算的思想,对每个新指标数据通过分布式异常检测模型的判断,准确高效的实现了异常状态的监测和告警,及时的避免了业务中断带来的影响,从而降低了对云式计算数据中心的运维管理资源投入。
实施例三
图3为本发明实施例三提供的一种用于云计算数据中心的管理装置的结构图。该***可适用于对云计算数据中心中各项指标进行监控告警管理的情况,可通过硬件和/或软件的方式实现,并一般可集成在进行云计算的服务平台中。如图3所示,该***包括:指标数据采集模块31、异常状态检测模块32以及告警信息输出模块33。
其中,指标数据采集模块31,用于获取用户确定的云计算数据中心中的待管理指标,并获取所述待管理指标的指标数据;
异常状态检测模块32,用于基于构建的异常检测模型,确定所述指标数据是否处于异常状态;
告警信息输出模块33,用于当所述指标数据处于异常状态时,以设定方式输出所述待管理指标的告警信息。
在本实施例中,该***首先通过指标数据采集模块31确定云计算数据中心中的待管理指标,并获取所述待管理指标的指标数据;然后通过异常状态检测模块32基于设定的异常检测模型,确定所述指标数据是否处于异常状态;最终通过告警信息输出模块33当所述指标数据处于异常状态时,以设定方式输出所述待管理指标的告警信息。
本发明实施例三提供的一种用于云计算数据中心的管理***,首先通过指标数据采集模块获得了待管理指标的指标数据;然后通过异常状态检测模块监控了指标数据的异常状态;最终通过告警信息输出模块进行了异常状态的告警提示。利用该***,能够基于训练学习得到的异常检测模型,自主的对待管理指标的异常状态进行准确检测,并快速进行预警通知,避免了传统监控告警***中需要运维人员为每个待管理指标配置静态阈值的繁琐操作,从而降低了对云式计算数据中心的运维管理资源投入。
进一步地,该***还优化包括了:
检测模型构建模块34,用于根据设定的异常检测训练学习算法,分布式构建所述云计算数据中心的异常检测模型。
在上述实施例的基础上,所述检测模型构建模块34具体用于:
在分布式计算平台上部署设定的异常检测训练学***台上训练获得所述云计算数据中心的异常检测模型。
进一步地,获取所述待管理指标的指标数据包括:
实时获取或以设定时间间隔获取所述待管理指标的指标数据;
相应的,所述***还包括:
历史数据存储模块35,用于将所述待管理指标的指标数据存储在设定的数据库中,形成所述待管理指标的历史指标数据。
进一步地,异常状态检测模块32具体用于:
将所述指标数据作为构建的异常检测模型的输入值,产生对应的指标数据特征;如果所述指标数据特征符合所述异常检测模型的标准指标特征,则确定所述指标数据处于正常状态;否则,确定所述指标数据处于异常状态。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种用于云计算数据中心的管理方法,其特征在于,包括:
获取用户确定的云计算数据中心中的待管理指标,并获取所述待管理指标的指标数据;
基于构建的异常检测模型,确定所述指标数据是否处于异常状态;
如果所述指标数据处于异常状态,则以设定方式输出所述待管理指标的告警信息。
2.根据权利要求1所述的方法,其特征在于,还包括:
根据设定的异常检测训练学习算法,分布式构建所述云计算数据中心的异常检测模型。
3.根据权利要求2所述的方法,其特征在于,所述根据设定的异常检测训练学习算法,分布式构建所述云计算数据中心的异常检测模型包括:
在分布式计算平台上部署设定的异常检测训练学习算法;
从数据库中获取所述待管理指标的历史指标数据,作为所述异常检测训练学习算法的训练数据集;
确定所述待管理指标的指标特征,作为所述异常检测训练学习算法的训练学习特征;
基于所述训练数据集及所述训练学***台上训练获得所述云计算数据中心的异常检测模型。
4.根据权利要求1所述的方法,其特征在于,获取所述待管理指标的指标数据包括:
实时获取或以设定时间间隔获取所述待管理指标的指标数据;
相应的,所述方法还包括:
将所述待管理指标的指标数据存储在设定的数据库中,形成所述待管理指标的历史指标数据。
5.根据权利要求1-4任一所述的方法,其特征在于,基于构建的异常检测模型,确定所述指标数据是否处于异常状态包括:
将所述指标数据作为构建的异常检测模型的输入值,产生对应的指标数据特征;
如果所述指标数据特征符合所述异常检测模型的标准指标特征,则确定所述指标数据处于正常状态;否则,确定所述指标数据处于异常状态。
6.一种用于云计算数据中心的管理***,其特征在于,包括:
指标数据采集模块,用于获取用户确定的云计算数据中心中的待管理指标,并获取所述待管理指标的指标数据;
异常状态检测模块,用于基于设定的异常检测模型,确定所述指标数据是否处于异常状态;
告警信息输出模块,用于当所述指标数据处于异常状态时,以设定方式输出所述待管理指标的告警信息。
7.根据权利要求6所述的***,其特征在于,还包括:
检测模型构建模块,用于根据构建的异常检测训练学习算法,分布式构建所述云计算数据中心的异常检测模型。
8.根据权利要求7所述的***,其特征在于,所述检测模型构建模块具体用于:
在分布式计算平台上部署设定的异常检测训练学习算法;
从数据库中获取所述待管理指标的历史指标数据,作为所述异常检测训练学习算法的训练数据集;
确定所述待管理指标的指标特征,作为所述异常检测训练学习算法的训练学习特征;
基于所述训练数据集及所述训练学***台上训练获得所述云计算数据中心的异常检测模型。
9.根据权利要求6所述的***,其特征在于,获取所述待管理指标的指标数据包括:
实时获取或以设定时间间隔获取所述待管理指标的指标数据;
相应的,所述***还包括:
历史数据存储模块,用于将所述待管理指标的指标数据存储在设定的数据库中,形成所述待管理指标的历史指标数据。
10.根据权利要求6-9任一所述的***,其特征在于,异常状态检测模块具体用于:
将所述指标数据作为构建的异常检测模型的输入值,产生对应的指标数据特征;
如果所述指标数据特征符合所述异常检测模型的标准指标特征,则确定所述指标数据处于正常状态;否则,确定所述指标数据处于异常状态。
CN201610980467.6A 2016-11-08 2016-11-08 一种用于云计算数据中心的管理方法及*** Pending CN108075906A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610980467.6A CN108075906A (zh) 2016-11-08 2016-11-08 一种用于云计算数据中心的管理方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610980467.6A CN108075906A (zh) 2016-11-08 2016-11-08 一种用于云计算数据中心的管理方法及***

Publications (1)

Publication Number Publication Date
CN108075906A true CN108075906A (zh) 2018-05-25

Family

ID=62154023

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610980467.6A Pending CN108075906A (zh) 2016-11-08 2016-11-08 一种用于云计算数据中心的管理方法及***

Country Status (1)

Country Link
CN (1) CN108075906A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108880881A (zh) * 2018-06-14 2018-11-23 郑州云海信息技术有限公司 一种云环境下资源监控的方法和装置
CN109347978A (zh) * 2018-11-22 2019-02-15 天津众鑫锐智科技有限公司 一种智能物联网计算平台
CN109815084A (zh) * 2018-12-29 2019-05-28 北京城市网邻信息技术有限公司 异常识别方法、装置和电子设备及存储介质
CN110413482A (zh) * 2019-07-29 2019-11-05 中国工商银行股份有限公司 检测方法和装置
CN110413431A (zh) * 2019-08-05 2019-11-05 吉林吉大通信设计院股份有限公司 一种针对于大数据平台故障的智能识别预警装置及方法
CN110489311A (zh) * 2019-03-01 2019-11-22 北京亿赛通科技发展有限责任公司 自动检测电脑用户行为及自动更新检测模型的方法和***
CN110740061A (zh) * 2019-10-18 2020-01-31 北京三快在线科技有限公司 故障预警方法、装置及计算机存储介质
WO2020078385A1 (zh) * 2018-10-18 2020-04-23 杭州海康威视数字技术股份有限公司 数据采集方法、装置、存储介质及***
CN111737099A (zh) * 2020-06-09 2020-10-02 国网电力科学研究院有限公司 一种基于高斯分布的数据中心异常检测方法及装置
CN112286771A (zh) * 2020-11-03 2021-01-29 中国电子科技集团公司第二十八研究所 一种针对全域资源监控的告警方法
CN112486767A (zh) * 2020-11-25 2021-03-12 中移(杭州)信息技术有限公司 云资源的智能监控方法、***、服务器以及存储介质
CN113032242A (zh) * 2019-12-25 2021-06-25 阿里巴巴集团控股有限公司 数据标记方法及装置,计算机存储介质和电子设备
CN113076232A (zh) * 2021-03-30 2021-07-06 深圳供电局有限公司 一种健康数据指标的异常检测方法及***
CN113138895A (zh) * 2021-04-19 2021-07-20 建信金融科技有限责任公司 云桌面设备的监控方法及装置
CN113159933A (zh) * 2021-05-20 2021-07-23 中国工商银行股份有限公司 一种风险控制方法、***、设备及介质
CN115953738A (zh) * 2023-03-02 2023-04-11 上海燧原科技有限公司 一种图像识别分布式训练的监控方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103401699A (zh) * 2013-07-18 2013-11-20 深圳先进技术研究院 一种云数据中心安全监控预警***及方法
CN104794192A (zh) * 2015-04-17 2015-07-22 南京大学 基于指数平滑、集成学习模型的多级异常检测方法
CN105335816A (zh) * 2015-10-13 2016-02-17 国网安徽省电力公司铜陵供电公司 基于深度学习的电力通信网运行趋势与业务风险分析方法
WO2016039845A1 (en) * 2014-09-09 2016-03-17 Belkin International, Inc. Coordinated and device-distributed detection of abnormal network device operation
CN105975443A (zh) * 2016-05-04 2016-09-28 西南大学 基于Lasso的异常检测方法及***
CN106156026A (zh) * 2015-03-24 2016-11-23 中国人民解放军国防科学技术大学 一种基于数据流虚拟资产在线异常发现的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103401699A (zh) * 2013-07-18 2013-11-20 深圳先进技术研究院 一种云数据中心安全监控预警***及方法
WO2016039845A1 (en) * 2014-09-09 2016-03-17 Belkin International, Inc. Coordinated and device-distributed detection of abnormal network device operation
CN106156026A (zh) * 2015-03-24 2016-11-23 中国人民解放军国防科学技术大学 一种基于数据流虚拟资产在线异常发现的方法
CN104794192A (zh) * 2015-04-17 2015-07-22 南京大学 基于指数平滑、集成学习模型的多级异常检测方法
CN105335816A (zh) * 2015-10-13 2016-02-17 国网安徽省电力公司铜陵供电公司 基于深度学习的电力通信网运行趋势与业务风险分析方法
CN105975443A (zh) * 2016-05-04 2016-09-28 西南大学 基于Lasso的异常检测方法及***

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108880881A (zh) * 2018-06-14 2018-11-23 郑州云海信息技术有限公司 一种云环境下资源监控的方法和装置
CN111078488B (zh) * 2018-10-18 2021-11-09 杭州海康威视数字技术股份有限公司 数据采集方法、装置、存储介质及***
WO2020078385A1 (zh) * 2018-10-18 2020-04-23 杭州海康威视数字技术股份有限公司 数据采集方法、装置、存储介质及***
CN111078488A (zh) * 2018-10-18 2020-04-28 杭州海康威视数字技术股份有限公司 数据采集方法、装置、存储介质及***
CN109347978A (zh) * 2018-11-22 2019-02-15 天津众鑫锐智科技有限公司 一种智能物联网计算平台
CN109815084A (zh) * 2018-12-29 2019-05-28 北京城市网邻信息技术有限公司 异常识别方法、装置和电子设备及存储介质
CN110489311A (zh) * 2019-03-01 2019-11-22 北京亿赛通科技发展有限责任公司 自动检测电脑用户行为及自动更新检测模型的方法和***
CN110489311B (zh) * 2019-03-01 2023-04-18 北京亿赛通科技发展有限责任公司 自动检测电脑用户行为及自动更新检测模型的方法和***
CN110413482B (zh) * 2019-07-29 2023-10-03 中国工商银行股份有限公司 检测方法和装置
CN110413482A (zh) * 2019-07-29 2019-11-05 中国工商银行股份有限公司 检测方法和装置
CN110413431A (zh) * 2019-08-05 2019-11-05 吉林吉大通信设计院股份有限公司 一种针对于大数据平台故障的智能识别预警装置及方法
CN110740061A (zh) * 2019-10-18 2020-01-31 北京三快在线科技有限公司 故障预警方法、装置及计算机存储介质
CN110740061B (zh) * 2019-10-18 2020-09-29 北京三快在线科技有限公司 故障预警方法、装置及计算机存储介质
CN113032242B (zh) * 2019-12-25 2024-02-09 阿里巴巴集团控股有限公司 数据标记方法及装置,计算机存储介质和电子设备
CN113032242A (zh) * 2019-12-25 2021-06-25 阿里巴巴集团控股有限公司 数据标记方法及装置,计算机存储介质和电子设备
CN111737099A (zh) * 2020-06-09 2020-10-02 国网电力科学研究院有限公司 一种基于高斯分布的数据中心异常检测方法及装置
CN111737099B (zh) * 2020-06-09 2021-04-16 国网电力科学研究院有限公司 一种基于高斯分布的数据中心异常检测方法及装置
CN112286771A (zh) * 2020-11-03 2021-01-29 中国电子科技集团公司第二十八研究所 一种针对全域资源监控的告警方法
CN112486767A (zh) * 2020-11-25 2021-03-12 中移(杭州)信息技术有限公司 云资源的智能监控方法、***、服务器以及存储介质
CN113076232A (zh) * 2021-03-30 2021-07-06 深圳供电局有限公司 一种健康数据指标的异常检测方法及***
CN113138895A (zh) * 2021-04-19 2021-07-20 建信金融科技有限责任公司 云桌面设备的监控方法及装置
CN113159933A (zh) * 2021-05-20 2021-07-23 中国工商银行股份有限公司 一种风险控制方法、***、设备及介质
CN115953738A (zh) * 2023-03-02 2023-04-11 上海燧原科技有限公司 一种图像识别分布式训练的监控方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN108075906A (zh) 一种用于云计算数据中心的管理方法及***
WO2020259421A1 (zh) 一种业务***的监控方法及装置
CN110351150B (zh) 故障根源确定方法及装置、电子设备和可读存储介质
US10878324B2 (en) Problem analysis and priority determination based on fuzzy expert systems
CN104809051B (zh) 用于预测计算机应用中的异常和故障的方法和装置
CN112579653B (zh) 工业数据的逐步情境化和分析
US11422859B2 (en) Methods and systems for cloud application optimization
US9530256B2 (en) Generating cumulative wear-based indicators for vehicular components
US10379146B2 (en) Detecting non-technical losses in electrical networks based on multi-layered statistical techniques from smart meter data
CN107786616A (zh) 基于云端的主机智能监控***
US9208209B1 (en) Techniques for monitoring transformation techniques using control charts
CN106874280A (zh) 异常数据的报警方法和装置
US11283863B1 (en) Data center management using digital twins
Alipour et al. Online machine learning for cloud resource provisioning of microservice backend systems
CN111897705B (zh) 服务状态处理、模型训练方法、装置、设备和存储介质
CN110633194B (zh) 一种硬件资源在特定环境下的性能评估方法
CN109389518A (zh) 关联分析方法及装置
CN109194534B (zh) 面向物联网设备群体的调度与管理方法
CN112700131B (zh) 基于人工智能的ab测试方法、装置、计算机设备及介质
CN104407688A (zh) 基于树回归的虚拟化云平台能耗测量方法及***
CN109976975A (zh) 一种磁盘容量预测方法、装置、电子设备及存储介质
CN109783324A (zh) ***运行预警方法及装置
CN102446135A (zh) 软件质量的检测方法
WO2018152213A1 (en) System and method for automatic configuration of a data collection system and schedule for control system monitoring
CN109634802A (zh) 进程监控方法及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180525

RJ01 Rejection of invention patent application after publication