CN113516244B - 一种智能运维方法、装置、电子设备及存储介质 - Google Patents
一种智能运维方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113516244B CN113516244B CN202110850483.4A CN202110850483A CN113516244B CN 113516244 B CN113516244 B CN 113516244B CN 202110850483 A CN202110850483 A CN 202110850483A CN 113516244 B CN113516244 B CN 113516244B
- Authority
- CN
- China
- Prior art keywords
- maintenance
- data
- historical
- change
- strategy set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012423 maintenance Methods 0.000 title claims abstract description 331
- 238000000034 method Methods 0.000 title claims abstract description 115
- 230000008859 change Effects 0.000 claims abstract description 111
- 230000008569 process Effects 0.000 claims description 43
- 238000012544 monitoring process Methods 0.000 claims description 15
- 238000004422 calculation algorithm Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 10
- 238000005065 mining Methods 0.000 claims description 10
- 238000007418 data mining Methods 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种智能运维方法、装置、电子设备及存储介质,所述方法包括:获取业务变动数据;基于所述业务变动数据,从历史知识库中匹配出变更运维策略集;将所述变更运维策略集与当前运维策略集进行比对,并根据比对结果,确定新的运维策略集;基于所述新的运维策略集,对设备和服务进行运维。本发明提供的智能运维方法、装置、电子设备及存储介质,通过获取设备上运行业务的变化数据,并在历史知识库中精准匹配出运维策略集,以利用运维策略集中的有针对性的、定制化的运维策略,更加有效地对业务数据相关的运维事件进行分析、定位,并做出决策,提升了IT资源利用率以及***服务稳定性。
Description
技术领域
本发明涉及大数据分析技术领域,尤其涉及一种智能运维方法、装置、电子设备及存储介质。
背景技术
在大数据时代的互联网技术(Internet Technology,IT)运维领域,人工智能IT运维(Artificial Intelligence Internet Technology Operations,AIOps),结合大数据、数据挖掘技术实现对硬件设备的全面监控、故障自动定位、根因分析和告警等,现已有较为成熟的框架和技术方案。
现有的AIOps运维***主要涉及三个方面,包括:智能运维算法单元,主要是利用人工智能算法,根据具体的运维场景、业务规则或者专家经验等,对运维事件进行分析、定位,并做出决策;自动化运维工具,主要是基于确定逻辑的运维工具,对***实施诸如控制、监控、上线等处理操作;运维大数据平台,主要用于采集、处理、存储、展示各种运维数据,感知与洞察***。
现有的智能运维算法单元,在如何自主感知各设备上运行业务的变更,包括设备的用途、运行的应用以及随之而来的网络环境、机房等的变化却是空白的,进而对各设备均实施统一的运维策略,造成资源浪费且不能抓住运维、监控的关键。
发明内容
本发明提供一种智能运维方法、装置、电子设备及存储介质,用以解决现有技术中对各设备均实施统一的运维策略,所造成资源浪费、运维效果差的缺陷。
第一方面,本发明提供一种智能运维方法,包括:获取业务变动数据;基于所述业务变动数据,从历史知识库中匹配出变更运维策略集;将所述变更运维策略集与当前运维策略集进行比对,并根据比对结果,确定新的运维策略集;基于所述新的运维策略集,对设备和服务进行运维。
根据本发明提供的一种智能运维方法,在所述业务变动数据包括应用变更数据和设备进程数据的情况下,所述获取业务变动数据,包括:接收所述应用变更数据,所述应用变更数据是由工程实施人员上传的;接收由进程监控服务单元通过心跳方式发送的所述设备进程数据。
根据本发明提供的一种智能运维方法,在基于所述业务变动数据,在历史知识库中进行规则匹配,以获取变更运维策略集之前,还包括:对历史运维数据进行数据挖掘,以制定业务数据与智能运维策略之间的关联规则,构建所述历史知识库。
根据本发明提供的一种智能运维方法,所述基于所述业务变动数据,在历史知识库中进行规则匹配,以获取变更运维策略集,包括:基于业务数据与智能运维策略之间的关联规则,调用关联规则挖掘算法,以利用所述业务变动数据对所述历史知识库进行挖掘,获取频繁项集;根据所述频繁项集,确定所述变更运维策略集。
根据本发明提供的一种智能运维方法,在所述基于所述业务变动数据,从历史知识库中匹配出变更运维策略集之前,还包括:对所述业务变动数据进行归并处理。
根据本发明提供的一种智能运维方法,所述将所述变更运维策略集与当前运维策略集进行比对,并根据比对结果,确定新的运维策略集,包括:在所述变更运维策略集与所述当前运维策略集的比对结果相同的情况下,则保持所述当前运维策略集不变;在所述变更运维策略集与所述当前运维策略集的比对结果不相同的情况下,则确定所述变更运维策略集为所述新的运维策略集。
根据本发明提供的一种智能运维方法,所述基于所述新的运维策略集,对设备和服务进行运维,包括:采集设备状态数据,并对所述设备状态数据中的设备进程数据进行归并处理;基于所述新的运维策略集,根据归并处理后的所述设备进程数据调用相应的运维策略,以实现对设备的运维。
第二方面,本发明还提供一种智能运维装置,包括:数据采集单元,用于获取业务变动数据;策略调用单元,用于基于所述业务变动数据,从历史知识库中匹配出变更运维策略集;策略匹配单元,用于将所述变更运维策略集与当前运维策略集进行比对,并根据比对结果,确定新的运维策略集;策略运行单元,用于基于所述新的运维策略集,对设备和服务进行运维。
第三方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述智能运维方法的步骤。
第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述智能运维方法的步骤。
本发明提供的智能运维方法、装置、电子设备及存储介质,通过获取设备上运行业务的变化数据,并在历史知识库中精准匹配出运维策略集,以利用运维策略集中的有针对性的、定制化的运维策略,能更加有效地对业务数据相关的运维事件进行分析、定位,并做出决策,提升了IT资源利用率以及***服务稳定性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的智能运维方法的流程示意图之一;
图2是本发明提供的智能运维方法的流程示意图之二;
图3是本发明提供的智能运维方法的流程示意图之三;
图4是本发明提供的智能运维装置的结构示意图;
图5是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明实施例的描述中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
在当前技术下,AIOps运维主要能够实现以下功能:
1)确定***异常以及故障隐患,且能对可能出现的异常或故障隐患及时预警,能显著降低故障发生的概率、降低IT运维的压力;
2)及时发现和定位各应用***的性能瓶颈,并快速定位各类故障发生的根本原因,以提升***服务的稳定性。
3)通过确定线上服务和设备资源容量之间的数据联系,为管理者做出精准决策提供依据;同时还能够提供资源预警、优化资源利用率,包括提升企业现有的IT资源利用率。
本发明所提供的智能运维方法、装置、电子设备及存储介质,是依托与AIOps运维的基本构架,不同的是,本发明通过及时掌握设备上部署实施的业务变化,并根据业务数据的变化,调用有针对性的、定制化的运维策略,更加合理、有效的进行运维、监控。
下面结合图1-图5描述本发明所提供的智能运维方法、装置、电子设备及存储介质。
图1是本发明提供的智能运维方法的流程示意图之一,如图1所示,包括但不限于以下步骤:
步骤101:获取业务变动数据。
业务变动数据是指能够反映各设备上与运行业务的变化相关的且发生了变动的数据,如网络环境数据、机房数据、应用服务数据(如对应有进行升级、部署、实施等相关数据)、与应用进程相关的数据、设备性能指标数据等数据中,发生了变动的数据。对此本发明不作具体的限定。
其中,获取业务变动数据的方法,可以是采用心跳方式,实时采集业务相关进行信息、采集工程实施人员上报信息等,对此本发明均不作具体的限定。
步骤102:基于所述业务变动数据,从历史知识库中匹配出变更运维策略集。
变更运维策略集是指,根据每一组业务变动数据从预先构建的历史知识库中,匹配出来的各运维策略的集合。其中,运维策略是指针对不同的业务变动数据,采用对应的人工智能算法,以根据所述业务变动数据的运维场景、业务规则或者专家经验等,进行分析、定位或决策(例如:异常检测、智能预警等)的策略,可以将每一个运维策略狭义为一个智能运维算法模型。
其中,历史知识库中预先存储有各种不同的业务变动数据所对应的相关运维策略。
在步骤102中,通过对步骤101中所采集的所有业务变动数据,根据预设的匹配规则,分别从历史知识库中,匹配出相应的运维策略,组建运维策略集,此处将这一运维策略集称作变更运维策略集。
步骤103:将所述变更运维策略集与当前运维策略集进行比对,并根据比对结果,确定新的运维策略集。
在根据当前采集的业务变动数据,从历史知识库中匹配出变更运维策略集之后,需要将其与***中正在运行的当前运维策略集进行比对,以确定是否需要对当前运维策略集进行更新。
例如:在变更运维策略集出现了新的运行策略(其根本原因是出现了新的业务数据),而该运行策略未曾加载至当前运维策略集,则需要重新加载这一运行策略,构成新的运维策略集。
步骤104:基于所述新的运维策略集,对设备和服务进行运维。
在通过上述步骤对当前运维策略集进行更新之后,则利用新的运维策略集,对***中的各个设备进行诸如控制、监控、上线等处理,实现智能运维。
本发明提供的智能运维方法,通过获取设备上运行业务的变化数据,并在历史知识库中精准匹配出运维策略集,以利用运维策略集中的有针对性的、定制化的运维策略,更加有效地对业务数据相关的运维事件进行分析、定位,并做出决策,提升了IT资源利用率以及***服务稳定性。
基于上述实施例的内容,作为一种可选实施例,在所述业务变动数据包括应用变更数据和设备进程数据的情况下,所述获取业务变动数据,包括:接收所述应用变更数据,所述应用变更数据是由工程实施人员上传的;基于agent平台,接收由进程监控服务单元通过心跳方式发送的所述设备进程数据。
图2是本发明提供的智能运维方法的流程示意图之二,如图2所示,本发明获取业务变动数据的途径,可以有以下两个方面,均由agent平台来完成的。其中agent平台是用于执行agent技术的载体。
Agent平台是一种处于一定环境下包装的计算机***,是一个具有自主性、社会性、反应性、主动性的抽象实体,它能在一定环境下能独立自主地运行,作用于环境也受环境影响,且能不断地从环境中获取知识以提高自己的能力。
一方面,为了能够及时掌握设备上应用服务的变动,本发明实现运维、管理在线化、一体化,提供开放性的管理功能,在工程实施人员对设备进行在线管理、对应用设备进行升级、或者部署实施新的应用的同时,自动向agent平台上传相关的应用变更数据,以实现业务数据的共享。
另一方面,通过agent的进程监控服务单元实时收集设备进程信息,以获取设备进程数据:通过实施监控设备进程信息,能够分析出应用服务进程对应的业务,从而确定设备上运行的业务内容。
需要说明的是,由于与业务内容相关的设备进程信息的变化缓慢,故本发明采用Heartbeat以心跳服务的方式,实时的将设备进程数据发送给agent平台,而不是由agent平台频繁的询问、调取这些设备进程数据。
另外,本发明所提供的智能运维方法的主体思路是:根据设备上运行业务的不同,以调用不同的运维策略,以使得AIOps运维更有针对性,使得设备资源被更加有效的利用。因此,这一智能运维方法既适用于分布式或集中式的设备运维场景,也适用于各种规模的设备运维;其对设备是透明的,不管运维的设备是服务器、摄像头还是其它终端,只要将智能运维agent平台远程配置到相应设备上即可实现正常工作。
本发明提供的智能运维方法,是一种基于业务驱动以实现智能运维的,基于agent的原理与技术,通过数据共享、接口服务完成基于大数据的实时计算,并与数据挖掘、深度学习等技术结合起来应用于智能运维领域,能有效地提高设备资源的有效利用率。
基于上述实施例的内容,作为一种可选实施例,在基于所述业务变动数据,在历史知识库中进行规则匹配,以获取变更运维策略集之前,还包括:对历史运维数据进行数据挖掘,以制定业务数据与智能运维策略之间的关联规则,构建所述历史知识库。
在本发明所提供的智能运维方法中,历史知识库可以是预先构建并存储在***存储器中,以供agent平台的实时调用。
历史知识库的构建过程可以是:
获取AIOps运维实施过程中的历史运维数据,该历史运维数据包括历史业务数据,和对历史业务数据进行运维的由历史运维策略构成的历史运维策略集;
对历史运维数据中的历史业务数据与历史运维策略进行关联规则挖掘,建立所有类型的业务数据与运维策略之间的关联规则,构建出历史知识库。
需要说明的是,在构建历史知识库之后,还可以在AIOps运维过程中,基于设备运行的应用服务、机房、网络等条件下造成的高频问题、根因分析确定相关运维策略集,建立设备、业务和运维策略集的关联关系,并根据这些关系持续更新历史知识库。
本发明提供的智能运维方法,通过预先构建历史知识库,在AIOps运维中,agent平台能够根据当前业务变动数据,及时从历史知识库中匹配对应的运维策略集,以快速的实现对设备和服务的运维、监控,响应速度快,运维效果更高。
基于上述实施例的内容,作为一种可选实施例,所述基于所述业务变动数据,在历史知识库中进行规则匹配,以获取变更运维策略集,包括:基于业务数据与智能运维策略之间的关联规则,调用关联规则挖掘算法,以利用所述业务变动数据对所述历史知识库进行挖掘,获取频繁项集;根据所述频繁项集,确定所述变更运维策略集。
图3是本发明提供的智能运维方法的流程示意图之三,如图3所示,在本发明提供了的智能运维方法中,采用agent技术,通过自动获取设备上的业务变动数据,并在历史知识库中通过关联挖掘算法,例如:FP-Growth算法,对运维历史数据实施数据挖掘,包括:
构建业务数据与智能运维策略之间的关联规则进行挖掘,根据业务数据与智能运维策略之间的因果关系,通过引入置信度,获取频繁项,从而实现在历史知识库中精准匹配出需要启动的智能运维策略,即自动匹配出与业务变动数据相对应的变更运维策略集。
在利用变更运维策略集对当前运维策略集进行更新之后,可以通过实时收集、处理的设备状态数据,调用新的运维策略集中的相关运维策略对设备进行智能运维、监控。
本发明提供的智能运维方法,基于关联规则挖掘算法,完成对设备运行的应用服务、机房、网络等条件下造成的高频问题、根因分析,从而确定对应的运维策略集,进而建立设备、业务和运维策略集的关系,能够根据不同的业务数据有针对性的、定制化的提供运维策略,更加合理、有效的实现设备运维、监控。
基于上述实施例的内容,作为一种可选实施例,在所述获取业务变动数据之后,还包括:对所述业务变动数据进行归并处理,获取关键业务数据,以利用所述关键业务数据从所述历史知识库中匹配出所述变更运维策略集。
结合图2所示,本发明获取业务变动数据的渠道有多种,各业务数据之间可能存在冗余、重复或者无效的数据,故本发明提供的智能运维方法,通过agent平台收集的设备进程信息,和由工程实施人员上传的应用变更数据之后,对所获取的所有业务数据进行合并优化,以提取出关键业务,剔除重复、无效业务数据。
本发明提供的智能运维方法,agent平台在获取到业务变动数据,通过对所有数据进行统一预处理,能够有效地提高数据精度,减轻平台的运算压力,同时也能够提高运维的精准性。
基于上述实施例的内容,作为一种可选实施例,所述将所述变更运维策略集与当前运维策略集进行比对,并根据比对结果,确定新的运维策略集,包括:在所述变更运维策略集与所述当前运维策略集的比对结果相同的情况下,则保持所述当前运维策略集不变;在所述变更运维策略集与所述当前运维策略集的比对结果不相同的情况下,则确定所述变更运维策略集为所述新的运维策略集。
在本发明所提供的智能运维方法中,agent平台中预先装载有当前运维策略集,并基于当前运维策略集实现设备AIOps运维。
在AIOps运维的过程中,实时采集业务变动数据,包括设备进程数据和工程实施人员上传的应用变动数据。
对业务变动数据进行合并优化后,基于匹配规则,对历史知识库行关联挖掘,通过引入置信度对挖掘出的运维策略进行处理,构建变更运维策略集。
进一步地,若变更运维策略集与当前运维策略集存在不同,则将变更运维策略集作为新的运维策略集加载至agent平台,以供调用;若变更运维策略集与当前运维策略集相同,则说明并未引入新的运维策略,此时无需对当前运维策略集进行更新。
本发明提供的智能运维方法,在AIOps实施过程中,对业务数据和智能运维策略集进行关联规则挖掘,构建历史知识库;再则,以心跳的方式及时接收设备业务的变更,结合进程信息,自主的在历史知识库中精准匹配智能运维策略集,实现更有针对性的监控、运维。
基于上述实施例的内容,作为一种可选实施例,所述基于所述新的运维策略集,对设备和服务进行运维,包括:采集设备状态数据,并对所述设备状态数据中的设备进程数据进行归并处理;基于所述新的运维策略集,根据归并处理后的所述设备进程数据调用相应的运维策略,以实现对设备的运维。
结合图3所示,本发明提供的agent平台具有以下几项功能:
其一是数据的采集,包括:实时收集与设备性能指标信息、进程信息相关的设备进程数据,并实时计算;接收工程实施人员上报的与设备应用相关的应用变更数据。
其二是选择功能,即agent平台在接收应用变更数据以及设备进程数据之后,进行业务归并,然后调用关联规则挖掘算法,从历史知识库中进行规则匹配,得出变更运维策略集(包括智能运维算法模型的集合)。如果变更运维策略与当前运维策略集不同,则载入并启动新的运维策略集;否则pass。
其三是监控功能,即agent平台实时收集设备状态数据,对进程相关信息进行处理、清洗并标准化;实时收集设备运行的状态数据,调用运维策略对设备进行诊断。
本发明提供的智能运维方法,利用agent技术,自动获取设备上运行业务的变化,并在历史知识库中通过关联规则精准匹配出有针对性的、定制化的运维策略集,并将之启动、运行,通过实时收集、处理的设备状态数据对设备进行智能运维、监控,更加合理、有效。
图4是本发明提供的智能运维装置的结构示意图,如图4所示,主要包括数据采集单元41、策略调用单元42、策略匹配单元43和策略运行单元44,其中:
数据采集单元41主要用于获取业务变动数据;策略调用单元42主要用于基于所述业务变动数据,在历史知识库中进行规则匹配,以获取变更运维策略集;策略匹配单元43主要用于将所述变更运维策略集与当前运维策略集进行比对,并根据比对结果,确定新的运维策略集;策略运行单元44主要用于基于所述新的运维策略集,对设备和服务进行运维。
需要说明的是,本发明实施例提供的智能运维装置,在具体运行时,可以执行上述任一实施例所述的智能运维方法,对此本实施例不作赘述。
本发明提供的智能运维装置,通过获取设备上运行业务的变化数据,并在历史知识库中精准匹配出运维策略集,以利用运维策略集中的有针对性的、定制化的运维策略,更加有效地对业务数据相关的运维事件进行分析、定位,并做出决策,提升了IT资源利用率以及***服务稳定性。
图5是本发明提供的电子设备的结构示意图,如图5所示,该电子设备可以包括:处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令,以执行智能运维方法,该方法包括:获取业务变动数据;从历史知识库中匹配出变更运维策略集;将所述变更运维策略集与当前运维策略集进行比对,并根据比对结果,确定新的运维策略集;基于所述新的运维策略集,对设备和服务进行运维。
此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的智能运维方法,该方法包括:获取业务变动数据;基于所述业务变动数据,从历史知识库中匹配出变更运维策略集;将所述变更运维策略集与当前运维策略集进行比对,并根据比对结果,确定新的运维策略集;基于所述新的运维策略集,对设备和服务进行运维。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的智能运维方法,该方法包括:获取业务变动数据;基于所述业务变动数据,从历史知识库中匹配出变更运维策略集;将所述变更运维策略集与当前运维策略集进行比对,并根据比对结果,确定新的运维策略集;基于所述新的运维策略集,对设备和服务进行运维。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (9)
1.一种智能运维方法,其特征在于,包括:
获取业务变动数据;
基于所述业务变动数据,从历史知识库中匹配出变更运维策略集;
将所述变更运维策略集与当前运维策略集进行比对,确定新的运维策略集;
基于所述新的运维策略集,对设备和服务进行运维;
在基于所述业务变动数据,在历史知识库中进行规则匹配,以获取变更运维策略集之前,还包括:
获取AIOps运维实施过程中的历史运维数据,所述历史运维数据包括历史业务数据和对所述历史业务数据进行运维的由历史运维策略构成的历史运维策略集;
对历史运维数据进行数据挖掘,以制定业务数据与智能运维策略之间的关联规则,构建所述历史知识库;
其中,所述业务变动数据是指反映各设备上与运行业务的变化相关的且发生了变动的数据,包括网络环境数据、机房数据、应用服务数据、与应用进程相关的数据、设备性能指标数据中的至少一种;
所述变更运维策略集是指根据每一组业务变动数据从预先构建的历史知识库中,匹配出来的各运维策略的集合;所述运维策略是指针对不同的业务变动数据,进行分析、定位或决策的策略。
2.根据权利要求1所述的智能运维方法,其特征在于,在所述业务变动数据包括应用变更数据和设备进程数据的情况下,所述获取业务变动数据,包括:
接收所述应用变更数据,所述应用变更数据是由工程实施人员上传的;
基于agent平台,接收由进程监控服务单元通过心跳方式发送的所述设备进程数据。
3.根据权利要求1所述的智能运维方法,其特征在于,所述基于所述业务变动数据,在历史知识库中进行规则匹配,以获取变更运维策略集,包括:
基于业务数据与智能运维策略之间的关联规则,调用关联规则挖掘算法,以利用所述业务变动数据对所述历史知识库进行挖掘,获取频繁项集;
根据所述频繁项集,确定所述变更运维策略集。
4.根据权利要求1所述的智能运维方法,其特征在于,在所述基于所述业务变动数据,从历史知识库中匹配出变更运维策略集之前,还包括:
对所述业务变动数据进行归并处理。
5.根据权利要求1所述的智能运维方法,其特征在于,所述将所述变更运维策略集与当前运维策略集进行比对,并根据比对结果,确定新的运维策略集,包括:
在所述变更运维策略集与所述当前运维策略集的比对结果相同的情况下,则保持所述当前运维策略集不变;
在所述变更运维策略集与所述当前运维策略集的比对结果不相同的情况下,则确定所述变更运维策略集为所述新的运维策略集。
6.根据权利要求1所述的智能运维方法,其特征在于,所述基于所述新的运维策略集,对设备和服务进行运维,包括:
采集设备状态数据,并对所述设备状态数据相关的设备进程数据进行归并处理;
基于所述新的运维策略集,根据归并处理后的所述设备进程数据调用相应的运维策略,以实现对设备的运维。
7.一种智能运维装置,其特征在于,包括:
数据采集单元,用于获取业务变动数据;其中,所述业务变动数据是指反映各设备上与运行业务的变化相关的且发生了变动的数据,包括网络环境数据、机房数据、应用服务数据、与应用进程相关的数据、设备性能指标数据中的至少一种;
策略调用单元,用于基于所述业务变动数据,从历史知识库中匹配出变更运维策略集;在基于所述业务变动数据,在历史知识库中进行规则匹配,以获取变更运维策略集之前,还包括:获取AIOps运维实施过程中的历史运维数据,所述历史运维数据包括历史业务数据和对所述历史业务数据进行运维的由历史运维策略构成的历史运维策略集;对所述历史运维数据进行数据挖掘,以制定业务数据与智能运维策略之间的关联规则,构建所述历史知识库;所述变更运维策略集是指根据每一组业务变动数据从预先构建的历史知识库中,匹配出来的各运维策略的集合;所述运维策略是指针对不同的业务变动数据,进行分析、定位或决策的策略;
策略匹配单元,用于将所述变更运维策略集与当前运维策略集进行比对,确定新的运维策略集;
策略运行单元,用于基于所述新的运维策略集,对设备和服务进行运维。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述智能运维方法步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述智能运维方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110850483.4A CN113516244B (zh) | 2021-07-27 | 2021-07-27 | 一种智能运维方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110850483.4A CN113516244B (zh) | 2021-07-27 | 2021-07-27 | 一种智能运维方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113516244A CN113516244A (zh) | 2021-10-19 |
CN113516244B true CN113516244B (zh) | 2023-12-05 |
Family
ID=78067628
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110850483.4A Active CN113516244B (zh) | 2021-07-27 | 2021-07-27 | 一种智能运维方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113516244B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114553726B (zh) * | 2022-02-23 | 2023-06-02 | 深圳市众功软件有限公司 | 一种基于功能、资源层面的网络安全运维方法及*** |
CN115037513A (zh) * | 2022-04-27 | 2022-09-09 | 锐捷网络股份有限公司 | 一种安全策略的配置方法及装置 |
CN115051930B (zh) * | 2022-05-23 | 2023-05-12 | ***数智科技有限公司 | 基于AISecOps结合中台算法的弊端优化方法 |
CN116882978B (zh) * | 2023-08-01 | 2024-04-09 | 中国船舶科学研究中心 | 一种基于产品信息框架的深海潜水器运维保障*** |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105843210A (zh) * | 2016-03-22 | 2016-08-10 | 清华大学 | 电力变压器缺陷信息数据挖掘方法 |
CN111159256A (zh) * | 2019-12-31 | 2020-05-15 | 贵州电网有限责任公司 | 一种面向设备运维的配网信息数据挖掘方法 |
CN111190876A (zh) * | 2019-12-31 | 2020-05-22 | 天津浪淘科技股份有限公司 | 日志管理***及其运行方法 |
CN111476381A (zh) * | 2020-04-08 | 2020-07-31 | 贵州爱信诺航天信息有限公司 | 基于国产化信息技术创新应用***运维服务的方法和*** |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200160191A1 (en) * | 2018-11-19 | 2020-05-21 | International Business Machines Corporation | Semi-automated correction of policy rules |
-
2021
- 2021-07-27 CN CN202110850483.4A patent/CN113516244B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105843210A (zh) * | 2016-03-22 | 2016-08-10 | 清华大学 | 电力变压器缺陷信息数据挖掘方法 |
CN111159256A (zh) * | 2019-12-31 | 2020-05-15 | 贵州电网有限责任公司 | 一种面向设备运维的配网信息数据挖掘方法 |
CN111190876A (zh) * | 2019-12-31 | 2020-05-22 | 天津浪淘科技股份有限公司 | 日志管理***及其运行方法 |
CN111476381A (zh) * | 2020-04-08 | 2020-07-31 | 贵州爱信诺航天信息有限公司 | 基于国产化信息技术创新应用***运维服务的方法和*** |
Non-Patent Citations (2)
Title |
---|
智能运维技术在电信大视频业务中的应用研究;吉锋;刘丽霞;文韬;张晗;;信息通信技术(第01期);全文 * |
高效、智能的IT运维体系建设;郑仕辉;;金融电子化(第12期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113516244A (zh) | 2021-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113516244B (zh) | 一种智能运维方法、装置、电子设备及存储介质 | |
CN111047082B (zh) | 设备的预警方法及装置、存储介质和电子装置 | |
KR102402845B1 (ko) | 디지털 트윈 기반 건설기계 지능화를 위한 실시간 데이터 처리 방법 | |
CN111629043B (zh) | 一种基于云端模式的跨平台健康管理*** | |
CN115225536B (zh) | 一种基于无监督学习的虚拟机异常检测方法及*** | |
CN111290913A (zh) | 一种基于运维数据预测的故障定位可视化***和方法 | |
CN112769605B (zh) | 一种异构多云的运维管理方法及混合云平台 | |
CN115809183A (zh) | 基于知识图谱的信创终端故障发现及处置的方法 | |
CN112650200B (zh) | 一种厂站设备故障的诊断方法及诊断装置 | |
CN114640581B (zh) | 一种基于数字孪生的算力网络处理方法及装置 | |
CN111884859B (zh) | 一种网络故障诊断方法、装置及可读存储介质 | |
CN114706675A (zh) | 基于云边协同***的任务部署方法及装置 | |
CN117074822A (zh) | 充电桩故障诊断方法、计算机设备及存储介质 | |
CN117670033A (zh) | 一种安全检查方法、***、电子设备及存储介质 | |
CN117312611A (zh) | 一种电力故障快速定位及诊断方法及相关装置 | |
CN108023740A (zh) | 监控中异常信息的风险提示方法和装置 | |
CN115604082A (zh) | 一种基于AIOps的故障诊断*** | |
CN114416415A (zh) | 鸿蒙操作***用远程在线故障检测方法及***、存储介质 | |
CN115277473A (zh) | 边缘网关的远程运维方法、装置、计算机设备、存储介质 | |
CN114374600A (zh) | 一种基于大数据的网络运维方法、装置、设备及产品 | |
CN113065001A (zh) | 一种故障止损方法及装置 | |
CN112711508A (zh) | 面向大规模客户端***的智能运维服务*** | |
CN115689320A (zh) | 基站运行的健康管理方法、装置及计算机可读存储介质 | |
Sharma et al. | The fundamentals and strategies of maintenance, repair, and overhaul (MRO) in Industry 4.0 | |
CN112434079A (zh) | 一种基于大数据的二次设备异常判别决策方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |