CN112836770B - Kpi异常定位分析方法及*** - Google Patents

Kpi异常定位分析方法及*** Download PDF

Info

Publication number
CN112836770B
CN112836770B CN202110318067.XA CN202110318067A CN112836770B CN 112836770 B CN112836770 B CN 112836770B CN 202110318067 A CN202110318067 A CN 202110318067A CN 112836770 B CN112836770 B CN 112836770B
Authority
CN
China
Prior art keywords
data
sequence
kpi
service
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110318067.XA
Other languages
English (en)
Other versions
CN112836770A (zh
Inventor
文弘扬
黄震人
熊小庆
王睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110318067.XA priority Critical patent/CN112836770B/zh
Publication of CN112836770A publication Critical patent/CN112836770A/zh
Application granted granted Critical
Publication of CN112836770B publication Critical patent/CN112836770B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Biology (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种KPI异常定位分析方法及***,涉及数据分析领域,可应用于金融领域和其他领域,所述方法包含:获取时序监控指标数据,对时序监控数据进行分流处理,组成服务KPI监控指标数据和机器KPI监控指标数据;通过GRU门控循环神经网络分析所述服务KPI时序指标数据和所述机器KPI时序指标数据,获得时段预测服务序列和时段预测机器序列;将服务指标预测序列与机器指标预测序列连接并传入Multi‑class异常分析定位模型,通过softmax分类器进行异常问题拟合定位获得KPI异常定位数据。

Description

KPI异常定位分析方法及***
技术领域
本发明涉及数据分析领域,可应用于金融领域和其他领域,尤指一种KPI(KeyPerformance Indicator,关键绩效指标)异常定位分析方法及***。
背景技术
随互联网科技的飞速发展,用户对互联网产品的服务质量要求也逐渐升高,产品上线后存在的潜在问题会逐步显现,如何做到第一时间发现问题,确定异常尤为重要,同样也是智能运维的最关键环节所在。针对互联网服务中,会针对多项数据指标进行监控,如cpu的使用率、内存占有量、网络响应时长、程序并发数、I/O等待时长等,通过对这部分数据进行监控分析完成异常定位。当前,主流的异常定位主要采用决策树、随机森林等,将监控数据进行一维处理后传入模型,完成异常问题的定位分析。
目前,针对运维监控异常问题定位的主流分析核心算法包括聚类分析、决策树、随机森林等算法。其中,聚类算法将根据已有的数据进行聚类统计,并归集为K类异常定位,该模型为无监督算法,无需人工打标,仅需要监控数据即可完成数据分析,结构简单。决策树、随机森林均为有监督学习算法,需要对已有数据进行人工归类、打标,通过进行概率分析进行异常问题定位。
聚类分析算法为非监督学***化处理后,数据的时序特征便被抹去,无法有效体现时序传递的潜在内容。
发明内容
本发明目的在于提供一种基于GRU门控循环神经网络的KPI异常定位分析方法及***,通过对监控数据实时传入,时序数据特征分析并借助深度神经网络进行异常问题定位分析,确定根因,及时反馈异常点,有效提高智能运维响应速度,提升服务质量。
为达上述目的,本发明所提供的KPI异常定位分析方法,具体包含:获取时序监控指标数据,对时序监控数据进行分流处理,组成服务KPI监控指标数据和机器KPI监控指标数据;通过GRU(gated recurrent unit,门控循环单元)门控循环神经网络分析所述服务KPI时序指标数据和所述机器KPI时序指标数据,获得时段预测服务序列和时段预测机器序列;将服务指标预测序列与机器指标预测序列连接并传入Multi-class(多类分类)异常分析定位模型获得KPI异常定位数据。
在上述KPI异常定位分析方法中,优选的,通过GRU门控循环神经网络分析所述服务KPI时序指标数据和所述机器KPI时序指标数据,获得时段预测服务序列和时段预测机器序列包含:将服务KPI时序指标数据传入GRU门控循环神经网络构建的GRU服务指标模型,预测生成时段预测服务序列;将机器KPI时序指标数据传入GRU门控循环神经网络构建的GRU机器指标模型,预测生成时段预测机器序列。
在上述KPI异常定位分析方法中,优选的,将服务指标预测序列与机器指标预测序列连接并传入Multi-class异常分析定位模型包含:通过预设DNN(Deep Neural Networks,深度神经网络)神经网络模型对所述服务指标预测序列与所述机器指标预测序列进行降维处理;将降维处理后的所述服务指标预测序列与所述机器指标预测序列通过Multi-class异常分析定位模型的merge层进行一维平面化数据整合,生成一维数据序列。
在上述KPI异常定位分析方法中,优选的,将服务指标预测序列与机器指标预测序列连接并传入Multi-class异常分析定位模型获得KPI异常定位数据包含:通过softmax分类器对所述一维数据序列进行异常问题拟合定位,获得KPI异常定位数据。
在上述KPI异常定位分析方法中,优选的,所述机器KPI监控指标数据包含:用户进程CPU使用率、***进程CPU使用率、监控进程CPU使用率、健康检查进程CPU使用率、IO等待时间、***空闲CPU使用率、内存使用量、内存空闲占比、每秒逻辑读块数、每秒执行硬解析频率、每秒SQL的解析频度、每秒SQL的执行频度。
在上述KPI异常定位分析方法中,优选的,所述服务KPI监控指标数据包含:Web服务的页面响应时间、页面访问量、服务连接数、新增服务连接数、服务连接失败数、交易笔数、交易失败笔数、交易延迟笔数、交易队列等待笔数、交易队列处理笔数、交易并发量。
本发明还提供一种KPI异常定位分析***,所述***包含:数据采集模块、数据分流模块和数据分析模块;所述数据采集模块用于获取时序监控指标数据;所述数据分流模块用于对时序监控数据进行分流处理,组成服务KPI监控指标数据和机器KPI监控指标数据;所述数据分析模块用于通过GRU门控循环神经网络分析所述服务KPI时序指标数据和所述机器KPI时序指标数据,获得时段预测服务序列和时段预测机器序列;以及,将服务指标预测序列与机器指标预测序列连接并传入Multi-class异常分析定位模型获得KPI异常定位数据。
在上述KPI异常定位分析***中,优选的,所述数据分析模块包含时序数据输入模块,所述时序数据输入模块用于将服务KPI时序指标数据传入GRU门控循环神经网络构建的GRU服务指标模型,预测生成时段预测服务序列;将机器KPI时序指标数据传入GRU门控循环神经网络构建的GRU机器指标模型,预测生成时段预测机器序列。
在上述KPI异常定位分析***中,优选的,所述数据分析模块包含数据加工模块,所述数据加工模块用于通过预设DNN神经网络模型对所述服务指标预测序列与所述机器指标预测序列进行降维处理;将降维处理后的所述服务指标预测序列与所述机器指标预测序列通过Multi-class异常分析定位模型的merge层进行一维平面化数据整合,生成一维数据序列。
在上述KPI异常定位分析***中,优选的,所述数据分析模块包含分析定位模块,所述分析定位模块用于通过softmax分类器对所述一维数据序列进行异常问题拟合定位,获得KPI异常定位数据。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。
本发明的有益技术效果在于:对原有数据的处理同时,保留数据时序特性,通过升维处理获取数据潜在关键,借助降维手段完成有效特征提取,最终由多分类器完成异常定位,更深层次刨析数据依赖关系,提升数据挖掘深度,最大程度获取数据内部关系,保障根因定位准确程度。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的限定。在附图中:
图1为本发明一实施例所提供的KPI异常定位分析方法的流程示意图;
图2为本发明一实施例所提供的时序指标数据的获取流程示意图;
图3为本发明一实施例所提供的KPI异常定位分析方法的实施流程示意图;
图4为本发明一实施例所提供的GRU门控循环神经网络神经单元的原理示意图;
图5为本发明一实施例所提供的预测序列预处理的流程示意图;
图6为本发明一实施例所提供的KPI异常定位分析方法的原理示意图;
图7为本发明一实施例所提供的KPI异常定位分析***的结构示意图;
图8为本发明一实施例所提供的电子设备的结构示意图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
请参考图1所示,本发明所提供的KPI异常定位分析方法,具体包含:
S101获取时序监控指标数据,对时序监控数据进行分流处理,组成服务KPI监控指标数据和机器KPI监控指标数据;
S102通过GRU门控循环神经网络分析所述服务KPI时序指标数据和所述机器KPI时序指标数据,获得时段预测服务序列和时段预测机器序列;
S103将服务指标预测序列与机器指标预测序列连接并传入Multi-class异常分析定位模型获得KPI异常定位数据。
在实际工作中,运维监控指标主要包含机器KPI指标和服务KPI指标两部分,机器KPI监控指标是反应物理设备包括服务器、路由设施、交换机等性能指标信息,服务KPI监控指标主要反应软件服务包括网络页面响应、页面跳转响应时长等性能指标,通过对两组时序指标序列进行数据分析,可有效提取出时序数据前后依赖关系,充分保留了数据依赖传递关系,通过深度神经网络对两组序列数据进行二次整合分析、降维处理,通过softmax多分类器最终确定异常问题所在。相关实施方式将在后续具体实施例详细说明,在此就不再一一详述。
在上述实施例中,所述机器KPI监控指标数据针对服务群组的机械设备数据监控,反映群组设备(路由设备、服务器、交换机等)健康状况的性能指标,包含:用户进程CPU使用率、***进程CPU使用率、监控进程CPU使用率、健康检查进程CPU使用率、IO等待时间、***空闲CPU使用率、内存使用量、内存空闲占比、每秒逻辑读块数、每秒执行硬解析频率、每秒SQL的解析频度、每秒SQL的执行频度。所述服务KPI监控指标数据针对提供服务质量进行监控,反映Web服务的规模、性能等信息,主要包含:Web服务的页面响应时间、页面访问量、服务连接数、新增服务连接数、服务连接失败数、交易笔数、交易失败笔数、交易延迟笔数、交易队列等待笔数、交易队列处理笔数、交易并发量。
在本发明一实施例中,针对历史监控内容进行人工确认生产环境可能存在异常的归类问题集,该部分将作为训练集的打标归类依据以及模型训练最终生成的输出预测值,由于存在无法明确定位的因素,所以,增加了一项新增异常(问题标签:999999999),当模型预测为该类异常,则需要进行人工进行异常定位分析数据。同时,模型训练过程中同样需要正样本,该类指标设定问题标签为:000000000,即无异常问题。
请参考图2所示,在本发明一实施例中,通过GRU门控循环神经网络分析所述服务KPI时序指标数据和所述机器KPI时序指标数据,获得时段预测服务序列和时段预测机器序列包含:
S201将服务KPI时序指标数据传入GRU门控循环神经网络构建的GRU服务指标模型,预测生成时段预测服务序列;
S202将机器KPI时序指标数据传入GRU门控循环神经网络构建的GRU机器指标模型,预测生成时段预测机器序列。
具体的,请参考图3所示,在实际工作中,本发明所提供的KPI异常定位分析方法的实施流程如下:
S301:获取时序监控指标数据;
S302/S303:将时序监控数据进行分流处理,组成服务KPI监控指标数据和机器KPI监控指标数据;
S3041:将服务KPI时序指标数据传入GRU-服务指标模型,预测生成时段预测服务序列;
S3042:将机器KPI时序指标数据传入GRU-机器指标模型,预测生成时段预测机器序列;
S3043:将服务指标预测序列与机器指标预测序列连接并传入Multi-class异常分析定位模型;
S305:根据KPI异常定位分析模型确定引发异常的问题定位
在上述实施例中GRU-服务指标模型和GRU-机器指标模型的结构原理相同,在实际工作中可采用相同的结构,仅在于训练所用数据的差异,在此仅为便于分辨两个模型的用途,并不对其具体原理结果做任何限定;请参考图4所示,上述GRU门控循环神经网络神经单元,神经元包括更新门和重置门两部分,神经元计算公式如下:
更新门:
重置门:
新状态:
隐藏状态:
更新门(z)决定信息过滤后留存数据内容;重置门(r)决定历史数据遗忘程度;新状态通过对上一个状态完成加权运算,利用重置门进行选择性遗忘上一隐藏状态;隐藏状态则利用更新门有选择的保留上一个隐藏状态以及下一个新状态。通过2组门控***和2组状态变换完成时序数据信息传递。
请参考图5所示,在本发明一实施例中,将服务指标预测序列与机器指标预测序列连接并传入Multi-class异常分析定位模型包含:
S501通过预设DNN神经网络模型对所述服务指标预测序列与所述机器指标预测序列进行降维处理;
S502将降维处理后的所述服务指标预测序列与所述机器指标预测序列通过Multi-class异常分析定位模型的merge层进行一维平面化数据整合,生成一维数据序列。
进一步的,在本发明另一实施例中,将服务指标预测序列与机器指标预测序列连接并传入Multi-class异常分析定位模型获得KPI异常定位数据可包含:通过softmax分类器对所述一维数据序列进行异常问题拟合定位,获得KPI异常定位数据。
请参考图6所示,整体上本发明关于KPI异常定位分析过程可分为三层结果,具体包含:时序数据GRU门控循环神经网络分析层,该部分为时序数据传入接口,时序数据经过GRU神经元生成序列数据,再传入对应的(机器KPI监控、服务KPI监控)DNN神经网络层,输出序列通过merge层完成数据归并,合成一维数据序列,再传入Multi-class多分类问题定位层,使用softmax分类器进行异常问题拟合定位,构成如下所示:
S601:时序数据输入层,该部分由机器KPI监控指标循环神经网络结构和服务KPI监控指标循环升级网路结构两部分组成,其中,机器KPI传入维度为23*10,即传入连续10s内机器指标监控数据,特征包括用户进程CPU使用率、***进程CPU使用率、监控进程CPU使用率、健康检查CPU使用率等总计23个体征维度,参考表1机器KPI监控指标,对应GRU单元共计23个机器监控维度;服务KPI传入维度为32*10,对应特征包括页面访问时间、页面访问量、服务连接数量、新增连接数量、连接错误数量、重新连接数量等总计32个业务监控维度;
S602:对机器KPI监控指标和服务KPI监控指标通过GRU神经网络生成的序列信息进行深度加工,对序列数据进行降维处理,结构如下:
S6021:机器KPI监控指标生成数据传入DNN神经网络模型,模型为3层网络结构,数据输入层为23,即GRU生成序列维度数,隐藏层包含神经元30个,输出层10个;
S6022:服务KPI监控指标生成数据传入DNN神经网络模型,模型为3层网络结构,数据输入层为32,隐藏层包含神经元40个,输出层15个;
S603:对两组DNN生成数据进行问题定位分析,具体结构如图4多分类神经网络结构图所示,merge层将机器KPI生成序列和服务KPI生成序列进行一维平面化数据整合,merge层总计25个神经元,隐藏1层包含神经元40个,隐藏2层包含神经元10个,输出层为单一输出,使用softmax分类器进行问题定位。
请参考图7所示,本发明还提供一种KPI异常定位分析***,所述***包含:数据采集模块、数据分流模块和数据分析模块;所述数据采集模块用于获取时序监控指标数据;所述数据分流模块用于对时序监控数据进行分流处理,组成服务KPI监控指标数据和机器KPI监控指标数据;所述数据分析模块用于通过GRU门控循环神经网络分析所述服务KPI时序指标数据和所述机器KPI时序指标数据,获得时段预测服务序列和时段预测机器序列;以及,将服务指标预测序列与机器指标预测序列连接并传入Multi-class异常分析定位模型获得KPI异常定位数据。
在本发明一实施例中,所述数据分析模块包含时序数据输入模块,所述时序数据输入模块用于将服务KPI时序指标数据传入GRU门控循环神经网络构建的GRU服务指标模型,预测生成时段预测服务序列;将机器KPI时序指标数据传入GRU门控循环神经网络构建的GRU机器指标模型,预测生成时段预测机器序列。进一步的,所述数据分析模块包含数据加工模块,所述数据加工模块用于通过预设DNN神经网络模型对所述服务指标预测序列与所述机器指标预测序列进行降维处理;将降维处理后的所述服务指标预测序列与所述机器指标预测序列通过Multi-class异常分析定位模型的merge层进行一维平面化数据整合,生成一维数据序列。在另一实施例中,所述数据分析模块还可包含分析定位模块,所述分析定位模块用于通过softmax分类器对所述一维数据序列进行异常问题拟合定位,获得KPI异常定位数据。该结构的具体实现原理和实例可参考上述实施例,在此就不再一一详述。
本发明的有益技术效果在于:对原有数据的处理同时,保留数据时序特性,通过升维处理获取数据潜在关键,借助降维手段完成有效特征提取,最终由多分类器完成异常定位,更深层次刨析数据依赖关系,提升数据挖掘深度,最大程度获取数据内部关系,保障根因定位准确程度。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。
如图8所示,该电子设备600还可以包括:通信模块110、输入单元120、音频处理器130、显示器160、电源170。值得注意的是,电子设备600也并不是必须要包括图8中所示的所有部件;此外,电子设备600还可以包括图8中没有示出的部件,可以参考现有技术。
如图8所示,中央处理器100有时也称为控制器或操作控件,可以包括微处理器或其他处理器***和/或逻辑***,该中央处理器100接收输入并控制电子设备600的各个部件的操作。
其中,存储器140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适***中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器100可执行该存储器140存储的该程序,以实现信息存储或处理等。
输入单元120向中央处理器100提供输入。该输入单元120例如为按键或触摸输入***。电源170用于向电子设备600提供电力。显示器160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器140还可以是某种其它类型的***。存储器140包括缓冲存储器141(有时被称为缓冲器)。存储器140可以包括应用/功能存储部142,该应用/功能存储部142用于存储应用程序和功能程序或用于通过中央处理器100执行电子设备600的操作的流程。
存储器140还可以包括数据存储部143,该数据存储部143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器140的驱动程序存储部144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块110即为经由天线111发送和接收信号的发送机/接收机110。通信模块(发送机/接收机)110耦合到中央处理器100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)110还经由音频处理器130耦合到扬声器131和麦克风132,以经由扬声器131提供音频输出,并接收来自麦克风132的音频输入,从而实现通常的电信功能。音频处理器130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器130还耦合到中央处理器100,从而使得可以通过麦克风132能够在本机上录音,且使得可以通过扬声器131来播放本机上存储的声音。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的***。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令***的制造品,该指令***实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种KPI异常定位分析方法,其特征在于,所述方法包含:
获取时序监控指标数据,对时序监控数据进行分流处理,组成服务KPI监控指标数据和机器KPI监控指标数据;
通过GRU门控循环神经网络分析所述服务KPI时序指标数据和所述机器KPI时序指标数据,获得时段预测服务序列和时段预测机器序列;
将服务指标预测序列与机器指标预测序列连接并传入Multi-class异常分析定位模型获得KPI异常定位数据;
其中,将服务指标预测序列与机器指标预测序列连接并传入Multi-class异常分析定位模型获得KPI异常定位数据包含:通过预设DNN神经网络模型对所述服务指标预测序列与所述机器指标预测序列进行降维处理;将降维处理后的所述服务指标预测序列与所述机器指标预测序列通过Multi-class异常分析定位模型的merge层进行一维平面化数据整合,生成一维数据序列;通过softmax分类器对所述一维数据序列进行异常问题拟合定位,获得KPI异常定位数据。
2.根据权利要求1所述的KPI异常定位分析方法,其特征在于,通过GRU门控循环神经网络分析所述服务KPI时序指标数据和所述机器KPI时序指标数据,获得时段预测服务序列和时段预测机器序列包含:
将服务KPI时序指标数据传入GRU门控循环神经网络构建的GRU服务指标模型,预测生成时段预测服务序列;
将机器KPI时序指标数据传入GRU门控循环神经网络构建的GRU机器指标模型,预测生成时段预测机器序列。
3.根据权利要求1或2所述的KPI异常定位分析方法,其特征在于,所述机器KPI监控指标数据包含:用户进程CPU使用率、***进程CPU使用率、监控进程CPU使用率、健康检查进程CPU使用率、IO等待时间、***空闲CPU使用率、内存使用量、内存空闲占比、每秒逻辑读块数、每秒执行硬解析频率、每秒SQL的解析频度、每秒SQL的执行频度。
4.根据权利要求1或2所述的KPI异常定位分析方法,其特征在于,所述服务KPI监控指标数据包含:Web服务的页面响应时间、页面访问量、服务连接数、新增服务连接数、服务连接失败数、交易笔数、交易失败笔数、交易延迟笔数、交易队列等待笔数、交易队列处理笔数、交易并发量。
5.一种KPI异常定位分析***,其特征在于,所述***包含:数据采集模块、数据分流模块和数据分析模块;
所述数据采集模块用于获取时序监控指标数据;
所述数据分流模块用于对时序监控数据进行分流处理,组成服务KPI监控指标数据和机器KPI监控指标数据;
所述数据分析模块用于通过GRU门控循环神经网络分析所述服务KPI时序指标数据和所述机器KPI时序指标数据,获得时段预测服务序列和时段预测机器序列;以及,将服务指标预测序列与机器指标预测序列连接并传入Multi-class异常分析定位模型获得KPI异常定位数据;
其中,所述数据分析模块包含数据加工模块和分析定位模块;
所述数据加工模块用于通过预设DNN神经网络模型对所述服务指标预测序列与所述机器指标预测序列进行降维处理;将降维处理后的所述服务指标预测序列与所述机器指标预测序列通过Multi-class异常分析定位模型的merge层进行一维平面化数据整合,生成一维数据序列;
所述分析定位模块用于通过softmax分类器对所述一维数据序列进行异常问题拟合定位,获得KPI异常定位数据。
6.根据权利要求5所述的KPI异常定位分析***,其特征在于,所述数据分析模块包含时序数据输入模块,所述时序数据输入模块用于将服务KPI时序指标数据传入GRU门控循环神经网络构建的GRU服务指标模型,预测生成时段预测服务序列;将机器KPI时序指标数据传入GRU门控循环神经网络构建的GRU机器指标模型,预测生成时段预测机器序列。
7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4任一所述方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有由计算机执行权利要求1至4任一所述方法的计算机程序。
CN202110318067.XA 2021-03-25 2021-03-25 Kpi异常定位分析方法及*** Active CN112836770B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110318067.XA CN112836770B (zh) 2021-03-25 2021-03-25 Kpi异常定位分析方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110318067.XA CN112836770B (zh) 2021-03-25 2021-03-25 Kpi异常定位分析方法及***

Publications (2)

Publication Number Publication Date
CN112836770A CN112836770A (zh) 2021-05-25
CN112836770B true CN112836770B (zh) 2024-02-27

Family

ID=75930521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110318067.XA Active CN112836770B (zh) 2021-03-25 2021-03-25 Kpi异常定位分析方法及***

Country Status (1)

Country Link
CN (1) CN112836770B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110928718A (zh) * 2019-11-18 2020-03-27 上海维谛信息科技有限公司 一种基于关联分析的异常处理方法、***、终端及介质
CN112395170A (zh) * 2020-12-07 2021-02-23 平安普惠企业管理有限公司 智能故障分析方法、装置、设备及存储介质
CN112416643A (zh) * 2020-11-26 2021-02-26 清华大学 无监督异常检测方法与装置
CN112416662A (zh) * 2020-11-26 2021-02-26 清华大学 多时间序列数据异常检测方法与装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110928718A (zh) * 2019-11-18 2020-03-27 上海维谛信息科技有限公司 一种基于关联分析的异常处理方法、***、终端及介质
CN112416643A (zh) * 2020-11-26 2021-02-26 清华大学 无监督异常检测方法与装置
CN112416662A (zh) * 2020-11-26 2021-02-26 清华大学 多时间序列数据异常检测方法与装置
CN112395170A (zh) * 2020-12-07 2021-02-23 平安普惠企业管理有限公司 智能故障分析方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN112836770A (zh) 2021-05-25

Similar Documents

Publication Publication Date Title
Imteaj et al. Federated learning for resource-constrained iot devices: Panoramas and state of the art
KR102087959B1 (ko) 통신망의 인공지능 운용 시스템 및 이의 동작 방법
CN108446382A (zh) 用于推送信息的方法和装置
CN110806954A (zh) 评估云主机资源的方法、装置、设备及存储介质
CN110399487A (zh) 一种文本分类方法、装置、电子设备及存储介质
CN110471821A (zh) 异常变更检测方法、服务器及计算机可读存储介质
CN116485475A (zh) 基于边缘计算的物联网广告***、方法及装置
CN111949795A (zh) 工单自动分类方法及装置
CN110210980A (zh) 一种驾驶行为评估方法、装置和存储介质
Cheng et al. FROG: A fast and reliable crowdsourcing framework
CN113821330B (zh) 任务调度方法、装置、计算机设备和存储介质
CN114912030A (zh) 权益模型训练方法、推荐方法及电子终端和计算机介质
CN114692552A (zh) 一种三维芯片的布局方法、装置及终端设备
CN107122464A (zh) 一种辅助决策***及方法
CN112836770B (zh) Kpi异常定位分析方法及***
CN116843395A (zh) 一种业务***的告警分级方法、装置、设备及存储介质
CN113835973B (zh) 一种模型训练方法及相关装置
CN116703046A (zh) 实时派工顺序的控制方法及***、电子设备和存储介质
CN113762972A (zh) 数据存储控制方法及装置、电子设备、存储介质
CN111435463B (zh) 数据处理方法及相关设备、***
CN111554089A (zh) 一种基于深度学习的交通状态预测方法及装置
CN117350607B (zh) 改进型knn算法模型的国际物流运输路径规划***
Chen et al. En-beats: A novel ensemble learning-based method for multiple resource predictions in cloud
CN118013399B (zh) 一种基于ai模型进行用户画像的处理方法和装置
CN115952009B (zh) 基于算网融合特征的数据中心推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant