CN114548195A - 一种数据标注处理方法、装置、存储介质及电子装置 - Google Patents

一种数据标注处理方法、装置、存储介质及电子装置 Download PDF

Info

Publication number
CN114548195A
CN114548195A CN202011349875.4A CN202011349875A CN114548195A CN 114548195 A CN114548195 A CN 114548195A CN 202011349875 A CN202011349875 A CN 202011349875A CN 114548195 A CN114548195 A CN 114548195A
Authority
CN
China
Prior art keywords
sample
label
value
sample set
newly added
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011349875.4A
Other languages
English (en)
Inventor
严心月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN202011349875.4A priority Critical patent/CN114548195A/zh
Priority to PCT/CN2021/129871 priority patent/WO2022111284A1/zh
Publication of CN114548195A publication Critical patent/CN114548195A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Operations Research (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种数据标注处理方法、装置、存储介质及电子装置,该方法包括:对性能指标数据进行异常检测,得到异常点组成的样本集合与该样本集合对应的标签集合;对该样本集合进行特征扩充,得到该样本集合的特征向量与对应的标签值;对该特征向量进行特征选择,得到该样本集合的目标特征向量;根据该样本集合的目标特征向量对新增样本进行标注,可以解决相关技术中通过监督的分类方法对性能指标数据进行标注,无法较好地适应流式数据的问题,实现无线网络关键性能指标数据故障跟因的有效判别,可以较好地适应流式数据。

Description

一种数据标注处理方法、装置、存储介质及电子装置
技术领域
本发明实施例涉及通信领域,具体而言,涉及一种数据标注处理方法、装置、存储介质及电子装置。
背景技术
作为智能运维体系的关键场景与重要环节,网络故障的及时发现与准确定位对保障无线网络环境与***稳定运行,从而满足社会日常、商业及公共服务等各方面的通讯需要发挥举足轻重的作用。为应对这一需求,无线网络运营过程往往需要投入大量人力,并依托具有丰富经验的业内专家参与诊断过程。基于能够表征各网络组件运行情况以及网络健康状态的关键性能指标体系,业务人员通过实时监测发现指标异动情况,进一步关联及下钻深层挖掘故障跟因,以实现包括传输故障、网络硬件设备异常等多种故障类型在内的快速定位与解决方案支持。当前,以上过程已通过异常检测算子、小区算子及跟因定位算子逐步实现并通过验证,但仍需业务人员介入跟因定位模块进行人工样本标注,以辅助故障定界及算法优化闭环实现,并未完全实现专家经验的凝练与固化。
针对上述情况,当前主要采用无监督的聚类方法或有监督的分类方法。前者在应用过程中需要业务专家针对聚类结果进行标注确认,针对流式输入数据需要更新整个模型,因此稳定性较差,不能够较好满足增量异常数据分类及标注的要求;后者虽然能够充分利用已有类别信息,但对于训练数据的标签完备性及充分性较高,且同样存在模型更新问题,无法较好地适应流式数据。
针对相关技术中通过监督的分类方法对性能指标数据进行标注,无法较好地适应流式数据的问题,尚未提出解决方案。
发明内容
本发明实施例提供了一种数据标注处理方法、装置、存储介质及电子装置,以至少解决相关技术中通过监督的分类方法对性能指标数据进行标注,无法较好地适应流式数据的问题。
根据本发明的一实施例,提供了一种数据标注处理方法,所述方法包括:
对性能指标数据进行异常检测,得到异常点组成的样本集合与所述样本集合对应的标签集合;
对所述样本集合进行特征扩充,得到所述样本集合的特征向量与对应的标签值;
对所述特征向量进行特征选择,得到所述样本集合的目标特征向量;
根据所述样本集合的目标特征向量对新增样本进行标注。
在一可选的实施例中,根据所述样本集合的目标特征向量对新增样本进行标注包括:
在所述新增样本未标注的情况下,根据所述样本集合的目标特征向量与对应的标签集合对所述新增样本的标签进行标注。
在一可选的实施例中,根据所述样本集合的目标特征向量与对应的标签集合对所述新增样本的标签进行标注包括:
若所述新增样本中的部分或全部样本点与所述样本集合相邻,确定所述新增样本与所述样本集合的目标特征向量之间的距离;
确定所述距离为所述新增样本中的节点与所述样本集合中各节点之间边的权重,得到权重矩阵;
根据所述权重矩阵构建对角矩阵;
根据所述对角矩阵与所述权重矩阵确定转移概率矩阵;
根据所述转移概率矩阵对所述新增样本的标签进行标注。
在一可选的实施例中,确定所述新增样本与所述样本集合的目标特征向量之间的距离包括:
获取所述新增样本中属于所述样本集合的邻近的样本点集合;
确定所述样本点集合中所有样本点与所述样本集合的目标特征向量的距离;
将所述样本点集合中所有样本点与所述样本集合的目标特征向量的距离确定为所述新增样本与所述样本集合的目标特征向量之间的距离。
在一可选的实施例中,根据所述权重矩阵构建对角矩阵包括:
分别确定所述权重矩阵中每行所有特征向量之和;
将所述每行所有特征向量之和组合得到所述对角矩阵。
在一可选的实施例中,根据所述转移概率矩阵对所述新增样本的标签进行标注包括:
从所述转移概率矩阵中获取所述新增样本对应的行,且所述样本集合的目标特征向量对应列的取值,得到目标转移矩阵;
将所述目标转移概率矩阵与所述样本集合对应的标签集合的乘积确定为所述新增样本的标签估计值;
根据所述标签估计值对所述新增样本进行标注。
在一可选的实施例中,在根据所述样本集合的目标特征向量对新增样本进行标注之后,所述方法还包括:
确定与所述新增样本相邻的未标注样本,将所述未标注样本添加到候选集合中;
根据所述新增样本对所述候选集合中的未标注样本进行标注。
在一可选的实施例中,根据所述新增样本对所述候选集合中的未标注样本进行标注包括:
针对所述候选集合中的未标注样本,根据所述转移概率矩阵的子矩阵与所述样本集合标签矩阵的子矩阵确定所述未标注样本的标签估计值;
若所述标签估计值与所述候选集合中未标注样本的初始标签值的差值的L1范数大于预设阈值,根据所述标签估计值更新所述未标注样本的标签值,其中,所述初始标签值为0向量。
在一可选的实施例中,在对性能指标数据进行异常检测,得到异常点组成的样本集合与所述样本集合对应的标签集合之前,所述方法还包括:
确定所述性能指标数据中的缺失值;
获取与所述缺失值的采样时间对应的历史同时刻的一个数据或多个数据;
根据所述一个数据或所述多个数据的均值填充所述缺失值。
在一可选的实施例中,对所述性能指标数据进行特征扩充,得到特征向量与对应的标签值包括:
通过时间序列模型对所述性能指标数据进行特征扩充,得到所述性能指标数据的各原始值对应的预测值,其中,所述时间序列模型包括以下之一:差分模型、三阶指数平滑模型Holt-Winters、滑动平均模型、滑动中值模型、时间序列分解模型、时间序列分解中值模型、小波变换模型;
根据所述预测值确定所述特征向量与对应的标签值。
在一可选的实施例中,对所述特征向量进行特征选择,得到所述样本集合的目标特征向量包括:
从所述特征向量中选取能够区分不同异常类型的特征项,得到所述样本集合的目标特征向量。
根据本发明的另一实施例,提供了一种数据标注处理装置,所述装置包括:
异常检测模块,用于对性能指标数据进行异常检测,得到异常点组成的样本集合与所述样本集合对应的标签集合;
特征扩充模块,用于对所述样本集合进行特征扩充,得到所述样本集合的特征向量与对应的标签值;
特征选择模块,用于对所述特征向量进行特征选择,得到所述样本集合的目标特征向量;
第一标注模块,用于根据所述样本集合的目标特征向量对新增样本进行增量标注。
在一可选的实施例中,所述第一标注模块,还用于
在所述新增样本未标注的情况下,根据所述样本集合的目标特征向量与对应的标签集合对所述新增样本的标签进行标注。
在一可选的实施例中,所述第一标注模块包括:
第一确定子模块,用于若所述新增样本中的部分或全部样本点与所述样本集合相邻,确定所述新增样本与所述样本集合的目标特征向量之间的距离;
第二确定子模块,用于确定所述距离为所述新增样本中的节点与所述样本集合中各节点之间边的权重,得到权重矩阵;
构建子模块,用于根据所述权重矩阵构建对角矩阵;
第三确定子模块,用于根据所述对角矩阵与所述权重矩阵确定转移概率矩阵;
标注子模块,用于根据所述转移概率矩阵对所述新增样本的标签进行标注。
在一可选的实施例中,所述第一确定子模块包括:
获取单元,用于获取所述新增样本中属于所述样本集合的邻近的样本点集合;
第一确定单元,用于确定所述样本点集合中所有样本点与所述样本集合的目标特征向量的距离;
第二确定单元,用于将所述样本点集合中所有样本点与所述样本集合的目标特征向量的距离确定为所述新增样本与所述样本集合的目标特征向量之间的距离。
在一可选的实施例中,所述构建子模块包括:
第三确定单元,用于分别确定所述权重矩阵中每行所有特征向量之和;
组合单元,用于将所述每行所有特征向量之和组合得到所述对角矩阵。
在一可选的实施例中,所述标注子模块包括:
获取单元,用于从所述转移概率矩阵中获取所述新增样本对应的行,且所述样本集合的目标特征向量对应列的取值,得到目标转移矩阵;
第四确定单元,用于将所述目标转移概率矩阵与所述样本集合对应的标签集合的乘积确定为所述新增样本的标签估计值;
标注单元,用于根据所述标签估计值对所述新增样本进行标注。
在一可选的实施例中,在根据所述样本集合的目标特征向量对新增样本进行标注之后,所述装置还包括:
添加模块,用于确定与所述新增样本相邻的未标注样本,将所述未标注样本添加到候选集合中;
第二标注模块,用于根据所述新增样本对所述候选集合中的未标注样本进行标注。
在一可选的实施例中,所述第二标注模块包括:
第四确定子模块,用于针对所述候选集合中的未标注样本,根据所述转移概率矩阵的子矩阵与所述样本集合标签矩阵的子矩阵确定所述未标注样本的标签估计值;
更新子模块,用于若所述标签估计值与所述候选集合中未标注样本的初始标签值的差值的L1范数大于预设阈值,根据所述标签估计值更新所述未标注样本的标签值,其中,所述初始标签值为0向量。
在一可选的实施例中,所述装置还包括:
确定模块,用于确定所述性能指标数据中的缺失值;
获取模块,用于获取与所述缺失值的采样时间对应的历史同时刻的一个数据或多个数据;
填充模块,用于根据所述一个数据或所述多个数据的均值填充所述缺失值。
在一可选的实施例中,所述特征扩充模块,还用于
通过时间序列模型对所述性能指标数据进行特征扩充,得到所述性能指标数据的各原始值对应的预测值,其中,所述时间序列模型包括以下之一:差分模型、三阶指数平滑模型Holt-Winters、滑动平均模型、滑动中值模型、时间序列分解模型、时间序列分解中值模型、小波变换模型;
根据所述预测值确定所述特征向量与对应的标签值。
在一可选的实施例中,所述特征选择模块,还用于
从所述特征向量中选取能够区分不同异常类型的特征项,得到所述样本集合的目标特征向量。
根据本发明的又一个实施例,还提供了一种计算机可读的存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
本发明实施例,对性能指标数据进行异常检测,得到异常点组成的样本集合与所述样本集合对应的标签集合;对所述样本集合进行特征扩充,得到所述样本集合的特征向量与对应的标签值;对所述特征向量进行特征选择,得到所述样本集合的目标特征向量;根据所述样本集合的目标特征向量对新增样本进行标注,可以解决相关技术中通过监督的分类方法对性能指标数据进行标注,无法较好地适应流式数据的问题,实现无线网络关键性能指标数据故障跟因的有效判别,可以较好地适应流式数据。
附图说明
图1是本发明实施例的数据标注处理方法的移动终端的硬件结构框图;
图2是根据本发明实施例的数据标注处理方法的流程图;
图3是根据本实施例的算法主流程图;
图4是根据本实施例的特征抽取的流程图;
图5是根据本实施例的特征选择的流程图;
图6是根据本实施例的增量标记的流程图;
图7是根据本实施例的标签传播的流程图;
图8是根据本实施例的数据标注处理装置的框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明的实施例。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的数据标注处理方法的移动终端的硬件结构框图,如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的数据传输方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及业务链地址池切片处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种运行于上述移动终端或网络架构的数据标注处理方法,图2是根据本发明实施例的数据标注处理方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,对性能指标数据进行异常检测,得到异常点组成的样本集合与所述样本集合对应的标签集合;
步骤S204,对所述样本集合进行特征扩充,得到所述样本集合的特征向量与对应的标签值;
本实施例中,上述步骤S204具体可以包括:
通过时间序列模型对所述性能指标数据进行特征扩充,得到所述性能指标数据的各原始值对应的预测值,其中,所述时间序列模型包括以下之一:差分模型、三阶指数平滑模型Holt-Winters、滑动平均模型、滑动中值模型、时间序列分解模型、时间序列分解中值模型、小波变换模型;
根据所述预测值确定所述特征向量与对应的标签值。
步骤S206,对所述特征向量进行特征选择,得到所述样本集合的目标特征向量;
本实施例中,上述步骤S206具体可以包括:
从所述特征向量中选取能够区分不同异常类型的特征项,得到所述样本集合的目标特征向量。
步骤S208,根据所述样本集合的目标特征向量对新增样本进行标注。
通过上述步骤S202至S208,对性能指标数据进行异常检测,得到异常点组成的样本集合与所述样本集合对应的标签集合;对所述样本集合进行特征扩充,得到所述样本集合的特征向量与对应的标签值;对所述特征向量进行特征选择,得到所述样本集合的目标特征向量;根据所述样本集合的目标特征向量对新增样本进行标注,可以解决相关技术中通过监督的分类方法对性能指标数据进行标注,无法较好地适应流式数据的问题,实现无线网络关键性能指标数据故障跟因的有效判别,可以较好地适应流式数据。
本实施例中,上述步骤S208具体可以包括:在所述新增样本未标注的情况下,根据所述样本集合的目标特征向量与对应的标签集合对所述新增样本的标签进行标注。
在一可选的实施例中,上述步骤S208具体可以包括:
S2081,若所述新增样本中的部分或全部样本点与所述样本集合相邻,确定所述新增样本与所述样本集合的目标特征向量之间的距离;
S2082,确定所述距离为所述新增样本中的节点与所述样本集合中各节点之间边的权重,得到权重矩阵;
S2083,根据所述权重矩阵构建对角矩阵;
S2084,根据所述对角矩阵与所述权重矩阵确定转移概率矩阵;
S2085,根据所述转移概率矩阵对所述新增样本的标签进行标注。
在一可选的实施例中,上述步骤S2082具体可以包括:
获取所述新增样本中属于所述样本集合的邻近的样本点集合;
确定所述样本点集合中所有样本点与所述样本集合的目标特征向量的距离;
将所述样本点集合中所有样本点与所述样本集合的目标特征向量的距离确定为所述新增样本与所述样本集合的目标特征向量之间的距离。
在一可选的实施例中,上述步骤S2083具体可以包括:
分别确定所述权重矩阵中每行所有特征向量之和;
将所述每行所有特征向量之和组合得到所述对角矩阵。
在一可选的实施例中,上述S2085具体可以包括:
从所述转移概率矩阵中获取所述新增样本对应的行,且所述样本集合的目标特征向量对应列的取值,得到目标转移矩阵;
将所述目标转移概率矩阵与所述样本集合对应的标签集合的乘积确定为所述新增样本的标签估计值;
根据所述标签估计值对所述新增样本进行标注。
在一可选的实施例中,在根据所述样本集合的目标特征向量对新增样本进行标注之后,确定与所述新增样本相邻的未标注样本,将所述未标注样本添加到候选集合中;根据所述新增样本对所述候选集合中的未标注样本进行标注,进一步的,针对所述候选集合中的未标注样本,根据所述转移概率矩阵的子矩阵与所述样本集合标签矩阵的子矩阵确定所述未标注样本的标签估计值;若所述标签估计值与所述候选集合中未标注样本的初始标签值的差值的L1范数大于预设阈值,根据所述标签估计值更新所述未标注样本的标签值,其中,所述初始标签值为0向量。
在一可选的实施例中,在对性能指标数据进行异常检测,得到异常点组成的样本集合与所述样本集合对应的标签集合之前,确定所述性能指标数据中的缺失值;获取与所述缺失值的采样时间对应的历史同时刻的一个数据或多个数据;根据所述一个数据或所述多个数据的均值填充所述缺失值。
本实施例采用数据挖掘与机器学习方法,通过对流式输入的无线网络关键性能指标数据进行特征抽取、特征选择及半监督的标签传播,实现未知类型样本数据的标注工作,从而达到标签样本自动扩充,辅助跟因定位算子优化的目标。进一步的,还可直接用于跟因分析环节,对故障所属大类进行明确。
本实施例中输入数据对象为异常检测算法得到的异常时刻点无线网络业务核心性能指标指标,及业务关心计数器的时序数据集合。
第一步,针对输入数据进行预处理,对其中缺失值采用如下方法填充:
选择历史同时刻数据点均值进行填充;
若无对应时刻数据点,则使用总体均值填充;
与此同时,对样本采集时间粒度进行统一,基于处理后初始样本集合进入流程,对模型进行初始化。
第二步,针对处理后核心指标数据实施特征工程,主要包括:
1,特征抽取,具体包括:
为充分表征不同性能指标数据时序特征,需要针对每一个输入异常对象对应K维指标数据进行特征扩充,以形成键值对(x,y),其中x为任一样本点进行特征抽取后所得到的L维特征向量x=[x1,x2,...,xl]T,y为对应样本对象异常类型标签值。主要采用以下用于时间序列数据处理的通用型模型包括差分模型、Holt-Winters、滑动平均模型、滑动中值模型、时间序列分解模型、时间序列分解中值模型及小波变换模型等时间序列模型。
2,特征选择,具体包括:
针对特征数据进行特征选择,其主要内容为:对于每一个异常样本对象经过特征抽取得到的L维特征向量x=[x1,x2,...,xl]T,及对应样本标签值y,求解使得特征选择概率等式p(y|x)=p(y|xθ*)成立的最小特征子集xθ*,从而实现由原始维度L至选择后维度M的降维过程,其中p为给定特征集合x下标签值y出现概率之间函数关系的真实映射。进一步的,针对以上假设,可构建p的近似预测模型q,并通过极大似然估计求解得到目标特征集合xθ*
Figure BDA0002801067460000081
其中,θ表示选定特征,τ表示用于预测类别标签的参数,以上求解的目的在于找到一个最小的目标特征集合xθ*使得预测模型q无限接近真实模型p。通过对以上表达式归一化、求取对数、计算互信息等过程,即可得到xθ*结果。
第三步,基于筛选特征数据进行增量标记,主要包括:
通过数据预处理及特征工程子模块,对于已标记样本对象,每个样本特征值与类别标签的关系对可表示为(x,y)。
其中x为特征向量x=[x1,x2,...,xm]T,下标为特征选择所得M维特征空间;y为已标注类别标签。基于性能指标实时监测输入的N个异常点样本对象,每个样本对应经过特征抽取及选择得到的M个特征值,有特征向量集合X={X1,X2,...,Xn}及标签集合L={L1,L2,...,Ln}。
为针对于流式进入***内的每一个新的样本n+1,开始模型训练过程:若样本未标注,则通过模型计算对其标签进行估计,从而实现跟因标注与样本扩充;若样本已有标签,则对模型本身进行更新。主要分为两个步骤实现:
1,样本数据k-nn关系构造,具体包括:
以原始样本点作为独立结点,对于新增样本n+1,计算该样本与已知各样本之间距离,距离计算方式为:
Figure BDA0002801067460000082
其中,M为单位矩阵(identity matrix:主对角线元素为1,其余元素均为0的方阵),i,j为两个不相同样本对象,N(i)为样本点i的邻居(可使用多种计算方式,本实施例中采用基于欧式距离的k-nn计算方法),即j属于i的最邻近k个样本点集合。
所得距离值即为新增样本对应节点与已知各节点之间边的权重,可形成权重矩阵
Figure BDA0002801067460000083
基于权重矩阵W(weight matrix:矩阵内元素值表示任意两个样本点之间边的权重,即两个样本对象的在当前特征维度下的近似程度),可构造对角矩阵(diagonal matrix:一个主对角线之外的元素皆为0的矩阵)
Figure BDA0002801067460000091
每一行对角元素值即为该行元素求和结果,进一步计算得到转移概率矩阵P(transitionmatrix:矩阵内元素均为非负,且各行元素之和为1,表示在一定条件下元素从某状态转移到另一个状态的概率)的表达式为:
Figure BDA0002801067460000092
其中,PLL,PLU,PUL,PUU为转移概率中对应标签样本对象、标签与无标签样本对象混合、无标签样本对象的子矩阵。
2,标签矩阵更新,具体包括:
原始样本标签F可表示为n×c矩阵
Figure BDA0002801067460000093
n为初始n个样本对象,c为标签个数,或可理解为c个故障大类,若已知某标签样本i属于类别c1,则标签矩阵对应赋值为
Figure BDA0002801067460000094
通过构造k-nn关系,可以得到用于表示状态转移的迁移矩阵P,并由此实现对于未标注的新增样本n+1的标签估计,即fn+1=Pn+1,1:n·F。
其中,Pn+1,1:n为上述转移概率矩阵第n+1行取值,F为上述标签矩阵,则fn+1表现为1×(n+1)的向量形式,即对于新增未标注样本对象n+1的标签估计;对于已标注样本,则保留其原有标签值不作更改。
3,有限标签传播,主要包括:
标签传播算法为增量标记子模块的核心算法,通过对满足影响显著性条件的未标注样本标签的局部更新,实现最小资源消耗下的类别标签扩散与传播。对于新增未标注样本n+1,在对其本身标签进行估计的基础上(若无标签类别信息),将该样本在k-nn关系中所有属于邻居节点且未标注的样本计入候选集合,对集合中任一样本对象k使用如下方式更新标签估计值:
Figure BDA0002801067460000095
其中,PUL(k)为转移概率子矩阵PUL第k行取值,FL为标注样本对象对应子标签矩阵,PUU(k)为转移概率子矩阵PUU第k行取值,FU为未标注样本对象对应子标签矩阵(初始为0矩阵)。
若该估计值与当前标签值之差的L1范数(L1 Norm:向量中各元素绝对值之和)大于阈值
Figure BDA0002801067460000096
则更新样本对象k对应标签值,同时将对象k作为新的扩散中心,将其周围满足条件的未标注样本点继续加入候选集合,重复以上步骤直至达到迭代步数或候选集合为空,得到标签值更新收敛结果。
为实现基于流式输入性能指标异常数据的故障跟因分类,本实施例基于增量标记算法的流式数据多分类框架,基于包括特征抽取及选择在内的可配置特征工程,以标签估计值偏离度为限制条件进行局部扩散更新,允许未标注样本对象根据输入动态更新标签类型,以较小计算代价实现可适应的多分类目标。
图3是根据本实施例的算法主流程图,如图3所示,包括:
S301,数据输入,以无线网络核心性能指标数据异常时刻为起始点,向前读取30天历史性能数据,并进行预处理后作为算法输入数据;
S302,对数据进行特征抽取,使用get_feature函数进行抽取函数配置,针对每个指标对象形成若干独立感知器;
S303,对所提取特征对象进行特征选择,在规模化特征数据中选择与标签相关性高的特征;
S304,数据标记,基于S303形成样本对象特征项集合X={X1,X2,...,Xn}及标签集合L,首先将初始化数据与增量数据分离,在增量数据中,将标记对象与未标记对象分离。进一步,对模型进行初始化,并将增量数据进行流式处理输入模型进行更新;
S305,获取未标记样本数据标签,即特定性能指标异常所对应故障大类。
图4是根据本实施例的特征抽取的流程图,如图4所示,包括:
S4201,数据输入,对性能指标时间序列数据进行采样粒度统一,作为算法输入;
S402,特征项选择,修改feature_list进行特征项配置,通过feature_mapping对特征算子进行定义,且算法根据特征项配置情况动态设定并行进程数,当前默认配置项为:
通过差分模型(Difference Model,简称为Diff)(last-day,last-week),具体如下:
Δf(xk)=f(xk)-f(xk-h);
Holt-Winters(α,β,γ={0.2,0.4,0.6,0.8});
Figure BDA0002801067460000101
Figure BDA0002801067460000102
bt=β*(lt-lt-1)+(1-β*)bt-1
Figure BDA0002801067460000103
使用水平分量lt平滑方程,趋势分量bt平滑方程,及季节性分量st平滑方程的乘法模型。
Historical average(window=1,2,3,4weeks),使用特定窗长的历史数据平均值作为特征值。
Historical median(window=1,2,3,4weeks),使用特定窗长的历史数据中值作为特征值。
可以通过时间序列分解(Time Series Decomposition,简称为TSD)(window=1,2,3,4weeks),如下:
yt=St*Tt*Rt
Figure BDA0002801067460000104
对时间序列分解后可以得到季节分量、趋势性分量及残差分量,特征项为各分量均值乘积(采用乘法分解方式)。
TSD median(window=1,2,3,4weeks),时间序列分解结果同上,特征项为各分量中值乘积(采用乘法分解方式)。
Wavelet(window=1,3,5,7days),对时间序列进行小波分解,得到高频信号部分,对各层高频信号建立自回归滑动平均模型(Autoregressive Moving Average Model,简称为ARMA)模型,以预测对应小波系数,最终使用小波系数重构数据获得特征值。共计7种通用预测模型,86种预测值类型。
S403,构造特征感知器,利用选择特征算子及对应参数构造特征感知器,形成对性能数据异常时刻的特征提取;
S404,获取特征数据。
图5是根据本实施例的特征选择的流程图,如图5所示,包括:
S501,特征数据输入,对特征工程获得特征数据作为算法输入;
S502,对特征数据进行转置运算,算法的目的是将特征数据转置,实现过程保持数据原有的分区,进而抑制数据散化,并通过数据池化降低计算成本;
S503,计算所有特征的相关性;
S504,初始化选定特征集合,根据S303中的特征相关性结果,初始化中间结果池并且创建特征的初始等级;
S505,判断选定特征是否满足中止条件,在判断结果为否的情况下,执行步骤S506,在判断结果为是的情况下,执行步骤S507,计算互信息和条件互信息值,并迭代更新中间结果池,直至满足中止条件跳转至S508;
S506,计算特征间的冗余性;
S507,更新选定特征集合;
S508,获取选定特征集和。
图6是根据本实施例的增量标记的流程图,如图6所示,包括:
S601,特征数据输入,将特征选择模块筛选所得特征集合作为算法输入,划分初始已标注样本集合作为训练数据进行模型初始化,其他数据进行流式输入;
S602,更新权重矩阵,对于新增样本n+1,利用特征向量与单位矩阵M计算与原样本集合中每个对象之间的权重计为w,生成权重矩阵W;
S603,更新迁移矩阵,计算更新对角矩阵D与迁移矩阵P为(n+1)×(n+1),其中使用二叉树结构对样本空间中的点进行排序,使得已标注样本排在未标注样本之前;
S604,更新标签矩阵,对新增样本n+1标签值进行估计;
S605,判断是否满足循环条件,在判断结果为是的情况下,执行步骤S606,否则执行步骤S608,对于未标注对象集合且属于当前节点邻居节点集合作为候选扩散集合,对于候选集合中的每个元素k,检验是否满足循环条件:1)候选扩散集合不为空,2)迭代次数小于阈值Tmax,若满足则结束迭代,跳转至S608,否则停留在循环中;
S606,标签传播,针对候选扩散集合中的每一个元素k,实施局部标签传播算法;
S607,计算更新标签矩阵的估计值;
S608,获取数据标签估计值。
图7是根据本实施例的标签传播的流程图,如图7所示,包括:
S701,候选集合数据输入,将候选标签扩散样本集合作为算法输入;
S702,判断候选集合是否为空,在判断结果为是的情况下,执行步骤S703,否则执行步骤S706,循环条件,判断候选是否不为空且迭代次数小于阈值Tmax,若满足,则执行循环,否则输出结果;
S703,计算标签更新影响因子,对于候选集合中每个样本对象i,得到其标签估计值与原始值偏差如下:
δfi=PUL(i)FL+PUU(i)FU-FU(i),其中,偏差绝对值即影响因子。
S704,评估标签更新影响因子,若S703所得的偏差绝对值大于特定阈值,则对样本对象i的标签值进行更新,并将该对象与影响因子值存储为集合A;
S705,更新候选集合,对于S504所获得集合A中的每一个对象j,获取未标注对象集合中且属于当前节点邻居节点加入候选扩散集合,并对对应标签值进行更新如下:
Figure BDA0002801067460000121
S706,获取标签更新值。
根据本发明的另一实施例,提供了一种数据标注处理装置,图8是根据本实施例的数据标注处理装置的框图,如图8所示,所述装置包括:
异常检测模块82,用于对性能指标数据进行异常检测,得到异常点组成的样本集合与所述样本集合对应的标签集合;
特征扩充模块84,用于对所述样本集合进行特征扩充,得到所述样本集合的特征向量与对应的标签值;
特征选择模块86,用于对所述特征向量进行特征选择,得到所述样本集合的目标特征向量;
第一标注模块88,用于根据所述样本集合的目标特征向量对新增样本进行增量标注。
在一可选的实施例中,所述第一标注模块88,还用于
在所述新增样本未标注的情况下,根据所述样本集合的目标特征向量与对应的标签集合对所述新增样本的标签进行标注。
在一可选的实施例中,所述第一标注模块88包括:
第一确定子模块,用于若所述新增样本中的部分或全部样本点与所述样本集合相邻,确定所述新增样本与所述样本集合的目标特征向量之间的距离;
第二确定子模块,用于确定所述距离为所述新增样本中的节点与所述样本集合中各节点之间边的权重,得到权重矩阵;
构建子模块,用于根据所述权重矩阵构建对角矩阵;
第三确定子模块,用于根据所述对角矩阵与所述权重矩阵确定转移概率矩阵;
标注子模块,用于根据所述转移概率矩阵对所述新增样本的标签进行标注。
在一可选的实施例中,所述第一确定子模块包括:
获取单元,用于获取所述新增样本中属于所述样本集合的邻近的样本点集合;
第一确定单元,用于确定所述样本点集合中所有样本点与所述样本集合的目标特征向量的距离;
第二确定单元,用于将所述样本点集合中所有样本点与所述样本集合的目标特征向量的距离确定为所述新增样本与所述样本集合的目标特征向量之间的距离。
在一可选的实施例中,所述构建子模块包括:
第三确定单元,用于分别确定所述权重矩阵中每行所有特征向量之和;
组合单元,用于将所述每行所有特征向量之和组合得到所述对角矩阵。
在一可选的实施例中,所述标注子模块包括:
获取单元,用于从所述转移概率矩阵中获取所述新增样本对应的行,且所述样本集合的目标特征向量对应列的取值,得到目标转移矩阵;
第四确定单元,用于将所述目标转移概率矩阵与所述样本集合对应的标签集合的乘积确定为所述新增样本的标签估计值;
标注单元,用于根据所述标签估计值对所述新增样本进行标注。
在一可选的实施例中,所述装置还包括:
添加模块,用于确定与所述新增样本相邻的未标注样本,将所述未标注样本添加到候选集合中;
第二标注模块,用于根据所述新增样本对所述候选集合中的未标注样本进行标注。
在一可选的实施例中,所述第二标注模块包括:
第四确定子模块,用于针对所述候选集合中的未标注样本,根据所述转移概率矩阵的子矩阵与所述样本集合标签矩阵的子矩阵确定所述未标注样本的标签估计值;
更新子模块,用于若所述标签估计值与所述候选集合中未标注样本的初始标签值的差值的L1范数大于预设阈值,根据所述标签估计值更新所述未标注样本的标签值,其中,所述初始标签值为0向量。
在一可选的实施例中,所述装置还包括:
确定模块,用于确定所述性能指标数据中的缺失值;
获取模块,用于获取与所述缺失值的采样时间对应的历史同时刻的一个数据或多个数据;
填充模块,用于根据所述一个数据或所述多个数据的均值填充所述缺失值。
在一可选的实施例中,所述特征扩充模块84,还用于
通过时间序列模型对所述性能指标数据进行特征扩充,得到所述性能指标数据的各原始值对应的预测值,其中,所述时间序列模型包括以下之一:差分模型、三阶指数平滑模型Holt-Winters、滑动平均模型、滑动中值模型、时间序列分解模型、时间序列分解中值模型、小波变换模型;
根据所述预测值确定所述特征向量与对应的标签值。
在一可选的实施例中,所述特征选择模块86,还用于
从所述特征向量中选取能够区分不同异常类型的特征项,得到所述样本集合的目标特征向量。
本发明的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种数据标注处理方法,其特征在于,所述方法包括:
对性能指标数据进行异常检测,得到异常点组成的样本集合与所述样本集合对应的标签集合;
对所述样本集合进行特征扩充,得到所述样本集合的特征向量与对应的标签值;
对所述特征向量进行特征选择,得到所述样本集合的目标特征向量;
根据所述样本集合的目标特征向量对新增样本进行标注。
2.根据权利要求1所述的方法,其特征在于,根据所述样本集合的目标特征向量对新增样本进行标注包括:
在所述新增样本未标注的情况下,根据所述样本集合的目标特征向量与对应的标签集合对所述新增样本的标签进行标注。
3.根据权利要求2所述的方法,其特征在于,根据所述样本集合的目标特征向量与对应的标签集合对所述新增样本的标签进行标注包括:
若所述新增样本中的部分或全部样本点与所述样本集合相邻,确定所述新增样本与所述样本集合的目标特征向量之间的距离;
确定所述距离为所述新增样本中的节点与所述样本集合中各节点之间边的权重,得到权重矩阵;
根据所述权重矩阵构建对角矩阵;
根据所述对角矩阵与所述权重矩阵确定转移概率矩阵;
根据所述转移概率矩阵对所述新增样本的标签进行标注。
4.根据权利要求3所述的方法,其特征在于,确定所述新增样本与所述样本集合的目标特征向量之间的距离包括:
获取所述新增样本中属于所述样本集合的邻近的样本点集合;
确定所述样本点集合中所有样本点与所述样本集合的目标特征向量的距离;
将所述样本点集合中所有样本点与所述样本集合的目标特征向量的距离确定为所述新增样本与所述样本集合的目标特征向量之间的距离。
5.根据权利要求3所述的方法,其特征在于,根据所述权重矩阵构建对角矩阵包括:
分别确定所述权重矩阵中每行所有特征向量之和;
将所述每行所有特征向量之和组合得到所述对角矩阵。
6.根据权利要求3所述的方法,其特征在于,根据所述转移概率矩阵对所述新增样本的标签进行标注包括:
从所述转移概率矩阵中获取所述新增样本对应的行,且所述样本集合的目标特征向量对应列的取值,得到目标转移矩阵;
将所述目标转移概率矩阵与所述样本集合对应的标签集合的乘积确定为所述新增样本的标签估计值;
根据所述标签估计值对所述新增样本进行标注。
7.根据权利要求3所述的方法,其特征在于,在根据所述样本集合的目标特征向量对新增样本进行标注之后,所述方法还包括:
确定与所述新增样本相邻的未标注样本,将所述未标注样本添加到候选集合中;
根据所述新增样本对所述候选集合中的未标注样本进行标注。
8.根据权利要求7所述的方法,其特征在于,根据所述新增样本对所述候选集合中的未标注样本进行标注包括:
针对所述候选集合中的未标注样本,根据所述转移概率矩阵的子矩阵与所述样本集合标签矩阵的子矩阵确定所述未标注样本的标签估计值;
若所述标签估计值与所述候选集合中未标注样本的初始标签值的差值的L1范数大于预设阈值,根据所述标签估计值更新所述未标注样本的标签值,其中,所述初始标签值为0向量。
9.根据权利要求1所述的方法,其特征在于,在对性能指标数据进行异常检测,得到异常点组成的样本集合与所述样本集合对应的标签集合之前,所述方法还包括:
确定所述性能指标数据中的缺失值;
获取与所述缺失值的采样时间对应的历史同时刻的一个数据或多个数据;
根据所述一个数据或所述多个数据的均值填充所述缺失值。
10.根据权利要求1至9中任一项所述的方法,其特征在于,所述对所述性能指标数据进行特征扩充,得到特征向量与对应的标签值包括:
通过时间序列模型对所述性能指标数据进行特征扩充,得到所述性能指标数据的各原始值对应的预测值,其中,所述时间序列模型包括以下之一:差分模型、三阶指数平滑模型Holt-Winters、滑动平均模型、滑动中值模型、时间序列分解模型、时间序列分解中值模型、小波变换模型;
根据所述预测值确定所述特征向量与对应的标签值。
11.根据权利要求1至9中任一项所述的方法,其特征在于,所述对所述特征向量进行特征选择,得到所述样本集合的目标特征向量包括:
从所述特征向量中选取能够区分不同异常类型的特征项,得到所述样本集合的目标特征向量。
12.一种数据标注处理装置,其特征在于,所述装置包括:
异常检测模块,用于对性能指标数据进行异常检测,得到异常点组成的样本集合与所述样本集合对应的标签集合;
特征扩充模块,用于对所述样本集合进行特征扩充,得到所述样本集合的特征向量与对应的标签值;
特征选择模块,用于对所述特征向量进行特征选择,得到所述样本集合的目标特征向量;
第一标注模块,用于根据所述样本集合的目标特征向量对新增样本进行增量标注。
13.一种计算机可读的存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至11任一项中所述的方法。
14.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至11任一项中所述的方法。
CN202011349875.4A 2020-11-26 2020-11-26 一种数据标注处理方法、装置、存储介质及电子装置 Pending CN114548195A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011349875.4A CN114548195A (zh) 2020-11-26 2020-11-26 一种数据标注处理方法、装置、存储介质及电子装置
PCT/CN2021/129871 WO2022111284A1 (zh) 2020-11-26 2021-11-10 一种数据标注处理方法、装置、存储介质及电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011349875.4A CN114548195A (zh) 2020-11-26 2020-11-26 一种数据标注处理方法、装置、存储介质及电子装置

Publications (1)

Publication Number Publication Date
CN114548195A true CN114548195A (zh) 2022-05-27

Family

ID=81668365

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011349875.4A Pending CN114548195A (zh) 2020-11-26 2020-11-26 一种数据标注处理方法、装置、存储介质及电子装置

Country Status (2)

Country Link
CN (1) CN114548195A (zh)
WO (1) WO2022111284A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117563144A (zh) * 2023-12-04 2024-02-20 惠州市凌盛医疗科技有限公司 一种红外治疗仪状况评估与剩余寿命预测方法及***

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116257800B (zh) * 2023-05-12 2023-08-25 智慧眼科技股份有限公司 一种训练样本的标注方法及***

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509969B (zh) * 2017-09-06 2021-11-09 腾讯科技(深圳)有限公司 数据标注方法及终端
US10771313B2 (en) * 2018-01-29 2020-09-08 Cisco Technology, Inc. Using random forests to generate rules for causation analysis of network anomalies
CN111224805A (zh) * 2018-11-26 2020-06-02 中兴通讯股份有限公司 一种网络故障根因检测方法、***及存储介质
CN111368890A (zh) * 2020-02-26 2020-07-03 珠海格力电器股份有限公司 故障检测方法及装置、信息物理融合***
CN111586728B (zh) * 2020-04-30 2022-08-09 南京邮电大学 一种面向小样本特征的异构无线网络故障检测与诊断方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117563144A (zh) * 2023-12-04 2024-02-20 惠州市凌盛医疗科技有限公司 一种红外治疗仪状况评估与剩余寿命预测方法及***
CN117563144B (zh) * 2023-12-04 2024-05-28 郭永强 一种红外治疗仪状况评估与剩余寿命预测方法及***

Also Published As

Publication number Publication date
WO2022111284A1 (zh) 2022-06-02

Similar Documents

Publication Publication Date Title
WO2019238109A1 (zh) 一种故障根因分析的方法及装置
CN111694879A (zh) 一种多元时间序列异常模式预测方法及数据采集监控装置
EP3968243A1 (en) Method and apparatus for realizing model training, and computer storage medium
CN114816909B (zh) 一种基于机器学习的实时日志检测预警方法及***
CN111079931A (zh) 一种基于图神经网络的状态空间概率性多时间序列预测方法
CN110335168B (zh) 基于gru优化用电信息采集终端故障预测模型的方法及***
CN115225536B (zh) 一种基于无监督学习的虚拟机异常检测方法及***
WO2022111284A1 (zh) 一种数据标注处理方法、装置、存储介质及电子装置
CN112217674B (zh) 基于因果网络挖掘和图注意力网络的告警根因识别方法
CN114024829B (zh) 电力通信网络的故障检修方法、装置、设备和存储介质
US20220284352A1 (en) Model update system, model update method, and related device
WO2023050534A1 (zh) 轨道交通站点设备能耗预测方法、装置、设备和存储介质
CN110781818B (zh) 视频分类方法、模型训练方法、装置及设备
WO2021204365A1 (en) Device and method for monitoring communication networks
CN113762595A (zh) 通行时间预测模型训练方法、通行时间预测方法及设备
CN105471647A (zh) 一种电力通信网故障定位方法
CN109993391B (zh) 网络运维任务工单的派发方法、装置、设备及介质
CN114065307A (zh) 一种基于双向图卷积神经网络的硬件木马检测方法与***
CN112769605A (zh) 一种异构多云的运维管理方法及混合云平台
CN113541986B (zh) 5g切片的故障预测方法、装置及计算设备
CN116248472A (zh) 基于神经霍克斯过程的云边端***故障预测方法
US20220292529A1 (en) Utilizing machine learning for optimization of planning and value realization for private networks
CN114913369A (zh) 基于知识推理的主动救援决策方法及装置
Kiavarz et al. A graph-based explanatory model for room-based energy efficiency analysis based on BIM data
CN115174421B (zh) 基于自监督解缠绕超图注意力的网络故障预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20220527