CN115130661A - 模型参数的优化方法、时序数据的异常检测方法及装置 - Google Patents

模型参数的优化方法、时序数据的异常检测方法及装置 Download PDF

Info

Publication number
CN115130661A
CN115130661A CN202210784623.7A CN202210784623A CN115130661A CN 115130661 A CN115130661 A CN 115130661A CN 202210784623 A CN202210784623 A CN 202210784623A CN 115130661 A CN115130661 A CN 115130661A
Authority
CN
China
Prior art keywords
domain
target domain
attribute
source domain
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210784623.7A
Other languages
English (en)
Inventor
何轶凡
卞亚涛
周水庚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202210784623.7A priority Critical patent/CN115130661A/zh
Publication of CN115130661A publication Critical patent/CN115130661A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种模型参数优化方法,可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。本申请包括:根据Ns个源域嵌入向量构建源域图神经网络;根对Ns个源域嵌入向量和源域检测网络的模型参数进行更新;根据源域样本数据和目标域样本数据生成属性相似度矩阵;根据属性相似度矩阵和更新后的Ns个源域嵌入向量,生成Nt个目标域嵌入向量;根据Nt个目标域嵌入向量构建目标域图神经网络;对Nt个目标域嵌入向量和目标域检测网络的模型参数进行更新。本申请还提供了时序数据的异常检测方法及装置。本申请能够协同源域属性实现对目标域数据异常检测性能的提升。此外,在源域检测网络的基础上进行更新,能够进一步提升针对目标域的检测性能。

Description

模型参数的优化方法、时序数据的异常检测方法及装置
技术领域
本申请涉及人工智能领域,尤其涉及一种模型参数的优化方法、时序数据的异常检测方法及装置。
背景技术
多元时间序列(multivariate time series,MTS)分析是指对多变量时间序列的研究。许多问题不仅是观察单个过程,而且是同时观察多个过程。在多元时序数据中,异常值通常较少,如果需要得到较好的异常标注,通常需要对***进行人为***异常,这会导致标注成本较高。因此,无监督多元时序异常检测是一个极具现实与研究意义的问题。
目前,提出一种图偏差网络(graph deviation networks,GDN)用于实现多元时序的异常检测。GDN中引入图的概念,以多元时序数据构造图结构,各属性为节点,通过计算属性间嵌入向量的相似度产生连接关系。其构造未来时刻数值的预测任务,并将预测值与真实值的误差作为异常分以判别异常。
发明人发现现有方案中至少存在如下问题,多元时序异常检测***通常会面临***升级或跨平台部署的情况,也就是会出现从源域向目标域迁移的需求。然而,多元时序***的升级过程通常会增加属性个数,这就导致了现有的方法无法直接使用源域训练好的模型直接应用于目标域,而需要在目标域上重新训练模型。针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种模型参数的优化方法、时序数据的异常检测方法及装置。本申请能够协同源域属性实现对目标域数据异常检测性能的提升。此外,在源域检测网络的基础上进行更新,能够进一步提升针对目标域的检测性能。
有鉴于此,本申请一方面提供一种模型参数的优化方法,包括:
获取源域样本数据以及目标域样本数据,其中,源域样本数据包括Ns个源域属性的时序数据,目标域样本数据包括Nt个目标域属性的时序数据,Ns与Nt均为大于1的整数;
根据Ns个源域属性所对应的Ns个源域嵌入向量,构建源域图神经网络,其中,源域嵌入向量与源域属性具有一一对应关系;
根据源域样本数据,对Ns个源域嵌入向量以及源域检测网络的模型参数进行更新,其中,源域检测网络包括源域图神经网络;
根据源域样本数据以及目标域样本数据,生成属性相似度矩阵,其中,属性相似度矩阵用于描述每个源域属性与每个目标域属性之间的相似度;
根据属性相似度矩阵以及更新后的Ns个源域嵌入向量,生成Nt个目标域嵌入向量,其中,目标域嵌入向量与目标域属性具有一一对应关系;
根据Nt个目标域嵌入向量,构建目标域图神经网络,其中,目标域图神经网络的模型参数采用源域图神经网络更新后的模型参数;
根据目标域样本数据,对Nt个目标域嵌入向量以及目标域检测网络的模型参数进行更新,其中,目标域检测网络包括目标域图神经网络。
本申请另一方面提供一种模型参数的优化方法,包括:
获取待检测数据,其中,待检测数据包括Nt个目标域属性的时序数据,每个目标域属性的时序数据包括T个时刻的数据,Nt与T均为大于1的整数;
基于待检测数据,通过目标域检测网络获取目标时刻所对应的Nt个预测数据值,其中,目标域检测网络为采用上述权利要求1至13中任一项方法训练得到的;
获取目标时刻所对应的Nt个实际数据值;
根据Nt个实际数据值以及Nt个预测数据值,计算得到目标时刻所对应的异常分值;
若目标时刻所对应的异常分值大于或等于异常分值阈值,则确定目标时刻为数据异常时刻。
本申请另一方面提供一种参数优化装置,包括:
获取模块,用于获取源域样本数据以及目标域样本数据,其中,源域样本数据包括Ns个源域属性的时序数据,目标域样本数据包括Nt个目标域属性的时序数据,Ns与Nt均为大于1的整数;
构建模块,用于根据Ns个源域属性所对应的Ns个源域嵌入向量,构建源域图神经网络,其中,源域嵌入向量与源域属性具有一一对应关系;
训练模块,用于根据源域样本数据,对Ns个源域嵌入向量以及源域检测网络的模型参数进行更新,其中,源域检测网络包括源域图神经网络;
生成模块,用于根据源域样本数据以及目标域样本数据,生成属性相似度矩阵,其中,属性相似度矩阵用于描述每个源域属性与每个目标域属性之间的相似度;
生成模块,还用于根据属性相似度矩阵以及更新后的Ns个源域嵌入向量,生成Nt个目标域嵌入向量,其中,目标域嵌入向量与目标域属性具有一一对应关系;
构建模块,还用于根据Nt个目标域嵌入向量,构建目标域图神经网络,其中,目标域图神经网络的模型参数采用源域图神经网络更新后的模型参数;
训练模块,还用于根据目标域样本数据,对Nt个目标域嵌入向量以及目标域检测网络的模型参数进行更新,其中,目标域检测网络包括目标域图神经网络。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
构建模块,具体用于针对每个源域属性,根据源域属性所对应的源域嵌入向量以及其余源域属性分别对应的源域嵌入向量,计算得到(Ns-1)个向量相似度,其中,其余源域属性为Ns个源域属性中除了源域属性之外剩余的(Ns-1)源域属性;
针对每个源域属性,从(Ns-1)个向量相似度中确定最大的Ks个向量相似度,其中,Ks为大于或等于1,且小于(Ns-1)的整数;
针对每个源域属性,根据最大的Ks个向量相似度,确定与源域属性具有连接关系的Ks个源域属性,其中,Ks个向量相似度中的向量相似度与Ks个源域属性中的源域属性具有一一对应关系;
根据每个源域属性以及与每个源域属性分别具有连接关系的Ks个源域属性,构建源域图结构,其中,源域图结构包括源域节点与源域连边,源域节点用于表征源域属性,源域连边用于表征不同源域属性之间具有连接关系;
根据源域图结构以及Ns个源域嵌入向量,构建源域图神经网络。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
构建模块,具体用于针对每个目标域属性,根据目标域属性所对应的目标域嵌入向量以及其余目标域属性分别对应的目标域嵌入向量,计算得到(Nt-1)个向量相似度,其中,其余目标域属性为Nt个目标域属性中除了目标域属性之外剩余的(Nt-1)目标域属性;
针对每个目标域属性,从(Nt-1)个向量相似度中确定最大的Kt个向量相似度,其中,Kt为大于或等于1,且小于(Nt-1)的整数;
针对每个目标域属性,根据最大的Kt个向量相似度,确定与目标域属性具有连接关系的Kt个目标域属性,其中,Kt个向量相似度中的向量相似度与Kt个目标域属性中的目标域属性具有一一对应关系;
根据每个目标域属性以及与每个目标域属性分别具有连接关系的Kt个目标域属性,构建目标域图结构,其中,目标域图结构包括目标域节点与目标域连边,目标域节点用于表征目标域属性,目标域连边用于表征不同目标域属性之间具有连接关系;
根据目标域图结构以及Nt个目标域嵌入向量,构建目标域图神经网络。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
训练模块,具体用于基于源域样本数据,通过源域图神经网络获取第一时刻所对应的Ns个源域聚合特征向量,其中,源域聚合特征向量与源域属性具有一一对应关系,源域图神经网络属于源域检测网络;
基于Ns个源域聚合特征向量以及Ns个源域嵌入向量,通过源域检测网络所包括的第一全连接层获取第一时刻所对应的Ns个源域预测数据值,其中,源域预测数据值与源域属性具有一一对应关系;
根据第一时刻所对应的Ns个源域预测数据值以及Ns个源域实际数据值,构建第一损失函数,其中,Ns个源域实际数据值来源于源域样本数据;
基于第一损失函数,对Ns个源域嵌入向量进行更新;
基于第一损失函数,对源域图神经网络的模型参数以及第一全连接层的模型参数进行更新。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
训练模块,具体用于从源域样本数据中获取Ns个源域时序数据,其中,源域时序数据与源域属性具有一一对应关系,每个源域时序数据包括从第二时刻至第三时刻的时序数据,第二时刻为出现在第一时刻之前的一个时刻,第三时刻为第一时刻相邻的前一时刻;
针对每个源域属性,根据源域图神经网络所对应的源域图结构,确定与源域属性具有连接关系的Ks个源域属性,其中,源域图神经网络属于源域检测网络,源域图结构包括源域节点与源域连边,源域节点用于表征源域属性,源域连边用于表征源域属性之间具有连接关系;
针对每个源域属性,根据源域图神经网络的模型参数、源域属性所对应的源域时序数据以及Ks个源域属性中每个源域属性所对应的源域时序数据,获取第一时刻的源域聚合特征向量。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
训练模块,具体用于从源域样本数据中获取Ns个源域时序数据,其中,源域时序数据与源域属性具有一一对应关系,每个源域时序数据包括从第二时刻至第三时刻的时序数据,第二时刻为出现在第一时刻之前的一个时刻,第三时刻为第一时刻相邻的前一时刻;
针对每个源域属性,根据源域图神经网络所对应的源域图结构,确定与源域属性具有连接关系的Ks个源域属性,其中,源域图神经网络属于源域检测网络,源域图结构包括源域节点与源域连边,源域节点用于表征源域属性,源域连边用于表征源域属性之间具有连接关系;
针对每个源域属性,获取源域属性与Ks个源域属性中每个源域属性之间的聚合注意力权重;
针对每个源域属性,根据源域图神经网络的模型参数、源域属性所对应的源域时序数据、源域属性所对应的聚合注意力权重、Ks个源域属性中每个源域属性所对应的源域时序数据以及Ks个源域属性中每个源域属性所对应的聚合注意力权重,获取第一时刻的源域聚合特征向量。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
训练模块,具体用于根据源域图神经网络的模型参数、源域属性所对应的源域时序数据以及源域嵌入向量,获取源域属性所对应的时序拼接向量;
根据源域图神经网络的模型参数、Ks个源域属性中每个源域属性所对应的源域时序数据以及源域嵌入向量,获取Ks个源域属性中每个源域属性所对应的时序拼接向量;
根据源域属性所对应的时序拼接向量,获取源域属性所对应的源域中间向量;
根据Ks个源域属性中每个源域属性所对应的时序拼接向量,获取Ks个源域属性中每个源域属性所对应的源域中间向量;
根据源域属性所对应的源域中间向量以及Ks个源域属性中每个源域属性所对应的源域中间向量,获取源域属性与Ks个源域属性中每个源域属性之间的聚合注意力权重。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
训练模块,具体用于基于目标域样本数据,通过目标域图神经网络获取第四时刻所对应的Nt个目标域聚合特征向量,其中,目标域聚合特征向量与目标域属性具有一一对应关系,目标域图神经网络属于目标域检测网络;
基于Nt个目标域聚合特征向量以及Nt个目标域嵌入向量,通过目标域检测网络所包括的第二全连接层获取第四时刻所对应的Nt个目标域预测数据值,其中,目标域预测数据值与目标域属性具有一一对应关系;
根据第四时刻所对应的Nt个目标域预测数据值以及Nt个目标域实际数据值,构建第二损失函数,其中,Nt个目标域实际数据值来源于目标域样本数据;
基于第二损失函数,对Nt个目标域嵌入向量进行更新;
基于第二损失函数,对目标域图神经网络的模型参数以及第二全连接层的模型参数进行更新。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
训练模块,具体用于从目标域样本数据中获取Nt个目标域时序数据,其中,目标域时序数据与目标域属性具有一一对应关系,每个目标域时序数据包括从第五时刻至第六时刻的时序数据,第五时刻为出现在第一时刻之前的一个时刻,第六时刻为第一时刻相邻的前一时刻;
针对每个目标域属性,根据目标域图神经网络所对应的目标域图结构,确定与目标域属性具有连接关系的Kt个目标域属性,其中,目标域图神经网络属于目标域检测网络,目标域图结构包括目标域节点与目标域连边,目标域节点用于表征目标域属性,目标域连边用于表征目标域属性之间具有连接关系;
针对每个目标域属性,根据目标域图神经网络的模型参数、目标域属性所对应的目标域时序数据以及Kt个目标域属性中每个目标域属性所对应的目标域时序数据,获取第四时刻的目标域聚合特征向量。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
训练模块,具体用于从目标域样本数据中获取Nt个目标域时序数据,其中,目标域时序数据与目标域属性具有一一对应关系,每个目标域时序数据包括从第五时刻至第六时刻的时序数据,第五时刻为出现在第四时刻之前的一个时刻,第六时刻为第四时刻相邻的前一时刻;
针对每个目标域属性,根据目标域图神经网络所对应的目标域图结构,确定与目标域属性具有连接关系的Kt个目标域属性,其中,目标域图神经网络属于目标域检测网络,目标域图结构包括目标域节点与目标域连边,目标域节点用于表征目标域属性,目标域连边用于表征目标域属性之间具有连接关系;
针对每个目标域属性,获取目标域属性与Kt个目标域属性中每个目标域属性之间的聚合注意力权重;
针对每个目标域属性,根据目标域图神经网络的模型参数、目标域属性所对应的目标域时序数据、目标域属性所对应的聚合注意力权重、Kt个目标域属性中每个目标域属性所对应的目标域时序数据以及Kt个目标域属性中每个目标域属性所对应的聚合注意力权重,获取第四时刻的目标域聚合特征向量。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
训练模块,具体用于根据目标域图神经网络的模型参数、目标域属性所对应的目标域时序数据以及目标域嵌入向量,获取目标域属性所对应的时序拼接向量;
根据目标域图神经网络的模型参数、Kt个目标域属性中每个目标域属性所对应的目标域时序数据以及目标域嵌入向量,获取Kt个目标域属性中每个目标域属性所对应的时序拼接向量;
根据目标域属性所对应的时序拼接向量,获取目标域属性所对应的目标域中间向量;
根据Kt个目标域属性中每个目标域属性所对应的时序拼接向量,获取Kt个目标域属性中每个目标域属性所对应的目标域中间向量;
根据目标域属性所对应的目标域中间向量以及Kt个目标域属性中每个目标域属性所对应的目标域中间向量,获取目标域属性与Kt个目标域属性中每个目标域属性之间的聚合注意力权重。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
生成模块,具体用于针对源域样本数据中每个源域属性所对应的时序数据,以及,目标域样本数据中每个目标域属性所对应的时序数据,根据源域属性所对应的时序数据以及目标域属性所对应的时序数据,计算得到源域属性与目标域属性之间的相似度;
生成模块,具体用于对属性相似度矩阵进行转置处理,得到转置后的属性相似度矩阵;
将转置后的属性相似度矩阵与更新后的Ns个源域嵌入向量进行相乘,得到Nt个目标域嵌入向量。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
生成模块,具体用于若源域属性所对应的时序数据大于或等于目标域属性所对应的时序数据,则根据目标域属性所对应的时序数据生成第一滑动窗口,其中,第一滑动窗口为Tt,Tt为大于1的整数;
基于第一滑动窗口,在源域属性所对应的时序数据中以第一预设步长进行滑动,得到P个第一子时序数据,其中,P为大于或等于1的整数;
计算目标域属性所对应的时序数据与每个第一子时序数据之间的相似度,得到P个序列相似度;
对P个序列相似度求平均,得到源域属性与目标域属性之间的相似度;
或者,
生成模块,具体用于若目标域属性所对应的时序数据大于或等于源域属性所对应的时序数据,则根据源域属性所对应的时序数据生成第二滑动窗口,其中,第二滑动窗口为Ts,Ts为大于1的整数;
基于第二滑动窗口,在目标域属性所对应的时序数据中以第二预设步长进行滑动,得到Q个第二子时序数据,其中,Q为大于或等于1的整数;
计算源域属性所对应的时序数据与每个第二子时序数据之间的相似度,得到Q个序列相似度;
对Q个序列相似度求平均,得到源域属性与目标域属性之间的相似度。
本申请另一方面提供一种异常检测装置,包括:
获取模块,用于获取待检测数据,其中,待检测数据包括Nt个目标域属性的时序数据,每个目标域属性的时序数据包括T个时刻的数据,Nt与T均为大于1的整数;
获取模块,还用于基于待检测数据,通过目标域检测网络获取目标时刻所对应的Nt个预测数据值,其中,目标域检测网络为采用上述权利要求1至13中任一项方法训练得到的;
获取模块,还用于获取目标时刻所对应的Nt个实际数据值;
确定模块,用于根据Nt个实际数据值以及Nt个预测数据值,计算得到目标时刻所对应的异常分值;
确定模块,还用于若目标时刻所对应的异常分值大于或等于异常分值阈值,则确定目标时刻为数据异常时刻。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,
确定模块,具体用于针对每个目标域属性,计算目标域属性所对应的均值以及方差;
针对每个目标域属性,计算目标域属性所对应的预测数据值以及实际数据值之间差值的绝对值,得到目标域属性所对应的第一数据值;
针对每个目标域属性,对目标域属性所对应的第一数据值与目标域属性所对应的均值进行求差,得到目标域属性所对应的第二数据值;
针对每个目标域属性,对目标域属性所对应的第二数据值与目标域属性所对应的方差求商,得到目标域属性所对应的第三数据值;
从每个目标域属性所对应的第三数据值中选择最大值作为目标时刻所对应的异常分值。
本申请另一方面提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述各方面的方法。
本申请的另一方面提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方面的方法。
本申请的另一个方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方面的方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请实施例中,提供了一种模型参数的优化方法,首先,获取源域样本数据以及目标域样本数据,基于此,根据Ns个源域属性所对应的Ns个源域嵌入向量,构建源域图神经网络。此外,可根据源域样本数据以及目标域样本数据,生成属性相似度矩阵,基于此,根据属性相似度矩阵以及更新后的Ns个源域嵌入向量,生成Nt个目标域嵌入向量。于是,可根据Nt个目标域嵌入向量,构建目标域图神经网络。最后,根据目标域样本数据,对Nt个目标域嵌入向量以及目标域检测网络的模型参数进行更新。通过上述方式,基于图神经网络构建域内属性联系,并基于属性相似度矩阵构建跨域属性之间的联系,由此,协同源域属性实现对目标域数据异常检测性能的提升。此外,源域中通常会包含一些对于目标域异常检测优异的数据特性,因此,在源域检测网络的基础上进行更新,能够进一步提升针对目标域的检测性能。
附图说明
图1为本申请实施例中异常检测***的一个架构示意图;
图2为本申请实施例中基于游戏业务实现多元时序异常检测的一个场景示意图;
图3为本申请实施例中基于车端业务实现多元时序异常检测的一个场景示意图;
图4为本申请实施例中基于网络业务实现多元时序异常检测的一个场景示意图;
图5为本申请实施例中基于气象业务实现多元时序异常检测的一个场景示意图;
图6为本申请实施例中模型参数优化方法的一个流程示意图;
图7为本申请实施例中模型参数优化方法的一个***框架图;
图8为本申请实施例中基于源域图神经网络实现自监督预测的一个示意图;
图9为本申请实施例中基于目标域图神经网络实现自监督预测的一个示意图;
图10为本申请实施例中时序数据异常检测方法的一个流程示意图;
图11为本申请实施例中时序数据异常检测方法的一个***框架图;
图12为本申请实施例中参数优化装置的一个示意图;
图13为本申请实施例中异常检测装置的一个示意图;
图14为本申请实施例中计算机设备的一个结构示意图。
具体实施方式
本申请实施例提供了一种模型参数的优化方法、时序数据的异常检测方法及装置。本申请能够协同源域属性实现对目标域数据异常检测性能的提升。此外,在源域检测网络的基础上进行更新,能够进一步提升针对目标域的检测性能。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“对应于”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
时序数据,也称时间序列数据,是针对同一业务按照时间顺序记录的数据集合。即,在时序数据中数据值与时间一一对应,时序数据可以用来描述某一业务随时间的变化趋势。目前时序数据已被应用在多个领域,例如,游戏领域、工业生产领域、农业生产领域、气象领域、经济学领域等。
时序数据在机器学习中也起到的重要的作用,利用时序数据进行机器学习,能够预测在未来某个时刻的数据变化情况。机器学习(machine learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。ML是人工智能(artificial intelligence,AI)的核心,是使计算机具有智能的根本途径,其应用遍及AI的各个领域。ML和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。
可以理解的是,现实中的***通常以连续的方式工作,并产生相应的多元时序数据,因此,从长时间的监测数据中自动化检测出异常值能保证***的安全,避免大量的财产损失。在多元时序数据中,异常值通常较少,且异常标签由于标注成本较高难以获取,因此无监督多元时序异常检测是一个极具现实与研究意义的问题。多元时序异常检测***通常会面临***升级或跨平台部署的情况,也就出现了从源域向目标域迁移的需求。然而,多元时序***的升级过程通常会增加属性个数,这就导致了难以直接使用源域训练好的模型应用于目标域。此外,源域中通常会包含一些对于目标域异常检测优异的数据特性,从零重新训练模型无法协同源域数据以提升目标域的检测性能。
基于此,本申请提出了一种基于自适应的无监督多元时序异常检测方法,通过图神经网络构建域内属性联系,通过滑动匹配相似度构建跨域属性联系,协同源域属性实现对目标域数据异常检测性能的提升。本申请提供的方法可应用于图1所示的异常检测***,如图所示,异常检测***包括服务器和终端设备,且客户端部署于终端设备上,其中,客户端可以通过浏览器的形式运行于终端设备上,也可以通过独立的应用程序(application,APP)的形式运行于终端设备上等,对于客户端的具体展现形式,此处不做限定。本申请涉及的服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备可以是手机、电脑、智能语音交互设备、智能家电、车载终端、飞行器等。终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。服务器和终端设备的数量也不做限制。本申请提供的方案可以由终端设备独立完成,也可以由服务器独立完成,还可以由终端设备与服务器配合完成,对此,本申请并不做具体限定。本申请实施例可应用于各种场景,包括但不限于云技术、AI、智慧交通、辅助驾驶等。
可以理解的是,现实中的***通常以连续的方式工作,并产生相应的多元时序数据。在上述***中,从长时间的时序数据中自动化检测出异常值,能够保证***的安全,避免大量的财产损失。下面将结合图1和若干个应用场景,对本申请提供的多元时序异常检测方法进行介绍。
场景一:游戏业务异常检测;
示例性地,请参阅图2,图2为本申请实施例中基于游戏业务实现多元时序异常检测的一个场景示意图,如图所示,以多人在线战术竞技(multiplayer online battlearena,MOBA)游戏为例,终端设备可以采集玩家每帧画面的数据,以记录移动速度和移动距离对应的时序数据。一种情况下,调用终端设备本地的目标域检测网络对这些时序数据进行检测,另一种情况下,终端设备可将这些时序数据推送至服务器,由服务器调用目标域检测网络对这些时序数据进行检测。如果检测游戏异常,则会显示相应的提示消息。
场景二:自动驾驶异常检测;
示例性地,请参阅图3,图3为本申请实施例中基于车端业务实现多元时序异常检测的一个场景示意图,如图所示,通过车载***记录车辆行驶的速度序列数据、加速度序列数据以及方向序列数据等。一种情况下,调用车载***本地的目标域检测网络对这些时序数据进行检测,另一种情况下,车载***可将这些时序数据推送至服务器,由服务器调用目标域检测网络对这些时序数据进行检测。如果检测行驶异常,则会及时给驾驶者提示。
场景三:网络异常检测;
示例性地,请参阅图4,图4为本申请实施例中基于网络业务实现多元时序异常检测的一个场景示意图,如图所示,服务器可获取局域网内各个终端设备在一段时间的连接时长序列、传输字节数据序列以及连接类型数据序列。于是,服务器调用目标域检测网络对这些时序数据进行检测。如果检测网络连接异常,则可以给用户相应的提示。
场景四:气象异常检测;
示例性地,请参阅图5,图5为本申请实施例中基于气象业务实现多元时序异常检测的一个场景示意图,如图所示,通过温度计采集一段时间内的气温数据序列,通过湿度计采集一段时间内的湿度数据序列,通过气压计采集一段时间内的气压数据序列。一种情况下,调用终端设备本地的目标域检测网络对这些时序数据进行检测,另一种情况下,调用服务器本地的目标域检测网络对这些时序数据进行检测。如果检测行驶异常,则会及时生成相应的播报。
鉴于本申请涉及到一些与专业领域相关的术语,为了便于理解,下面将进行解释。
(1)多元时序(multivariate time series,MTS):表示每一时刻包含多个属性特征的时序数据。
(2)无监督异常检测(anomaly detection,AD):给定一组无标签数据,分析数据特性,从数据中挑选出偏离整体数据分布的样本点。
(3)域内:对于两个不同的多元时序***A和多元时序***B,若多元时序***A包含属性a1、属性a2和属性a3,多元时序***B包含属性b1、属性b2和属性b3,则属性a1、属性a2和属性a3属于一个域内,属性b1、属性b2和属性b3属于另一个域内。
(4)跨域:对于两个不同的多元时序***A和多元时序***B,若多元时序***A包含属性a1、属性a2和属性a3,多元时序***B包含属性b1、属性b2和属性b3,则属性a1与属性b1属于跨域关系。
(5)源域和目标域:对于两个不同的多元时序***A和多元时序***B,利用多元时序***A的数据集协助以提升在多元时序***B上的异常检测性能,由于目的是提升多元时序***B的性能,因此,多元时序***B为目标域,而多元时序***A为目标域提供了额外的数据源,因此,多元时序***A为源域。
结合上述介绍,下面将对本申请中模型参数的优化方法进行介绍,请参阅图6,本申请实施例中模型参数的优化方法可以由计算机设备执行,该计算机设备可以是终端设备或服务器,本申请实施例包括:
210、获取源域样本数据以及目标域样本数据,其中,源域样本数据包括Ns个源域属性的时序数据,目标域样本数据包括Nt个目标域属性的时序数据,Ns与Nt均为大于1的整数;
在一个或多个实施例中,获取源域样本数据以及目标域样本数据。为了便于理解,请参阅图7,图7为本申请实施例中模型参数优化方法的一个***框架图,如图所示,源域样本数据包括Ns个源域属性的时序数据,目标域样本数据包括Nt个目标域属性的时序数据,Ns与Nt均为大于1的整数,且,Ns与Nt不一定取值相同。
220、根据Ns个源域属性所对应的Ns个源域嵌入向量,构建源域图神经网络,其中,源域嵌入向量与源域属性具有一一对应关系;
在一个或多个实施例中,在多元时序数据中,各个属性之间可能以复杂的方式相互关联。因此,本申请利用可训练的多维嵌入向量来表征各个属性,并依此捕捉各属性间的相互关系。对于包含N个属性的多元时序数据,为每个属性关联一个嵌入向量表征其特性。
具体地,下面将再次结合图7进行介绍,对于包含Ns个源域属性的多元时序数据,每个源域属性关联的一个源域嵌入向量表示为:
Figure BDA0003731451610000111
其中,vi表示第i个源域属性对应的源域嵌入向量。
源域嵌入向量随机初始化,并随着模型的训练而迭代更新。源域嵌入向量包含了源域属性的特性,可以为后续图结构学习提供基础。基于此,根据源域嵌入向量之间的相似度来衡量源域属性之间的相似度,将源域属性之间的相似度作为源域图神经网络聚合各个邻居数值的依据。
230、根据源域样本数据,对Ns个源域嵌入向量以及源域检测网络的模型参数进行更新,其中,源域检测网络包括源域图神经网络;
在一个或多个实施例中,为了便于理解,请再次参阅图7,可从源域样本数据获取时长为L(例如,从0时刻到L时刻)的多元时序数据(即,Ns个源域时序数据),并获取第(L+1)时刻的多元时序数据(即,Ns个源域实际数据值)。
具体地,将时长为L的Ns个源域时序数据作为源域检测网络的输入,通过源域检测网络输出第(L+1)时刻的Ns个源域预测数据值。基于此,根据Ns个源域预测数据值以及Ns个源域实际数据值之间的损失,对Ns个源域嵌入向量进行更新,并且对源域检测网络的模型参数进行更新。
240、根据源域样本数据以及目标域样本数据,生成属性相似度矩阵,其中,属性相似度矩阵用于描述每个源域属性与每个目标域属性之间的相似度;
在一个或多个实施例中,结合源域样本数据以及目标域样本数据,可计算出每个源域属性与每个目标域属性之间的相似度,从而得到一个Ns×Nt的相似度矩阵。
需要说明的是,可采用滑动窗口的方式计算相似度,其中,滑动窗口相似度的计算方式简单,复杂度较低,适用于较长的时序数据。或者,也可以采用动态时间规整(dynamictime warping,DTW)的方式计算相似度,其中,DTW适用于时序数据较短的时序数据。
250、根据属性相似度矩阵以及更新后的Ns个源域嵌入向量,生成Nt个目标域嵌入向量,其中,目标域嵌入向量与目标域属性具有一一对应关系;
在一个或多个实施例中,在得到属性相似度矩阵之后,利用属性相似度矩阵与经过步骤230更新后的Ns个源域嵌入向量之间的乘积,可计算出Nt个目标域嵌入向量。其中,Ns个源域嵌入向量即为一个源域嵌入矩阵,而Nt个目标域嵌入向量即为一个目标域嵌入矩阵。基于此,可采用如下方式计算目标域嵌入矩阵:
Vt=Vs×MT;式(2)
其中,Vt表示目标域嵌入矩阵。Vs表示源域嵌入矩阵,即,包括Ns个源域嵌入向量。M表示属性相似度矩阵,且,
Figure BDA0003731451610000112
(·)T表示转置。
260、根据Nt个目标域嵌入向量,构建目标域图神经网络,其中,目标域图神经网络的模型参数采用源域图神经网络更新后的模型参数;
在一个或多个实施例中,目标域嵌入向量也会随着模型的训练而迭代更新。目标域嵌入向量包含了目标域属性的特性,可以为后续图结构学习提供基础。基于此,可根据目标域嵌入向量之间的相似度来衡量目标域属性之间的相似度,将目标域属性之间的相似度作为目标域图神经网络聚合各个邻居数值的依据。
具体地,目标域图神经网络的模型参数采用源域图神经网络更新后的模型参数,即,继承源域图神经网络的神经网络聚合参数W。由此,实现了跨域数据的信息互动,使得目标域图神经网络能继承源域图神经网络已学习的属性间关联,且能在目标域样本数据上进行微调,以持续提高模型的异常检测能力。
270、根据目标域样本数据,对Nt个目标域嵌入向量以及目标域检测网络的模型参数进行更新,其中,目标域检测网络包括目标域图神经网络。
在一个或多个实施例中,为了便于理解,请再次参阅图7,可从目标域样本数据获取时长为L(例如,从0时刻到L时刻)的多元时序数据(即,Nt个目标域时序数据),并获取第(L+1)时刻的多元时序数据(即,Nt个目标域实际数据值)
具体地,将时长为L的Nt个目标域时序数据作为目标域检测网络的输入,通过目标域检测网络输出第(L+1)时刻的Nt个目标域预测数据值。基于此,根据Nt个目标域预测数据值以及Nt个目标域实际数据值之间的损失,对Nt个目标域嵌入向量进行更新,并且对目标域检测网络的模型参进行更新。
在源域中,输入是源域样本数据,经过属性嵌入和图结构学习构建以属性为节点的图神经网络,并通过未来时刻属性预测自监督任务训练源域检测网络,最后以预测误差作为异常分判别异常点。在目标域中,输入是源域样本数据、目标域样本数据、Ns个源域嵌入向量以及源域图神经网络的模型参数。由此,根据相似度计算方法获取源域属性与目标域属性间关联,结合Ns个源域嵌入向量进行目标域嵌入向量的初始化以及图结构学习。同时,本申请使用源域图神经网络的模型参数初始化目标域图神经网络,并在目标域样本数据上进行自监督预测任务进一步训练模型,最后,同样通过预测误差进行目标域的多元时序数据异常检测。
本申请实施例中,提供了一种模型参数的优化方法。通过上述方式,基于图神经网络构建域内属性联系,并基于属性相似度矩阵构建跨域属性之间的联系,由此,协同源域属性实现对目标域数据异常检测性能的提升。此外,源域中通常会包含一些对于目标域异常检测优异的数据特性,因此,在源域检测网络的基础上进行更新,能够进一步提升针对目标域的检测性能。
可选地,在上述图6对应的各个实施例的基础上,本申请实施例提供的另一个可选实施例中,根据Ns个源域属性所对应的Ns个源域嵌入向量,构建源域图神经网络,具体可以包括:
针对每个源域属性,根据源域属性所对应的源域嵌入向量以及其余源域属性分别对应的源域嵌入向量,计算得到(Ns-1)个向量相似度,其中,其余源域属性为Ns个源域属性中除了源域属性之外剩余的(Ns-1)源域属性;
针对每个源域属性,从(Ns-1)个向量相似度中确定最大的Ks个向量相似度,其中,Ks为大于或等于1,且小于(Ns-1)的整数;
针对每个源域属性,根据最大的Ks个向量相似度,确定与源域属性具有连接关系的Ks个源域属性,其中,Ks个向量相似度中的向量相似度与Ks个源域属性中的源域属性具有一一对应关系;
根据每个源域属性以及与每个源域属性分别具有连接关系的Ks个源域属性,构建源域图结构,其中,源域图结构包括源域节点与源域连边,源域节点用于表征源域属性,源域连边用于表征不同源域属性之间具有连接关系;
根据源域图结构以及Ns个源域嵌入向量,构建源域图神经网络。
在一个或多个实施例中,介绍了一种构建源域图神经网络的方式。由前述实施例可知,本申请需要利用图神经网络抽取时序数据特征,然而,现实应用中,源域属性之间的相互关系以及图中节点的连接关系通常并没有给定。因此,需要通过计算源域属性相似度求得节点间关联以构造源域图神经网络。
具体地,对于第i个源域属性而言,其可能与除它自身以外的所有源域属性相关联。第i个源域属性的其余源域属性可以表示为一个关联候选集,即,
Figure BDA0003731451610000131
于是,可采用如下方式计算第i个源域属性的源域嵌入向量与关联候选集中每个源域嵌入向量之间的向量相似度,并选择向量相似度较大的前Ks个源域属性构建联系:
Figure BDA0003731451610000132
如果
Figure BDA0003731451610000133
则Aij=1;式(4)
其中,e表示相似度矩阵。eij表示第i个源域属性的源域嵌入向量与第j个源域属性的源域嵌入向量之间的向量相似度。A表示属性联通矩阵。Aij表示第i个源域属性与第j个源域属性之间具有连接关系,即,建立两者之间的源域连边。TopKs表示从关联候选集中选择向量相似度最大的Ks个源域属性的操作。Ks表示预先设定的参数。vi表示第i个源域属性对应的源域嵌入向量。vj表示第j个源域属性对应的源域嵌入向量。(·)T表示转置。
至此,根据每个源域属性以及与每个源域属性分别具有连接关系的Ks个源域属性,即可构建源域图神经网络。其中,源域图结构包括源域节点与源域连边,一个源域节点表示一个源域属性,源域连边用于表征不同源域属性之间具有连接关系。
其次,本申请实施例中,提供了一种构建源域图神经网络的方式。通过上述方式,利用源域嵌入向量之间的相似度,可联通相似度较大的源域属性,使得源域图神经网络中节点之间的连接关系更准确。
可选地,在上述图6对应的各个实施例的基础上,本申请实施例提供的另一个可选实施例中,根据Nt个目标域嵌入向量,构建目标域图神经网络,具体可以包括:
针对每个目标域属性,根据目标域属性所对应的目标域嵌入向量以及其余目标域属性分别对应的目标域嵌入向量,计算得到(Nt-1)个向量相似度,其中,其余目标域属性为Nt个目标域属性中除了目标域属性之外剩余的(Nt-1)目标域属性;
针对每个目标域属性,从(Nt-1)个向量相似度中确定最大的Kt个向量相似度,其中,Kt为大于或等于1,且小于(Nt-1)的整数;
针对每个目标域属性,根据最大的Kt个向量相似度,确定与目标域属性具有连接关系的Kt个目标域属性,其中,Kt个向量相似度中的向量相似度与Kt个目标域属性中的目标域属性具有一一对应关系;
根据每个目标域属性以及与每个目标域属性分别具有连接关系的Kt个目标域属性,构建目标域图结构,其中,目标域图结构包括目标域节点与目标域连边,目标域节点用于表征目标域属性,目标域连边用于表征不同目标域属性之间具有连接关系;
根据目标域图结构以及Nt个目标域嵌入向量,构建目标域图神经网络。
在一个或多个实施例中,介绍了一种构建目标域图神经网络的方式。由前述实施例可知,本申请需要利用图神经网络抽取时序数据特征,然而,现实应用中,目标域属性之间的相互关系以及图中节点的连接关系通常并没有给定。因此,需要通过计算目标域属性相似度求得节点间关联以构造目标域图神经网络。
具体地,对于第i个目标域属性而言,其可能与除它自身以外的所有目标域属性相关联。第i个目标域属性的其余目标域属性可以表示为一个关联候选集,即,
Figure BDA0003731451610000141
Figure BDA0003731451610000142
于是,可采用如下方式计算第i个目标域属性的目标域嵌入向量与关联候选集中每个目标域嵌入向量之间的向量相似度,并选择向量相似度较大的前Kt个目标域属性构建联系:
Figure BDA0003731451610000143
如果
Figure BDA0003731451610000144
则Aij=1;式(6)
其中,e表示相似度矩阵。eij表示第i个目标域属性的目标域嵌入向量与第j个目标域属性的目标域嵌入向量之间的向量相似度。A表示属性联通矩阵。Aij表示第i个目标域属性与第j个目标域属性之间具有连接关系,即,建立两者之间的目标域连边。TopKt表示从关联候选集中选择向量相似度最大的Kt个目标域属性的操作。Ks表示预先设定的参数。vi表示第i个目标域属性对应的目标域嵌入向量。vj表示第j个目标域属性对应的目标域嵌入向量。(·)T表示转置。
至此,根据每个目标域属性以及与每个目标域属性分别具有连接关系的Kt个目标域属性,即可构建目标域图神经网络。其中,目标域图结构包括目标域节点与目标域连边,一个目标域节点表示一个目标域属性,目标域连边用于表征不同目标域属性之间具有连接关系。
其次,本申请实施例中,提供了一种构建目标域图神经网络的方式。通过上述方式,利用目标域嵌入向量之间的相似度,可联通相似度较大的目标域属性,使得目标域图神经网络中节点之间的连接关系更准确。
可选地,在上述图6对应的各个实施例的基础上,本申请实施例提供的另一个可选实施例中,根据源域样本数据,对Ns个源域嵌入向量以及源域检测网络的模型参数进行更新,具体可以包括:
基于源域样本数据,通过源域图神经网络获取第一时刻所对应的Ns个源域聚合特征向量,其中,源域聚合特征向量与源域属性具有一一对应关系,源域图神经网络属于源域检测网络;
基于Ns个源域聚合特征向量以及Ns个源域嵌入向量,通过源域检测网络所包括的第一全连接层获取第一时刻所对应的Ns个源域预测数据值,其中,源域预测数据值与源域属性具有一一对应关系;
根据第一时刻所对应的Ns个源域预测数据值以及Ns个源域实际数据值,构建第一损失函数,其中,Ns个源域实际数据值来源于源域样本数据;
基于第一损失函数,对Ns个源域嵌入向量进行更新;
基于第一损失函数,对源域图神经网络的模型参数以及第一全连接层的模型参数进行更新。
在一个或多个实施例中,介绍了一种基于自监督预测任务训练神经网络的方式。由前述实施例可知,源域检测网络包括源域图神经网络以及第一全连接(fullyconnected,FC)层,通过源域检测网络获取在第一时刻的Ns个源域聚合特征向量,然后,将Ns个源域聚合特征向量作为第一FC层的输入,通过第一FC层输出Ns个源域预测数据值。
具体地,假设Ns个源域属性包括“温度属性”、“湿度属性”和“气压属性”。将一段时间内采集到这些属性对应的时序数据作为源域检测网络的输入,通过源域检测网络输出下一个时刻的Ns个源域预测数据值,例如,Ns个源域预测数据值包括温度数值“25”25,湿度数值“0.75”,以及气压数值“1200”。可通过如下方式预测第t时刻(即,第一时刻)的Ns个源域预测数据值:
Figure BDA0003731451610000151
其中,
Figure BDA0003731451610000152
表示第t时刻(即,第一时刻)的Ns个源域预测数据值。
Figure BDA0003731451610000153
表示Ns个源域聚合特征向量。{v1,v2,...,vNs}表示Ns个源域嵌入向量。⊙表示向量内积。fθs表示第一FC层的可训练网络参数。
基于此,根据第t时刻(即,第一时刻)所对应的Ns个源域预测数据值以及Ns个源域实际数据值,构建第一损失函数,以第一损失函数为均方误差(Mean Square Error,MSE)为例,即,第一损失函数表示为:
Figure BDA0003731451610000154
其中,LMSE表示第一损失函数。
Figure BDA0003731451610000155
表示第t时刻的Ns个源域预测数据值。
Figure BDA0003731451610000156
表示第t时刻的Ns个源域实际数据值。
Figure BDA0003731451610000157
中上面的“2”表示平方,下面的“2”表示矩阵的l2范数。Ds表示源域样本总数据集。|Ds|表示源域样本数据个数。
由此,以最小化第一损失函数为目标,对Ns个源域嵌入向量进行更新,并且,对源域图神经网络的模型参数以及第一FC层的模型参数进行更新。
需要说明的是,第一损失函数可以采用MSE损失函数,或者,可以采用平均绝对误差(mean absolute error,MAE)损失函数,或者,采用均方根误差(root mean squareerror,RMSE)损失函数,或者,采用其他类型的损失函数,此处不做限定。
其次,本申请实施例中,提供了一种基于自监督预测任务训练神经网络的方式。通过上述方式,根据源域实际数据值与源域预测数据值之间的误差,训练源域图神经网络的模型参数以及第一FC层的模型参数。一方面,能够优化源域检测网络在预测任务上的性能,另一方面,利用源域图神经网络能够更好的抽取多元数据中各个源域属性之间的相互关系,为精准的异常检测提供了丰富的信息。
可选地,在上述图6对应的各个实施例的基础上,本申请实施例提供的另一个可选实施例中,基于源域样本数据,通过源域图神经网络获取第一时刻所对应的Ns个源域聚合特征向量,具体可以包括:
从源域样本数据中获取Ns个源域时序数据,其中,源域时序数据与源域属性具有一一对应关系,每个源域时序数据包括从第二时刻至第三时刻的时序数据,第二时刻为出现在第一时刻之前的一个时刻,第三时刻为第一时刻相邻的前一时刻;
针对每个源域属性,根据源域图神经网络所对应的源域图结构,确定与源域属性具有连接关系的Ks个源域属性,其中,源域图神经网络属于源域检测网络,源域图结构包括源域节点与源域连边,源域节点用于表征源域属性,源域连边用于表征源域属性之间具有连接关系;
针对每个源域属性,根据源域图神经网络的模型参数、源域属性所对应的源域时序数据以及Ks个源域属性中每个源域属性所对应的源域时序数据,获取第一时刻的源域聚合特征向量。
在一个或多个实施例中,介绍了一种基于图神经网络(graph neural network,GNN)获取源域预测数据值的方式。由前述实施例可知,源域样本数据包括一段时间内的Ns个源域时序数据,其中,每个源域时序数据即为一个源域属性所对应的时序数据。基于此,可从源域样本数据中提取连续时长的Ns个源域时序数据,用于预测下一个时刻的Ns个源域预测数据值。由于本申请适用于无监督异常检测,即无法获取时序数据的异常标签用以训练模型,因此,可采用未来时刻的Ns个源域实际数据值Ns个源域预测数据值来训练模型。
具体地,为了便于理解,请参阅图8,图8为本申请实施例中基于源域图神经网络实现自监督预测的一个示意图,如图所示,对于每个时刻t,长度为L的多元时序序列可表示为
Figure BDA0003731451610000161
即,xt=[xt-L,xt-L+1,...,xt-1]。其中,以待预测的第t个时刻作为“第一时刻”,以第(t-L)个时刻为“第二时刻”,第(t-1)个时刻作为“第三时刻”。基于此,可采用如下方式计算第i个源域属性在第一时刻的源域聚合特征向量:
Figure BDA0003731451610000162
其中,
Figure BDA0003731451610000163
表示第i个源域属性在第一时刻的源域聚合特征向量。
Figure BDA0003731451610000164
表示第i个源域属性的所对应的源域时序数据。
Figure BDA0003731451610000165
表示第j个源域属性的所对应的源域时序数据。N(i)={j|Aij=1}表示与第i个源域属性具有连接关系的Ks个源域属性。W表示神经网络聚合参数,即,源域图神经网络的模型参数。ReLU(·)表示线性整流函数。
再次,本申请实施例中,提供了一种基于GNN获取源域预测数据值的方式。通过上述方式,可以直接通过求平均对源域节点进行聚合,即,对于Ks个邻居节点,每个邻居节点的权重为1/Ks,由此,作为一种具体实现方式,以保证方案的可行性和可操作性。
可选地,在上述图6对应的各个实施例的基础上,本申请实施例提供的另一个可选实施例中,基于源域样本数据,通过源域图神经网络获取第一时刻所对应的Ns个源域聚合特征向量,具体可以包括:
从源域样本数据中获取Ns个源域时序数据,其中,源域时序数据与源域属性具有一一对应关系,每个源域时序数据包括从第二时刻至第三时刻的时序数据,第二时刻为出现在第一时刻之前的一个时刻,第三时刻为第一时刻相邻的前一时刻;
针对每个源域属性,根据源域图神经网络所对应的源域图结构,确定与源域属性具有连接关系的Ks个源域属性,其中,源域图神经网络属于源域检测网络,源域图结构包括源域节点与源域连边,源域节点用于表征源域属性,源域连边用于表征源域属性之间具有连接关系;
针对每个源域属性,获取源域属性与Ks个源域属性中每个源域属性之间的聚合注意力权重;
针对每个源域属性,根据源域图神经网络的模型参数、源域属性所对应的源域时序数据、源域属性所对应的聚合注意力权重、Ks个源域属性中每个源域属性所对应的源域时序数据以及Ks个源域属性中每个源域属性所对应的聚合注意力权重,获取第一时刻的源域聚合特征向量。
在一个或多个实施例中,介绍了一种基于注意力GNN获取源域预测数据值的方式。由前述实施例可知,源域样本数据包括一段时间内的Ns个源域时序数据,其中,每个源域时序数据即为一个源域属性所对应的时序数据。基于此,可从源域样本数据中提取连续时长的Ns个源域时序数据,用于预测下一个时刻的Ns个源域预测数据值。
具体地,请再次参阅图8,基于此,可采用如下方式计算第i个源域属性在第一时刻的源域聚合特征向量:
Figure BDA0003731451610000171
其中,
Figure BDA0003731451610000172
表示第i个源域属性在第一时刻的源域聚合特征向量。
Figure BDA0003731451610000173
表示第i个源域属性的所对应的源域时序数据。
Figure BDA0003731451610000174
表示第j个源域属性的所对应的源域时序数据。N(i)={j|Aij=1}表示与第i个源域属性具有连接关系的Ks个源域属性。W表示神经网络聚合参数,即,源域图神经网络的模型参数。αi,j表示第i个源域属性与第j个源域属性之间的聚合注意力权重。ReLU(·)表示函数。
再次,本申请实施例中,提供了一种基于注意力GNN获取源域预测数据值的方式。通过上述方式,可以为邻居节点分配一个动态变化的权重,从而更好地抽取源域属性之间的相互关系。由此,作为另一种具体实现方式,以保证方案的可行性和可操作性。
可选地,在上述图6对应的各个实施例的基础上,本申请实施例提供的另一个可选实施例中,获取源域属性与Ks个源域属性中每个源域属性之间的聚合注意力权重,具体可以包括:
根据源域图神经网络的模型参数、源域属性所对应的源域时序数据以及源域嵌入向量,获取源域属性所对应的时序拼接向量;
根据源域图神经网络的模型参数、Ks个源域属性中每个源域属性所对应的源域时序数据以及源域嵌入向量,获取Ks个源域属性中每个源域属性所对应的时序拼接向量;
根据源域属性所对应的时序拼接向量,获取源域属性所对应的源域中间向量;
根据Ks个源域属性中每个源域属性所对应的时序拼接向量,获取Ks个源域属性中每个源域属性所对应的源域中间向量;
根据源域属性所对应的源域中间向量以及Ks个源域属性中每个源域属性所对应的源域中间向量,获取源域属性与Ks个源域属性中每个源域属性之间的聚合注意力权重。
在一个或多个实施例中,提供了一种计算聚合注意力权重的方式。由前述实施例可知,以第i个源域属性为例,基于源域图结构可获取与之具有连接关系的Ks个源域属性。基于此,可采用如下方式计算在第一时刻下,第i个源域属性与第j个源域属性之间的聚合注意力权重:
Figure BDA0003731451610000181
Figure BDA0003731451610000182
Figure BDA0003731451610000183
其中,
Figure BDA0003731451610000184
表示第i个源域属性所对应的时序拼接向量。
Figure BDA0003731451610000185
表示第i个源域属性所对应的源域时序数据。vi表示第i个源域属性的源域嵌入向量。W表示神经网络聚合参数,即,源域图神经网络的模型参数。
Figure BDA0003731451610000186
表示矩阵的拼接。π(i,j)表示第i个源域属性与第j个源域属性之间的源域中间向量。
Figure BDA0003731451610000187
表示第j个源域属性所对应的时序拼接向量。a(·)表示可训练参数。LeakyReLU(·)表示函数。N(i)={j|Aij=1}表示与第i个源域属性具有连接关系的Ks个源域属性。
进一步地,本申请实施例中,提供了一种计算聚合注意力权重的方式。通过上述方式,可结合相关公式计算源域属性之间的聚合注意力权重,从而保证方案的可行性。
可选地,在上述图6对应的各个实施例的基础上,本申请实施例提供的另一个可选实施例中,根据目标域样本数据,对Nt个目标域嵌入向量以及目标域检测网络的模型参数进行更新,具体可以包括:
基于目标域样本数据,通过目标域图神经网络获取第四时刻所对应的Nt个目标域聚合特征向量,其中,目标域聚合特征向量与目标域属性具有一一对应关系,目标域图神经网络属于目标域检测网络;
基于Nt个目标域聚合特征向量以及Nt个目标域嵌入向量,通过目标域检测网络所包括的第二全连接层获取第四时刻所对应的Nt个目标域预测数据值,其中,目标域预测数据值与目标域属性具有一一对应关系;
根据第四时刻所对应的Nt个目标域预测数据值以及Nt个目标域实际数据值,构建第二损失函数,其中,Nt个目标域实际数据值来源于目标域样本数据;
基于第二损失函数,对Nt个目标域嵌入向量进行更新;
基于第二损失函数,对目标域图神经网络的模型参数以及第二全连接层的模型参数进行更新。
在一个或多个实施例中,介绍了一种基于自监督预测任务训练神经网络的方式。由前述实施例可知,目标域检测网络包括目标域图神经网络以及第二FC层,通过目标域检测网络获取在第四时刻的Nt个目标域聚合特征向量,然后,将Nt个目标域聚合特征向量作为第二FC层的输入,通过第二FC层输出Nt个目标域预测数据值。
具体地,假设Nt个目标域属性包括“温度属性”和“湿度属性”。将一段时间内采集到这些属性对应的时序数据作为目标域检测网络的输入,通过目标域检测网络输出下一个时刻的Nt个目标域预测数据值,例如,Nt个目标域预测数据值包括温度数值“30”,湿度数值“0.87”。可通过如下方式预测第t时刻(即,第四时刻)的Nt个目标域预测数据值:
Figure BDA0003731451610000191
其中,
Figure BDA0003731451610000192
表示第t时刻(即,第四时刻)的Nt个目标域预测数据值。
Figure BDA0003731451610000193
表示Nt个目标域聚合特征向量。{v1,v2,...,vNt}表示Nt个目标域嵌入向量。⊙表示向量内积。fθt表示第二FC层的可训练网络参数。
基于此,根据第t时刻(即,第四时刻)所对应的Nt个目标域预测数据值以及Nt个目标域实际数据值,构建第二损失函数,以第二损失函数为MSE为例,即,第二损失函数表示为:
Figure BDA0003731451610000194
其中,LMSE表示第一损失函数。
Figure BDA0003731451610000195
表示第t时刻的Nt个目标域预测数据值。
Figure BDA0003731451610000196
表示第t时刻的Nt个目标域实际数据值。
Figure BDA0003731451610000197
中上面的“2”表示平方,下面的“2”表示矩阵的l2范数。Dt表示目标域样本总数据集。|Dt|表示目标域样本数据个数。
由此,以最小化第一损失函数为目标,对Nt个目标域嵌入向量进行更新,并且,对目标域图神经网络的模型参数以及第二FC层的模型参数进行更新。
需要说明的是,第二损失函数可以采用MSE损失函数,或者,可以采用MAE)损失函数,或者,采用RMSE损失函数,或者,采用其他类型的损失函数,此处不做限定。
其次,本申请实施例中,提供了一种基于自监督预测任务训练神经网络的方式。通过上述方式,根据目标域实际数据值与目标域预测数据值之间的误差,训练目标域图神经网络的模型参数以及第二FC层的模型参数。一方面,能够优化目标域检测网络在预测任务上的性能,另一方面,利用目标域图神经网络能够更好的抽取多元数据中各个目标域属性之间的相互关系,为精准的异常检测提供了丰富的信息。
可选地,在上述图6对应的各个实施例的基础上,本申请实施例提供的另一个可选实施例中,基于目标域样本数据,通过目标域图神经网络获取第四时刻所对应的Nt个目标域聚合特征向量,具体可以包括:
从目标域样本数据中获取Nt个目标域时序数据,其中,目标域时序数据与目标域属性具有一一对应关系,每个目标域时序数据包括从第五时刻至第六时刻的时序数据,第五时刻为出现在第一时刻之前的一个时刻,第六时刻为第一时刻相邻的前一时刻;
针对每个目标域属性,根据目标域图神经网络所对应的目标域图结构,确定与目标域属性具有连接关系的Kt个目标域属性,其中,目标域图神经网络属于目标域检测网络,目标域图结构包括目标域节点与目标域连边,目标域节点用于表征目标域属性,目标域连边用于表征目标域属性之间具有连接关系;
针对每个目标域属性,根据目标域图神经网络的模型参数、目标域属性所对应的目标域时序数据以及Kt个目标域属性中每个目标域属性所对应的目标域时序数据,获取第四时刻的目标域聚合特征向量。
在一个或多个实施例中,介绍了一种基于GNN获取目标域预测数据值的方式。由前述实施例可知,目标域样本数据包括一段时间内的Nt个目标域时序数据,其中,每个目标域时序数据即为一个目标域属性所对应的时序数据。基于此,可从目标域样本数据中提取连续时长的Nt个目标域时序数据,用于预测下一个时刻的Nt个目标域预测数据值。由于本申请适用于无监督异常检测,即无法获取时序数据的异常标签用以训练模型,因此,可采用未来时刻的Nt个目标域实际数据值Nt个目标域预测数据值来训练模型。
具体地,为了便于理解,请参阅图9,图9为本申请实施例中基于目标域图神经网络实现自监督预测的一个示意图,如图所示,对于每个时刻t,长度为L的多元时序序列可表示为
Figure BDA0003731451610000201
即,xt=[xt-L,xt-L+1,...,xt-1]。其中,以待预测的第t个时刻作为“第一时刻”,以第(t-L)个时刻为“第五时刻”,第(t-1)个时刻作为“第六时刻”。基于此,可采用如下方式计算第i个目标域属性在第一时刻的目标域聚合特征向量:
Figure BDA0003731451610000202
其中,
Figure BDA0003731451610000203
表示第i个目标域属性在第一时刻的目标域聚合特征向量。
Figure BDA0003731451610000204
表示第i个目标域属性的所对应的目标域时序数据。
Figure BDA0003731451610000205
表示第j个目标域属性的所对应的目标域时序数据。N(i)={j|Aij=1}表示与第i个目标域属性具有连接关系的Kt个目标域属性。W表示神经网络聚合参数,即,目标域图神经网络的模型参数。ReLU(·)表示线性整流函数。
再次,本申请实施例中,提供了一种基于GNN获取目标域预测数据值的方式。通过上述方式,可以直接通过求平均对目标域节点进行聚合,即,对于Kt个邻居节点,每个邻居节点的权重为1/Kt,由此,作为一种具体实现方式,以保证方案的可行性和可操作性。
可选地,在上述图6对应的各个实施例的基础上,本申请实施例提供的另一个可选实施例中,基于目标域样本数据,通过目标域图神经网络获取第四时刻所对应的Nt个目标域聚合特征向量,具体可以包括:
从目标域样本数据中获取Nt个目标域时序数据,其中,目标域时序数据与目标域属性具有一一对应关系,每个目标域时序数据包括从第五时刻至第六时刻的时序数据,第五时刻为出现在第四时刻之前的一个时刻,第六时刻为第四时刻相邻的前一时刻;
针对每个目标域属性,根据目标域图神经网络所对应的目标域图结构,确定与目标域属性具有连接关系的Kt个目标域属性,其中,目标域图神经网络属于目标域检测网络,目标域图结构包括目标域节点与目标域连边,目标域节点用于表征目标域属性,目标域连边用于表征目标域属性之间具有连接关系;
针对每个目标域属性,获取目标域属性与Kt个目标域属性中每个目标域属性之间的聚合注意力权重;
针对每个目标域属性,根据目标域图神经网络的模型参数、目标域属性所对应的目标域时序数据、目标域属性所对应的聚合注意力权重、Kt个目标域属性中每个目标域属性所对应的目标域时序数据以及Kt个目标域属性中每个目标域属性所对应的聚合注意力权重,获取第四时刻的目标域聚合特征向量。
在一个或多个实施例中,介绍了一种基于注意力GNN获取目标域预测数据值的方式。由前述实施例可知,目标域样本数据包括一段时间内的Nt个目标域时序数据,其中,每个目标域时序数据即为一个目标域属性所对应的时序数据。基于此,可从目标域样本数据中提取连续时长的Nt个目标域时序数据,用于预测下一个时刻的Nt个目标域预测数据值。
具体地,请再次参阅图9,基于此,可采用如下方式计算第i个目标域属性在第四时刻的目标域聚合特征向量:
Figure BDA0003731451610000211
其中,
Figure BDA0003731451610000212
表示第i个目标域属性在第四时刻的目标域聚合特征向量。
Figure BDA0003731451610000213
表示第i个目标域属性的所对应的目标域时序数据。
Figure BDA0003731451610000214
表示第j个目标域属性的所对应的目标域时序数据。N(i)={j|Aij=1}表示与第i个目标域属性具有连接关系的Kt个目标域属性。W表示神经网络聚合参数,即,目标域图神经网络的模型参数。αi,j表示第i个目标域属性与第j个目标域属性之间的聚合注意力权重。ReLU(·)表示函数。
再次,本申请实施例中,提供了一种基于注意力GNN获取目标域预测数据值的方式。通过上述方式,可以为邻居节点分配一个动态变化的权重,从而更好地抽取目标域属性之间的相互关系。由此,作为另一种具体实现方式,以保证方案的可行性和可操作性。
可选地,在上述图6对应的各个实施例的基础上,本申请实施例提供的另一个可选实施例中,获取目标域属性与Kt个目标域属性中每个目标域属性之间的聚合注意力权重,具体可以包括:
根据目标域图神经网络的模型参数、目标域属性所对应的目标域时序数据以及目标域嵌入向量,获取目标域属性所对应的时序拼接向量;
根据目标域图神经网络的模型参数、Kt个目标域属性中每个目标域属性所对应的目标域时序数据以及目标域嵌入向量,获取Kt个目标域属性中每个目标域属性所对应的时序拼接向量;
根据目标域属性所对应的时序拼接向量,获取目标域属性所对应的目标域中间向量;
根据Kt个目标域属性中每个目标域属性所对应的时序拼接向量,获取Kt个目标域属性中每个目标域属性所对应的目标域中间向量;
根据目标域属性所对应的目标域中间向量以及Kt个目标域属性中每个目标域属性所对应的目标域中间向量,获取目标域属性与Kt个目标域属性中每个目标域属性之间的聚合注意力权重。
在一个或多个实施例中,提供了一种计算聚合注意力权重的方式。由前述实施例可知,以第i个目标域属性为例,基于目标域图结构可获取与之具有连接关系的Kt个目标域属性。基于此,可采用如下方式计算在第四时刻下,第i个目标域属性与第j个目标域属性之间的聚合注意力权重:
Figure BDA0003731451610000221
Figure BDA0003731451610000222
Figure BDA0003731451610000223
其中,
Figure BDA0003731451610000224
表示第i个目标域属性所对应的时序拼接向量。
Figure BDA0003731451610000225
表示第i个目标域属性所对应的目标域时序数据。vi表示第i个目标域属性的目标域嵌入向量。W表示神经网络聚合参数,即,目标域图神经网络的模型参数。
Figure BDA0003731451610000226
表示矩阵的拼接。π(i,j)表示第i个目标域属性与第j个目标域属性之间的目标域中间向量。
Figure BDA0003731451610000227
表示第j个目标域属性所对应的时序拼接向量。a(·)表示可训练参数。LeakyReLU(·)表示函数。N(i)={j|Aij=1}表示与第i个目标域属性具有连接关系的Kt个目标域属性。
进一步地,本申请实施例中,提供了一种计算聚合注意力权重的方式。通过上述方式,可结合相关公式计算目标域属性之间的聚合注意力权重,从而保证方案的可行性。
可选地,在上述图6对应的各个实施例的基础上,本申请实施例提供的另一个可选实施例中,根据源域样本数据以及目标域样本数据,生成属性相似度矩阵,具体可以包括:
针对源域样本数据中每个源域属性所对应的时序数据,以及,目标域样本数据中每个目标域属性所对应的时序数据,根据源域属性所对应的时序数据以及目标域属性所对应的时序数据,计算得到源域属性与目标域属性之间的相似度;
根据属性相似度矩阵以及更新后的Ns个源域嵌入向量,生成Nt个目标域嵌入向量,具体可以包括:
对属性相似度矩阵进行转置处理,得到转置后的属性相似度矩阵;
将转置后的属性相似度矩阵与更新后的Ns个源域嵌入向量进行相乘,得到Nt个目标域嵌入向量。
在一个或多个实施例中,介绍了一种生成属性相似度矩阵的方式。由前述实施例可知,结合源域样本数据以及目标域样本数据,可计算出每个源域属性与每个目标域属性之间的相似度,从而得到一个Ns×Nt的相似度矩阵。
具体地,可采用如下方式计算目标域嵌入矩阵:
Vt=Vs×MT;式(21)
其中,Vt表示目标域嵌入矩阵,即,包括Nt个目标域嵌入向量,且,
Figure BDA0003731451610000228
Vt中的目标域嵌入向量表示为
Figure BDA0003731451610000229
Vs表示源域嵌入矩阵,即,包括更新后的Ns个源域嵌入向量,且,
Figure BDA00037314516100002210
Vs中的源域嵌入向量表示为
Figure BDA00037314516100002211
Figure BDA00037314516100002212
M表示属性相似度矩阵,且,
Figure BDA00037314516100002213
(·)T表示转置。
其次,本申请实施例中,提供了一种生成属性相似度矩阵的方式。通过上述方式,考虑到时序数据可能较长,因此,采用滑动窗口相似度计算方式更为简单,复杂度较低,计算效率高。
可选地,在上述图6对应的各个实施例的基础上,本申请实施例提供的另一个可选实施例中,根据源域属性所对应的时序数据以及目标域属性所对应的时序数据,计算得到源域属性与目标域属性之间的相似度,具体可以包括:
若源域属性所对应的时序数据大于或等于目标域属性所对应的时序数据,则根据目标域属性所对应的时序数据生成第一滑动窗口,其中,第一滑动窗口为Tt,Tt为大于1的整数;
基于第一滑动窗口,在源域属性所对应的时序数据中以第一预设步长进行滑动,得到P个第一子时序数据,其中,P为大于或等于1的整数;
计算目标域属性所对应的时序数据与每个第一子时序数据之间的相似度,得到P个序列相似度;
对P个序列相似度求平均,得到源域属性与目标域属性之间的相似度;
或者,
根据源域属性所对应的时序数据以及目标域属性所对应的时序数据,计算得到源域属性与目标域属性之间的相似度,具体可以包括:
若目标域属性所对应的时序数据大于或等于源域属性所对应的时序数据,则根据源域属性所对应的时序数据生成第二滑动窗口,其中,第二滑动窗口为Ts,Ts为大于1的整数;
基于第二滑动窗口,在目标域属性所对应的时序数据中以第二预设步长进行滑动,得到Q个第二子时序数据,其中,Q为大于或等于1的整数;
计算源域属性所对应的时序数据与每个第二子时序数据之间的相似度,得到Q个序列相似度;
对Q个序列相似度求平均,得到源域属性与目标域属性之间的相似度。
在一个或多个实施例中,提供了一种利用滑动窗口相似度函数计算属性之间相似度的方式。由前述实施例可知,通过计算跨域属性间的相似度(即,源域属性与目标域属性之间的相似度),可以获得跨域属性关联信息,并结合源域训练所得的Ns个源域嵌入向量,模型参数对Nt个目标域嵌入向量,对模型进行初始化。使得目标域无需从零训练模型,继承了源域模型的异常检测能力。基于此,下面将结合两种情形,介绍计算源域属性与目标域属性之间的相似度的方式。
情形一,源域属性所对应的时序数据大于或等于目标域属性所对应的时序数据;
具体地,假设源域样本数据为
Figure BDA0003731451610000231
目标域样本数据为
Figure BDA0003731451610000232
且,Ts≥Tt。基于此,可以将较小的Tt时长作为第一滑动窗口。
以计算第i个源域属性与第j个目标域属性之间的相似度为例。首先,可基于第一滑动窗口的大小,以第一预设步长在第i个源域属性所对应的时序数据上进行滑动,由此得到P个第一子时序数据。然后,分别计算第j个目标域属性所对应的时序数据与每个第一子时序数据之间的相似度,得到P个序列相似度。最后,对P个序列相似度求平均,即可得到第i个源域属性与第j个目标域属性之间的相似度。具体计算方式为:
Mi,j=SlidingSim(Xs,i,Xt,j); 式(22)
其中,Mi,j表示第i个源域属性与第j个目标域属性之间的相似度。Xs,i表示第i个源域属性所对应的时序数据,且,
Figure BDA0003731451610000241
Xt,j表示第j个目标域属性所对应的时序数据,且,
Figure BDA0003731451610000242
SlidingSim(·)表示滑动窗口相似度函数,利用SlidingSim(·)可以计算不同长度的时序序列之间的相似度。
进一步地,滑动窗口相似度函数的计算方式如下:
SlidingSim(Xs,i,Xt,j)=mean{cos(Xs,i[k:k+Tt],Xt,j)|k∈[0:stride:Ts-Tt]}; 式(23)
其中,SlidingSim(·)表示滑动窗口相似度函数。Xs,i表示第i个源域属性所对应的时序数据。Xt,j表示第j个目标域属性所对应的时序数据。Ts表示源域样本数据的时长。Tt表示目标域样本数据的时长。mean(·)表示对集合元素求平均。cos(·)表示求余弦相似度。stride是一个手动设定的滑动窗口的步长。k表示一个变量。
情形二,目标域属性所对应的时序数据大于或等于源域属性所对应的时序数据;
具体地,假设源域样本数据为
Figure BDA0003731451610000243
目标域样本数据为
Figure BDA0003731451610000244
且,Ts≤Tt。基于此,可以将较小的Ts时长作为第二滑动窗口。
以计算第i个源域属性与第j个目标域属性之间的相似度为例。首先,可基于第二滑动窗口的大小,以第二预设步长在第j个目标域属性所对应的时序数据上进行滑动,由此得到Q个第二子时序数据。然后,分别计算第i个源域属性所对应的时序数据与每个第二子时序数据之间的相似度,得到Q个序列相似度。最后,对Q个序列相似度求平均,即可得到第i个源域属性与第j个目标域属性之间的相似度。
需要说明的是,由于情形二与情形一的计算方式类型,故此处不再赘述。可以理解的是,上述公式中采用的是余弦相似度进行计算,在实际应用中,还可以采用其他类型的相似度算法,此处仅为一个示意,不应理解为对本申请的限定。
可见,简而言之,滑动窗口相似度就是将较短序列在长序列上以指定步长滑动,并计算每一步的相似度(例如,余弦相似度),最终取所有步相似度的均值作为两个序列相似度,该方法可以计算不等长时间序列的相似度,且可根据滑动步长控制算法的时间消耗。
再次,本申请实施例中,提供了一种利用滑动窗口相似度函数计算属性之间相似度的方式。通过上述方式,可结合相关公式计算属性之间相似度,从而保证方案的可行性。
结合上述介绍,下面将对本申请中时序数据的异常检测方法进行介绍,请参阅图10,本申请实施例中时序数据的异常检测方法可以由计算机设备执行,该计算机设备可以是终端设备或服务器,本申请实施例包括:
310、获取待检测数据,其中,待检测数据包括Nt个目标域属性的时序数据,每个目标域属性的时序数据包括T个时刻的数据,Nt与T均为大于1的整数;
在一个或多个实施例中,获取待检测数据。为了便于理解,请参阅图11,图11为本申请实施例中时序数据异常检测方法的一个***框架图,如图所示,待检测数据包括Nt个目标域属性的时序数据,每个目标域属性的时序数据包括连续T个时刻的采集到的数据。
320、基于待检测数据,通过目标域检测网络获取目标时刻所对应的Nt个预测数据值,其中,目标域检测网络为采用上述实施例中任一项方法训练得到的;
在一个或多个实施例中,将待检测数据作为目标域检测网络的输入,由目标域检测网络输出下一个时刻(即,目标时刻)所对应的Nt个预测数据值。需要说明的是,目标域检测网络已在前述实施例中进行介绍,故此处不做赘述。
330、获取目标时刻所对应的Nt个实际数据值;
在一个或多个实施例中,当进入下一时刻(即,目标时刻)时,可获取到Nt个实际数据值,即,每个目标域属性在目标时刻所对应的N实际数据值。
340、根据Nt个实际数据值以及Nt个预测数据值,计算得到目标时刻所对应的异常分值;
在一个或多个实施例中,结合Nt个实际数据值以及Nt个预测数据值之间的差异情况,可进一步计算针对该目标时刻的异常分值。
350、若目标时刻所对应的异常分值大于或等于异常分值阈值,则确定目标时刻为数据异常时刻。
在一个或多个实施例中,如果该目标时刻所对应的异常分值大于或等于异常分值阈值,则确定目标时刻为数据异常时刻,即,可能在目标时刻出现异常情况。反之,如果该目标时刻所对应的异常分值小于异常分值阈值,则确定目标时刻为数据正常时刻,即,在目标时刻并未出现异常情况。
具体地,为了便于介绍,下面将结合传感器场景进行说明。在部署传感器之后,传感器数据被源源不断的传输至数据存储端,即可以利用多元时序传感器数据构建模型,对每一个时刻的数据给予异常分值,并对于异常分值高于异常分值阈值的数据点判定为异常点,以供后续运维人员对异常进行分析和处理。当传感器***升级后(传感器的个数或型号发生了变化),仍可以利用历史模型(即,将旧***的目标域检测网络作为新***的源域检测网络),在历史模型(即,源域检测网络)的基础上,结合域间联系和新数据进行训练,实现在新***的异常检测。
本申请实施例中,提供了一种时序数据的异常检测方法。通过上述方式,在异常检测阶段的时间复杂度较低,可以灵活的应用与各多元时序***以实现实时的异常检测。此外,还可以较好的利用历史数据缓解***升级导致的冷启动问题。
可选地,在上述图10对应的各个实施例的基础上,本申请实施例提供的另一个可选实施例中,根据Nt个实际数据值以及Nt个预测数据值,计算得到目标时刻所对应的异常分值,具体可以包括:
针对每个目标域属性,计算目标域属性所对应的均值以及方差;
针对每个目标域属性,计算目标域属性所对应的预测数据值以及实际数据值之间差值的绝对值,得到目标域属性所对应的第一数据值;
针对每个目标域属性,对目标域属性所对应的第一数据值与目标域属性所对应的均值进行求差,得到目标域属性所对应的第二数据值;
针对每个目标域属性,对目标域属性所对应的第二数据值与目标域属性所对应的方差求商,得到目标域属性所对应的第三数据值;
从每个目标域属性所对应的第三数据值中选择最大值作为目标时刻所对应的异常分值。
在一个或多个实施例中,介绍了一种计算异常分值的方式。由前述实施例可知,源域与目标域分别训练得到了一个基于图神经网络预测未来时刻属性的检测网络。对于给定的测试数据,本申请则可根据预测误差判别时序数据中的异常点。由于本申请针对的是多元时序数据,因此,为了便于说明,下面将以Nt个目标域属性中的一个目标域属性为例进行介绍,其他目标域属性也采用类似方式进行计算,此处不一一列举。
具体地,考虑到多元的数据特性,各个目标域属性的值域可能相差较大,且异常通常只会出现在部分目标域属性中。因此,需要对预测误差进行规范化,并选取最大属性预测误差作为异常分值。即,首先根据每个目标域属性所对应的时序数据,可分别计算出每个目标域属性所对应的均值以及方差。然后,采用如下方式计算目标时刻所对应的异常分值:
Figure BDA0003731451610000261
其中,Anomaly Score表示目标时刻所对应的异常分值。t表示目标时刻。max(·)表示选择最大值。μ表示Nt个均值,即,包括每个目标域属性所对应的均值。σ表示Nt个方差,即,包括每个目标域属性所对应的方差。
Figure BDA0003731451610000262
表示目标时刻的Nt个预测数据值,即,包括每个目标域属性所对应的预测数据值。xt表示目标时刻的Nt个预测数据值,即,包括每个目标域属性所对应的实际数据值。
基于此,针对一个目标域属性,将该目标域属性所对应的预测数据值和实际数据值代入至
Figure BDA0003731451610000263
可计算得到目标域属性所对应的第一数据值。基于此,将目标域属性所对应的第一数据值和目标域属性所对应的均值代入至
Figure BDA0003731451610000264
可计算得到目标域属性所对应的第二数据值。最后,将目标域属性所对应的第二数据值和目标域属性所对应的方差代入至
Figure BDA0003731451610000265
可计算得到目标域属性所对应的第三数据值。
需要说明的是,在实际应用中,除了可以直接选最大目标域属性预测的误差作为异常分值,如果多元时序***存在较多属性异常的特性,还可以采用平均预测误差或前K个平均预测误差的方法设计异常分计算公式。
其次,本申请实施例中,提供了一种计算异常分值的方式。通过上述方式,可结合相关公式计算异常分值,从而保证方案的可行性。
下面对本申请中的参数优化装置进行详细描述,请参阅图12,图12为本申请实施例中参数优化装置的一个实施例示意图,参数优化装置40包括:
获取模块410,用于获取源域样本数据以及目标域样本数据,其中,源域样本数据包括Ns个源域属性的时序数据,目标域样本数据包括Nt个目标域属性的时序数据,Ns与Nt均为大于1的整数;
构建模块420,用于根据Ns个源域属性所对应的Ns个源域嵌入向量,构建源域图神经网络,其中,源域嵌入向量与源域属性具有一一对应关系;
训练模块430,用于根据源域样本数据,对Ns个源域嵌入向量以及源域检测网络的模型参数进行更新,其中,源域检测网络包括源域图神经网络;
生成模块440,用于根据源域样本数据以及目标域样本数据,生成属性相似度矩阵,其中,属性相似度矩阵用于描述每个源域属性与每个目标域属性之间的相似度;
生成模块440,还用于根据属性相似度矩阵以及更新后的Ns个源域嵌入向量,生成Nt个目标域嵌入向量,其中,目标域嵌入向量与目标域属性具有一一对应关系;
构建模块420,还用于根据Nt个目标域嵌入向量,构建目标域图神经网络,其中,目标域图神经网络的模型参数采用源域图神经网络更新后的模型参数;
训练模块430,还用于根据目标域样本数据,对Nt个目标域嵌入向量以及目标域检测网络的模型参数进行更新,其中,目标域检测网络包括目标域图神经网络。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的参数优化装置40的另一实施例中,
构建模块420,具体用于针对每个源域属性,根据源域属性所对应的源域嵌入向量以及其余源域属性分别对应的源域嵌入向量,计算得到(Ns-1)个向量相似度,其中,其余源域属性为Ns个源域属性中除了源域属性之外剩余的(Ns-1)源域属性;
针对每个源域属性,从(Ns-1)个向量相似度中确定最大的Ks个向量相似度,其中,Ks为大于或等于1,且小于(Ns-1)的整数;
针对每个源域属性,根据最大的Ks个向量相似度,确定与源域属性具有连接关系的Ks个源域属性,其中,Ks个向量相似度中的向量相似度与Ks个源域属性中的源域属性具有一一对应关系;
根据每个源域属性以及与每个源域属性分别具有连接关系的Ks个源域属性,构建源域图结构,其中,源域图结构包括源域节点与源域连边,源域节点用于表征源域属性,源域连边用于表征不同源域属性之间具有连接关系;
根据源域图结构以及Ns个源域嵌入向量,构建源域图神经网络。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的参数优化装置40的另一实施例中,
构建模块420,具体用于针对每个目标域属性,根据目标域属性所对应的目标域嵌入向量以及其余目标域属性分别对应的目标域嵌入向量,计算得到(Nt-1)个向量相似度,其中,其余目标域属性为Nt个目标域属性中除了目标域属性之外剩余的(Nt-1)目标域属性;
针对每个目标域属性,从(Nt-1)个向量相似度中确定最大的Kt个向量相似度,其中,Kt为大于或等于1,且小于(Nt-1)的整数;
针对每个目标域属性,根据最大的Kt个向量相似度,确定与目标域属性具有连接关系的Kt个目标域属性,其中,Kt个向量相似度中的向量相似度与Kt个目标域属性中的目标域属性具有一一对应关系;
根据每个目标域属性以及与每个目标域属性分别具有连接关系的Kt个目标域属性,构建目标域图结构,其中,目标域图结构包括目标域节点与目标域连边,目标域节点用于表征目标域属性,目标域连边用于表征不同目标域属性之间具有连接关系;
根据目标域图结构以及Nt个目标域嵌入向量,构建目标域图神经网络。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的参数优化装置40的另一实施例中,
训练模块430,具体用于基于源域样本数据,通过源域图神经网络获取第一时刻所对应的Ns个源域聚合特征向量,其中,源域聚合特征向量与源域属性具有一一对应关系,源域图神经网络属于源域检测网络;
基于Ns个源域聚合特征向量以及Ns个源域嵌入向量,通过源域检测网络所包括的第一全连接层获取第一时刻所对应的Ns个源域预测数据值,其中,源域预测数据值与源域属性具有一一对应关系;
根据第一时刻所对应的Ns个源域预测数据值以及Ns个源域实际数据值,构建第一损失函数,其中,Ns个源域实际数据值来源于源域样本数据;
基于第一损失函数,对Ns个源域嵌入向量进行更新;
基于第一损失函数,对源域图神经网络的模型参数以及第一全连接层的模型参数进行更新。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的参数优化装置40的另一实施例中,
训练模块430,具体用于从源域样本数据中获取Ns个源域时序数据,其中,源域时序数据与源域属性具有一一对应关系,每个源域时序数据包括从第二时刻至第三时刻的时序数据,第二时刻为出现在第一时刻之前的一个时刻,第三时刻为第一时刻相邻的前一时刻;
针对每个源域属性,根据源域图神经网络所对应的源域图结构,确定与源域属性具有连接关系的Ks个源域属性,其中,源域图神经网络属于源域检测网络,源域图结构包括源域节点与源域连边,源域节点用于表征源域属性,源域连边用于表征源域属性之间具有连接关系;
针对每个源域属性,根据源域图神经网络的模型参数、源域属性所对应的源域时序数据以及Ks个源域属性中每个源域属性所对应的源域时序数据,获取第一时刻的源域聚合特征向量。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的参数优化装置40的另一实施例中,
训练模块430,具体用于从源域样本数据中获取Ns个源域时序数据,其中,源域时序数据与源域属性具有一一对应关系,每个源域时序数据包括从第二时刻至第三时刻的时序数据,第二时刻为出现在第一时刻之前的一个时刻,第三时刻为第一时刻相邻的前一时刻;
针对每个源域属性,根据源域图神经网络所对应的源域图结构,确定与源域属性具有连接关系的Ks个源域属性,其中,源域图神经网络属于源域检测网络,源域图结构包括源域节点与源域连边,源域节点用于表征源域属性,源域连边用于表征源域属性之间具有连接关系;
针对每个源域属性,获取源域属性与Ks个源域属性中每个源域属性之间的聚合注意力权重;
针对每个源域属性,根据源域图神经网络的模型参数、源域属性所对应的源域时序数据、源域属性所对应的聚合注意力权重、Ks个源域属性中每个源域属性所对应的源域时序数据以及Ks个源域属性中每个源域属性所对应的聚合注意力权重,获取第一时刻的源域聚合特征向量。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的参数优化装置40的另一实施例中,
训练模块430,具体用于根据源域图神经网络的模型参数、源域属性所对应的源域时序数据以及源域嵌入向量,获取源域属性所对应的时序拼接向量;
根据源域图神经网络的模型参数、Ks个源域属性中每个源域属性所对应的源域时序数据以及源域嵌入向量,获取Ks个源域属性中每个源域属性所对应的时序拼接向量;
根据源域属性所对应的时序拼接向量,获取源域属性所对应的源域中间向量;
根据Ks个源域属性中每个源域属性所对应的时序拼接向量,获取Ks个源域属性中每个源域属性所对应的源域中间向量;
根据源域属性所对应的源域中间向量以及Ks个源域属性中每个源域属性所对应的源域中间向量,获取源域属性与Ks个源域属性中每个源域属性之间的聚合注意力权重。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的参数优化装置40的另一实施例中,
训练模块430,具体用于基于目标域样本数据,通过目标域图神经网络获取第四时刻所对应的Nt个目标域聚合特征向量,其中,目标域聚合特征向量与目标域属性具有一一对应关系,目标域图神经网络属于目标域检测网络;
基于Nt个目标域聚合特征向量以及Nt个目标域嵌入向量,通过目标域检测网络所包括的第二全连接层获取第四时刻所对应的Nt个目标域预测数据值,其中,目标域预测数据值与目标域属性具有一一对应关系;
根据第四时刻所对应的Nt个目标域预测数据值以及Nt个目标域实际数据值,构建第二损失函数,其中,Nt个目标域实际数据值来源于目标域样本数据;
基于第二损失函数,对Nt个目标域嵌入向量进行更新;
基于第二损失函数,对目标域图神经网络的模型参数以及第二全连接层的模型参数进行更新。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的参数优化装置40的另一实施例中,
训练模块430,具体用于从目标域样本数据中获取Nt个目标域时序数据,其中,目标域时序数据与目标域属性具有一一对应关系,每个目标域时序数据包括从第五时刻至第六时刻的时序数据,第五时刻为出现在第一时刻之前的一个时刻,第六时刻为第一时刻相邻的前一时刻;
针对每个目标域属性,根据目标域图神经网络所对应的目标域图结构,确定与目标域属性具有连接关系的Kt个目标域属性,其中,目标域图神经网络属于目标域检测网络,目标域图结构包括目标域节点与目标域连边,目标域节点用于表征目标域属性,目标域连边用于表征目标域属性之间具有连接关系;
针对每个目标域属性,根据目标域图神经网络的模型参数、目标域属性所对应的目标域时序数据以及Kt个目标域属性中每个目标域属性所对应的目标域时序数据,获取第四时刻的目标域聚合特征向量。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的参数优化装置40的另一实施例中,
训练模块430,具体用于从目标域样本数据中获取Nt个目标域时序数据,其中,目标域时序数据与目标域属性具有一一对应关系,每个目标域时序数据包括从第五时刻至第六时刻的时序数据,第五时刻为出现在第四时刻之前的一个时刻,第六时刻为第四时刻相邻的前一时刻;
针对每个目标域属性,根据目标域图神经网络所对应的目标域图结构,确定与目标域属性具有连接关系的Kt个目标域属性,其中,目标域图神经网络属于目标域检测网络,目标域图结构包括目标域节点与目标域连边,目标域节点用于表征目标域属性,目标域连边用于表征目标域属性之间具有连接关系;
针对每个目标域属性,获取目标域属性与Kt个目标域属性中每个目标域属性之间的聚合注意力权重;
针对每个目标域属性,根据目标域图神经网络的模型参数、目标域属性所对应的目标域时序数据、目标域属性所对应的聚合注意力权重、Kt个目标域属性中每个目标域属性所对应的目标域时序数据以及Kt个目标域属性中每个目标域属性所对应的聚合注意力权重,获取第四时刻的目标域聚合特征向量。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的参数优化装置40的另一实施例中,
训练模块430,具体用于根据目标域图神经网络的模型参数、目标域属性所对应的目标域时序数据以及目标域嵌入向量,获取目标域属性所对应的时序拼接向量;
根据目标域图神经网络的模型参数、Kt个目标域属性中每个目标域属性所对应的目标域时序数据以及目标域嵌入向量,获取Kt个目标域属性中每个目标域属性所对应的时序拼接向量;
根据目标域属性所对应的时序拼接向量,获取目标域属性所对应的目标域中间向量;
根据Kt个目标域属性中每个目标域属性所对应的时序拼接向量,获取Kt个目标域属性中每个目标域属性所对应的目标域中间向量;
根据目标域属性所对应的目标域中间向量以及Kt个目标域属性中每个目标域属性所对应的目标域中间向量,获取目标域属性与Kt个目标域属性中每个目标域属性之间的聚合注意力权重。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的参数优化装置40的另一实施例中,
生成模块440,具体用于针对源域样本数据中每个源域属性所对应的时序数据,以及,目标域样本数据中每个目标域属性所对应的时序数据,根据源域属性所对应的时序数据以及目标域属性所对应的时序数据,计算得到源域属性与目标域属性之间的相似度;
生成模块440,具体用于对属性相似度矩阵进行转置处理,得到转置后的属性相似度矩阵;
将转置后的属性相似度矩阵与更新后的Ns个源域嵌入向量进行相乘,得到Nt个目标域嵌入向量。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的参数优化装置40的另一实施例中,
生成模块440,具体用于若源域属性所对应的时序数据大于或等于目标域属性所对应的时序数据,则根据目标域属性所对应的时序数据生成第一滑动窗口,其中,第一滑动窗口为Tt,Tt为大于1的整数;
基于第一滑动窗口,在源域属性所对应的时序数据中以第一预设步长进行滑动,得到P个第一子时序数据,其中,P为大于或等于1的整数;
计算目标域属性所对应的时序数据与每个第一子时序数据之间的相似度,得到P个序列相似度;
对P个序列相似度求平均,得到源域属性与目标域属性之间的相似度;
或者,
生成模块440,具体用于若目标域属性所对应的时序数据大于或等于源域属性所对应的时序数据,则根据源域属性所对应的时序数据生成第二滑动窗口,其中,第二滑动窗口为Ts,Ts为大于1的整数;
基于第二滑动窗口,在目标域属性所对应的时序数据中以第二预设步长进行滑动,得到Q个第二子时序数据,其中,Q为大于或等于1的整数;
计算源域属性所对应的时序数据与每个第二子时序数据之间的相似度,得到Q个序列相似度;
对Q个序列相似度求平均,得到源域属性与目标域属性之间的相似度。
下面对本申请中的异常检测装置进行详细描述,请参阅图13,图13为本申请实施例中异常检测装置的一个实施例示意图,异常检测装置50包括:
获取模块510,用于获取待检测数据,其中,待检测数据包括Nt个目标域属性的时序数据,每个目标域属性的时序数据包括T个时刻的数据,Nt与T均为大于1的整数;
获取模块510,还用于基于待检测数据,通过目标域检测网络获取目标时刻所对应的Nt个预测数据值,其中,目标域检测网络为采用上述权利要求1至13中任一项方法训练得到的;
获取模块510,还用于获取目标时刻所对应的Nt个实际数据值;
确定模块520,用于根据Nt个实际数据值以及Nt个预测数据值,计算得到目标时刻所对应的异常分值;
确定模块520,还用于若目标时刻所对应的异常分值大于或等于异常分值阈值,则确定目标时刻为数据异常时刻。
可选地,在上述图13所对应的实施例的基础上,本申请实施例提供的异常检测装置50的另一实施例中,
确定模块520,具体用于针对每个目标域属性,计算目标域属性所对应的均值以及方差;
针对每个目标域属性,计算目标域属性所对应的预测数据值以及实际数据值之间差值的绝对值,得到目标域属性所对应的第一数据值;
针对每个目标域属性,对目标域属性所对应的第一数据值与目标域属性所对应的均值进行求差,得到目标域属性所对应的第二数据值;
针对每个目标域属性,对目标域属性所对应的第二数据值与目标域属性所对应的方差求商,得到目标域属性所对应的第三数据值;
从每个目标域属性所对应的第三数据值中选择最大值作为目标时刻所对应的异常分值。
图14是本申请实施例提供的一种计算机设备结构示意图,该计算机设备600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以***处理器(centralprocessing units,CPU)622(例如,一个或一个以上处理器)和存储器632,一个或一个以上存储应用程序642或数据644的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器632和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对计算机设备中的一系列指令操作。更进一步地,中央处理器622可以设置为与存储介质630通信,在计算机设备600上执行存储介质630中的一系列指令操作。
计算机设备600还可以包括一个或一个以上电源626,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口658,和/或,一个或一个以上操作***641,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中由计算机设备所执行的步骤可以基于该图14所示的计算机设备结构。
本申请实施例中还提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,该处理器执行计算机程序时,实现前述各个实施例描述方法的步骤。
本申请实施例中还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现前述各个实施例描述方法的步骤。
本申请实施例中还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时,实现前述各个实施例描述方法的步骤。
可以理解的是,在本申请的具体实施方式中,涉及到时序数据等,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是服务器或终端设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储计算机程序的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (20)

1.一种模型参数的优化方法,其特征在于,包括:
获取源域样本数据以及目标域样本数据,其中,所述源域样本数据包括Ns个源域属性的时序数据,所述目标域样本数据包括Nt个目标域属性的时序数据,所述Ns与所述Nt均为大于1的整数;
根据所述Ns个源域属性所对应的Ns个源域嵌入向量,构建源域图神经网络,其中,所述源域嵌入向量与所述源域属性具有一一对应关系;
根据所述源域样本数据,对所述Ns个源域嵌入向量以及源域检测网络的模型参数进行更新,其中,所述源域检测网络包括所述源域图神经网络;
根据所述源域样本数据以及所述目标域样本数据,生成属性相似度矩阵,其中,所述属性相似度矩阵用于描述每个源域属性与每个目标域属性之间的相似度;
根据所述属性相似度矩阵以及更新后的Ns个源域嵌入向量,生成Nt个目标域嵌入向量,其中,所述目标域嵌入向量与所述目标域属性具有一一对应关系;
根据所述Nt个目标域嵌入向量,构建目标域图神经网络,其中,所述目标域图神经网络的模型参数采用所述源域图神经网络更新后的模型参数;
根据所述目标域样本数据,对所述Nt个目标域嵌入向量以及目标域检测网络的模型参数进行更新,其中,所述目标域检测网络包括所述目标域图神经网络。
2.根据权利要求1所述的优化方法,其特征在于,所述根据所述Ns个源域属性所对应的Ns个源域嵌入向量,构建源域图神经网络,包括:
针对所述每个源域属性,根据源域属性所对应的源域嵌入向量以及其余源域属性分别对应的源域嵌入向量,计算得到(Ns-1)个向量相似度,其中,所述其余源域属性为所述Ns个源域属性中除了所述源域属性之外剩余的(Ns-1)源域属性;
针对所述每个源域属性,从所述(Ns-1)个向量相似度中确定最大的Ks个向量相似度,其中,所述Ks为大于或等于1,且小于所述(Ns-1)的整数;
针对所述每个源域属性,根据所述最大的Ks个向量相似度,确定与所述源域属性具有连接关系的Ks个源域属性,其中,所述Ks个向量相似度中的向量相似度与所述Ks个源域属性中的源域属性具有一一对应关系;
根据所述每个源域属性以及与所述每个源域属性分别具有连接关系的Ks个源域属性,构建源域图结构,其中,所述源域图结构包括源域节点与源域连边,所述源域节点用于表征源域属性,所述源域连边用于表征不同源域属性之间具有连接关系;
根据所述源域图结构以及所述Ns个源域嵌入向量,构建所述源域图神经网络。
3.根据权利要求1所述的优化方法,其特征在于,所述根据所述Nt个目标域嵌入向量,构建目标域图神经网络,包括:
针对所述每个目标域属性,根据目标域属性所对应的目标域嵌入向量以及其余目标域属性分别对应的目标域嵌入向量,计算得到(Nt-1)个向量相似度,其中,所述其余目标域属性为所述Nt个目标域属性中除了所述目标域属性之外剩余的(Nt-1)目标域属性;
针对所述每个目标域属性,从所述(Nt-1)个向量相似度中确定最大的Kt个向量相似度,其中,所述Kt为大于或等于1,且小于所述(Nt-1)的整数;
针对所述每个目标域属性,根据所述最大的Kt个向量相似度,确定与所述目标域属性具有连接关系的Kt个目标域属性,其中,所述Kt个向量相似度中的向量相似度与所述Kt个目标域属性中的目标域属性具有一一对应关系;
根据所述每个目标域属性以及与所述每个目标域属性分别具有连接关系的Kt个目标域属性,构建目标域图结构,其中,所述目标域图结构包括目标域节点与目标域连边,所述目标域节点用于表征目标域属性,所述目标域连边用于表征不同目标域属性之间具有连接关系;
根据所述目标域图结构以及所述Nt个目标域嵌入向量,构建所述目标域图神经网络。
4.根据权利要求1所述的优化方法,其特征在于,所述根据所述源域样本数据,对所述Ns个源域嵌入向量以及源域检测网络的模型参数进行更新,包括:
基于所述源域样本数据,通过所述源域图神经网络获取第一时刻所对应的Ns个源域聚合特征向量,其中,所述源域聚合特征向量与所述源域属性具有一一对应关系,所述源域图神经网络属于所述源域检测网络;
基于所述Ns个源域聚合特征向量以及所述Ns个源域嵌入向量,通过所述源域检测网络所包括的第一全连接层获取所述第一时刻所对应的Ns个源域预测数据值,其中,所述源域预测数据值与所述源域属性具有一一对应关系;
根据所述第一时刻所对应的所述Ns个源域预测数据值以及Ns个源域实际数据值,构建第一损失函数,其中,所述Ns个源域实际数据值来源于所述源域样本数据;
基于所述第一损失函数,对所述Ns个源域嵌入向量进行更新;
基于所述第一损失函数,对所述源域图神经网络的模型参数以及所述第一全连接层的模型参数进行更新。
5.根据权利要求4所述的优化方法,其特征在于,所述基于所述源域样本数据,通过所述源域图神经网络获取第一时刻所对应的Ns个源域聚合特征向量,包括:
从所述源域样本数据中获取Ns个源域时序数据,其中,所述源域时序数据与所述源域属性具有一一对应关系,每个源域时序数据包括从第二时刻至第三时刻的时序数据,所述第二时刻为出现在所述第一时刻之前的一个时刻,所述第三时刻为所述第一时刻相邻的前一时刻;
针对所述每个源域属性,根据所述源域图神经网络所对应的源域图结构,确定与所述源域属性具有连接关系的所述Ks个源域属性,其中,所述源域图神经网络属于所述源域检测网络,所述源域图结构包括源域节点与源域连边,所述源域节点用于表征源域属性,所述源域连边用于表征源域属性之间具有连接关系;
针对所述每个源域属性,根据所述源域图神经网络的模型参数、源域属性所对应的源域时序数据以及Ks个源域属性中每个源域属性所对应的源域时序数据,获取所述第一时刻的源域聚合特征向量。
6.根据权利要求4所述的优化方法,其特征在于,所述基于所述源域样本数据,通过所述源域图神经网络获取第一时刻所对应的Ns个源域聚合特征向量,包括:
从所述源域样本数据中获取Ns个源域时序数据,其中,所述源域时序数据与所述源域属性具有一一对应关系,每个源域时序数据包括从第二时刻至第三时刻的时序数据,所述第二时刻为出现在所述第一时刻之前的一个时刻,所述第三时刻为所述第一时刻相邻的前一时刻;
针对所述每个源域属性,根据所述源域图神经网络所对应的源域图结构,确定与源域属性具有连接关系的Ks个源域属性,其中,所述源域图神经网络属于所述源域检测网络,所述源域图结构包括源域节点与源域连边,所述源域节点用于表征源域属性,所述源域连边用于表征源域属性之间具有连接关系;
针对所述每个源域属性,获取所述源域属性与Ks个源域属性中每个源域属性之间的聚合注意力权重;
针对所述每个源域属性,根据所述源域图神经网络的模型参数、所述源域属性所对应的源域时序数据、所述源域属性所对应的聚合注意力权重、所述Ks个源域属性中每个源域属性所对应的源域时序数据以及所述Ks个源域属性中每个源域属性所对应的聚合注意力权重,获取所述第一时刻的源域聚合特征向量。
7.根据权利要求6所述的优化方法,其特征在于,所述获取所述源域属性与Ks个源域属性中每个源域属性之间的聚合注意力权重,包括:
根据所述源域图神经网络的模型参数、所述源域属性所对应的源域时序数据以及源域嵌入向量,获取所述源域属性所对应的时序拼接向量;
根据所述源域图神经网络的模型参数、所述Ks个源域属性中每个源域属性所对应的源域时序数据以及源域嵌入向量,获取所述Ks个源域属性中每个源域属性所对应的时序拼接向量;
根据所述源域属性所对应的时序拼接向量,获取所述源域属性所对应的源域中间向量;
根据所述Ks个源域属性中每个源域属性所对应的时序拼接向量,获取所述Ks个源域属性中每个源域属性所对应的源域中间向量;
根据所述源域属性所对应的源域中间向量以及所述Ks个源域属性中每个源域属性所对应的源域中间向量,获取所述源域属性所对应的聚合注意力权重以及所述Ks个源域属性中每个源域属性所对应的聚合注意力权重。
8.根据权利要求1所述的优化方法,其特征在于,所述根据所述目标域样本数据,对所述Nt个目标域嵌入向量以及目标域检测网络的模型参数进行更新,包括:
基于所述目标域样本数据,通过所述目标域图神经网络获取第四时刻所对应的Nt个目标域聚合特征向量,其中,所述目标域聚合特征向量与所述目标域属性具有一一对应关系,所述目标域图神经网络属于所述目标域检测网络;
基于所述Nt个目标域聚合特征向量以及所述Nt个目标域嵌入向量,通过所述目标域检测网络所包括的第二全连接层获取所述第四时刻所对应的Nt个目标域预测数据值,其中,所述目标域预测数据值与所述目标域属性具有一一对应关系;
根据所述第四时刻所对应的所述Nt个目标域预测数据值以及Nt个目标域实际数据值,构建第二损失函数,其中,所述Nt个目标域实际数据值来源于所述目标域样本数据;
基于所述第二损失函数,对所述Nt个目标域嵌入向量进行更新;
基于所述第二损失函数,对所述目标域图神经网络的模型参数以及所述第二全连接层的模型参数进行更新。
9.根据权利要求8所述的优化方法,其特征在于,所述基于所述目标域样本数据,通过所述目标域图神经网络获取第四时刻所对应的Nt个目标域聚合特征向量,包括:
从所述目标域样本数据中获取Nt个目标域时序数据,其中,所述目标域时序数据与所述目标域属性具有一一对应关系,每个目标域时序数据包括从第五时刻至第六时刻的时序数据,所述第五时刻为出现在所述第一时刻之前的一个时刻,所述第六时刻为所述第一时刻相邻的前一时刻;
针对所述每个目标域属性,根据所述目标域图神经网络所对应的目标域图结构,确定与目标域属性具有连接关系的Kt个目标域属性,其中,所述目标域图神经网络属于所述目标域检测网络,所述目标域图结构包括目标域节点与目标域连边,所述目标域节点用于表征目标域属性,所述目标域连边用于表征目标域属性之间具有连接关系;
针对所述每个目标域属性,根据所述目标域图神经网络的模型参数、所述目标域属性所对应的目标域时序数据以及所述Kt个目标域属性中每个目标域属性所对应的目标域时序数据,获取所述第四时刻的目标域聚合特征向量。
10.根据权利要求8所述的优化方法,其特征在于,所述基于所述目标域样本数据,通过所述目标域图神经网络获取第四时刻所对应的Nt个目标域聚合特征向量,包括:
从所述目标域样本数据中获取Nt个目标域时序数据,其中,所述目标域时序数据与所述目标域属性具有一一对应关系,每个目标域时序数据包括从第五时刻至第六时刻的时序数据,所述第五时刻为出现在所述第四时刻之前的一个时刻,所述第六时刻为所述第四时刻相邻的前一时刻;
针对所述每个目标域属性,根据所述目标域图神经网络所对应的目标域图结构,确定与目标域属性具有连接关系的Kt个目标域属性,其中,所述目标域图神经网络属于所述目标域检测网络,所述目标域图结构包括目标域节点与目标域连边,所述目标域节点用于表征目标域属性,所述目标域连边用于表征目标域属性之间具有连接关系;
针对所述每个目标域属性,获取所述目标域属性与Kt个目标域属性中每个目标域属性之间的聚合注意力权重;
针对所述每个目标域属性,根据所述目标域图神经网络的模型参数、所述目标域属性所对应的目标域时序数据、所述目标域属性所对应的聚合注意力权重、所述Kt个目标域属性中每个目标域属性所对应的目标域时序数据以及所述Kt个目标域属性中每个目标域属性所对应的聚合注意力权重,获取所述第四时刻的目标域聚合特征向量。
11.根据权利要求10所述的优化方法,其特征在于,所述获取所述目标域属性与Kt个目标域属性中每个目标域属性之间的聚合注意力权重,包括:
根据所述目标域图神经网络的模型参数、所述目标域属性所对应的目标域时序数据以及目标域嵌入向量,获取所述目标域属性所对应的时序拼接向量;
根据所述目标域图神经网络的模型参数、所述Kt个目标域属性中每个目标域属性所对应的目标域时序数据以及目标域嵌入向量,获取所述Kt个目标域属性中每个目标域属性所对应的时序拼接向量;
根据所述目标域属性所对应的时序拼接向量,获取所述目标域属性所对应的目标域中间向量;
根据所述Kt个目标域属性中每个目标域属性所对应的时序拼接向量,获取所述Kt个目标域属性中每个目标域属性所对应的目标域中间向量;
根据所述目标域属性所对应的目标域中间向量以及所述Kt个目标域属性中每个目标域属性所对应的目标域中间向量,获取所述目标域属性所对应的聚合注意力权重以及所述Kt个目标域属性中每个目标域属性所对应的聚合注意力权重。
12.根据权利要求1至11中任一项所述的优化方法,其特征在于,所述根据所述源域样本数据以及所述目标域样本数据,生成属性相似度矩阵,包括:
针对所述源域样本数据中每个源域属性所对应的时序数据,以及,所述目标域样本数据中每个目标域属性所对应的时序数据,根据源域属性所对应的时序数据以及目标域属性所对应的时序数据,计算得到所述源域属性与所述目标域属性之间的相似度;
所述根据所述属性相似度矩阵以及更新后的Ns个源域嵌入向量,生成Nt个目标域嵌入向量,包括:
对所述属性相似度矩阵进行转置处理,得到转置后的属性相似度矩阵;
将所述转置后的属性相似度矩阵与所述更新后的Ns个源域嵌入向量进行相乘,得到所述Nt个目标域嵌入向量。
13.根据权利要求12所述的优化方法,其特征在于,所述根据源域属性所对应的时序数据以及目标域属性所对应的时序数据,计算得到所述源域属性与所述目标域属性之间的相似度,包括:
若所述源域属性所对应的时序数据大于或等于所述目标域属性所对应的时序数据,则根据所述目标域属性所对应的时序数据生成第一滑动窗口,其中,所述第一滑动窗口为Tt,所述Tt为大于1的整数;
基于所述第一滑动窗口,在所述源域属性所对应的时序数据中以第一预设步长进行滑动,得到P个第一子时序数据,其中,所述P为大于或等于1的整数;
计算所述目标域属性所对应的时序数据与每个第一子时序数据之间的相似度,得到P个序列相似度;
对所述P个序列相似度求平均,得到所述源域属性与所述目标域属性之间的相似度;
或者,
所述根据源域属性所对应的时序数据以及目标域属性所对应的时序数据,计算得到所述源域属性与所述目标域属性之间的相似度,包括:
若所述目标域属性所对应的时序数据大于或等于所述源域属性所对应的时序数据,则根据所述源域属性所对应的时序数据生成第二滑动窗口,其中,所述第二滑动窗口为Ts,所述Ts为大于1的整数;
基于所述第二滑动窗口,在所述目标域属性所对应的时序数据中以第二预设步长进行滑动,得到Q个第二子时序数据,其中,所述Q为大于或等于1的整数;
计算所述源域属性所对应的时序数据与每个第二子时序数据之间的相似度,得到Q个序列相似度;
对所述Q个序列相似度求平均,得到所述源域属性与所述目标域属性之间的相似度。
14.一种时序数据的异常检测方法,其特征在于,包括:
获取待检测数据,其中,所述待检测数据包括Nt个目标域属性的时序数据,每个目标域属性的时序数据包括T个时刻的数据,所述Nt与所述T均为大于1的整数;
基于所述待检测数据,通过目标域检测网络获取目标时刻所对应的Nt个预测数据值,其中,所述目标域检测网络为采用上述权利要求1至13中任一项方法训练得到的;
获取所述目标时刻所对应的Nt个实际数据值;
根据所述Nt个实际数据值以及所述Nt个预测数据值,计算得到所述目标时刻所对应的异常分值;
若所述目标时刻所对应的异常分值大于或等于异常分值阈值,则确定所述目标时刻为数据异常时刻。
15.根据权利要求14所述的异常检测方法,其特征在于,所述根据所述Nt个实际数据值以及所述Nt个预测数据值,计算得到所述目标时刻所对应的异常分值,包括:
针对所述每个目标域属性,计算目标域属性所对应的均值以及方差;
针对所述每个目标域属性,计算所述目标域属性所对应的预测数据值以及实际数据值之间差值的绝对值,得到所述目标域属性所对应的第一数据值;
针对所述每个目标域属性,对所述目标域属性所对应的第一数据值与所述目标域属性所对应的均值进行求差,得到所述目标域属性所对应的第二数据值;
针对所述每个目标域属性,对所述目标域属性所对应的第二数据值与所述目标域属性所对应的方差求商,得到所述目标域属性所对应的第三数据值;
从所述每个目标域属性所对应的第三数据值中选择最大值作为所述目标时刻所对应的异常分值。
16.一种参数优化装置,其特征在于,包括:
获取模块,用于获取源域样本数据以及目标域样本数据,其中,所述源域样本数据包括Ns个源域属性的时序数据,所述目标域样本数据包括Nt个目标域属性的时序数据,所述Ns与所述Nt均为大于1的整数;
构建模块,用于根据所述Ns个源域属性所对应的Ns个源域嵌入向量,构建源域图神经网络,其中,所述源域嵌入向量与所述源域属性具有一一对应关系;
训练模块,用于根据所述源域样本数据,对所述Ns个源域嵌入向量以及源域检测网络的模型参数进行更新,其中,所述源域检测网络包括所述源域图神经网络;
生成模块,用于根据所述源域样本数据以及所述目标域样本数据,生成属性相似度矩阵,其中,所述属性相似度矩阵用于描述每个源域属性与每个目标域属性之间的相似度;
所述生成模块,还用于根据所述属性相似度矩阵以及更新后的Ns个源域嵌入向量,生成Nt个目标域嵌入向量,其中,所述目标域嵌入向量与所述目标域属性具有一一对应关系;
所述构建模块,还用于根据所述Nt个目标域嵌入向量,构建目标域图神经网络,其中,所述目标域图神经网络的模型参数采用所述源域图神经网络更新后的模型参数;
所述训练模块,还用于根据所述目标域样本数据,对所述Nt个目标域嵌入向量以及目标域检测网络的模型参数进行更新,其中,所述目标域检测网络包括所述目标域图神经网络。
17.一种异常检测装置,其特征在于,包括:
获取模块,用于获取待检测数据,其中,所述待检测数据包括Nt个目标域属性的时序数据,每个目标域属性的时序数据包括T个时刻的数据,所述Nt与所述T均为大于1的整数;
所述获取模块,还用于基于所述待检测数据,通过目标域检测网络获取目标时刻所对应的Nt个预测数据值,其中,所述目标域检测网络为采用上述权利要求1至13中任一项方法训练得到的;
所述获取模块,还用于获取所述目标时刻所对应的Nt个实际数据值;
确定模块,用于根据所述Nt个实际数据值以及所述Nt个预测数据值,计算得到所述目标时刻所对应的异常分值;
所述确定模块,还用于若所述目标时刻所对应的异常分值大于或等于异常分值阈值,则确定所述目标时刻为数据异常时刻。
18.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至13中任一项所述的优化方法的步骤,或,实现权利要求14至15中任一项所述的异常检测方法的步骤。
19.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至13中任一项所述的优化方法的步骤,或,实现权利要求14至15中任一项所述的异常检测方法的步骤。
20.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至13中任一项所述的优化方法的步骤,或,实现权利要求14至15中任一项所述的异常检测方法的步骤。
CN202210784623.7A 2022-07-05 2022-07-05 模型参数的优化方法、时序数据的异常检测方法及装置 Pending CN115130661A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210784623.7A CN115130661A (zh) 2022-07-05 2022-07-05 模型参数的优化方法、时序数据的异常检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210784623.7A CN115130661A (zh) 2022-07-05 2022-07-05 模型参数的优化方法、时序数据的异常检测方法及装置

Publications (1)

Publication Number Publication Date
CN115130661A true CN115130661A (zh) 2022-09-30

Family

ID=83381350

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210784623.7A Pending CN115130661A (zh) 2022-07-05 2022-07-05 模型参数的优化方法、时序数据的异常检测方法及装置

Country Status (1)

Country Link
CN (1) CN115130661A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117829211A (zh) * 2024-01-08 2024-04-05 国网江苏省电力有限公司扬州供电分公司 一种基于自注意力机制的光伏功率预测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117829211A (zh) * 2024-01-08 2024-04-05 国网江苏省电力有限公司扬州供电分公司 一种基于自注意力机制的光伏功率预测方法

Similar Documents

Publication Publication Date Title
CN111161315B (zh) 一种基于图神经网络的多目标跟踪方法和***
CN113807399B (zh) 一种神经网络训练方法、检测方法以及装置
CN111160191B (zh) 一种视频关键帧提取方法、装置及存储介质
CN111401344A (zh) 人脸识别方法和装置及人脸识别***的训练方法和装置
CN110765882B (zh) 一种视频标签确定方法、装置、服务器及存储介质
CN114550053A (zh) 一种交通事故定责方法、装置、计算机设备及存储介质
CN110072183B (zh) 基于群智感知的被动式定位指纹库构建方法
CN110781818B (zh) 视频分类方法、模型训练方法、装置及设备
CN110781595B (zh) 能源使用效率pue的预测方法、装置、终端及介质
CN116599857B (zh) 一种适用于物联网多场景的数字孪生应用***
CN112115965A (zh) 一种基于svm的被动操作***识别方法、存储介质及设备
CN112784920A (zh) 云边端协同的旋转部件对抗域自适应故障诊断方法
CN114693624A (zh) 一种图像检测方法、装置、设备及可读存储介质
CN113569657A (zh) 一种行人重识别方法、装置、设备及存储介质
CN115130661A (zh) 模型参数的优化方法、时序数据的异常检测方法及装置
CN113313215A (zh) 图像数据处理方法、装置、计算机设备和存储介质
CN117156442A (zh) 基于5g网络的云数据安全保护方法及***
CN113591839B (zh) 一种特征提取模型构建方法、目标检测方法及其设备
CN111488887B (zh) 基于人工智能的图像处理方法、装置
CN113835973B (zh) 一种模型训练方法及相关装置
CN115438841A (zh) 基于人工智能精准预测降雨模型的训练方法及预测方法
CN114708307B (zh) 基于相关滤波器的目标跟踪方法、***、存储介质及设备
CN115329906B (zh) 一种基于图正则化网络的故障诊断方法及装置
CN117591813B (zh) 基于多维特征的复杂装备故障诊断方法及***
Anton et al. Using Cognitive Technologies as Cloud Services for Product Quality Control. A Case Study for Greenhouse Vegetables

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination