CN105550700A - 一种基于关联分析和主成分分析的时间序列数据清洗方法 - Google Patents

一种基于关联分析和主成分分析的时间序列数据清洗方法 Download PDF

Info

Publication number
CN105550700A
CN105550700A CN201510902558.3A CN201510902558A CN105550700A CN 105550700 A CN105550700 A CN 105550700A CN 201510902558 A CN201510902558 A CN 201510902558A CN 105550700 A CN105550700 A CN 105550700A
Authority
CN
China
Prior art keywords
time series
data
pca
principal component
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510902558.3A
Other languages
English (en)
Other versions
CN105550700B (zh
Inventor
牛进苍
陈玉峰
张锦逵
祝永新
盛戈皞
杜修明
杨祎
郭志红
辜超
朱文兵
郑建
李秀卫
朱孟兆
周加斌
李程启
马艳
马强
李欣阳
刘鑫意
刘梦云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201510902558.3A priority Critical patent/CN105550700B/zh
Publication of CN105550700A publication Critical patent/CN105550700A/zh
Application granted granted Critical
Publication of CN105550700B publication Critical patent/CN105550700B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于关联分析和主成分分析的时间序列数据清洗方法,步骤:采用皮尔逊系数分析法(PCC)找出变压器故障和其它电力数据的一些隐藏关联;采用主成分分析法(PCA)对所有相关的时间序列进行降维、降噪处理;将清洗后的一部分数据作为训练集输入到BP神经网络(BPNN)中进行训练学习,并用剩下的部分数据作为测试集对模型加以验证。本发明与传统技术相比,能显著提高变压器故障诊断的精确度,同时可以提高分类的准确度,并且在面对高维数据时,运算时间更短。

Description

一种基于关联分析和主成分分析的时间序列数据清洗方法
技术领域
本发明涉及一种基于关联分析和主成分分析的时间序列数据清洗方法。
背景技术
作为国家经济和安全的命脉,电网的安全运营一直是电网最核心和本质的要求。油浸式变压器是又电力***中至关重要的设备,它们的工作状态直接影响到整个电力***的安全性,发生任何故障都可能会导致严重的经济损失。所以很有必要对潜在的故障进行预测,以便及时采取合适的方案对设备进行检修。溶解气体分析法(DGA)是用于电力变压器故障诊断的有效方法。根据电力行业的经验,变压器的工作状态主要和几种油中溶解气体的含量有关,主要包括:氢气(H2),甲烷(CH4),乙炔(C2H2),乙烯(C2H4),乙烷(C2H6),一氧化碳(CO)和二氧化碳(CO2)。
过去,电力***普遍采用三比值法来对变压器等电力设备进行估值诊断。三比值法是根据电气设备内绝缘油在故障下裂解产生气体组分含量的相对浓度与温度的相互依赖关系,从几种特征气体中选取两种溶解度和扩散系数相近的气体组成三对比值,以不同的编码表示特定的故障类型。三比值法对于一些常见的严重故障比较适用,但对一些发生频率较低的故障则不大敏感,因为有些编码并没有正确的故障类型与之相对应。此外,由于该编码***对故障类型划分比较绝对,而实际应用中的故障情况要复杂很多,所以当气体含量接近编码的边界时,三比值法经常会发生误判。
近年来,人工智能技术因其强大的学习能力和泛化性,逐渐被应用在变压器故障诊断领域。在实际应用中,灰色模型(GM)、支持向量机(SVM)、随机森林(RF)等方法都取得了比传统三比值法更优越的性能。然而,随着智能电网的高速发展,这些方法也逐渐难以适应更大的数据规模了。一方面,这些方法依然是用传统的DGA气体去做故障预测,而忽略了其它一些可能和变压器工作状态相关的隐藏因素,比如油温和接地电流等。另一方面,当数据集越来越大时,会产生很多的冗余和噪声,如果不做任何预处理而直接输入分类器,会导致预测精度下降和***运算时间的增加。皮尔逊系数分析法(PCC)可通过计算皮尔逊系数找出与变压器故障有隐藏关联的其它电力数据,为故障诊断增加新的依据。而主成分分析法(PCA)可对越来越大的时间序列进行数据清洗,达到降维、降噪的效果。
申请号为201210302062.9的发明专利公开了一种基于大卫三角形法和置信度高低进行变电站中电压器故障的诊断方法。申请号为201310068804.0的发明专利公开了一种基于模糊聚类的变压器故障诊断方法。在处理类似于电力设备的故障数据时它们都可用于提高准确性,但是由于只关注机器学习的训练过程,而缺乏对采集数据的预处理,效率存在明显局限:即当数据规模越来越大时,训练数据中存在大量的冗余和噪声,训练效率低下且一定程度上影响了最终的准确性。
发明内容
本发明的目的就是为了解决上述问题,提供一种基于关联分析和主成分分析的时间序列数据清洗方法,它具有在大规模数据背景可提高变压器故障诊断的准确度,同时提升***的响应速度的优点。
为了实现上述目的,本发明采用如下技术方案:
一种基于关联分析和主成分分析的时间序列数据清洗方法,包括以下步骤:
步骤S1:采用皮尔逊系数分析法PCC(Pearson’sCorrelationCoefficient)从电力生产管理***PMS(ProductionManagementSystem)中找出与变压器故障有隐藏关联的电力数据作为与故障相关的时间序列,为变压器增加新的故障诊断依据;
步骤S2:采用主成分分析法PCA(PrincipalComponentAnalysis)对与故障相关的时间序列进行数据清洗,达到降维、降噪的效果;所述数据清洗包括计算相关系数矩阵、计算特征值和特征向量以及选择主成分;
步骤S3:将步骤S2清洗后的时间序列数据作为训练集,输入到BP神经网络(BPNN,BackPropagationNeuralNetwork)中进行训练学习,得到关于电力数据时间序列和故障类型关系的训练模型,并且再次使用训练集中的数据作为测试集对训练模型加以测试,以验证训练模型的有效性。
所述步骤S1中,每次将从候选数据指标中选取一种计算出候选数据指标的皮尔逊系数,如果候选数据指标的皮尔逊系数大于设定阈值,则认为该候选数据指标与变压器故障结果强相关,则引入该候选数据指标作为新的故障诊断依据。
所述步骤S2的相关系数矩阵计算步骤为:
对于两个给定的n维向量X和Y,它们的相关系数矩阵R定义为:
式中,rij(i,j=1,2,…,n)为表达原始变量Xi和Xj之间关联程度的相关系数,其中Xi和Xj是一维向量,rij计算公式如下:
r i j = Σ k = 1 n ( ( X i j - X l ‾ ) × ( X k j - X J ‾ ) ) Σ k = 1 n ( ( X k i - X l ‾ ) 2 ) × Σ k = 1 n ( ( X k i - X l ‾ ) 2 )
其中,rij为一维向量Xi和Xj的相关系数,Xki表示一维向量Xi中的第k个元素,Xkj表示一
维向量Xj中的第k个元素,表示一维向量Xi的平均值,表示一维向量Xj的平均值,
计算公式为:
X l ‾ = Σ k = 1 n ( X k i ) n
因为R是实对称矩阵,所以只需计算实对称矩阵R的上三角元素或者下三角元素即可。
所述步骤S2的特征值与特征向量计算步骤为:
特征值是特征方程|λI-R|=0的解;
其中,I是单位向量,R表示符合相关系数矩阵。
利用特征方程求出所有特征值λi(i=1,2,...,n),并按大小排序,即令λ1≥λ2≥…λn≥0;然后带入特征方程分别求出对应特征值λi的特征向量Ui
Y 1 Y 2 . . . Y n = U 1 U 2 ... U n X 1 X 2 . . . X n = U 11 X 1 + U 21 X 2 + ... U n 1 X n U 12 X 1 + U 22 X 2 + ... U n 2 X n . . . U l n X 1 + U 2 n X 1 + ... U n n X n
其中,Ui是一维特征向量,Uik表示Ui中的第k个元素,Y1,Y2,…,Yn即分别是第1,2,…n个主成分。
所述步骤S2选择主成分步骤为:
定义特征值λi(i=1,2,...,n)的信息贡献率:
D o n a t i o n R a t e ( i ) Σ i = 1 k λ i Σ j = 1 n λ j , ( i = 1 , 2 , ... , n )
当累计贡献率接近1时(累计贡献率为大于85%),前m个特征值λ1,λ2,....,λm对应的m个主成分即被选为新的指标变量。
本发明的有益效果:
1、本方法运用关联分析方法发掘出油温和变压器工作状态间的高关联度,并且通过加入油温这个强关联度的额外因素提高数据清洗降维的准确度。
2、本方法运用PCA预处理方法,对与故障相关的时间序列进行数据清洗,达到降维、降噪的效果显著提高了变压器故障诊断的精确度。
3、与传统方法相比,虽然本方法多了两个步骤,但在面对高维数据时,运算时间更短。
4、本发明是一整套处理流程,通过该流程增加了具有学习价值的特征,充分发掘对故障诊断有用的信息,针对电网大数据,对可获得的数据进行整合,通过构造原始指标的适当线性组合,产生一系列互不线性相关的综合性指标,从中选出少数几个新的综合指标,并且使它们尽可能多地含有原始指标所含有的信息,即用较少的指标去解释原来资料的信息。最后利用神经网络进行学习,可在更短时间获得更准确的故障判断结果。
附图说明
图1基于关联分析和主成分分析的时间序列数据清洗方法流程图;
图2(a)相关系数为1的时间序列;
图2(b)相关系数为0的时间序列;
图2(c)相关系数为-1的时间序列;
图3(a)和图3(b)BP神经网络示意图;
图4油温与总烃气体关系示意图;
图5特征数与执行时间关系示意图;
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
如图1所示,一种基于关联分析和主成分分析的时间序列数据清洗方法,包括以下步骤:
步骤S1:采用皮尔逊系数分析法(PCC)找出和变压器故障有隐藏关联的其它电力数据,为故障诊断增加新的依据。
本发明在此阶段采用皮尔逊分析法(PCC)分析其它电力数据。皮尔逊分析法(PCC)是一种广泛用于模式识别、统计分析和图像处理的度量方法,皮尔逊系数是表示两个数据集间线性相关程度的参数,其取值区间为[-1,1],1代表完全正相关,-1代表完全负相关,0表示没有任何关系,示意图如图2(a)、图2(b)、图2(c)所示。图2(a)表示完全正相关,图2(b)表示没有关系,图2(c)表示完全负相关。
在本发明中采用一维时间序列作为输入数据,对于数据集X和Y,他们之间的皮尔逊系数表示为:
r = r x y = Σ i = 1 N ( X i - X ‾ ) × ( Y i - Y ‾ ) Σ i = 1 N - ( X i - X ‾ ) 2 × Σ i = 1 N - ( Y i - Y ‾ ) 2
步骤S2:使用主成分分析法清洗数据
本发明在此阶段采用的主成分分析法也称主向量分析法。其从可观测的显示变量中提取信息,组成不可直接观测的隐含变量。在用统计方法研究多变量问题时,变量越多,计算量和增加分析问题的复杂性就越大,因此人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析法利用降维的思想,通过构造原始指标的适当线性组合,产生一系列互不线性相关的综合性指标,从中选出少数几个新的综合指标,并且使它们尽可能多地含有原始指标所含有的信息,即用较少的指标去解释原来资料的信息。具体实现方法是通过一系列的数学变换,将给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,I个变量就有I个主成分。
本步骤分为三步:计算相关系数矩阵、计算特征值和特征向量、以及选择主成分。
(1)计算相关矩阵系数
在计算之前首先要将数据标准化。输入数据为N个一维向量,将这N个输入向量组成一个新的N×I的矩阵,包括n个原始溶解气体分析法的变量和上一步皮尔逊方法得到的新变量,这个矩阵由之前的原始变量时间序列和上一步皮尔逊方法得到的相关系数构成。我们需要计算所有变量之间的相关系数,最后输出相关系数矩阵R。
其中rij(i,j=1,2,…,N)表示原始变量Xi,Xj关联程度的相关系数,其中Xi,Xj是一维向量。其计算公式如下:
r i j = Σ k = 1 n ( ( X k i - X ‾ i ) × ( X k - j - X ‾ j ) ) Σ k = 1 n - ( ( X k i - X ‾ i ) 2 ) × Σ k = 1 n - ( ( X k i - X ‾ i ) 2 )
(2)计算特征值与特征向量
首先解特征方程|λE-R|=0(其中E是单位向量,R表示相关系数矩阵)求出特征值,并按大小排序,然后分别求出对应特征值λi(i=1,2,...,n)的特征向量Ui(i=1,2,...,n)其中特征向量U是n×1的向量,所以用Uij来表示第i个特征向量中的第j个数得到特征向量之后,便可得到主成分矩阵Y,其中每一行Y,其中每一行Yi代表第i个主成分
Y 1 Y 2 . . . Y n = U 1 U 2 ... U n X 1 X 2 . . . X n = U 11 X 1 + U 21 X 2 + ... U n 1 X n U 12 X 1 + U 22 X 2 + ... U n 2 X n . . . U l n X 1 + U 2 n X 1 + ... U n n X n
(3)选择主成分
计算每个特征向量的信息贡献率,计算特征值λi(i=1,2,...,n)的累计贡献率
D e n o t i o n R a t e ( n ) = Σ m = 1 k λ m Σ m = 1 n λ m
当累计贡献率接近1时(本方法中我们所取累计贡献率为大于85%),前m个特征值λ1,λ2...λm对应的m个主成分即被选为新的指标变量。
步骤S3:用BP神经网络进行故障诊断
BP(BackPropagation)神经网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学***方和最小。
BP神经网络模型拓扑结构包括输入层(inputlayer)、隐藏层(hiddenlayer)和输出层(outputlayer),图3(a)和图3(b)是BP神经网络的结构图。
经过上一步PCA的预处理过程,我们可以得到更高质量的训练样本。该训练集被馈送到网络中,所传送的值由输入层经中间层向前传播到输出层。然后,我们可以得到输出层中对输入的响应。接着,为了减少实际输出和期望输出之间的误差,连接权重从输出层调整到中间层,最后再根据梯度下降的方向调整至输入层。因为BPNN包含中间的隐含层,所以它具备实现非线性模型的能力。
在开始用BP神经网络进行训练之前,偏离率和权重必须初始化。我们使用零附近的随机数初始化网络中的权重和偏离率。然后,当新的数据集Yn送入BP网络时,网络的权重和偏差会进行迭代调整,以减少在训练过程中对网络性能的功能性影响。
经过神经网络的训练之后,我们便能得到一个新的故障诊断的模型。
为了检测本方法的可靠性及其性能,从国家电网和其他检测***收集了相关历史数据,比如油温、环境湿度和负载电流。还有超过200条包含故障类型的数据供我们验证本方法的有效性。
(1)新指标与实验数据的相关性
在本实验基于所掌握的历史运行数据,用PCC法计算出各新指标和总烃的相关程度,以评判哪些新指标是有效的。各指标和总烃间的PCC值如表1所示:
表1非气体指标及其皮尔逊系数
对于PCC法来说,皮尔逊系数的绝对值和相关程度的关系可参考表2:
表2皮尔逊系数及相关程度对照表
通过以上两表可以得出“油温”这一指标和总烃之间存在很强的相关性。实际上通过在同一张图中绘制油温和总烃两个时间序列的变化趋势,也可以看出油温和总烃随着时间变化的趋势几乎一致,如图4所示。
至此,已有充分的理由把油温这一指标也加入故障诊断中来。
(2)新指标数据集与传统指标分类准确性的对比
来自国家电网的前150条故障数据当做训练集输入到BP神经网络进行训练学习,并用剩下的故障数据作为测试集进行准确率的验证。值得一提的是,为了方便神经网络的学习,我们把故障数据中的各故障类型用不同的数字来标识,对应关系如表3:
表3故障类型与类型编号对照表
最终发现用只用原先传统的7种指标时,故障分类的准确性是61.30%,而当增加油温作为第8种指标时,分类的准确率就提高到了81.05%。
(3)预处理对准确性的影响
当数据规模变大后,原始数据不可避免地会包含很多噪声和冗余,如果直接输入神经网络中,会对最终***的性能不利。因此本方法在神经网络的输入层之前增加了一个基于主成分分析的数据清洗流程。
基于本方法的步骤二可分别计算出有无油温的两种情况下的主成分累计贡献率。随着主成分数量k的增加,两种情况下累计贡献率的增长情况如表4:
表4有无油温指标时累计贡献率
可以看出,当k=3时,两种情况下的累计贡献率均已超过了85%。所以我们可以选择前3个主成分作为新的训练集输入BP神经网络。最终的分类结果证明了经过PCA的预处理,两种情况下的性能都有不同程度的提升。其中,只有7项指标时,准确率提高到了85.17%,考虑油温时,准确率提高到了91.57%。
(4)新方法处理与传统方法对比
各情况下故障诊断准确率的总结,如下表所示:
分类准确率 无油温 有油温
无PCA预处理 61.30% 81.05%
有PCA预处理 85.17% 91.57%
通过上表的汇总,可以得出3个结论:
a)增加油温这一指标可以有效提高故诊断的准确率;
b)PCA预处理方法可以有效减少原始数据的噪声和维度,从而简化***结构,提高故障分类的准确率;
c)当同时采用油温指标和PCA预处理时,分类的效果达到了最高的91.57%,证明我们的方法行之有效。
(5)本方法和传统方法的运行时间的对比
本实验分别记录了当输入指标数从5到8的增长过程中,两种方法的运行时间,并绘制折线图如图5所示。
通过上图可以看出,虽然本方法多了两个过程,但随着数据维度的增加,本方法的运行速度逐渐快于传统的BPNN方法。而且本方法运行时间的斜率更小,意味着当面对更高的数据维度时,本方法有着更好的可扩展性。
所以相比于传统方法,本方法显然有着更优越的性能,可以考虑在电力***中推行。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (6)

1.一种基于关联分析和主成分分析的时间序列数据清洗方法,其特征是,包括以下步骤:
步骤S1:采用皮尔逊系数分析法PCC从电力生产管理***PMS中找出与变压器故障有隐藏关联的电力数据作为与故障相关的时间序列,为变压器增加新的故障诊断依据;
步骤S2:采用主成分分析法PCA对与故障相关的时间序列进行数据清洗,达到降维、降噪的效果;所述数据清洗包括计算相关系数矩阵、计算特征值和特征向量以及选择主成分;
步骤S3:将步骤S2清洗后的时间序列数据作为训练集,输入到BP神经网络中进行训练学习,得到关于电力数据时间序列和故障类型关系的训练模型,并且再次使用训练集中的数据作为测试集对训练模型加以测试,以验证训练模型的有效性。
2.如权利要求1所述的一种基于关联分析和主成分分析的时间序列数据清洗方法,其特征是,
所述步骤S1中,每次将从候选数据指标中选取一种计算出候选数据指标的皮尔逊系数,如果候选数据指标的皮尔逊系数大于设定阈值,则认为该候选数据指标与变压器故障结果强相关,则引入该候选数据指标作为新的故障诊断依据。
3.如权利要求1所述的一种基于关联分析和主成分分析的时间序列数据清洗方法,其特征是,
所述步骤S2的相关系数矩阵计算步骤为:
对于两个给定的n维向量X和Y,它们的相关系数矩阵R定义为:
式中,rij为表达原始变量Xi和Xj之间关联程度的相关系数,i,j=1,2,…,n,其中Xi和Xj是一维向量,rij计算公式如下:
r i j = Σ k = 1 n ( ( X k i - X l ‾ ) × ( X k j - X J ‾ ) ) Σ k = 1 n ( ( X k i - X l ‾ ) 2 ) × Σ k = 1 n ( ( X k i - X l ‾ ) 2 )
其中,rij为一维向量Xi和Xj的相关系数,Xki表示一维向量Xi中的第k个元素,Xkj表示一维向量Xj中的第k个元素,表示一维向量Xi的平均值,表示一维向量Xj的平均值,计算公式为:
X l ‾ = Σ k = 1 n ( X k i ) n
因为R是实对称矩阵,所以只需计算实对称矩阵R的上三角元素或者下三角元素即可。
4.如权利要求1所述的一种基于关联分析和主成分分析的时间序列数据清洗方法,其特征是,
所述步骤S2的特征值与特征向量计算步骤为:
特征值是特征方程|λI-R|=0的解;
其中,I是单位向量,R表示符合相关系数矩阵;
利用特征方程求出所有特征值λi,i=1,2,...,n,并按大小排序,即令λ1≥λ2≥…λn≥0;然后带入特征方程分别求出对应特征值λi的特征向量Ui
Y 1 Y 2 . . . Y n = | U 1 U 2 ... U n | × | X 1 X 2 . . . X n | = | U 11 X 1 + U 21 X 2 + ... U n 1 X n U 12 X 1 + U 22 X 2 + ... U n 2 X n . . . U 1 n X 1 + U 2 n X 1 + ... U n n X n |
其中,Ui是一维特征向量,Uik表示Ui中的第k个元素,Y1,Y2,…,Yn即分别是第1,2,…n个主成分。
5.如权利要求1所述的一种基于关联分析和主成分分析的时间序列数据清洗方法,其特征是,
所述步骤S2选择主成分步骤为:
定义特征值λi(i=1,2,...,n)的信息贡献率:
D o n a t i o n R a t e ( i ) = Σ i = 1 k λ i Σ j = 1 n λ j , ( i = 1 , 2 , ... , n )
当累计贡献率接近1时,前m个特征值λ1,λ2,…·,λm对应的m个主成分即被选为新的指标变量。
6.如权利要求1所述的一种基于关联分析和主成分分析的时间序列数据清洗方法,其特征是,当累计贡献率接近1即累计贡献率为大于85%。
CN201510902558.3A 2015-12-08 2015-12-08 一种基于关联分析和主成分分析的时间序列数据清洗方法 Active CN105550700B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510902558.3A CN105550700B (zh) 2015-12-08 2015-12-08 一种基于关联分析和主成分分析的时间序列数据清洗方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510902558.3A CN105550700B (zh) 2015-12-08 2015-12-08 一种基于关联分析和主成分分析的时间序列数据清洗方法

Publications (2)

Publication Number Publication Date
CN105550700A true CN105550700A (zh) 2016-05-04
CN105550700B CN105550700B (zh) 2019-04-09

Family

ID=55829883

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510902558.3A Active CN105550700B (zh) 2015-12-08 2015-12-08 一种基于关联分析和主成分分析的时间序列数据清洗方法

Country Status (1)

Country Link
CN (1) CN105550700B (zh)

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106055579A (zh) * 2016-05-20 2016-10-26 上海交通大学 基于人工神经网络的车辆性能数据清洗***及其方法
CN106529124A (zh) * 2016-10-14 2017-03-22 云南电网有限责任公司昆明供电局 基于主成分分析与支持向量机的变压器绝缘状态评估方法
CN106557546A (zh) * 2016-10-20 2017-04-05 中国电力科学研究院 一种对特高压在线监测数据进行挖掘并评价的方法及***
CN106569069A (zh) * 2016-11-04 2017-04-19 广州供电局有限公司 电力变压器故障诊断方法
CN106771091A (zh) * 2016-11-21 2017-05-31 浙江大学 油浸式变压器在线监测数据和带电检测数据间***误差的评价方法
CN106774229A (zh) * 2016-12-16 2017-05-31 杭州和利时自动化有限公司 一种soe参数异动分析方法及装置
CN107590506A (zh) * 2017-08-17 2018-01-16 北京航空航天大学 一种基于特征处理的复杂设备故障诊断方法
CN107679089A (zh) * 2017-09-05 2018-02-09 全球能源互联网研究院 一种用于电力传感数据的清洗方法、装置和***
CN107728602A (zh) * 2017-09-28 2018-02-23 合肥工业大学 一种液压成形装备故障的个性化服务方法
CN107862468A (zh) * 2017-11-23 2018-03-30 深圳市智物联网络有限公司 设备风险识别模型建立的方法及装置
CN107992959A (zh) * 2017-04-26 2018-05-04 国网浙江省电力公司 一种基于电力大数据可视化神经网络数据挖掘技术的电力故障预测方法
CN108088916A (zh) * 2017-12-05 2018-05-29 国网山东省电力公司电力科学研究院 一种油中溶解气体在线监测数据质量的提升方法及***
WO2018152527A1 (en) * 2017-02-17 2018-08-23 Accuweather, Inc. System and method for forecasting economic trends using statistical analysis of weather data
CN108805415A (zh) * 2018-05-22 2018-11-13 国网江西省电力有限公司电力科学研究院 基于历史信息挖掘的变压器本体关键评价指标选取方法
CN108805195A (zh) * 2018-04-03 2018-11-13 北京理工大学 一种基于二值深层神经网络的电机群故障诊断方法
CN108959498A (zh) * 2018-06-26 2018-12-07 北京航空航天大学 一种用于健康监测的大数据处理平台及其设计方法
CN109067598A (zh) * 2018-09-25 2018-12-21 江苏润和软件股份有限公司 一种基于图中心度的云计算***物理设备故障检测方法
CN109101986A (zh) * 2018-06-07 2018-12-28 国网山东省电力公司青岛供电公司 基于栈式降噪自编码器的输变电设备状态异常检测方法和***
CN109190979A (zh) * 2018-09-03 2019-01-11 深圳市智物联网络有限公司 一种工业物联网数据分析方法、***及相关设备
CN109324595A (zh) * 2018-09-19 2019-02-12 西安理工大学 一种基于增量pca的工业监测数据分类方法
CN109740859A (zh) * 2018-12-11 2019-05-10 国网山东省电力公司淄博供电公司 基于主成分分析法和支持向量机的变压器状态评估方法及***
CN109919432A (zh) * 2019-01-28 2019-06-21 国网湖北省电力有限公司宜昌供电公司 一种基于大数据的变电站设备故障影响因素分析方法
CN110288114A (zh) * 2019-03-22 2019-09-27 国网浙江省电力有限公司信息通信分公司 基于电力营销数据的违规用电行为预测方法
CN110441065A (zh) * 2019-07-04 2019-11-12 杭州华电江东热电有限公司 基于lstm的燃气轮机在线检测方法与装置
CN110472671A (zh) * 2019-07-24 2019-11-19 西安工程大学 基于多阶段的油浸式变压器故障数据预处理方法
CN111143101A (zh) * 2019-12-12 2020-05-12 东软集团股份有限公司 用于确定故障根源的方法、装置、存储介质及电子设备
CN111614489A (zh) * 2020-04-27 2020-09-01 国网山东省电力公司电力科学研究院 基于稀疏自编码的暂态录波故障数据清洗方法和***
CN111982149A (zh) * 2020-08-20 2020-11-24 歌尔科技有限公司 一种计步识别方法、装置、设备及可读存储介质
CN112070154A (zh) * 2020-09-07 2020-12-11 常州微亿智造科技有限公司 时间序列数据处理方法和装置
CN112253236A (zh) * 2020-10-13 2021-01-22 中煤科工集团西安研究院有限公司 利用相关性分析对矿井电法监测数据进行数据清洗的方法
CN112365045A (zh) * 2020-11-09 2021-02-12 上海明华电力科技有限公司 一种基于大数据的主蒸汽温度智能预测方法
CN112699921A (zh) * 2020-12-16 2021-04-23 重庆邮电大学 一种基于堆栈降噪自编码的电网暂态故障数据聚类清洗方法
CN112964476A (zh) * 2020-12-25 2021-06-15 中汽研汽车检验中心(天津)有限公司 一种重型柴油车实际道路颗粒物排放在线预测方法
CN113189418A (zh) * 2021-04-12 2021-07-30 中能瑞通(北京)科技有限公司 一种基于电压数据的拓扑关系识别方法
CN115046764A (zh) * 2022-05-05 2022-09-13 燕山大学 一种滚动轴承早期故障诊断方法
CN115204235A (zh) * 2022-07-22 2022-10-18 大庆正方软件科技股份有限公司 一种基于时序分析的电参降噪方法
CN116384012A (zh) * 2023-06-05 2023-07-04 中国航发四川燃气涡轮研究院 一种航空发动机涡轮盘应力预测方法
CN117632664A (zh) * 2024-01-11 2024-03-01 深圳市柏特瑞电子有限公司 一种基于自动比对的机房设备监测方法及***

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722660A (zh) * 2012-06-29 2012-10-10 广州供电局有限公司 空气击穿电压的预测方法与装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722660A (zh) * 2012-06-29 2012-10-10 广州供电局有限公司 空气击穿电压的预测方法与装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
J. L. GUARDADO等: "A Comparative Study of Neural Network Efficiency in Power Transformers Diagnosis Using Dissolved Gas Analysis", 《IEEE TRANSACTIONS ON POWER DELIVERY》 *
严英杰等: "基于关联规则和主成分分析的输电线路状态评价关键参数体系构建", 《高电压技术》 *
严英杰等: "基于时间序列分析的输变电设备状态大数据清洗方法", 《电力***自动化》 *
杨廷方等: "基于改进型主成分分析的电力变压器潜伏性故障诊断", 《电力自动化设备》 *
知乎用户: "机器学习中,有哪些特征选择的工程方法?", 《HTTPS://WWW.ZHIHU.COM/QUESTION/28641663》 *

Cited By (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106055579B (zh) * 2016-05-20 2020-01-21 上海交通大学 基于人工神经网络的车辆性能数据清洗***及其方法
CN106055579A (zh) * 2016-05-20 2016-10-26 上海交通大学 基于人工神经网络的车辆性能数据清洗***及其方法
CN106529124A (zh) * 2016-10-14 2017-03-22 云南电网有限责任公司昆明供电局 基于主成分分析与支持向量机的变压器绝缘状态评估方法
CN106557546A (zh) * 2016-10-20 2017-04-05 中国电力科学研究院 一种对特高压在线监测数据进行挖掘并评价的方法及***
CN106557546B (zh) * 2016-10-20 2021-03-02 中国电力科学研究院 一种对特高压在线监测数据进行挖掘并评价的方法及***
CN106569069A (zh) * 2016-11-04 2017-04-19 广州供电局有限公司 电力变压器故障诊断方法
CN106771091A (zh) * 2016-11-21 2017-05-31 浙江大学 油浸式变压器在线监测数据和带电检测数据间***误差的评价方法
CN106774229A (zh) * 2016-12-16 2017-05-31 杭州和利时自动化有限公司 一种soe参数异动分析方法及装置
CN106774229B (zh) * 2016-12-16 2019-06-21 杭州和利时自动化有限公司 一种soe参数异动分析方法及装置
WO2018152527A1 (en) * 2017-02-17 2018-08-23 Accuweather, Inc. System and method for forecasting economic trends using statistical analysis of weather data
CN107992959A (zh) * 2017-04-26 2018-05-04 国网浙江省电力公司 一种基于电力大数据可视化神经网络数据挖掘技术的电力故障预测方法
CN107590506A (zh) * 2017-08-17 2018-01-16 北京航空航天大学 一种基于特征处理的复杂设备故障诊断方法
CN107679089A (zh) * 2017-09-05 2018-02-09 全球能源互联网研究院 一种用于电力传感数据的清洗方法、装置和***
CN107679089B (zh) * 2017-09-05 2021-10-15 全球能源互联网研究院 一种用于电力传感数据的清洗方法、装置和***
CN107728602A (zh) * 2017-09-28 2018-02-23 合肥工业大学 一种液压成形装备故障的个性化服务方法
CN107862468A (zh) * 2017-11-23 2018-03-30 深圳市智物联网络有限公司 设备风险识别模型建立的方法及装置
CN108088916B (zh) * 2017-12-05 2019-06-04 国网山东省电力公司电力科学研究院 一种油中溶解气体在线监测数据质量的提升方法及***
CN108088916A (zh) * 2017-12-05 2018-05-29 国网山东省电力公司电力科学研究院 一种油中溶解气体在线监测数据质量的提升方法及***
CN108805195A (zh) * 2018-04-03 2018-11-13 北京理工大学 一种基于二值深层神经网络的电机群故障诊断方法
CN108805415A (zh) * 2018-05-22 2018-11-13 国网江西省电力有限公司电力科学研究院 基于历史信息挖掘的变压器本体关键评价指标选取方法
CN109101986A (zh) * 2018-06-07 2018-12-28 国网山东省电力公司青岛供电公司 基于栈式降噪自编码器的输变电设备状态异常检测方法和***
CN108959498A (zh) * 2018-06-26 2018-12-07 北京航空航天大学 一种用于健康监测的大数据处理平台及其设计方法
CN109190979A (zh) * 2018-09-03 2019-01-11 深圳市智物联网络有限公司 一种工业物联网数据分析方法、***及相关设备
CN109324595A (zh) * 2018-09-19 2019-02-12 西安理工大学 一种基于增量pca的工业监测数据分类方法
CN109067598A (zh) * 2018-09-25 2018-12-21 江苏润和软件股份有限公司 一种基于图中心度的云计算***物理设备故障检测方法
CN109740859A (zh) * 2018-12-11 2019-05-10 国网山东省电力公司淄博供电公司 基于主成分分析法和支持向量机的变压器状态评估方法及***
CN109919432A (zh) * 2019-01-28 2019-06-21 国网湖北省电力有限公司宜昌供电公司 一种基于大数据的变电站设备故障影响因素分析方法
CN110288114A (zh) * 2019-03-22 2019-09-27 国网浙江省电力有限公司信息通信分公司 基于电力营销数据的违规用电行为预测方法
CN110441065A (zh) * 2019-07-04 2019-11-12 杭州华电江东热电有限公司 基于lstm的燃气轮机在线检测方法与装置
CN110441065B (zh) * 2019-07-04 2022-02-08 杭州华电江东热电有限公司 基于lstm的燃气轮机在线检测方法与装置
CN110472671A (zh) * 2019-07-24 2019-11-19 西安工程大学 基于多阶段的油浸式变压器故障数据预处理方法
CN111143101A (zh) * 2019-12-12 2020-05-12 东软集团股份有限公司 用于确定故障根源的方法、装置、存储介质及电子设备
CN111614489A (zh) * 2020-04-27 2020-09-01 国网山东省电力公司电力科学研究院 基于稀疏自编码的暂态录波故障数据清洗方法和***
CN111982149A (zh) * 2020-08-20 2020-11-24 歌尔科技有限公司 一种计步识别方法、装置、设备及可读存储介质
CN112070154A (zh) * 2020-09-07 2020-12-11 常州微亿智造科技有限公司 时间序列数据处理方法和装置
CN112253236A (zh) * 2020-10-13 2021-01-22 中煤科工集团西安研究院有限公司 利用相关性分析对矿井电法监测数据进行数据清洗的方法
CN112253236B (zh) * 2020-10-13 2022-09-23 中煤科工集团西安研究院有限公司 利用相关性分析对矿井电法监测数据进行数据清洗的方法
CN112365045A (zh) * 2020-11-09 2021-02-12 上海明华电力科技有限公司 一种基于大数据的主蒸汽温度智能预测方法
CN112699921B (zh) * 2020-12-16 2022-07-15 重庆邮电大学 一种基于堆栈降噪自编码的电网暂态故障数据聚类清洗方法
CN112699921A (zh) * 2020-12-16 2021-04-23 重庆邮电大学 一种基于堆栈降噪自编码的电网暂态故障数据聚类清洗方法
CN112964476A (zh) * 2020-12-25 2021-06-15 中汽研汽车检验中心(天津)有限公司 一种重型柴油车实际道路颗粒物排放在线预测方法
CN112964476B (zh) * 2020-12-25 2022-11-25 中汽研汽车检验中心(天津)有限公司 一种重型柴油车实际道路颗粒物排放在线预测方法
CN113189418A (zh) * 2021-04-12 2021-07-30 中能瑞通(北京)科技有限公司 一种基于电压数据的拓扑关系识别方法
CN115046764A (zh) * 2022-05-05 2022-09-13 燕山大学 一种滚动轴承早期故障诊断方法
CN115204235A (zh) * 2022-07-22 2022-10-18 大庆正方软件科技股份有限公司 一种基于时序分析的电参降噪方法
CN115204235B (zh) * 2022-07-22 2024-05-03 大庆正方软件科技股份有限公司 一种基于时序分析的电参降噪方法
CN116384012A (zh) * 2023-06-05 2023-07-04 中国航发四川燃气涡轮研究院 一种航空发动机涡轮盘应力预测方法
CN117632664A (zh) * 2024-01-11 2024-03-01 深圳市柏特瑞电子有限公司 一种基于自动比对的机房设备监测方法及***
CN117632664B (zh) * 2024-01-11 2024-04-26 深圳市柏特瑞电子有限公司 一种基于自动比对的机房设备监测方法及***

Also Published As

Publication number Publication date
CN105550700B (zh) 2019-04-09

Similar Documents

Publication Publication Date Title
CN105550700A (zh) 一种基于关联分析和主成分分析的时间序列数据清洗方法
Zhu et al. Wavelet-based fuzzy reasoning approach to power-quality disturbance recognition
CN103914064B (zh) 基于多分类器和d-s证据融合的工业过程故障诊断方法
CN108445752B (zh) 一种自适应选择深度特征的随机权神经网络集成建模方法
CN107832777A (zh) 一种采用时域压缩多分辨率快速s变换特征提取的电能质量扰动识别方法
CN103927412A (zh) 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法
CN104537415A (zh) 一种基于压缩感知和dros-elm的非线性过程工业故障预测及识别方法
CN105046376A (zh) 考虑指标相关性的水库群防洪调度方案优选方法
CN104966161A (zh) 一种基于高斯混合模型的电能质量录波数据计算分析方法
Yang et al. An integrated model combined ARIMA, EMD with SVR for stock indices forecasting
CN105447646A (zh) 一种配电***健康指数评估方法
CN102253301B (zh) 基于微分进化算法和回声状态网络静态分类的模拟电路故障诊断方法
CN105160496A (zh) 一种企业电力能效综合评估方法
CN104634265A (zh) 一种基于多元图像特征融合的矿物浮选泡沫层厚度软测量方法
Yang et al. An intelligent singular value diagnostic method for concrete dam deformation monitoring
Saikia et al. Detection and classification of power quality disturbances using wavelet transform, fuzzy logic and neural network
CN111325233A (zh) 一种变压器故障检测方法及装置
CN114021758A (zh) 一种基于梯度提升决策树与逻辑回归融合的运维人员智能推荐方法和装置
CN104376370A (zh) 一种大坝水平位移预测方法
CN112636328B (zh) 一种中压配电网设备负荷状态辨识方法
CN106447537A (zh) 一种电能质量时间序列相关性评估方法
CN116224158A (zh) 基于CNN-LSTM-Attention的多端柔性直流输电线路单极接地故障定位方法
Kim et al. Anomaly pattern detection in streaming data based on the transformation to multiple binary-valued data streams
Agarwal Abductive networks for two-group classification: a comparison with neural networks
CN105975774A (zh) 一种基于超效率dea模型的工业用户能源利用效率评价方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant