CN113987033B - 主变在线监测数据群体偏差识别与校准方法 - Google Patents

主变在线监测数据群体偏差识别与校准方法 Download PDF

Info

Publication number
CN113987033B
CN113987033B CN202111615216.5A CN202111615216A CN113987033B CN 113987033 B CN113987033 B CN 113987033B CN 202111615216 A CN202111615216 A CN 202111615216A CN 113987033 B CN113987033 B CN 113987033B
Authority
CN
China
Prior art keywords
data
deviation
association
node
line segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111615216.5A
Other languages
English (en)
Other versions
CN113987033A (zh
Inventor
童超
辛建波
康琛
周梦垚
许勇
朱自伟
刘凤龙
李阳林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Jiangxi Electric Power Co ltd
State Grid Corp of China SGCC
Nanchang University
Electric Power Research Institute of State Grid Jiangxi Electric Power Co Ltd
Original Assignee
State Grid Jiangxi Electric Power Co ltd
State Grid Corp of China SGCC
Nanchang University
Electric Power Research Institute of State Grid Jiangxi Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Jiangxi Electric Power Co ltd, State Grid Corp of China SGCC, Nanchang University, Electric Power Research Institute of State Grid Jiangxi Electric Power Co Ltd filed Critical State Grid Jiangxi Electric Power Co ltd
Priority to CN202111615216.5A priority Critical patent/CN113987033B/zh
Publication of CN113987033A publication Critical patent/CN113987033A/zh
Application granted granted Critical
Publication of CN113987033B publication Critical patent/CN113987033B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/086Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Strategic Management (AREA)
  • Fuzzy Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Biology (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Physiology (AREA)
  • Game Theory and Decision Science (AREA)

Abstract

本发明公开了一种主变在线监测数据群体偏差识别与校准方法,数据收集;对线下数据校核过的在线监测数据进行分段线性化,提取线段曲线与数据群体特征;构建分段关联挖掘模型,对曲线特征表征的线段集合进行符号化,使用Apriori算法挖掘在线检测数据不同指标的关联性,发现异常数值;考虑时段特性获取支持度变化,并识别数据偏差;利用强关联指标序列构建多指标预测模型,完成偏差校准;利用校准数据重新计算不同指标的关联性,验证数据群体偏差校准的可靠性。本发明可通过挖掘不同指标序列的关联规则,识别数据群体偏差,并构建一种基于改进遗传算法优化的BP神经网络算法多指标预测模型对数据群体偏差进行校准。

Description

主变在线监测数据群体偏差识别与校准方法
技术领域
本发明一种主变在线监测数据群体偏差识别与校准方法,属于电力设备在线监测数据清洗领域。
背景技术
变压器是电能转换与传输的枢纽设备,其安全稳定的运行是对用户供电质量的重要保障。变压器的DGA在线监测数据是对设备绝缘性能的实时监测,DGA在线监测数据是对变压器进行状态评估的重要依据。一段时间的监测数据,包含其整体变化趋势、变化中的极值点及跃变点以及数据统计特征,可以从多方面反映变压器内部可能存在的异常状况。同时,在线监测装置作为变压器的一部分,其健康状态也关系着变压器的整体健康,影响着在线监测数据的有效性和合理性。
随着运行时间的不断累积,在运行过程中,DGA在线监测装置暴露的问题日益增多,问题主要原因有两方面,一方面由于不同产家的产品质量问题或供电局管理问题,导致各种软件、硬件故障问题频发,这类问题的主要特征是数据出现个别异常点,或信号断开等情况;另一方面由于装置采样传感器随着运行时间的积累,某个指标传感器读取的数据会一直存在一个偏差,导致该指标数据整体偏离实际值。截至目前,国内外有许多针对在线监测数据出现异常点的清洗方法,但对数据群体偏移缺乏有效的分析手段。供电公司为解决数据出现的整体偏移导致的误判,现采用的方式主要是要求运维单位每隔一段数据用标准的变压器油去现场人工校准或对偏差数据进行删除操作。这种方式低效、耗时、耗力且费用昂贵,大大降低了电力设备在线监测装置(OMDS)的实时性,很多地区往往因为运维不及时导致在线监测数据误报,为了避免误报,很多单位直接把信号断了或者把预警关了,导致变压器在线监测装置无法发挥其监测效果,使得变压器潜伏故障的预警变得无计可施。
现场迫切需要更加便捷智能的方式对在线监测数据群体偏差进行识别并进行自动矫正,本发明通过构建某段数据群体特征的箱线图,分析序列数据的整体特征,再通过分段关联规则的挖掘,获取数据在时序上关联性强弱的变化,通过关联性的变化,可以有效地判断出数据的整体偏移。
经过电力设备的长期运行,已有较大规模的在线监测数据存储于电力数据库中,本发明挖掘群体样本的数据均为线下校核后的数据,通过对已线下校核后的指标数据进行关联分析,挖掘出其群体中存在的关联关系,基于该关联关系分析数据中不同偏差的数据,并对偏差进行校准。
发明内容
本发明所解决的技术问题在于提供一种主变在线监测数据群体偏差识别与校准方法,以解决上述技术背景的问题。
本发明通过以下技术方案来实现,一种主变在线监测数据群体偏差识别与校准方法,具体步骤如下:
S1、数据收集:在线监测数据对变压器设备的实时状态表征有重要作用,是变压器设备状态评估和故障识别的重要依据,收集设备在线监测数据以及与之相关的变压器故障信息,形成完善的数据体系;
S2、对在线监测数据进行分段线性化,提取线段曲线特征;
S3、构建分段关联挖掘模型,对曲线特征表征的线段集合进行符号化,使用Apriori算法挖掘DGA不同指标的关联性,发现异常数值:提取线段群体特征的箱线图特征,通过箱线图分析序列数据的整体特征,构建线段群体相似度模型,并使用基于最大最小距离的改进K-means聚类算法为线段划分类别,类别数量以曲线特征的整体划分设定为6,并为同类别线段赋予符号,完成在线监测数据的符号化;基于Apriori算法的思想,设置最小置信度与支持度,挖掘不同序列之间存在的频繁项集,量化不同序列之间的关联性,获得指标层面的数据支持度和置信度;
S4、考虑时段特性获取支持度变化,识别数据偏差:根据在线监测数据之间在时序上的关联性强弱变化,判定数据中末端时间存在的异常偏差,完成数据偏差的追踪;
S5、利用强关联指标数据,构建基于遗传模拟退火算法优化的BP神经网络算法的多指标预测模型,完成对偏差数据的校准;
S6、利用校准后的数据,对两序列数据分段重新进行关联规则的挖掘,判断校准后的偏差数据段关联程度是否满足关联度阈值,检验偏差校准的可靠性。
具体地,步骤S2中,依据数据点时间顺序,将可线性拟合的连续数据点视为同一集合,判断依据为数据点拟合误差阈值,当误差接近阈值时,停止增加数据点;选取拟合误差为0.8,并通过线段的斜率、常数项、线段跨度、线段拟合误差和线段前后均值变化等表征拟合出的线段。
具体地,步骤S4中,通过对数据分段分别进行关联规则挖掘,获取在时序上的两序列数据关联程度变化,实现数据关联度追踪;根据两序列数据关联程度的变化,识别数据偏差。
具体地,步骤S4的主要过程为:
S41.基于步骤S3中的分段关联挖掘模型,可得到两类数据之间的频繁项集作为关联规则;通过关联规则的支持度与置信度综合计算指标层面的数据关联度;
S42.通过划分数据序列为多个数据段落,对数据分段分别进行关联规则挖掘,获 取在时序上的两序列数据关联程度变化,实现数据关联度追踪;同时定义指标层面的最小 支持度阈值
Figure DEST_PATH_IMAGE001
与最小置信度阈值
Figure DEST_PATH_IMAGE002
,在偏离最小置信度阈值
Figure 787071DEST_PATH_IMAGE002
时,认为当前数据段落存在数据偏差,使得原有数据关联偏离,造成关联程度的下降。
具体地,本发明步骤S5中:利用强关联规则序列数据,构建基于遗传模拟退火算法优化的BP神经网络算法的多指标预测模型,通过多指标预测模型预测偏差数据对偏差数据进行校准。步骤S5具体过程如下:
S51.基于步骤S3中的分段关联挖掘结果,利用强关联规则序列数据,构建基于遗传模拟退火算法优化的BP神经网络算法的多指标预测模型,以与偏差数据序列具有强关联性的序列数据作为神经网络的输入层,以偏差数据作为输出层构建神经网络;
S52.通过遗传模拟退火算法修正网络节点连接权值,代入最佳权值,获取标准油样正常数据完成对神经网络的训练和测试后,对偏差数据进行预测,完成对偏差数据的校准。
具体地,基于遗传模拟退火算法优化的BP神经网络算法的流程为:确定神经网络输入层、隐藏层和输出层的节点数,初始化相关参数,得到网络节点编码,输入样本数据,进行归一化处理后和网络节点编码一起经过遗传模拟退火算法的选择、交叉、变异、退火、计算新个体适应度操作,判断是否满足适应度要求,如不满足,返回交叉步骤,如满足,获取节点最优权值,然后通过BP神经网络算法训练样本数据,计算训练结果均方差,判断是否满足误差允许范围,如不满足,重新训练样本数据,如满足,确定最佳预测网络。
具体地,本发明步骤S6的具体过程为:
S61.利用校准后的数据,重新对具有强关联规则的两个序列进行分段关联规则的挖掘,获取校准后两序列数据关联规则;
S62.比较校准后两序列数据偏差部分的关联程度与关联度阈值的关系,检验偏差校准的可靠性;
S63.关联度阈值的设置,通过对正常两序列数据整体关联规则的挖掘,获取两序列数据整体的关联程度,关联程度阈值设置为limit_rev。
本发明收集变压器设备在线监测数据,针对在线监测数据,通过数据之间的关联度挖掘分析线性耦合关系,实现数据偏差的检测。首先对数据进行分段线性化,在曲线特征上进行指标分析,通过构建某段数据群体特征的箱线图,分析序列数据的整体特征,然后使用改进K-means聚类将在线监测分段数据符号化,使用Apriori算法挖掘数据中不同指标之间的关联性,以此发掘异常数据的存在,并构建遗传模拟退火算法改进的BP神经网络多指标预测模型,对偏差数据进行预测,实现对偏差数据的校准。
附图说明
图1为本发明的流程图。
图2为氢气指标在线数据。
图3为甲烷指标在线数据。
图4为氢气指标拟合前后对比图。
图5为甲烷指标拟合对比图。
图6为基于遗传模拟退火算法优化的BP神经网络算法流程图。
图7为偏差数据与原始数据对比图。
图8为偏差数据预测图。
图9为氢气带偏差数据的群体箱线图特征。
图10为氢气正常数据的群体箱线图特征。
图11为甲烷正常数据的群体箱线图特征。
图中,IQR是指四分位距。
具体实施方式
下面结合附图和实施例对本发明进一步详细阐明。
参照图1,一种主变在线监测数据群体偏差识别与校准方法,具体步骤如下:
S1、数据收集:在线监测数据对变压器设备的实时状态表征有重要作用,是变压器设备状态评估和故障识别的重要依据,收集设备在线监测数据以及与之相关的变压器故障信息,形成完善的数据体系;
S2、对在线监测数据进行分段线性化,提取线段曲线特征:依据数据点时间顺序,将可线性拟合的连续数据点视为同一集合,判断依据为数据点拟合误差阈值,当误差接近阈值时,停止增加数据点;选取拟合误差为0.8,并通过线段的斜率、常数项、线段跨度、线段拟合误差和线段前后均值变化等表征拟合出的线段;
S3、构建分段关联挖掘模型,对曲线特征表征的线段集合进行符号化,使用Apriori算法挖掘DGA不同指标的关联性,发现异常数值:提取线段群体特征的箱线图特征,通过箱线图分析序列数据的整体特征,构建线段群体相似度模型,并使用基于最大最小距离的改进K-means聚类算法为线段划分类别,类别数量以曲线特征的整体划分设定为6,并为同类别线段赋予符号,完成在线监测数据的符号化;基于Apriori算法的思想,设置最小置信度与支持度,挖掘不同序列之间存在的频繁项集,量化不同序列之间的关联性,获得指标层面的数据支持度和置信度;线段群体相似度模型对单个偏差数据的识别不敏感,对数据的整体偏移反应灵敏;
S4、考虑时段特性获取支持度变化,识别数据偏差:根据在线监测数据之间在时序上的关联性强弱变化,判定数据中末端时间存在的异常偏差,完成数据偏差的追踪;根据两序列数据关联程度的变化,识别数据偏差;
S5、利用强关联指标数据,构建基于遗传模拟退火算法优化的BP神经网络算法的多指标预测模型,对偏差数据进行预测,完成对偏差数据的校准:利用强关联规则序列数据,构建基于遗传模拟退火算法优化的BP神经网络算法的多指标预测模型,通过多指标预测模型预测偏差数据对偏差数据进行校准;
S6、利用校准后的数据,对两序列数据分段重新进行关联规则的挖掘,判断校准后的偏差数据段关联程度是否满足关联度阈值,检验偏差校准的可靠性。
本发明步骤S1中,依据中国电力行业标准《油浸式变压器(电抗器)状态评价导则》,结合企业实际生产经验和已有的故障缺陷记录,同时参考了一些文献的研究成果,选择DGA在线监测数据指标为氢气,甲烷,乙烷,乙烯,乙炔,微水。
本发明步骤S2中提出的对在线监测数据进行分段线性化的具体步骤是:
S21.对于类似DGA的设备指标在线监测数据,其本质可以看作为按着一定的时间间隔顺序,一个个采集的状态指标数值。可知数据具有很强的时间属性,可以等效为时间序列数据。
S22.对时间序列
Figure DEST_PATH_IMAGE003
,以长度为
Figure DEST_PATH_IMAGE004
的窗口截取数 据点,对截取窗口内的数据,基于滑动窗口的思想,对其中含有的数据点进行分段线性拟 合。
S23.以窗口内的首个数据点为初始线段的拟合起点,令该点为
Figure DEST_PATH_IMAGE005
,假设初始线段 的拟合终点为
Figure DEST_PATH_IMAGE006
,将这
Figure DEST_PATH_IMAGE007
个数据点拟合为一条线段。
S24.那么对于这样一条线段,其可以用如下所示的式子表达:
Figure DEST_PATH_IMAGE008
(1)
Figure DEST_PATH_IMAGE009
(2)
式中
Figure DEST_PATH_IMAGE010
表示时间序列中
Figure DEST_PATH_IMAGE011
时刻的采样数值,
Figure DEST_PATH_IMAGE012
表示拟合线段中含有的数值点数 量,
Figure DEST_PATH_IMAGE013
表示拟合线段方程的因变量;
以实际数据点至拟合线段的距离作为拟合误差,提高拟合线段对实际数值点的拟 合准确度;计算拟合线段步长内所有实际数据点至线段的距离
Figure DEST_PATH_IMAGE014
,以其之和作为该线段的 拟合整体误差
Figure DEST_PATH_IMAGE015
Figure DEST_PATH_IMAGE016
(3)
Figure DEST_PATH_IMAGE017
(4)
式中,t n 表示时间步长;设置拟合误差阈值为
Figure DEST_PATH_IMAGE018
,如果
Figure DEST_PATH_IMAGE019
,则说明该点 短仍然可以继续增加拟合点,令
Figure DEST_PATH_IMAGE020
,并重复上述步骤;如果有
Figure DEST_PATH_IMAGE021
,则令
Figure DEST_PATH_IMAGE022
,以该点为线段拟合终点,生成一条线段;如果有
Figure DEST_PATH_IMAGE023
,则判定该线段无法 拟合,保存当前线段的拟合终点为
Figure DEST_PATH_IMAGE024
,记录其数据采样时刻,之后回到步骤 S23,重置参数
Figure DEST_PATH_IMAGE025
,并以当前拟合终点作为下一线段的拟合起点进行下一部分的数据拟合, 直至该序列中所有的数据点都拟合完毕。
假设拟合的线段的斜率为
Figure DEST_PATH_IMAGE026
,线段中拟合数值点个数为
Figure DEST_PATH_IMAGE027
,那么该线段拟合数据 的实际增长率可以表示为:
Figure DEST_PATH_IMAGE028
,每条线段相对前一条线段的斜率增长率可 以表示为:
Figure DEST_PATH_IMAGE029
,每条线段m个数值点箱线图第一四分位数表示为
Figure DEST_PATH_IMAGE030
,每条线段m个 数值点箱线图第三四分位数表示为
Figure DEST_PATH_IMAGE031
,以
Figure DEST_PATH_IMAGE032
Figure DEST_PATH_IMAGE033
六个元素构成线 段的六元组
Figure DEST_PATH_IMAGE034
,以该数组表示拟合出的一条线段。
本发明步骤S3中构建分段关联挖掘模型的主要步骤是:
S31.为去除在线监测数据中不同指标之间存在的数量级差异,首先对同一序列中 存在的所有线段属性进行形如
Figure DEST_PATH_IMAGE035
的标准化操作,将数值映射到(0,1)区 间。
S32.在聚类分析时,需要建立衡量线段类别特性的标准;在线监测数据反映的是设备实时状态信息量,而其中参数的变化趋势和形态最能体现设备运行状态的变化,因此,在建立衡量线段类别特性时,对线段不同属性需要有不同的考虑,本发明提取线段群体特征的箱线图特征,即箱线图的第一、第三分位数以及中位数,同时引入斜率、线段跨度、增长率和斜率的变化率,来分析线段本身变化的特征和波动的趋势。斜率变化率描述序列数据的波动程度;同时,由于变压器在线监测数据具有较多噪声数据,箱线图的第一、第三分位数以及中位数可以粗略体现数据的分散程度,很好的剔除异常噪声数据的影响。
建立的线段群体相似度模型如下式所示:
Figure DEST_PATH_IMAGE036
(5)
式中,
Figure DEST_PATH_IMAGE037
表示线段群体相似度,
Figure DEST_PATH_IMAGE038
分别表示 在线段群体相似度模型中斜率、跨度、增长率、第一四分位数、第三四分位数和斜率变化率 所占的权重比率;
S33.基于上述的线段群体相似度模型,对线段集合使用基于最大最小距离的改进K-means算法进行聚类分析,将相似的线段划分为同一类别。
S34.最大最小距离同样以欧式距离为基础,其与K-means算法不同之处在于其取 尽量远的对象作为聚类中心。对于样本集,给定一比例系数
Figure DEST_PATH_IMAGE039
,任取样本集
Figure DEST_PATH_IMAGE040
中的任一样本为初始聚类中心,记为
Figure DEST_PATH_IMAGE041
任取剩下
Figure DEST_PATH_IMAGE042
个样本中距离
Figure 459752DEST_PATH_IMAGE041
最远的样本为第二个聚类中心,记为
Figure DEST_PATH_IMAGE043
计算剩下
Figure DEST_PATH_IMAGE044
个样本与
Figure 41912DEST_PATH_IMAGE041
Figure 387443DEST_PATH_IMAGE043
的距离,并求出其中最小值,即:
Figure DEST_PATH_IMAGE045
(6)
Figure DEST_PATH_IMAGE046
(7)
式中,D ij 表示样本i、j间的欧式距离,D i 表示该样本i与聚类中心
Figure 147589DEST_PATH_IMAGE041
Figure 70414DEST_PATH_IMAGE043
两者距离 的最小值,x i 表示样本i,zj代表第j个聚类中心。
Figure DEST_PATH_IMAGE047
(8)
zi代表第i个聚类中心,
Figure DEST_PATH_IMAGE048
比例系数
Figure DEST_PATH_IMAGE049
,选取对应样本
Figure DEST_PATH_IMAGE050
作为第三个 聚类中心
Figure DEST_PATH_IMAGE051
假设有
Figure DEST_PATH_IMAGE052
个聚类中心,以此计算剩下的
Figure DEST_PATH_IMAGE053
个样本至聚类中心的距离
Figure DEST_PATH_IMAGE054
,并 有:
Figure DEST_PATH_IMAGE055
(9)
Figure DEST_PATH_IMAGE056
表示样本i、k间的欧式距离,则对应的样本
Figure DEST_PATH_IMAGE057
为第
Figure DEST_PATH_IMAGE058
个聚类中心,记为
Figure DEST_PATH_IMAGE059
;并不断循环这个过程,直至没有新的聚类中心出现。
当没有新的聚类中心出现时,将样本按最小距离原则分配至各类中。基于最大最小距离改进的K-means聚类算法其优势在于保证了每次聚类分析时聚类中心一致,去除了传统K-means算法选取聚类中心的随机性,能有效提高聚类分析的准确度与速度。
S35.最小支持度与最小置信度参数的设置;置信度与支持度阈值时判定序列关联 与频繁项集的基础,合适的阈值参数有利于增强关联关系的可信度,记频繁项集1与频繁项 集2的最小支持度阈值为
Figure DEST_PATH_IMAGE060
Figure DEST_PATH_IMAGE061
,序列关联挖掘中的最小置信度阈值为
Figure DEST_PATH_IMAGE062
S36.频繁项集的生成:使用经过归总之后的两符号化序列作为事务集,记为
Figure DEST_PATH_IMAGE063
,其中
Figure DEST_PATH_IMAGE064
,其中nA和 nB分别为序列A和序列B划分的线段条数,
Figure DEST_PATH_IMAGE065
为符号化序列
Figure DEST_PATH_IMAGE066
的符号元素,
Figure DEST_PATH_IMAGE067
为另一个 符号化序列
Figure DEST_PATH_IMAGE068
的符号元素;两序列对应的所有符号类别为:
Figure DEST_PATH_IMAGE069
Figure DEST_PATH_IMAGE070
,其中mA和mB分别为两符号集A和B的符号种类,基于Apriori算法,通过对 事务集的两阶段扫描,得到序列的频繁项集。根据式(10)计算序列中每个符号的置信度:
Figure DEST_PATH_IMAGE071
(10)
式中
Figure DEST_PATH_IMAGE072
Figure DEST_PATH_IMAGE073
代表的是需要挖掘关联规则的两个指标对象,
Figure DEST_PATH_IMAGE074
表示事务集的个数, 即序列中元素的个数,支持度表示的是项在事务集中的占比程度,在发掘频繁项集1时,将 支持度大于
Figure DEST_PATH_IMAGE075
的项划分至频繁项集1的集合中。
记关联挖掘中两序列的频繁项集1的集合分别为
Figure DEST_PATH_IMAGE076
Figure DEST_PATH_IMAGE077
,根据指标参数将集合中 的项两两配对,构成形如
Figure DEST_PATH_IMAGE078
形式的频繁项集2,计算每个项在频繁项集2中的支持 度,将支持度大于
Figure DEST_PATH_IMAGE079
的项划分至频繁项集2,记为
Figure DEST_PATH_IMAGE080
S37.序列关联性的挖掘;将所有序列进行两两组合,分别统计其中存在的频繁项集2中项的支持度以及对应关联挖掘序列之间的置信度;
首先根据式(11)对所有频繁项集2在两指标参数之间的支持度累加,并以此作为这两个参数序列在所有多元序列中的支持度计数。
Figure DEST_PATH_IMAGE081
(11)
Figure DEST_PATH_IMAGE082
(12)
Figure DEST_PATH_IMAGE083
(13)
其中,
Figure DEST_PATH_IMAGE084
为对两序列聚类分析之后的所划分出的线段类别总数。同时记指 标序列层面的最小支持度阈值为
Figure DEST_PATH_IMAGE085
,若参数指标层面的支持度大于设置的阈值, 则计算符号项集组合在两序列中的置信度
Figure DEST_PATH_IMAGE086
,如式(14)所示:
Figure DEST_PATH_IMAGE087
(14)
当置信度大于所设置的最小置信度阈值时,保留关联规则
Figure DEST_PATH_IMAGE088
,使用置信 度描述两指标之间的关联强度,判定两指标存在强关联。
本发明步骤S4的主要过程为:
S41.基于步骤S3中的分段关联挖掘模型,可得到两类数据之间的频繁项集2作为关联规则;通过关联规则的支持度与置信度综合计算指标层面的数据关联度。
S42.通过划分数据序列为多个数据段落,对数据分段分别进行关联规则挖掘,获 取在时序上的两序列数据关联程度变化,实现数据关联度追踪。同时定义指标层面的最小 支持度阈值
Figure DEST_PATH_IMAGE089
与最小置信度阈值
Figure DEST_PATH_IMAGE090
,在偏离最小置信度阈值
Figure 531964DEST_PATH_IMAGE090
时, 认为当前数据段落存在数据偏差,使得原有数据关联偏离,造成关联程度的下降。
本发明步骤S5的具体理念为:
1)BP神经网络是一种误差反向传播的多层前馈神经网络,是当前应用最广泛的神经网络。其网络结构一般情况下由输入层、隐含层、输出层组成。输入与输出之间均有连接。误差的反向传播是BP神经网络模型算法的核心,随着迭代次数的增加,误差不断减小,当达到人工设定的迭代次数或者最小误差时停止训练,确定神经元之间的最优连接权值和阈值。
2)模拟退火算法灵感来自于温度变化的过程,该过程导致固体加热和冷却后能量发生变化。模拟退火算法具有很强的局部搜索能力。根据 Metropolis 标准的概率规则,可以接受目标函数的增加。该标准依赖控制参数,类似于物理退火,因此被称为***温度。模拟退火算法在温度不断下降过程中通过重复采样,得到问题的全局最优解。
3)遗传模拟退火算法是一种改进的遗传算法。遗传算法是一种由自然精华过程衍生出来的算法,并成为一种基于生物学的杰出随机搜索技术。遗传算法首先从一组初始的随机解决方案开始,将每一个目标编码为一条染色体,代表问题的解。在连续迭代过程中,染色体不断进化,并基于适应度的标准来评判该染色体是否为最优解。其后代是通过使用交叉算子将当前一代的两个染色体合并或使用突变算子对染色体修饰而形成。
4)遗传模拟退火算法以提高效率为目的,将上述两种算法相组合。算法既保留了遗传算法全局搜索的优点,又结合了模拟退火算法局部搜索的长处。遗传模拟退火算法本质上是从一组随机产生的初始解开始,进行最优解搜索。首先基于一系列遗传操作产生一组新的个体,然后引入退火过程进行修正,该过程类似于随机梯度下降法,最后将退火结果作为新个体。
5)遗传模拟退火算法优化的BP神经网络原理:遗传模拟退火算法优化的BP神经网 络算法首先确定神经网络结构,其次利用遗传模拟退火算法优化,最后再通过BP神经网络 预测。设BP神经网络的输入层有n个节点,隐藏层有q个节点,输出层有m个节点,输入层节点 i 到隐藏层节点 j 之间的权值为v ij ,隐藏层节点j与输出层节点k之间的权值为
Figure DEST_PATH_IMAGE091
;正向 传播阶段,隐藏层第 j 个节点输出o j 与输出层第k个节点输出o k 分别为:
Figure DEST_PATH_IMAGE092
(15)
式中:x i 为输入层样本数据;
Figure DEST_PATH_IMAGE093
Figure DEST_PATH_IMAGE094
分别为隐藏层第 j个节点和输出层第 k 个节点的净输入;
Figure DEST_PATH_IMAGE095
Figure DEST_PATH_IMAGE096
分 别为隐藏层第 j 个节点和输出层第 k 个节点的阈值;f(net) 为sigmod 函数,即
Figure DEST_PATH_IMAGE097
(16)
e表示自然对数,net指净输入;
误差反向阶段,误差信号为:
Figure DEST_PATH_IMAGE098
式中:E为总误差;d k 为样本的期望输出;
Figure DEST_PATH_IMAGE099
Figure DEST_PATH_IMAGE100
分别为净输入为时
Figure DEST_PATH_IMAGE101
Figure DEST_PATH_IMAGE102
sigmod函数的导数;
权值修正量为:
Figure DEST_PATH_IMAGE103
式中:
Figure DEST_PATH_IMAGE104
,为学习率;o i 为输入层节点i的输出;
Figure DEST_PATH_IMAGE105
为输入层节点 i 到 隐藏层节点 j 之间的权值修正量,
Figure DEST_PATH_IMAGE106
为隐藏层节点 j 与 输出层节点 k 之间的权值 修正量。
根据式(18)可知,由于权值的确定性,神经网络算法极值容易过早出现,具有较低的局部搜索能力,但该算法的全局搜索能力很强。相反,遗传模拟退火算法具有一定局部搜索能力,但必须经过反复的退火操作才能进入最优过程,因而运行效率不高。因此,若通过GSA对神经网络节点的权值进行修正,将大大提高运行效率和准确度。对式(18)作出如下调整,有
Figure DEST_PATH_IMAGE107
式中,
Figure DEST_PATH_IMAGE108
为引入遗传模拟退火法算法前的隐藏层节点 i 到输出层节点 j 之间 的权值;
Figure DEST_PATH_IMAGE109
为引入遗传模拟退火法算法后隐藏层节点 i 到输出层节点 j 之间的权值 修正量;
Figure DEST_PATH_IMAGE110
为隐藏层节点 i 到输出层节点 j 之间的权值修正量,
Figure DEST_PATH_IMAGE111
为隐藏层节点 i 到输出层节点 j 之间的权值;
Figure DEST_PATH_IMAGE112
,为修正量系数;
Figure DEST_PATH_IMAGE113
(20)
式中:
Figure DEST_PATH_IMAGE114
为随机数;T 为退火温度,有
Figure DEST_PATH_IMAGE115
(21)
式中:T 0 为模拟退火的初始温度;t为退火次数,此时,适应度F i 的计算式为:
Figure DEST_PATH_IMAGE116
(22)
式中,e表示自然对数。
遗传模拟退火算法优化的BP神经网络算法的优点:
通过遗传模拟退火算法修正网络节点连接权值,避免网络陷入极小值点,解决了现阶段偏差数据预测模型所存在的过拟合问题。且避免了复杂参数设置,具有广阔的发展和应用前景。
变压器在线监测设备由于分布面广,网络结构复杂,运行环境恶劣且波动大,和设备本身精度等因素的制约,在实际运行过程中存在大量异常数据,尤其是一些波动较大的噪声数据,在进行分段关联规则挖掘的过程中,极其容易影响数据序列的分段情况,进而影响序列的关联规则。遗传模拟退火算法优化的BP神经网络算法可以很好的应对噪声数据的影响,提高预测精度。
本发明步骤S5的具体步骤为:
S51.基于步骤S3中的分段关联挖掘结果,利用强关联规则序列数据,构建基于遗传模拟退火算法优化的BP神经网络算法的多指标预测模型,以与偏差数据序列具有强关联性的序列数据作为神经网络的输入层,以偏差数据作为输出层构建神经网络;其中,基于遗传模拟退火算法优化的BP神经网络算法的流程如图6所示,确定神经网络输入层、隐藏层和输出层的节点数,初始化相关参数,得到网络节点编码,输入样本数据,进行归一化处理后和网络节点编码一起经过遗传模拟退火算法(GSA)的选择、交叉、变异、退火、计算新个体适应度操作,判断是否满足适应度要求,如不满足,返回交叉步骤,如满足,获取节点最优权值,然后通过BP神经网络算法(BP)训练样本数据,计算训练结果均方差,判断是否满足误差允许范围,如不满足,重新训练样本数据,如满足,确定最佳预测网络。
S52.通过遗传模拟退火算法修正网络节点连接权值,代入最佳权值,获取标准油样正常数据完成对神经网络的训练和测试后,对偏差数据进行预测,完成对偏差数据的校准。
本发明步骤S6的具体过程为:
S61.利用校准后的数据,重新对上述具有强关联规则的两个序列进行分段关联规则的挖掘,获取校准后两序列数据关联规则;
S62.比较校准后两序列数据偏差部分的关联程度与关联度阈值的关系,检验偏差校准的可靠性;
S63.关联度阈值的设置,通过对正常两序列数据整体关联规则的挖掘,获取两序列数据整体的关联程度,关联程度阈值设置为limit_rev。
本发明的一个实际应用案例如下:
S1、数据收集。
以某台主变设备的DGA历史在线监测数据中的氢气与甲烷气体指标为研究对象,考虑到油色谱的在线监测数据普遍以天为采样周期,也即一天一个指标采样数据;因此,本发明以接近两年的采样点数量(700个点)作为数据窗口长度,数据曲线如图2、图3所示。从上述气体指标的可视化结果可以看出,所有指标的在线数据可以等效为一条随采样点波动的数据曲线;因此,通过设置合理的拟合误差阈值,将指标序列进行分段拟合是切实可行的。
S2、对在线监测数据进行分段线性化,提取线段曲线特征。
使用本发明提出的方法上述连续数据进行分段线性化拟合,此处应注意:由于不同指标数据所处的数量级不同,所以在使用本发明提出的方式进行分段线性化拟合时,对不同的指标数据应该选取适当的拟合误差阈值,各个指标数据的具体拟合结果如下图4和图5所示。由上图4和图5可知,DGA在线数据的指标拟合较为成功,以两个端点连成的线段表示线段跨度内的所有数据点,且以氢气为例,将其拟合的部分线段相关属性如表1所示。
Figure DEST_PATH_IMAGE117
表5进一步证明了本发明提出的在线数据分段线性化算法的可行性,每条线段拟合的误差均小于设置的拟合误差阈值,且拟合的线段能较好的反映拟合区间内在线数据点的变化趋势,算法的有效性得到验证。
S3、构建分段关联挖掘模型,对曲线特征表征的线段集合进行符号化,使用Apriori算法挖掘DGA不同指标的关联性,发现异常数值。
提取线段群体特征的箱线图特征,氢气带偏差数据的群体箱线图特征如图9所示,氢气正常数据的群体箱线图特征如图10所示,甲烷正常数据的群体箱线图特征如图11所示。
连续数据关联关系的挖掘: 得到对应的频繁项集之后,使用本发明提出的方法分 析两指标之间的关联性,以支持度与置信度表示关联关系的强弱,得到
Figure DEST_PATH_IMAGE118
的支持 度与置信度分别为0.5076与0.5641,均大于所设置的相关最小阈值,表示该规则为强关联 规则,说明氢气与甲烷指标之间存在强关联关系。
目前研究结果中,氢气是发生偏差问题最多的DGA气体,且往往是正偏差,级偏差值大于原始值。在氢气数据的后200个数据点加入一个持续上升的误差,形成偏差数据,数据图7所示。
此时,对偏差数据进行关联挖掘,可得支持度与置信度为0.3939和0.6420,支持度存在明显下降,表示数据在线段曲线特征上的对应分类组合,存在频繁项集的减少和缺失,使得整体的支持度下降需要分段进行数据的关联挖掘检索。
数据分段关联挖掘分析:将上述数据按照100个点作为一组,进行分组关联挖掘分析,其线段数量、支持度与置信度如表2所示:
Figure DEST_PATH_IMAGE119
由上表可知,偏差影响其所在数据段落的关联程度,但对其余分段没有影响,可通过设置合理的数据点分组,求取数据关联程度的变化,从而找到偏差的位置。本发明设置的支持度阈值为0.5,置信度阈值为0.6,可知,新的偏差使得数据不存在强关联关系。
S4、考虑时段特性获取支持度变化,分析数据关联性变化,可以看出数据偏差使得序列数据关联程度在持续下降,在序列数据末100个数据不存在强关联性。
S5、利用强关联指标数据,构建基于遗传模拟退火算法优化的BP神经网络算法的多指标预测模型,完成对偏差数据的校准,通过上述步骤S3分段关联挖掘,获取与氢气具有强关联性的序列,构建多指标预测模型,预测偏差数据,完成对数据偏差的校准;
通过上述步骤S3分段关联规则的挖掘,可知氢气与其他序列数据的关联性如表3所示:
Figure DEST_PATH_IMAGE120
由上表可知,氢气只与甲烷具有强关联性;
构建基于遗传模拟退火算法优化的BP神经网络算法的多指标预测模型;以甲烷为输入,氢气为输出,构建神经网络预测模型,隐含层个数为8。通过神经网络预测模型,预测偏差数据,预测结果如图8所示。
S6、利用校准后的数据,对两序列数据分段重新进行关联规则的挖掘,判断校准后的偏差数据段关联程度是否满足关联程度阈值,检验偏差校准的可靠性。
Figure DEST_PATH_IMAGE121
由上表可知,对数据偏差进行校准后,两序列的支持度和置信度都满足相应的阈值,验证了数据校准的可靠性。

Claims (7)

1.一种主变在线监测数据群体偏差识别与校准方法,其特征在于,步骤如下:
S1、数据收集:在线监测数据对变压器设备的实时状态表征有重要作用,是变压器设备状态评估和故障识别的重要依据,收集设备在线监测数据以及与之相关的变压器故障信息,形成完善的数据体系;
S2、对在线监测数据进行分段线性化,提取线段曲线特征;
S3、构建分段关联挖掘模型,对曲线特征表征的线段集合进行符号化,使用Apriori算法挖掘DGA不同指标的关联性,发现异常数值:提取线段群体特征的箱线图特征,通过箱线图分析序列数据的整体特征,构建线段群体相似度模型,并使用基于最大最小距离的改进K-means聚类算法为线段划分类别,类别数量以曲线特征的整体划分设定为6,并为同类别线段赋予符号,完成在线监测数据的符号化;基于Apriori算法的思想,设置最小置信度与支持度,挖掘不同序列之间存在的频繁项集,量化不同序列之间的关联性,获得指标层面的数据支持度和置信度;
S4、考虑时段特性获取支持度变化,识别数据偏差:根据在线监测数据之间在时序上的关联性强弱变化,判定数据中末端时间存在的异常偏差,完成数据偏差的追踪;
S5、利用强关联指标数据,构建基于遗传模拟退火算法改进的BP神经网络算法多指标预测模型,完成对偏差数据的校准;
S6、利用校准后的数据,对两序列数据分段重新进行关联规则的挖掘,判断校准后的偏差数据段关联规则是否满足关联度阈值,检验偏差校准的可靠性。
2.根据权利要求1所述的一种主变在线监测数据群体偏差识别与校准方法,其特征在于,步骤S5的具体步骤为:
S51.基于步骤S3中的分段关联挖掘结果,利用强关联规则序列数据,构建基于遗传模拟退火算法优化的BP神经网络算法的多指标预测模型,以与偏差数据序列具有强关联性的序列数据作为神经网络的输入层,以偏差数据作为输出层构建神经网络;
S52.通过遗传模拟退火算法修正网络节点连接权值,代入最佳权值,获取标准油样数据完成对神经网络的训练和测试后,对偏差数据进行预测,完成对偏差数据的校准。
3.根据权利要求2所述的一种主变在线监测数据群体偏差识别与校准方法,其特征在于,基于遗传模拟退火算法优化的BP神经网络算法的流程为:确定神经网络输入层、隐藏层和输出层的节点数,初始化相关参数,得到网络节点编码,输入样本数据,进行归一化处理后和网络节点编码一起经过遗传模拟退火算法的选择、交叉、变异、退火、计算新个体适应度操作,判断是否满足适应度要求,如不满足,返回交叉步骤,如满足,获取节点最优权值,然后通过BP神经网络算法训练样本数据,计算训练结果均方差,判断是否满足误差允许范围,如不满足,重新训练样本数据,如满足,确定最佳预测网络。
4.根据权利要求1所述的一种主变在线监测数据群体偏差识别与校准方法,其特征在 于,设BP神经网络的输入层有n个节点,隐藏层有q个节点,输出层有m个节点,输入层节点 i 到隐藏层节点 j 之间的权值为v ij ,隐藏层节点j与输出层节点k之间的权值为
Figure 207374DEST_PATH_IMAGE001
;正向传 播阶段,隐藏层第 j 个节点输出o j 与输出层第k个节点输出o k 分别为:
Figure 455953DEST_PATH_IMAGE002
(15)
式中:x i 为输入层样本数据;
Figure 192440DEST_PATH_IMAGE003
Figure 475654DEST_PATH_IMAGE004
分别为隐藏层第 j个节点和输出层第 k个节点 的净输入;
Figure 157171DEST_PATH_IMAGE005
Figure 893046DEST_PATH_IMAGE006
分 别为隐藏层第 j 个节点和输出层第 k 个节点的阈值;f(net)为 sigmod 函数,即
Figure 826367DEST_PATH_IMAGE007
(16)
e表示自然对数,net指净输入;
误差反向阶段,误差信号为:
Figure 839453DEST_PATH_IMAGE008
(17)
式中:E为总误差;d k 为样本的期望输出;
Figure 567238DEST_PATH_IMAGE009
Figure 915043DEST_PATH_IMAGE010
分别为净输入为
Figure 120896DEST_PATH_IMAGE011
Figure 378702DEST_PATH_IMAGE012
时的sigmod函数的导数;
权值修正量为:
Figure 152754DEST_PATH_IMAGE013
(18)
式中:
Figure 191117DEST_PATH_IMAGE014
,为学习率;o i 为输入层节点i的输出;
Figure 810449DEST_PATH_IMAGE015
为输入层节点 i 到隐藏层 节点 j 之间的权值修正量,
Figure 188340DEST_PATH_IMAGE016
为隐藏层节点 j 与 输出层节点 k 之间的权值修正量;
对式(18)作出如下调整,有
Figure 992348DEST_PATH_IMAGE017
(19)
式中:
Figure 314745DEST_PATH_IMAGE018
为引入遗传模拟退火算法前的隐藏层节点 i 到输出层节点 j 之间的权 值;
Figure 127980DEST_PATH_IMAGE019
为引入遗传模拟退火算法后隐藏层节点 i 到输出层节点 j 之间的权值修正量;
Figure 973095DEST_PATH_IMAGE020
为隐藏层节点 i 到输出层节点 j 之间的权值修正量,
Figure 479163DEST_PATH_IMAGE021
为隐藏层节点 i 到输出层 节点 j 之间的权值;
Figure 898643DEST_PATH_IMAGE022
,为修正量系数;
Figure 374624DEST_PATH_IMAGE023
(20)
式中:
Figure 461528DEST_PATH_IMAGE024
为随机数;T 为退火温度,有
Figure 748284DEST_PATH_IMAGE025
(21)
式中:T 0 为模拟退火的初始温度;t为退火次数,此时,适应度F i 的计算式为:
Figure 655061DEST_PATH_IMAGE026
(22)
式中,e表示自然对数。
5.根据权利要求1所述的一种主变在线监测数据群体偏差识别与校准方法,其特征在于,步骤S2中,依据数据点时间顺序,将可线性拟合的连续数据点视为同一集合,判断依据为数据点拟合误差阈值,当误差等于数据点拟合误差阈值时,停止增加数据点;选取拟合误差为0.8,并通过线段的斜率、斜率变化率、常数项、线段跨度、线段拟合误差和线段前后均值变化表征拟合出的线段。
6.根据权利要求1所述的一种主变在线监测数据群体偏差识别与校准方法,其特征在于,步骤S4的具体过程为:
S41.基于步骤S3中的分段关联挖掘模型,可得到两类数据之间的频繁项集作为关联规则;通过关联规则的支持度与置信度综合计算指标层面的数据关联度;
S42.通过划分数据序列为多个数据段落,对数据分段分别进行关联规则挖掘,获取在 时序上的两序列数据关联程度变化,实现数据关联度追踪;同时定义指标层面的最小支持 度阈值
Figure 810098DEST_PATH_IMAGE027
与最小置信度阈值
Figure 876143DEST_PATH_IMAGE028
,在偏离最小置信度阈值
Figure 724014DEST_PATH_IMAGE028
时,认 为当前数据段落存在数据偏差,使得原有数据关联偏离,造成关联程度的下降。
7.根据权利要求1所述的一种主变在线监测数据群体偏差识别与校准方法,其特征在于,步骤S6的具体过程为:
S61.利用校准后的数据,重新对具有强关联规则的两个序列进行分段关联规则的挖掘,获取校准后两序列数据关联规则;
S62.比较校准后两序列数据偏差部分的关联程度与关联度阈值的关系,检验偏差校准的可靠性;
S63.关联度阈值的设置,通过对正常两序列数据整体关联规则的挖掘,获取两序列数据整体的关联程度,关联程度阈值设置为limit_rev。
CN202111615216.5A 2021-12-28 2021-12-28 主变在线监测数据群体偏差识别与校准方法 Active CN113987033B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111615216.5A CN113987033B (zh) 2021-12-28 2021-12-28 主变在线监测数据群体偏差识别与校准方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111615216.5A CN113987033B (zh) 2021-12-28 2021-12-28 主变在线监测数据群体偏差识别与校准方法

Publications (2)

Publication Number Publication Date
CN113987033A CN113987033A (zh) 2022-01-28
CN113987033B true CN113987033B (zh) 2022-04-12

Family

ID=79734595

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111615216.5A Active CN113987033B (zh) 2021-12-28 2021-12-28 主变在线监测数据群体偏差识别与校准方法

Country Status (1)

Country Link
CN (1) CN113987033B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117216469B (zh) * 2023-09-03 2024-03-15 国网江苏省电力有限公司信息通信分公司 一种电力***实时监测与预测的大数据处理方法及***
CN117112514B (zh) * 2023-10-23 2024-01-09 山东同利新材料有限公司 基于对氯甲基苯乙烯生产数据的记录存储方法
CN117235511B (zh) * 2023-11-13 2024-02-20 北京市计量检测科学研究院 一种二次仪表校准方法
CN117249922B (zh) * 2023-11-17 2024-03-08 山东盈动智能科技有限公司 一种用于温度测试仪的温度校准方法及***
CN117476136B (zh) * 2023-12-28 2024-03-15 山东松盛新材料有限公司 一种高纯羧酸酯合成工艺参数优化方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015176565A1 (zh) * 2014-05-22 2015-11-26 袁志贤 一种基于多维时间序列的电气设备故障预测方法
CN112684379A (zh) * 2020-11-25 2021-04-20 江苏科技大学 一种基于数字孪生的变压器故障诊断***及其方法
CN112800686A (zh) * 2021-03-29 2021-05-14 国网江西省电力有限公司电力科学研究院 一种变压器dga在线监测数据异常模式判定方法
CN113792754A (zh) * 2021-08-12 2021-12-14 国网江西省电力有限公司电力科学研究院 一种先除异后修复的换流变dga在线监测数据处理方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112711904A (zh) * 2020-12-17 2021-04-27 玉溪矿业有限公司 一种基于sa-ga-bp的***振动特征参量预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015176565A1 (zh) * 2014-05-22 2015-11-26 袁志贤 一种基于多维时间序列的电气设备故障预测方法
CN112684379A (zh) * 2020-11-25 2021-04-20 江苏科技大学 一种基于数字孪生的变压器故障诊断***及其方法
CN112800686A (zh) * 2021-03-29 2021-05-14 国网江西省电力有限公司电力科学研究院 一种变压器dga在线监测数据异常模式判定方法
CN113792754A (zh) * 2021-08-12 2021-12-14 国网江西省电力有限公司电力科学研究院 一种先除异后修复的换流变dga在线监测数据处理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Monitoring of the Cross-Calibration Biases Between the S-NPP and NOAA-20 VIIRS Sensor Data Records Using Goes Advanced Baseline Imager as a Transfer";Jingfeng Huang等;《 IGARSS 2020 - 2020 IEEE International Geoscience and Remote Sensing Symposium》;20210217;第1-4页 *
"改进的BP神经网络在故障诊断中的应用";陈金辉等;《河北科技大学学报》;20111031;第455-495页 *

Also Published As

Publication number Publication date
CN113987033A (zh) 2022-01-28

Similar Documents

Publication Publication Date Title
CN113987033B (zh) 主变在线监测数据群体偏差识别与校准方法
CN108023876B (zh) 基于可持续性集成学习的入侵检测方法及入侵检测***
WO2022110557A1 (zh) 一种台区户变关系异常诊断方法及装置
CN107169628B (zh) 一种基于大数据互信息属性约简的配电网可靠性评估方法
CN115577275A (zh) 一种基于lof和孤立森林的时序数据异常监测***及方法
CN105930976B (zh) 基于加权理想点法的节点电压暂降严重程度综合评估方法
CN109829497B (zh) 一种基于监督学习的台区用户识别及判别方法
Shi et al. Improving power grid monitoring data quality: An efficient machine learning framework for missing data prediction
CN113723010A (zh) 一种基于lstm温度-位移相关模型的桥梁损伤预警方法
CN107037306A (zh) 基于隐马尔科夫模型的变压器故障动态预警方法
CN111079941B (zh) 信用信息处理方法、***、终端和存储介质
CN111401785A (zh) 一种基于模糊关联规则的电力***设备故障预警方法
CN113792754A (zh) 一种先除异后修复的换流变dga在线监测数据处理方法
CN108334894B (zh) 基于无监督机器学习的变压器油温异常识别方法
CN103443809A (zh) 判别模型学习设备、方法和程序
CN112147432A (zh) 基于注意力机制的BiLSTM模块、变压器状态诊断方法和***
CN116737510B (zh) 一种基于数据分析的键盘智能监测方法及***
CN114015825A (zh) 基于注意力机制的高炉热负荷异常状态监测方法
CN116011158A (zh) 一种低压台区的拓扑识别方法、***及装置
CN114372093A (zh) 一种变压器dga在线监测数据的处理方法
Zhang et al. Fault diagnosis of oil-immersed power transformer based on difference-mutation brain storm optimized catboost model
CN113392877B (zh) 一种基于蚁群算法与c-k算法的日负荷曲线聚类方法
CN113780420A (zh) 基于gru-gcn的变压器油中溶解气体浓度预测方法
CN116432856A (zh) 基于cnn-glstm模型的管道动态预警方法及装置
CN116341290A (zh) 一种长贮装备可靠性抽样检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant