CN107506824B - 一种配电网的不良观测数据检测方法及装置 - Google Patents
一种配电网的不良观测数据检测方法及装置 Download PDFInfo
- Publication number
- CN107506824B CN107506824B CN201710772737.9A CN201710772737A CN107506824B CN 107506824 B CN107506824 B CN 107506824B CN 201710772737 A CN201710772737 A CN 201710772737A CN 107506824 B CN107506824 B CN 107506824B
- Authority
- CN
- China
- Prior art keywords
- observation data
- data
- bad
- data set
- observation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000001514 detection method Methods 0.000 claims abstract description 38
- 238000013528 artificial neural network Methods 0.000 claims description 34
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 11
- 238000007689 inspection Methods 0.000 claims description 8
- 238000007619 statistical method Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 17
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 239000011159 matrix material Substances 0.000 description 29
- 239000013598 vector Substances 0.000 description 11
- 238000012544 monitoring process Methods 0.000 description 6
- 238000012549 training Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012067 mathematical method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000000540 analysis of variance Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/043—Architecture, e.g. interconnection topology based on fuzzy logic, fuzzy membership or fuzzy inference, e.g. adaptive neuro-fuzzy inference systems [ANFIS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Mathematical Optimization (AREA)
- Computational Linguistics (AREA)
- Automation & Control Theory (AREA)
- Computational Mathematics (AREA)
- Fuzzy Systems (AREA)
- Mathematical Analysis (AREA)
- Tourism & Hospitality (AREA)
- Pure & Applied Mathematics (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Water Supply & Treatment (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Public Health (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Testing Or Calibration Of Command Recording Devices (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种配电网的不良观测数据检测方法,包括获取配电网的观测数据和理论数据;计算观测数据与理论数据的残差;依据残差对观测数据进行模糊聚类,生成多个观测数据集;分别判断各个观测数据集中是否存在残差大于预设残差阈值的观测数据;若是,则将观测数据集中的观测数据放入可疑数据集中;采用标准化残差法对可疑数据集中的观测数据进行辨识;根据辨识结果输出不良观测数据。本申请利用模糊聚类和初步判断可以获得观测数据数量相对较少的可疑数据集,进而减少了在标准化残差法辨识过程中的计算量,提高***的检测速度。本申请还公开了一种配电网的不良观测数据检测装置,同样具有上述有益效果。
Description
技术领域
本申请涉及电网技术领域,特别涉及一种配电网的不良观测数据检测方法及装置。
背景技术
随着电网技术的不断发展,电力***的拓扑结构和运行模式也越来越复杂,由此,对配电网运行状态和电能质量的监测也变得尤为重要。
在通过观测数据对配电网的运行状态进行监测时,由于某些原因,例如相关的实时量测***精度不高、线路发生功率转载或者电力人员抄表错误等,总是会出现错误的观测数据,即不良观测数据。对于电力***来说,不良观测数据很可能会导致电力调度中心发出错误的调度指令,干扰甚至破坏了电力***的稳定运行状态,因此极大降低了整个电力***的安全性与可靠性。
在配电网不良观测数据检测技术领域内,标准化残差法是一种常用技术手段。但是,现有技术中一般直接对所有观测数据采用标准化残差法进行辨识,而标准化残差法的检测过程是基于残差方程(一般是非线性的)的,需要进行大量的运算来完成状态估计,因此,现有技术中不良观测数据的检测方法需要较大的运算量,检测效率较低。
发明内容
本申请的目的在于提供一种配电网的不良观测数据检测方法及装置,以便有效地减少不良观测数据辨识过程中的运算量,减小运算负担,进而提高检测效率。
为解决上述技术问题,本申请提供了一种配电网的不良观测数据检测方法,包括:
获取配电网的观测数据和理论数据;
计算所述观测数据与所述理论数据的残差;
依据所述残差对所述观测数据进行模糊聚类,生成多个观测数据集;
分别判断各个所述观测数据集中是否存在残差大于预设残差阈值的观测数据;
若是,则将所述观测数据集中的观测数据放入可疑数据集中;
采用标准化残差法对所述可疑数据集中的观测数据进行辨识;
根据辨识结果输出不良观测数据。
可选地,所述依据所述残差对所述观测数据进行模糊聚类,生成多个观测数据集包括:
依据所述残差,采用不同的截取水平参数对所述观测数据进行模糊聚类,得到多种模糊聚类结果;
筛选保留一种所述模糊聚类结果中的观测数据集。
可选地,所述筛选保留一种所述模糊聚类结果中的观测数据集包括:
采用混合F统计量方法筛选保留一种所述模糊聚类结果中的观测数据集。
可选地,所述将所述观测数据集中的观测数据放入可疑数据集中包括:
判断所述观测数据集中的观测数据的个数是否大于预设个数;
若否,则将所述观测数据集中的所有观测数据放入所述可疑数据集中;
若是,则将所述观测数据集的代表观测数据放入所述可疑数据集中;所述代表观测数据与所述观测数据集的聚类中心的距离小于第一预设距离阈值;
所述根据辨识结果输出不良观测数据还包括:
若所述代表观测数据的辨识结果为不良观测数据,则判定与所述聚类中心的距离小于第二预设距离阈值的观测数据为不良观测数据,并输出;
若所述代表观测数据的辨识结果为正常观测数据,则判定与所述聚类中心的距离不小于所述第二预设距离阈值的观测数据为不良观测数据,并输出。
可选地,在所述根据辨识结果输出不良观测数据之后还包括:
利用神经网络计算正常观测数据的理论估计值;
判断所述正常观测数据与其理论估计值的误差是否小于预设检验阈值;
若是,则判定所述不良观测数据检测正确。
可选地,所述利用神经网络计算正常观测数据的理论估计值包括:
利用Levenberg-Marquardt神经网络计算正常观测数据的理论估计值。
本申请还提供了一种配电网的不良观测数据检测装置,包括获取模块、计算模块、模糊聚类模块、判断模块、辨识模块和输出模块:
获取模块:用于获取配电网的观测数据和理论数据;
计算模块:用于计算所述观测数据与所述理论数据的残差;
模糊聚类模块:用于依据所述残差对所述观测数据进行模糊聚类,生成多个观测数据集;
判断模块:用于分别判断各个所述观测数据集中是否存在残差大于预设残差阈值的观测数据;若是,则将所述观测数据集中的观测数据放入可疑数据集中;
辨识模块:用于采用标准化残差法对所述可疑数据集中的观测数据进行辨识;
输出模块:用于根据辨识结果输出不良观测数据。
可选地,所述模糊聚类模块具体用于:
依据所述残差,采用不同的截取水平参数对所述观测数据进行模糊聚类,得到多种模糊聚类结果;
筛选保留一种所述模糊聚类结果中的观测数据集。
可选地,所述判断模块具体用于:
判断所述观测数据集中的观测数据的个数是否大于预设个数;
若否,则将所述观测数据集中的所有观测数据放入所述可疑数据集中;
若是,则将所述观测数据集的代表观测数据放入所述可疑数据集中;所述代表观测数据与所述观测数据集的聚类中心的距离小于第一预设距离阈值;
所述输出模块还用于:
若所述代表观测数据的辨识结果为不良观测数据,则判定与所述聚类中心的距离小于第二预设距离阈值的观测数据为不良观测数据,并输出;
若所述代表观测数据的辨识结果为正常观测数据,则判定与所述聚类中心的距离不小于所述第二预设距离阈值的观测数据为不良观测数据,并输出。
可选地,还包括:
检验模块:用于利用神经网络计算正常观测数据的理论估计值;判断所述正常观测数据与其理论估计值的误差是否小于预设检验阈值;若是,则判定所述不良观测数据检测正确。
本申请所提供的配电网的不良观测数据检测方法,包括:获取配电网的观测数据和理论数据;计算所述观测数据与所述理论数据的残差;依据所述残差对所述观测数据进行模糊聚类,生成多个观测数据集;分别判断各个所述观测数据集中是否存在残差大于预设残差阈值的观测数据;若是,则将所述观测数据集中的观测数据放入可疑数据集中;采用标准化残差法对所述可疑数据集中的观测数据进行辨识;根据辨识结果输出不良观测数据。
可见,相比于现有技术,本申请所提供的配电网的不良观测数据检测方法中,首先利用模糊聚类过程将所有待检测的观测数据进行分类,并通过初步判断,获得观测数据个数相对较少的可疑数据集,以利用标准化残差法进行辨识,获得不良观测数据。因此,不存在可疑数据的观测数据集,也就可以避免了不必要的辨识过程,有效减少了不良观测数据检测过程中的运算量,进而提高了检测效率。本申请所提供的配电网的不良观测数据检测装置可以实现上述配电网的不良观测数据检测方法,同样具有上述有益效果。
附图说明
为了更清楚地说明现有技术和本申请实施例中的技术方案,下面将对现有技术和本申请实施例描述中需要使用的附图作简要的介绍。当然,下面有关本申请实施例的附图描述的仅仅是本申请中的一部分实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图,所获得的其他附图也属于本申请的保护范围。
图1为本申请实施例所提供的一种配电网的不良观测数据检测方法的流程图;
图2为本申请实施例所提供的一种对配电网的观测数据进行模糊聚类的流程图;
图3为本申请实施例所提供的一种将观测数据集中的观测数据放入可疑数据集中的流程图;
图4为本申请实施例所提供的一种训练L-M神经网络的方法的流程图;
图5为本申请实施例所提供的一种配电网的不良观测数据检测装置的结构框图。
具体实施方式
为了对本申请实施例中的技术方案进行更加清楚、完整地描述,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行介绍。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参考图1,图1为本申请实施例所提供的一种配电网的不良观测数据检测方法的流程图,主要包括以下步骤:
步骤101:获取配电网的观测数据和理论数据。
在配电网的状态监测中,主要的监测对象一般有节点电压、节点/线路输出有功功率、节点/线路输出无功功率等,因此可以通过实时量测***对这些监测对象进行量测,获取其观测数据。同时,可以从计算中心获取相应的理论数据,以便在接下来的步骤中根据观测数据和理论数据的残差进行不良观测数据的检测。
需要说明的是,在对配电网进行监测对象的量测时,作为一种优选实施例,可以采用精确度和适用度更高的IEEE 33节点***模型,当然,也可以采用IEEE 30等其他节点***模型,本领域技术人员可以自行选择并设置,本申请实施例对此并不进行限定。
步骤102:计算观测数据与理论数据的残差。
所说的残差即为观测数据与理论数据的差值。具体地,对于步骤101中所获取的观测数据或者理论数据,是多个节点的相关数据,而每个节点又有多个监测对象即多个特征,因此,为了便于分析,则可以将所有节点的各个特征的残差,构成残差矩阵。
用n来表示节点的个数,用m来表示每个节点的特征的个数,则可以将第i个节点的所有特征的残差构成列向量xi,并将所有的列向量xi(i=1,2,…,n)构成残差矩阵Xm×n=[x1x2 … xn]。
步骤103:依据残差对观测数据进行模糊聚类,生成多个观测数据集。
模糊聚类是一种采用模糊数学语言对事物按一定的要求进行描述和分类的数学方法;通常把被聚类的事物称为样本,将被聚类的一组事物称为样本集。作为数理统计中的一种多元分析方法,它用数学方法定量地确定样本间的亲疏关系,从而客观地划分类型。聚类就是将研究对象的样本分成多个类或簇,使得各个类之间的数据差别尽可能大,而类内之间的数据差别尽可能小,即最小化类间相似性、最大化类内相似性。
通过模糊聚类分析,依据一定的模糊关系,可以将配电网中的众多观测数据聚类得到多个观测数据集,同一个观测数据集中的大部分数据由于彼此之间相似性很高,将具有相同的属性,即,同为正常观测数据或者同为不良观测数据。因此,可以通过简单易执行的初步检测对各个观测数据集中是否存在可疑数据进行初步判断,若存在可疑数据,则再利用标准化残差法进行辨识;而若不存在任何一个可疑数据,说明该观测数据集中很可能不存在不良观测数据,则可以不对该观测数据集中的观测数据进行标准化残差法辨识,由此可以节约大量运算资源,减小运算负担,提高检测效率。
在对配电网的观测数据进行模糊聚类的过程中,主要包括以下步骤,如图2所示。
步骤1031:根据残差计算观测数据间的相似系数,建立模糊相似矩阵。
模糊相似矩阵是描述样本间相似关系的矩阵,具有自反和对称的特性。在构建本技术问题中的模糊相似矩阵时,需要先加将步骤102中得到的残差矩阵Xm×n进行预处理。由于不同特征的残差无法直接相比较,因此首先需要根据残差矩阵Xm×n生成观测数据的标准差矩阵Um×n=[u1 u2 … un],然后再依据标准差矩阵Um×n对观测数据进行模糊聚类。完整的标准差矩阵Um×n如下所示:
其中,uij为第j个节点的第i个特征的标准差。
构建标准差矩阵Um×n的模糊相似矩阵R=(rij)n×n:
其中,rij的计算公式为:
其中,rij为ui和uj之间的相似系数;C为相似关系参数,一般可取0.02;i、j=1,2,…,n。
步骤1032:根据模糊相似矩阵生成模糊等价矩阵。
模糊等价矩阵是对模糊相似矩阵进行一系列模糊运算后、具有自反、对称和传递特性的矩阵,对模糊等价矩阵进行λ截取操作可以得到模糊聚类结果。
求解模糊等价矩阵的过程即为根据模糊相似矩阵求解其传递闭包的过程,可以采用多种方法。对于本申请所解决的技术问题,作为一种优选实施例,可以采用较为简捷快速的逐次平方法,即,依次计算模糊相似矩阵R的2k次方:R、R2、R4、R8、…、…,直至出现则即为模糊相似矩阵R的模糊等价矩阵,记为
步骤1033:利用截取水平参数对模糊等价矩阵进行截取,获得多个观测数据集。
选取适当大小的截取水平参数λ∈[0,1],对模糊等价矩阵t(R)进行截取,得到截取结果矩阵t(R)λ=[(r'ij)λ]n×n,其中,
若(r'ij)λ=1,则说明在λ的截取水平上,ui和uj的相似度很高,其对应的观测数据可以归为一类,即应当放入同一个观测数据集中;若(r'ij)λ=0,则说明在λ的截取水平上,ui和uj的相似度不高,其对应的观测数据应当归为不同类,即放入不同的观测数据集中。
值得一提的是,在进行模糊聚类时,截取水平参数λ的取值对聚类结果具有一定的影响力,因此,作为一种优选实施例,还可以采用不同的截取水平参数λ对观测数据进行模糊聚类,得到多种模糊聚类结果,然后再筛选保留一种模糊聚类结果中的观测数据集。作为一种优选实施例,这里所说的筛选保留的过程,可以为筛选保留能够“最小化类间相似性,最大化类内相似性”的模糊聚类结果的过程,即确定最佳模糊聚类结果的过程。具体地,在评判“最小化类间相似性,最大化类内相似性”的程度时,可采用混合F统计量方法。
混合F统计量方法源于数理统计中的方差分析,是用来确定多维样本的最佳模糊分类的方法。用yi表示第i个待分类的m维样本,i=1,2,…,n;则它们构成的样本集为Y={y1、y2、…、yi、…、yn};假设经过模糊聚类,样本集Y中的n个样本被分为r类,并且第t类中有nt个样本。则混合F统计量的计算表达式为
根据混合F统计量计算表达式可见,其分子的表征意义为模糊聚类所得到的类与类之间的距离,其分母的表征意义为类内样本间的距离;因此,混合F统计量的值越大,说明该模糊聚类结果的类间距离越大且类内样本越紧凑,即该模糊聚类结果越合理。由于混合F统计量是服从自由度为(r-1,n-r)的F分布,因此,可以根据F分布临界值表获取在置信区间α上的临界值Fα,计算求得差值δ=F-Fα,则δ值最大的聚类结果即为使类间相似性最小化、类内相似性最大化的最佳模糊聚类结果,因此可以保留该最佳模糊聚类结果中的多个观测数据集,以便后续步骤的进行。
当然,还可以通过其他方法来确定最佳模糊聚类结果,例如模糊划分熵等方法,本领域技术人员可以自行选择并设置,本申请实施例并不进行限定。
步骤104:分别判断各个观测数据集中是否存在残差大于预设残差阈值的观测数据;若是,进入步骤105。
在经过步骤103中的模糊聚类得到多个观测数据集之后,即可对各个观测数据集进行简单的初步判断:只要该观测数据集存在可疑数据,即可将其观测数据放入可疑数据集中。在进行初步判断时,可以预先设定一个预设残差阈值,若某个观测数据的残差大于该预设残差阈值,则可以判定该观测数据为可疑数据,即很可能为不良观测数据的数据。
需要补充的是,这里所说的预设残差阈值,可以根据经验设置,或者根据运行历史中正常观测数据的范围进行设置,本申请实施例对此并不进行限定。
步骤105:将观测数据集中的观测数据放入可疑数据集中。
将可疑数据放入可疑数据集中,以便于接下来对可疑数据进行辨识。这里需要说明的是,经步骤104判断某个观测数据集中存在可疑数据之后,可以将该观测数据集中的所有观测数据都放入可疑数据集中,也可以只放入该观测数据集的代表观测数据,以便进一步减少步骤106中的辨识对象数量,简化运算量。所说的代表观测数据为与观测数据集的聚类中心的距离小于第一预设距离阈值的观测数据,由于其距离聚类中心较近,因此代表观测数据的辨识结果可以充分代表该观测数据集中大部分观测数据的辨识结果。
作为一种优选实施例,步骤105的过程又主要包括以下步骤,如图3所示:
步骤1051:判断观测数据集中的观测数据的个数是否大于预设个数;若是,进入步骤1052;若否,进入步骤1054。
这里所说的预设个数可由本领域技术人员自行选择设置,例如1个或者5个等,本申请实施例对此并不进行限定。
步骤1052:查找观测数据集中的代表观测数据。
当该观测数据集中的观测数据很多时,则可以只将代表观测数据放入可疑数据集中。在进行代表观测数据的查找时,首先可以计算每个观测数据与该观测数据集的聚类中心的距离,然后对该距离进行判断,若其小于第一预设距离阈值,则判定为代表观测数据。具体地,计算距离时具体可以采用欧式距离法,其计算表达式为
其中,如前所述,ytsk表示第t类观测数据集中的第s个观测数据的第k个特征;为第t类观测数据集的第k个特征的聚类平均值,表征第t类观测数据集的第k个特征的聚类中心;dts为第t类观测数据集中的第s个观测数据与该观测数据集聚类中心的距离。当然也可以采用其他的距离公式进行计算,本申请对此并不进行限定。
步骤1053:将代表观测数据放入可疑数据集中。
由于同一个观测数据集中的观测数据一般是具有较高相似性的,因此,代表观测数据进行辨识的结果可以代表该观测数据集中的大部分数据:若其辨识结果为不良观测数据,则该观测数据集中其他未经辨识的观测数据中大部分也为不良观测数据。当然,为了保证检测精确度,可以结合各观测数据与该观测数据集聚类中心的距离,对未经辨识的观测数据进行判断,即,可以认为与聚类中心的距离小于第二预设距离阈值的观测数据与代表观测数据具有同样的正常/不良属性,而距离大于第二预设距离阈值的观测数据与代表观测数据具有相反的正常/不良属性。
步骤1054:将观测数据集中所有的观测数据放入可疑数据集中。
若存在可疑数据的观测数据集的容量很小,即其中的观测数据数量有限,则可以直接将其中所有的观测数据都放入可疑数据集中进行检测。
步骤106:采用标准化残差法对可疑数据集中的观测数据进行辨识。
步骤107:根据辨识结果输出不良观测数据。
经过步骤106进行了标准化残差法的检测之后,即可根据辨识结果,将不良观测数据输出。
需要说明的是,如前文所述,若在步骤105中,加入到可疑数据集中的可疑数据只是观测数据集的代表观测数据的话,则此时需要根据代表观测数据的辨识结果,进一步输出没有参加辨识的不良观测数据。
具体地,若代表观测数据为正常观测数据,则可以判定其所代表的观测数据集中与聚类中心的距离大于第二预设距离阈值的观测数据为不良观测数据,并将该部分不良观测数据也进行输出;而若代表观测数据为不良观测数据,则可以判定其所代表的观测数据集中与聚类中心的距离小于第二预设距离阈值的观测数据为不良观测数据,并将该部分不良观测数据也进行输出。
可见,本申请实施例所提供的配电网的不良观测数据检测方法,首先通过模糊聚类,将众多的观测数据按照模糊相似度进行分类,并对分类得到的多个观测数据集进行初步判断,从而只对存在可疑数据的观测数据集采用标准化残差法进行辨识。考虑到同一个观测数据集内的观测数据相似度较高,因此初步判断结果的正确率得到了有效的保证,由此,可以通过初步判断排除掉一些正常观测数据,进而减少了采用标准化残差法进行辨识的运算工作量,有效提高了不良观测数据的检测效率。
此外,本申请实施例所提供的配电网的不良观测数据检测方法中,还可以在步骤106根据辨识结果输出不良观测数据之后,对检测结果进行进一步检验。
具体地,在输出不良观测数据之后,正常观测数据也就已经确定了。则此时可以利用预先训练好的神经网络,计算出正常观测数据的理论估计值,并判断正常观测数据与其理论估计值的误差是否小于预设检验阈值;若是,则判定步骤106中的不良观测数据的检测结果正确。
需要说明的是,这里所说的误差,可以采用相对误差,以便对于不同特征量都可以采用同一个预设检验阈值。并且,作为一种优选实施例,这里可以采用Levenberg-Marquardt(L-M)神经网络来计算正常观测数据的理论估计值。L-M神经网络具有一致的数据输入与输出结构,是传统BP神经网络算法的改进,改进之处在于它结合了梯度下降法和高斯-牛顿法来训练和调整权值,即,沿着参数的(近似)二次导数变化来改变神经网络的权值,具有更高的输出精度。
训练L-M神经网络的过程如图4所示,主要包括以下步骤:
步骤401:获取L-M神经网络的输入样本和输出样本。
易理解的是,这里所说的输入样本和输出样本都是配电网中的正常的数据,可以从配电网正常运行时的历史数据获得,也可以从标准数据中心等获得。配电网中的相关监测对象之间是有一定关系的,例如,可以由节点的有功功率、无功功率、电压和相位角等计算得到线路的始端/末端有功功率和始端/末端无功功率,因此,可将节点的有功功率、无功功率、电压和相位角等的正常数据作为L-M神经网络的输入样本,将线路的始端/末端有功功率和始端/末端无功功率的正常数据作为L-M神经网络的输出样本,由此可训练L-M神经网络,使其根据输入样本运算得到的输出值可以对输出样本进行精准的估计。
步骤402:设定权值向量。
步骤403:依据权值向量,利用L-M神经网络对输入样本进行运算,得到输出值。
L-M神经网络的输出值的计算表达式为
其中,为神经网络的第j个输出值;xj为神经网络的第j个输入样本;j=1,2,3,…,m,m为神经网络训练的输入样本的总数;wi为神经网络输出层的权值向量的第i个分量;i=1,2,3,…,n,n为神经网络的权函数的个数;Ti(xj)为xj的第i个权函数,其递推关系式为:
步骤404:计算输出值与输出样本的总体差值。
输出值与输出样本的总体差值的计算公式为
其中,E(w)为输出值与输出样本的总体差值;w=[w1,…,wi,…,wn],为神经网络输出层的权值向量;fj(w)为神经网络的第j个输出样本与第j个输出值的差值,即
其中,φ(xj)为神经网络的第j个输出样本。
步骤405:判断总体差值是否小于预设目标误差;若否,则进入步骤406;若是,则进入步骤407。
步骤406:更新权值向量,进入步骤403。
更新权值向量的计算表达式为
w(k+1)=w(k)-ηk[JT(w(k))J(w(k))+μkI]JT(w(k))F(w(k)),
其中,ηk和μk为调整参数,满足条件ηk+μk=1;I为单位矩阵;F(w(k))=[f1(w(k))f2(w(k))…fj(w(k))…fm(w(k))],为神经网络的差值向量;k为迭代的次数;J(w(k))为权值向量w(k)的雅各比矩阵,具体为:
步骤407:训练结束。
下面对本申请实施例所提供的配电网的不良观测数据检测装置进行介绍。下文描述的配电网的不良观测数据检测装置与上文描述的配电网的不良观测数据检测方法可相互对应参照。
请参阅图5,图5为本申请所提供的一种配电网的不良观测数据检测装置的结构框图;主要包括获取模块501、计算模块502、模糊聚类模块503、判断模块504、辨识模块505和输出模块506。
获取模块501主要用于获取配电网的观测数据和理论数据。
计算模块502主要用于计算观测数据与理论数据的残差。
模糊聚类模块503主要用于依据残差对观测数据进行模糊聚类,生成多个观测数据集。
其中,模糊聚类模块503可以具体用于依据残差,采用不同的截取水平参数对观测数据进行模糊聚类,得到多种模糊聚类结果;并筛选保留一种模糊聚类结果中的观测数据集。并且,具体可以采用混合F统计量方法来筛选保留其中一种模糊聚类结果中的观测数据集。
判断模块504主要用于分别判断各个观测数据集中是否存在残差大于预设残差阈值的观测数据;若是,则将观测数据集中的观测数据放入可疑数据集中。
其中,当判断模块504判定观测数据集中存在残差大于预设残差阈值的观测数据时,可以具体用于判断该观测数据集中的观测数据的个数是否大于预设个数;若否,则将该观测数据集中的所有观测数据放入可疑数据集中;若是,则将该观测数据集的代表观测数据放入可疑数据集中。这里所说的代表观测数据与该观测数据集的聚类中心的距离小于第一预设距离阈值。
辨识模块505主要用于采用标准化残差法对可疑数据集中的观测数据进行辨识。
输出模块506主要用于根据辨识结果输出不良观测数据。
其中,输出模块506还可以用于若代表观测数据的辨识结果为不良观测数据,则判定与聚类中心的距离小于第二预设距离阈值的观测数据为不良观测数据,并将其输出;若代表观测数据的辨识结果为正常观测数据,则判定与聚类中心的距离不小于第二预设距离阈值的观测数据为不良观测数据,并将其输出。
除此之外,本申请实施例所提供的配电网的不良观测数据检测装置还可以包括检验模块。检验模块主要用于利用神经网络计算正常观测数据的理论估计值;判断正常观测数据与其理论估计值的误差是否小于预设检验阈值;若是,则判定不良观测数据检测正确。具体地,检验模块具体可以用于采用L-M神经网络来计算正常观测数据的理论估计值,以便对不良观测数据的检测结果进行检验。
可见,本申请所提供的配电网的不良观测数据检测装置,利用模糊聚类模块503对数量众多的观测数据进行聚类,并利用判断模块504对观测数据进行初步判断,从而可以得到观测数据个数较少的可疑数据集,使得在对可疑数据集中的观测数据进行标准化残差法辨识时,省去了大量运算过程,进而提高了检测效率。
本申请中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的***而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需说明的是,在本申请文件中,诸如“第一”和“第二”之类的关系术语,仅仅用来将一个实体或者操作与另外一个实体或者操作区分开来,而不一定要求或者暗示这些实体或者操作之间存在任何这种实际的关系或者顺序。此外,术语“包括”、“包含”或者其他任何变体,意指非排他性的包含,即并不排除在所述过程、方法、物品或者设备等之中,还包括有其他没有明确列出的要素。
以上对本申请所提供的技术方案进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
Claims (8)
1.一种配电网的不良观测数据检测方法,其特征在于,包括:
获取配电网的观测数据和理论数据;
计算所述观测数据与所述理论数据的残差;
依据所述残差对所述观测数据进行模糊聚类,生成多个观测数据集;
分别判断各个所述观测数据集中是否存在残差大于预设残差阈值的观测数据;
若是,则将所述观测数据集中的观测数据放入可疑数据集中;
采用标准化残差法对所述可疑数据集中的观测数据进行辨识;
根据辨识结果输出不良观测数据;
其中,所述将所述观测数据集中的观测数据放入可疑数据集中包括:
判断所述观测数据集中的观测数据的个数是否大于预设个数;
若否,则将所述观测数据集中的所有观测数据放入所述可疑数据集中;
若是,则将所述观测数据集的代表观测数据放入所述可疑数据集中;所述代表观测数据与所述观测数据集的聚类中心的距离小于第一预设距离阈值;
所述根据辨识结果输出不良观测数据还包括:
若所述代表观测数据的辨识结果为不良观测数据,则判定与所述聚类中心的距离小于第二预设距离阈值的观测数据为不良观测数据,并输出;
若所述代表观测数据的辨识结果为正常观测数据,则判定与所述聚类中心的距离不小于所述第二预设距离阈值的观测数据为不良观测数据,并输出。
2.根据权利要求1所述的不良观测数据检测方法,其特征在于,所述依据所述残差对所述观测数据进行模糊聚类,生成多个观测数据集包括:
依据所述残差,采用不同的截取水平参数对所述观测数据进行模糊聚类,得到多种模糊聚类结果;
筛选保留一种所述模糊聚类结果中的观测数据集。
3.根据权利要求2所述的不良观测数据检测方法,其特征在于,所述筛选保留一种所述模糊聚类结果中的观测数据集包括:
采用混合F统计量方法筛选保留一种所述模糊聚类结果中的观测数据集。
4.根据权利要求1至3任一项所述的不良观测数据检测方法,其特征在于,在所述根据辨识结果输出不良观测数据之后还包括:
利用神经网络计算正常观测数据的理论估计值;
判断所述正常观测数据与其理论估计值的误差是否小于预设检验阈值;
若是,则判定所述不良观测数据检测正确。
5.根据权利要求4所述的不良观测数据检测方法,其特征在于,所述利用神经网络计算正常观测数据的理论估计值包括:
利用Levenberg-Marquardt神经网络计算正常观测数据的理论估计值。
6.一种配电网的不良观测数据检测装置,其特征在于,包括:
获取模块:用于获取配电网的观测数据和理论数据;
计算模块:用于计算所述观测数据与所述理论数据的残差;
模糊聚类模块:用于依据所述残差对所述观测数据进行模糊聚类,生成多个观测数据集;
判断模块:用于分别判断各个所述观测数据集中是否存在残差大于预设残差阈值的观测数据;若是,则将所述观测数据集中的观测数据放入可疑数据集中;
辨识模块:用于采用标准化残差法对所述可疑数据集中的观测数据进行辨识;
输出模块:用于根据辨识结果输出不良观测数据;
其中,所述判断模块具体用于:
判断所述观测数据集中的观测数据的个数是否大于预设个数;
若否,则将所述观测数据集中的所有观测数据放入所述可疑数据集中;
若是,则将所述观测数据集的代表观测数据放入所述可疑数据集中;所述代表观测数据与所述观测数据集的聚类中心的距离小于第一预设距离阈值;
所述输出模块还用于:
若所述代表观测数据的辨识结果为不良观测数据,则判定与所述聚类中心的距离小于第二预设距离阈值的观测数据为不良观测数据,并输出;
若所述代表观测数据的辨识结果为正常观测数据,则判定与所述聚类中心的距离不小于所述第二预设距离阈值的观测数据为不良观测数据,并输出。
7.根据权利要求6所述的不良观测数据检测装置,其特征在于,所述模糊聚类模块具体用于:
依据所述残差,采用不同的截取水平参数对所述观测数据进行模糊聚类,得到多种模糊聚类结果;
筛选保留一种所述模糊聚类结果中的观测数据集。
8.根据权利要求6或者7所述的不良观测数据检测装置,其特征在于,还包括:
检验模块:用于利用神经网络计算正常观测数据的理论估计值;判断所述正常观测数据与其理论估计值的误差是否小于预设检验阈值;若是,则判定所述不良观测数据检测正确。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710772737.9A CN107506824B (zh) | 2017-08-31 | 2017-08-31 | 一种配电网的不良观测数据检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710772737.9A CN107506824B (zh) | 2017-08-31 | 2017-08-31 | 一种配电网的不良观测数据检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107506824A CN107506824A (zh) | 2017-12-22 |
CN107506824B true CN107506824B (zh) | 2021-01-26 |
Family
ID=60693398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710772737.9A Expired - Fee Related CN107506824B (zh) | 2017-08-31 | 2017-08-31 | 一种配电网的不良观测数据检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107506824B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110687346A (zh) * | 2018-07-04 | 2020-01-14 | 国网上海市电力公司 | 一种电网电压异常原因数据检查及优化方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103618309A (zh) * | 2013-11-27 | 2014-03-05 | 广东电网公司电力科学研究院 | 电网中误差参数的调节方法和*** |
CN104166718A (zh) * | 2014-08-18 | 2014-11-26 | 国家电网公司 | 一种适用于大电网的不良数据检测与辨识方法 |
CN105183938A (zh) * | 2015-07-17 | 2015-12-23 | 国家电网公司 | 电网不良数据辨识与估计方法 |
-
2017
- 2017-08-31 CN CN201710772737.9A patent/CN107506824B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103618309A (zh) * | 2013-11-27 | 2014-03-05 | 广东电网公司电力科学研究院 | 电网中误差参数的调节方法和*** |
CN104166718A (zh) * | 2014-08-18 | 2014-11-26 | 国家电网公司 | 一种适用于大电网的不良数据检测与辨识方法 |
CN105183938A (zh) * | 2015-07-17 | 2015-12-23 | 国家电网公司 | 电网不良数据辨识与估计方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107506824A (zh) | 2017-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Charrad et al. | NbClust: an R package for determining the relevant number of clusters in a data set | |
CN108520357B (zh) | 一种线损异常原因的判别方法、装置及服务器 | |
CN107885928B (zh) | 考虑测量误差的步进应力加速性能退化可靠性分析方法 | |
CN111291777A (zh) | 一种基于多组学集成的癌症亚型分类方法 | |
CN113092981B (zh) | 晶圆数据检测方法及***、存储介质及测试参数调整方法 | |
CN110210681B (zh) | 一种基于距离的监测站点pm2.5值的预测方法 | |
CN110087207B (zh) | 无线传感器网络缺失数据重建方法 | |
CN111275307A (zh) | 一种水质自动在线站高频连续观测数据质量控制方法 | |
CN117196353B (zh) | 基于大数据的环境污染评估与监测方法及*** | |
CN110569876A (zh) | 非侵入式负荷识别方法、装置及计算设备 | |
CN113988441A (zh) | 电力无线网络链路质量预测、模型训练方法及装置 | |
CN111915022B (zh) | 滑移式岩溶危岩稳定系数快速识别的高斯过程方法及装置 | |
CN107908807B (zh) | 一种基于贝叶斯理论的小子样可靠性评定方法 | |
CN108470194B (zh) | 一种特征筛选方法及装置 | |
CN111898637A (zh) | 一种基于ReliefF-DDC特征选择算法 | |
CN115221973A (zh) | 一种基于增强加权异质集成学习的航空轴承故障诊断方法 | |
CN107506824B (zh) | 一种配电网的不良观测数据检测方法及装置 | |
CN112949735A (zh) | 一种基于离群数据挖掘的液态危化品挥发浓度异常发现方法 | |
CN109840386B (zh) | 基于因子分析的损伤识别方法 | |
CN116662840A (zh) | 一种基于机器学习的低压台区用户相位识别方法 | |
CN116186507A (zh) | 一种特征子集的选取方法、装置及存储介质 | |
CN115754199A (zh) | 基于隶属度函数和主成分分析的水质检测方法 | |
CN106709598B (zh) | 一种基于单类样本的电压稳定性预测判断方法 | |
CN114880954A (zh) | 一种基于机器学习的滑坡敏感性的评估方法 | |
CN113255810A (zh) | 基于关键决策逻辑设计测试覆盖率的网络模型测试方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210126 Termination date: 20210831 |