CN109389282A - 一种基于高斯混合模型的电能表生产厂商评价方法 - Google Patents

一种基于高斯混合模型的电能表生产厂商评价方法 Download PDF

Info

Publication number
CN109389282A
CN109389282A CN201810943552.4A CN201810943552A CN109389282A CN 109389282 A CN109389282 A CN 109389282A CN 201810943552 A CN201810943552 A CN 201810943552A CN 109389282 A CN109389282 A CN 109389282A
Authority
CN
China
Prior art keywords
electric energy
energy meter
index
quality
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201810943552.4A
Other languages
English (en)
Inventor
崔幼
吴国诚
李熊
刘晟源
林振智
薛梦雯
张媛
葛岳军
孙钢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Huayun Information Technology Co Ltd
Original Assignee
Zhejiang Huayun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Huayun Information Technology Co Ltd filed Critical Zhejiang Huayun Information Technology Co Ltd
Priority to CN201810943552.4A priority Critical patent/CN109389282A/zh
Publication of CN109389282A publication Critical patent/CN109389282A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/80Management or planning
    • Y02P90/82Energy audits or management systems therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Educational Administration (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于高斯混合模型的电能表生产厂商评价方法,包括步骤:获取电能表的原始数据,筛选电能表质量的评估指标;采用高斯混合模型聚类算法提取典型评估指标数据,获取聚类中心,形成电能表质量综合评估的决策矩阵,并对其分别按效益型和成本型进行标准化处理;分别计算电能表各项评估指标基于层次分析法、熵权法、皮尔逊相关系数法以及变异系数法的权重,用指标权重的组合优化模型获得组合权重,对决策矩阵进行加权处理从而获得电能表质量综合评估的评估矩阵;用夹角度量法对电能表的质量进行综合评估,按照从高至低的顺序将各个电能表供应商的质量进行优劣排序,获得评价结果。其可以为精准核算电能使用量和电能收入提供支撑。

Description

一种基于高斯混合模型的电能表生产厂商评价方法
技术领域
本发明涉及电力***领域,特别是涉及一种基于高斯混合模型的电能表生产厂商评价方 法。
背景技术
随着电力市场改革的不断深入,电力营销越来越受到电力企业的重视。电能计量作为电 力营销的支撑环节,为精准核算电能使用量和电能收入提供了基础数据。电能表的质量好坏 对用电信息采集***的数据质量、应用水平以及电力企业效益会产生直接的影响。因此,研 究电能表的综合质量评估模型和方法对提高电能表的数据质量和电力企业效益具有非常重要 的实际意义。
目前,综合评估电能计量设备质量和供应商的模型和方法还不多,这些模型和方法主要分 为三类:第一类方法是依据电能计量设备的某一个检测指标(如首检合格率)对电能表供应商 进行优劣排序;第二类方法是从不同角度提出多个电能表质量性能指标,并采用简单加权法 对指标进行综合和优劣排序,但由于不同指标对电能计量设备质量的影响程度不同(即没有考 虑不同指标对电能表质量的影响程度),从而造成该类方法的评估结果不准确;第三类方法采 用专家打分法、层次分析法(Analytic Hierarchy Process,AHP)等主观赋权法直接或间接地确 定各个指标的权重,考虑了不同指标对电能表质量的影响程度,但是限于专家的知识和经验 水平,其权重确定较为主观,从而可能导致电能表质量评估结果的差异较大。
为了及时准确地监控电能使用状态,大量的电能表安装在用户侧,终端定期将用户计量 和故障告警数据发送到用电信息采集***。因为生产批次和安装区域不同,电能表的型号众 多、类型多样,所以电能表将产生海量的结构化和非结构化的计量和故障告警信息,传统的 数据处理方法已经很难胜任。此外,环境噪声、电磁干扰等非质量因素也可能造成电能表产 生坏数据、空数据等问题。
发明内容
本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供一 种基于高斯混合模型的电能表生产厂商评价方法,以达到对电能表质量作出科学、合理的定 量评价的目的。为此,本发明采取以下技术方案。
一种基于高斯混合模型的电能表生产厂商评价方法,其特征在于,包括如下步骤:
1)获取每个批次和区域中电能表的原始数据,确定7个评价指标作为衡量电能表质量的 评估指标,分别为:负荷采集合格率α1,电量数据采集率α2,无故障工作时间α3,考虑计量 异常的严重异常次数α4、一般异常次数α5、轻微异常次数α6,以及维修率α7
式中:Nsamp是采样时间段的总个数,Tsamp,i是第i次采样的时间长度,即总采样时 间;Mi、mi、Ci和ci分别是第i个采样时间段内电能表负荷数据合格的个数、负荷数据总个 数、理论应采集的数据量和实际采集的数据量;Fser,i、Fgen,i、Fun,i分别是第i个采样时间段内 电能表发生严重、一般和轻微故障的次数;Nsamp,F是首次出现Fser,i+Fgen,i+Fun,i≠0的采样时间 段;Trate和TF分别是电能表的额定运行时间和故障停运时间;
2)采用高斯混合模型聚类算法提取电能表海量数据中的典型评估指标数据,获取聚类中 心,形成电能表质量综合评估的决策矩阵,并对其分别按效益型和成本型进行标准化处理;
3)分别计算电能表各项评估指标基于层次分析法、熵权法、皮尔逊相关系数法以及变异 系数法的权重,然后用指标权重的组合优化模型获得组合权重,对决策矩阵进行加权处理从 而获得电能表质量综合评估的评估矩阵;
4)根据评估矩阵,用夹角度量法对电能表的质量进行综合评估,按照从高至低的顺序将 各个电能表供应商的质量进行优劣排序,获得评价结果。
作为优选技术手段:在步骤2)高斯混合模型聚类算法中:
假设GMM由K个高斯分布混合而成,则每个高斯分布称作一个“组分”,这些“组分”线 性相加即为GMM的概率密度函数:
式中:ωk表示第k个多维单高斯分布的权值,Nk(x;μk;Σk)表示第k个多维单高斯分布的概 率密度函数,x表示数据样本列向量,μk表示第k个高斯模型的期望向量,Σk表示第k个高 斯模型的方差;
电能表质量数据的GMM聚类算法流程为:
205)令l=0,随机选择初始化的ω(l)(l)(l),求取第i个样本点xi属于第k类高斯模 型的初始化后验概率:
206)将第201)步得到的结果代入最大似然公式计算第l+1次迭代的GMM聚类参数:
式中:N为待聚类的数据点个数;
207)若成立(ε一般取10-5),则迭代结束,即为估计得到的GMM聚类参数,继续下一步;否则,回到第2)步;
208)采用贝叶斯概率公式计算第i个样本点xi属于第k类高斯模型的概率:
根据贝叶斯概率最大准则,将第i个样本点xi划分到使其概率p(μkk|xi)取得最大的那 类高斯模型中。
作为优选技术手段:在步骤2),决策矩阵为:
式中:dij表示第i个电能表供应商第j个指标的值,P为电能表供应商个数,Q为衡量供应商 的电能表质量的评价指标个数,在其中Q等于7;
效益型指标标准化处理方法为:
成本型指标标准化处理方法为:
式中:分别表示所有P个电能表供应商中指标j的最小值和最大值;Ω1表 示效益型指标集合,其中Ω1={1,2,3};Ω2表示成本型指标集合,其中Ω2={4,5,6,7}。
作为优选技术手段:在步骤3)中,分别采用层次分析法、熵权法、相关系数法和变异 系数法计算电能表质量指标权重,接着用指标的组合优化模型计算组合权重,其中:
层次分析法为:设Q个指标为U={u1,u2,…,uQ},每次取两个指标ui和uj,按1~9的比 例用aij表示指标ui与uj对电能表质量的影响程度之比,数值越大表示ui相对于uj越重要; 这样即可获得一个电能表质量评估问题的判断矩阵A=(aij)Q×Q,该判断矩阵具有如下性质: aij>0,aji=1/aij,(i=1,2,…,Q;j=1,2,…,Q);计算指标权重前首先对判断矩阵A进行一致性检验, 如果一致性检验未通过,则说明aij取值前后矛盾,需要重新赋值;如果通过,则说明aij取值 前后一致,判断矩阵A可用于求取指标权重;求取指标权重可以用列和求逆法,即:
将bj归一化,即可求得归一化后的指标权重为
式中:
电能表质量指标的熵权为:
式中:κ表示常数κ=1/lnP,并且假定fij=0时,fijlnfij=0;
计算皮尔逊相关系数权重时:假设d′x=(d′1x,d′2x,...,d′Px)T和d′y=(d′1y,d′2y,...,d′Py)T表示标准 化决策矩阵D′的两个列向量,则第x个指标和第y个指标之间的皮尔逊相关系数定义为
式中:分别是向量d′x和d′y的平均值;基于皮尔逊相关系数的权重定义为
式中:
计算变异系数法权重时:指标uj的变异系数定义为:
式中:表示向量(d′1j,d′2j,...,d′Pj)T的平均值;基于变异系数法的指标权重定义为:
式中:
指标权重的组合优化模型为:
式中:表示待优化的第j个电能表质量指标的组合权重,表示采用第k种方法求解得到 的第j个指标的权重,G表示权重确定方法的数目,表示的隶属度函数;显然,越大,权重与最终的组合权重越贴近。
作为优选技术手段:在步骤4)用夹角度量法对电能表的质量进行综合评估,包括步骤:
405)形成P个待评估的供应商对应的Q个质量指标的评估矩阵
R=(rij)P×Q
式中:
406)计算电能表质量评估中的理想点和负理想点,其分别为
式中:
407)分别计算每个供应商下的电能表质量指标与理想点、负理想点的夹角距离,即
式中:ri=(ri1,ri2,...,riQ)表示评估矩阵R的第i个行向量;
408)计算每个供应商下的电能表质量指标与理想点的夹角逼近程度,即
可以看出:第i个供应商生产的电能表质量越好,γi愈接近于1;反之,质量越差,γi越 接近于0;因此,可以根据γi取值的大小得到电能表质量的评估结果。
有益效果:本技术方案对采集到的原始数据进行清洗、填补以及聚类分析将有助于提高 电能表的数据质量,减少后续提出的电能表综合评估模型的存储规模和计算量。
附图说明
图1为本发明流程图;
图2为第1个供应商下电能表质量数据散点图及GMM聚类结果;
图3为第3个供应商下电能表质量数据散点图及GMM聚类结果;
图4为第12个供应商下电能表质量数据散点图及GMM聚类结果。
具体实施方式
为了更好地理解本发明的目的、技术方案以及技术效果,以下结合附图对本发明进行进 一步的讲解说明。
参考图1,图1所示为本实施例的基于计量大数据聚类模型的电能表生产厂商评价方法 流程图,包括如下步骤:
S10,获取电能表的原始数据,筛选7个衡量电能表质量的评估指标:负荷采集合格率, 电量数据采集率,无故障工作时间,考虑计量异常的严重异常次数、一般异常次数、轻微异 常次数,以及维修率;
在本实施例中:
电能表分为供应商、型号、批次和单个设备四个层次,而计量自动化***中一般以单个 设备为单元存储数据。目前,在计量自动化***中已采集的电能表质量数据包含有负荷采集 合格率α1,电量数据采集率α2,无故障工作时间α3,考虑计量异常的严重异常次数α4、一 般异常次数α5、轻微异常次数α6,以及维修率α7,其含义分别可以为:
式中:Nsamp是采样时间段的总个数,Tsamp,i是第i次采样的时间长度,即总采样时 间;Mi、mi、Ci和ci分别是第i个采样时间段内电能表负荷数据合格的个数、负荷数据总个 数、理论应采集的数据量和实际采集的数据量;Fser,i、Fgen,i、Fun,i分别是第i个采样时间段内 电能表发生严重、一般和轻微故障的次数;Nsamp,F是首次出现Fser,i+Fgen,i+Fun,i≠0的采样时间 段;Trate和TF分别是电能表的额定运行时间和故障停运时间。
S20,采用大数据分析技术中的高斯混合模型聚类算法提取电能表海量数据中的典型指标 数据,获取聚类中心,形成电能表质量综合评估的决策矩阵,并对其分别按效益型和成本型 进行标准化处理;
在本实施例中:
每个供应商生产的电能表数量众多、型号复杂,因此从***中导出的电能表数据无法直 接应用于对每个供应商的质量评估。为此,可以用大数据分析技术中的数据聚类方法,挖掘 各个供应商电能表质量的典型特征,从而实现对其质量的综合评估。
高斯混合模型(Gaussian Mixture Model,GMM)用高斯分布概率密度函数来描述数据,它 可以将一个大数据集分解为若干个符合高斯分布的模型。因此,高斯混合模型可用于数据聚 类,提取数据集中的典型特征。假设GMM由K个高斯分布混合而成,则每个高斯分布称作 一个“组分”,这些“组分”线性相加即为GMM的概率密度函数:
式中:ωk表示第k个多维单高斯分布的权值,Nk(x;μk;Σk)表示第k个多维单高斯分布的概 率密度函数,x表示数据样本列向量,μk表示第k个高斯模型的期望向量,Σk表示第k个高 斯模型的方差。
电能表的质量受到多个独立因素的影响,且这些因素都不是决定性的。根据中心极限定 理,可认为同一批次的电能表质量的指标数据符合高斯分布。对于某一电能表供应商下的K 个批次的设备,可认为其质量的指标数据是K个高斯分布模型的叠加。因此,高斯混合模型 聚类算法适用于挖掘电能表质量的指标数据。在进行GMM聚类之前,首先需要估计各个高 斯分布模型的参数,这里采用期望最大化算法[进行估计。因此,电能表质量数据的GMM聚 类算法流程可以为:
201)令l=0,随机选择初始化的ω(l)(l)(l),求取第i个样本点xi属于第k类高斯模 型的初始化后验概率:
202)将第1)步得到的结果代入最大似然公式计算第l+1次迭代的GMM聚类参数:
式中:N为待聚类的数据点个数。
203)若成立(ε一般取10-5),则迭代结束,即为估计得到的GMM聚类参数,继续下一步;否则,回到第2)步;
204)采用贝叶斯概率公式计算第i个样本点xi属于第k类高斯模型的概率:
根据贝叶斯概率最大准则,将第i个样本点xi划分到使其概率p(μkk|xi)取得最大的那 类高斯模型中。
当所有的样本点均按照上述步骤划分到各自所属的高斯模型后,GMM聚类完成并获得 了相应的聚类中心。GMM聚类算法舍弃了电能表质量评估原始指标数据中冗余和不重要的 信息,但保留了原始指标数据的重要数据和典型特征。因此,GMM聚类算法大大压缩了数 据的规模、减少了综合评估的计算量,却几乎不影响电能表质量综合评估的准确性。
设D为电能表质量评估问题的决策矩阵,D中的元素dij表示第i个电能表供应商第j个 指标的值。因为不同指标间的量纲不同,所以不能直接对各个指标的重要程度进行比较,需 要进行归一化处理。此外,电能表质量指标还分为效益型和成本型两类,效益型指标数值越 大代表质量越好,成本型指标数值越大代表质量越差。因此,在确定指标权重前首先要对D 进行归一化处理以得到归一化后的决策矩阵D′,其归一化处理公式可以为:
式中:分别表示所有P个电能表供应商中指标j的最小值和最大值;Ω1表 示效益型指标集合,其中Ω1={1,2,3};Ω2表示成本型指标集合,其中Ω2={4,5,6,7}。
S30,分别计算电能表各项指标基于层次分析法、熵权法、皮尔逊相关系数法以及变异系 数法的权重,然后用指标权重的组合优化模型获得组合权重,对决策矩阵进行加权处理从而 获得电能表质量综合评估的评估矩阵;
在本实施例中:
AHP法通过指标间两两比较重要程度,间接获得每个指标的权重,该方法属于一种主观 赋权法。设Q个指标为U={u1,u2,…,uQ}。每次取两个指标ui和uj,按1~9的比例用aij表 示指标ui与uj对电能表质量的影响程度之比,数值越大表示ui相对于uj越重要。这样即可获 得一个电能表质量评估问题的判断矩阵A=(aij)Q×Q,该判断矩阵具有如下性质:aij>0,aji=1/aij, (i=1,2,…,Q;j=1,2,…,Q)。计算指标权重前首先对判断矩阵A进行一致性检验,如果一致性 检验未通过,则说明aij取值前后矛盾,需要重新赋值;如果通过,则说明aij取值前后一致, 判断矩阵A可用于求取指标权重。即可以为:
将bj归一化,即可求得归一化后的指标权重为
式中:
在信息学中,熵用来表征***的无序程度和数据的离差程度。指标的信息熵越大则其在 综合评估中提供的信息就越少,相应的权重也应该越小;反之,其信息熵越小,则权重应当 越大。因此,电能表质量指标uj的熵Hj可以定义为
式中:κ表示常数κ=1/lnP,并且假定fij=0时,fijlnfij=0。据此,第j个 电能表质量指标的熵权可以定义为
式中:
在统计学中相关系数用于衡量两个变量之间的关联性,包括皮尔逊相关系数、斯皮尔曼 相关系数和肯德尔相关系数等,其中皮尔逊相关系数更适用于符合正态分布的数据[17],因此 本发明使用皮尔逊相关系数来计算指标间内在的相关程度。相关程度越大说明指标间信息的 重复性越大,相应指标的权重应越小;反之,相关程度越小,权重应越大。假设 d′x=(d′1x,d′2x,...,d′Px)T和d′y=(d′1y,d′2y,...,d′Py)T表示标准化决策矩阵D′的两个列向量,则第x个 指标和第y个指标之间的皮尔逊相关系数可以定义为:
式中:分别是向量d′x和d′y的平均值。因此,基于相关系数法的权重可以定义为
式中:
变异系数法是一种根据指标数据间的对比强度来确定指标权重的客观赋权法。某个指标 的变异程度越大,说明其相对于其它指标的对比强度越大,则在综合评估中对评估对象的重 要性越高,从而其权重也应越大;反之,变异程度越小,权重应越小。指标uj的变异系数可 以定义为:
式中:表示向量(d′1j,d′2j,...,d′Pj)T的平均值。因此,基于变异系数法的指标权重可以定义为
式中:
虽然上述4种主、客观方法简单易行,但均存在一定的不足。主观赋权法仅依照专家的 经验,很容易导致主观偏好过强;客观赋权法仅凭借实际数据,但实际数据可能会出现一定 误差,从而可能导致评估结果不符合实际。为了充分考虑依据专家经验的主观打分,同时依 据数据本身的特征对权重进行修正,本发明基于权重隶属度最大,构建了电能表质量指标权 重的组合优化模型,即可以为
式中:表示待优化的第j个电能表质量指标的组合权重,表示采用第k种方法求解得到 的第j个指标的权重,G表示权重确定方法的数目,表示的隶属度函数。显然,越大,权重与最终的组合权重越贴近。
S40,根据评估矩阵,用夹角度量法对电能表的质量进行综合评估,按照从高至低的顺序 将各个电能表供应商的质量进行优劣排序,获得评价结果。
在本实施例中:
确定各个电能表质量指标的组合权重后,电能表的综合质量评估可以转化为一个多属性 决策问题。夹角度量法采用变量之间的夹角作为距离的测度,依据被评估对象与理想化目标 的逼近程度进行排序。因此,基于夹角度量法的电能表综合质量评估的流程可以为:
401)形成P个待评估的供应商对应的Q个质量指标的评估矩阵
R=(rij)P×Q
式中:
402)计算电能表质量评估中的理想点和负理想点,其分别为
式中:
403)分别计算每个供应商下的电能表质量指标与理想点、负理想点的夹角距离,即
式中:ri=(ri1,ri2,...,riQ)表示评估矩阵R的第i个行向量。
404)计算每个供应商下的电能表质量指标与理想点的夹角逼近程度,即
可以看出:第i个供应商生产的电能表质量越好,γi愈接近于1;反之,质量越差,γi越 接近于0。因此,可以根据γi取值的大小得到电能表质量的评估结果。
为了进一步理解本发明,以下采用国网浙江省电力公司宁波供电公司管辖的某地区的电 能表数据进行算例仿真,该原始数据集共有11565条数据,经过数据清洗之后可用数据为 11312条,共有17个待评估的电能表供应商,每个供应商下有若干设备批次,所有的设备批 次总数为58个。
将17个供应商及其58个批次的数据按顺序重新进行编号,以第1、3、12个供应商为例 分析GMM聚类算法的效果。第1个供应商下有2个批次,共142台电能表;第3个供应商 下有4个批次,共496台电能表,第12个供应商下有6个批次,共1514台电能表。每台电 能表都有7个指标,图2至图4分别展示了经归一化处理后的第1、3、12个供应商下电能表 各个质量指标的散点图和经GMM聚类后的聚类中心。
从图2可以看出,反映电能表质量的原始数据较多,不容易直接用于后续的质量评估。 然而,经过GMM算法分析后,第1个供应商下的142台电能表的质量数据符合2个多维高斯分布模型的叠加,故可将这142台电能表聚集成典型的2类,其聚类中心分别如图2中圆点所示。因此,可以用2台典型的电能表表征这142台电能表的质量特征。同理,从图3可 以看出,第3个供应商下的496台电能表的质量数据符合4个多维高斯分布模型的叠加,故 可用4台典型的电能表表征这496台电能表的质量特征;从图4可以看出,第12个供应商下 的1514台电能表的质量数据符合6个多维高斯分布模型的叠加,故可用6台典型的电能表表征这1514台电能表的质量特征。由此,海量电能表质量评估的原始数据得到了压缩,冗余和不重要的信息被舍弃,重要、典型的特征被保留,从而使得后续的指标权重优化和质量综合评估的计算量都大大降低。
对每个供应商下的电能表都进行GMM聚类分析,可以获得表征各个供应商的电能表质 量的典型电能表,然后将这些典型电能表相应的指标取平均值即可得到如表1所示的决策矩 阵D′。
表1标准化后的电能表质量决策矩阵
假定专家对指标的判断矩阵A为
经检验,A满足一致性要求,计算基于AHP法的权重,其结果如表2所示。此外,表2还分别给出了基于熵权法、相关系数法、变异系数法和组合优化模型的指标权重。从表2可以看出:客观权重对主观权重起到了一定的修正作用,按照专家经验,电能表的严重异常指标α4应占有较大的权重,但另外三种客观赋权法都对α4给出了较小的权重,这是因为原始数据中各个供应商的α4数值差异不大。因此,和其它指标相比,该指标难以辨别各个供应商的电能表质量优劣,故应当赋予较小的权重。
表2不同方法计算得到的指标权重
然后,基于得到的指标组合权重,形成电能表质量的评估矩阵R,进而采用夹角度量法 对电能表的质量进行综合评估,最后得到如表3所示的电能表质量综合评估的结果。
表3电能表质量综合评估结果
从表3可以看出:电能表质量最好的前9家供应商分别为:10、9、5、7、6、13、11、 16和4,其中第10个供应商在电能表质量综合评估中的评估值最高,第15个供应商的评估 值最低。从表1所示的电能表指标数据可以看出:第10个供应商的无故障工作时间、严重异 常次数这两个指标在所有供应商中数值最大,其余5项指标的数值大小都排在前三位,所以第10个供应商生产的电能表质量最好;虽然第15个供应商在电量数据采集率这个指标上取值较大,但其在剩下6个指标的取值均较小,尤其在无故障工作时间这个指标上,第15个供应商的取值很小,其值仅为0.0700,然而该指标的组合权重达到0.5575,重要程度远超其余所有指标。因此,将第15个供应商生产的电能表质量判定为最差是合理的。

Claims (5)

1.一种基于高斯混合模型的电能表生产厂商评价方法,其特征在于,包括如下步骤:
1)获取每个批次和区域中电能表的原始数据,确定7个评价指标作为衡量电能表质量的评估指标,分别为:负荷采集合格率α1,电量数据采集率α2,无故障工作时间α3,考虑计量异常的严重异常次数α4、一般异常次数α5、轻微异常次数α6,以及维修率α7
式中:Nsamp是采样时间段的总个数,Tsamp,i是第i次采样的时间长度,即总采样时间;Mi、mi、Ci和ci分别是第i个采样时间段内电能表负荷数据合格的个数、负荷数据总个数、理论应采集的数据量和实际采集的数据量;Fser,i、Fgen,i、Fun,i分别是第i个采样时间段内电能表发生严重、一般和轻微故障的次数;Nsamp,F是首次出现Fser,i+Fgen,i+Fun,i≠0的采样时间段;Trate和TF分别是电能表的额定运行时间和故障停运时间;
2)采用高斯混合模型聚类算法提取电能表海量数据中的典型评估指标数据,获取聚类中心,形成电能表质量综合评估的决策矩阵,并对其分别按效益型和成本型进行标准化处理;
3)分别计算电能表各项评估指标基于层次分析法、熵权法、皮尔逊相关系数法以及变异系数法的权重,然后用指标权重的组合优化模型获得组合权重,对决策矩阵进行加权处理从而获得电能表质量综合评估的评估矩阵;
4)根据评估矩阵,用夹角度量法对电能表的质量进行综合评估,按照从高至低的顺序将各个电能表供应商的质量进行优劣排序,获得评价结果。
2.根据权利要求1所述的一种基于高斯混合模型的电能表生产厂商评价方法,其特征在于,在步骤2)高斯混合模型聚类算法中:
假设GMM由K个高斯分布混合而成,则每个高斯分布称作一个“组分”,这些“组分”线性相加即为GMM的概率密度函数:
式中:ωk表示第k个多维单高斯分布的权值,Nk(x;μk;Σk)表示第k个多维单高斯分布的概率密度函数,x表示数据样本列向量,μk表示第k个高斯模型的期望向量,Σk表示第k个高斯模型的方差;
电能表质量数据的GMM聚类算法流程为:
201)令l=0,随机选择初始化的ω(l)(l)(l),求取第i个样本点xi属于第k类高斯模型的初始化后验概率:
202)将第201)步得到的结果代入最大似然公式计算第l+1次迭代的GMM聚类参数:
式中:N为待聚类的数据点个数;
203)若成立(ε一般取10-5),则迭代结束,即为估计得到的GMM聚类参数,继续下一步;否则,回到第2)步;
204)采用贝叶斯概率公式计算第i个样本点xi属于第k类高斯模型的概率:
根据贝叶斯概率最大准则,将第i个样本点xi划分到使其概率p(μkk|xi)取得最大的那类高斯模型中。
3.根据权利要求1所述的一种基于高斯混合模型的电能表生产厂商评价方法,其特征在于,在步骤2),决策矩阵为:
式中:dij表示第i个电能表供应商第j个指标的值,P为电能表供应商个数,Q为衡量供应商的电能表质量的评价指标个数,在其中Q等于7;
效益型指标标准化处理方法为:
成本型指标标准化处理方法为:
式中:分别表示所有P个电能表供应商中指标j的最小值和最大值;Ω1表示效益型指标集合,其中Ω1={1,2,3};Ω2表示成本型指标集合,其中Ω2={4,5,6,7}。
4.根据权利要求1的一种基于高斯混合模型的电能表生产厂商评价方法,其特征在于,在步骤3)中,分别采用层次分析法、熵权法、相关系数法和变异系数法计算电能表质量指标权重,接着用指标的组合优化模型计算组合权重,其中:
层次分析法为:设Q个指标为U={u1,u2,…,uQ},每次取两个指标ui和uj,按1~9的比例用aij表示指标ui与uj对电能表质量的影响程度之比,数值越大表示ui相对于uj越重要;这样即可获得一个电能表质量评估问题的判断矩阵A=(aij)Q×Q,该判断矩阵具有如下性质:aij>0,aji=1/aij,(i=1,2,…,Q;j=1,2,…,Q);计算指标权重前首先对判断矩阵A进行一致性检验,如果一致性检验未通过,则说明aij取值前后矛盾,需要重新赋值;如果通过,则说明aij取值前后一致,判断矩阵A可用于求取指标权重;求取指标权重可以用列和求逆法,即:
将bj归一化,即可求得归一化后的指标权重为
式中:
电能表质量指标的熵权为:
式中:κ表示常数κ=1/lnP,并且假定fij=0时,fijlnfij=0;
计算皮尔逊相关系数权重时:假设d′x=(d′1x,d′2x,...,d′Px)T和d′y=(d′1y,d′2y,...,d′Py)T表示标准化决策矩阵D′的两个列向量,则第x个指标和第y个指标之间的皮尔逊相关系数定义为
式中:分别是向量d′x和d′y的平均值;基于皮尔逊相关系数的权重定义为
式中:
计算变异系数法权重时:指标uj的变异系数定义为:
式中:表示向量(d′1j,d′2j,...,d′Pj)T的平均值;基于变异系数法的指标权重定义为:
式中:
指标权重的组合优化模型为:
式中:表示待优化的第j个电能表质量指标的组合权重,表示采用第k种方法求解得到的第j个指标的权重,G表示权重确定方法的数目,表示的隶属度函数;显然,越大,权重与最终的组合权重越贴近。
5.根据权利要求1所述的一种基于高斯混合模型的电能表生产厂商评价方法,其特征在于,在步骤4)用夹角度量法对电能表的质量进行综合评估,包括步骤:
401)形成P个待评估的供应商对应的Q个质量指标的评估矩阵
R=(rij)P×Q
式中:
402)计算电能表质量评估中的理想点和负理想点,其分别为
式中:
403)分别计算每个供应商下的电能表质量指标与理想点、负理想点的夹角距离,即
式中:ri=(ri1,ri2,...,riQ)表示评估矩阵R的第i个行向量;
404)计算每个供应商下的电能表质量指标与理想点的夹角逼近程度,即
可以看出:第i个供应商生产的电能表质量越好,γi愈接近于1;反之,质量越差,γi越接近于0;因此,可以根据γi取值的大小得到电能表质量的评估结果。
CN201810943552.4A 2018-08-17 2018-08-17 一种基于高斯混合模型的电能表生产厂商评价方法 Withdrawn CN109389282A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810943552.4A CN109389282A (zh) 2018-08-17 2018-08-17 一种基于高斯混合模型的电能表生产厂商评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810943552.4A CN109389282A (zh) 2018-08-17 2018-08-17 一种基于高斯混合模型的电能表生产厂商评价方法

Publications (1)

Publication Number Publication Date
CN109389282A true CN109389282A (zh) 2019-02-26

Family

ID=65418388

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810943552.4A Withdrawn CN109389282A (zh) 2018-08-17 2018-08-17 一种基于高斯混合模型的电能表生产厂商评价方法

Country Status (1)

Country Link
CN (1) CN109389282A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111048207A (zh) * 2019-12-27 2020-04-21 四川九八村信息科技有限公司 一种供血浆者评价方法及***
CN111598387A (zh) * 2020-04-08 2020-08-28 中国电力科学研究院有限公司 一种于多维度确定电能表质量的方法及***
CN112766739A (zh) * 2021-01-22 2021-05-07 北京工商大学 一种基于bwm-e模型的肉制品中重金属污染评价方法
CN115602323A (zh) * 2022-09-07 2023-01-13 浙江一山智慧医疗研究有限公司(Cn) 适用于疾病风险评估的组合风险评估模型、方法及应用
CN117977585A (zh) * 2024-04-02 2024-05-03 山西汇达电信设备有限公司 一种配电网电能质量评估方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111048207A (zh) * 2019-12-27 2020-04-21 四川九八村信息科技有限公司 一种供血浆者评价方法及***
CN111598387A (zh) * 2020-04-08 2020-08-28 中国电力科学研究院有限公司 一种于多维度确定电能表质量的方法及***
CN112766739A (zh) * 2021-01-22 2021-05-07 北京工商大学 一种基于bwm-e模型的肉制品中重金属污染评价方法
CN112766739B (zh) * 2021-01-22 2023-08-11 北京工商大学 一种基于bwm-e模型的肉制品中重金属污染评价方法
CN115602323A (zh) * 2022-09-07 2023-01-13 浙江一山智慧医疗研究有限公司(Cn) 适用于疾病风险评估的组合风险评估模型、方法及应用
CN117977585A (zh) * 2024-04-02 2024-05-03 山西汇达电信设备有限公司 一种配电网电能质量评估方法
CN117977585B (zh) * 2024-04-02 2024-06-07 山西汇达电信设备有限公司 一种配电网电能质量评估方法

Similar Documents

Publication Publication Date Title
CN109389145A (zh) 基于计量大数据聚类模型的电能表生产厂商评价方法
CN108520357B (zh) 一种线损异常原因的判别方法、装置及服务器
CN109409628B (zh) 基于计量大数据聚类模型的采集终端生产厂商评价方法
CN109389282A (zh) 一种基于高斯混合模型的电能表生产厂商评价方法
CN105117602B (zh) 一种计量装置运行状态预警方法
CN110196814B (zh) 一种软件质量评价方法
CN111950918A (zh) 一种基于电力交易数据的市场风险评估方法
CN107527114A (zh) 一种基于大数据的线路台区异常分析方法
CN109472003A (zh) 一种应用于成本分析的多元线性回归算法
CN116150897A (zh) 一种基于数字孪生的机床主轴性能测评方法及***
CN111949939B (zh) 基于改进topsis和聚类分析的智能电表运行状态评价方法
CN109271319A (zh) 一种基于面板数据分析的软件故障的预测方法
Kong et al. A remote estimation method of smart meter errors based on neural network filter and generalized damping recursive least square
CN113792939B (zh) 基于混合威布尔分布的电能表可靠性预测方法及装置
CN113469571A (zh) 数据质量评价方法、装置、计算机设备及可读存储介质
Taillardat et al. Evaluating probabilistic forecasts of extremes using continuous ranked probability score distributions
CN105303194B (zh) 一种电网指标体系建立方法、装置以及计算设备
CN109389281A (zh) 一种基于高斯混合模型的采集终端生产厂商评价方法
Friginal et al. Multi-criteria analysis of measures in benchmarking: Dependability benchmarking as a case study
CN116842684A (zh) 电能表及其运行可靠性的评估方法、***、电能表处理器
Zhou et al. Statistics-based method for large-scale group decision-making with incomplete linguistic distribution fuzzy information: Incorporating reliability and entropy
CN113780888A (zh) 一种电能质量综合评估方法
Yun et al. Line loss calculation of low-voltage districts based on improved K-Means
CN111045951B (zh) 基于无线电业务模型实现无线电应用软件质量测试效果分析处理的方法
CN110084477A (zh) 一种云数据中心运行状态评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20190226

WW01 Invention patent application withdrawn after publication